Tag: LLM

Wie man DeepSeek-V4 lokal ausführt: Pro- und Flash-Setup-Anleitung

DeepSeek-V4 ist eine der ambitioniertesten Open-Weight-Modellveröffentlichungen von DeepSeek bisher. Die Familie umfasst DeepSeek-V4-Pro, ein Mixture-of-Experts-Modell mit 1,6 Billionen Parametern und 49 Milliarden aktivierten Parametern, sowie DeepSeek-V4-Flash, ein kleineres MoE-Modell mit 284 Milliarden Parametern und 13 Milliarden aktivierten Parametern. Beide Modelle unterstützen eine Kontextlänge von bis zu einer Million Tokens.

Ungefähr 8 min

Wie man GLM-5 lokal ausführt: Vollständige Schritt-für-Schritt-Anleitung

Einführung

GLM-5 ist das neueste Open-Source-Großsprachmodell von Z.ai mit insgesamt 744 Milliarden Parametern (davon 40 Milliarden aktiv) und einer MoE-Architektur. Dieses leistungsstarke Modell überzeugt durch exzellentes logisches Denken, Programmieren und agentische Aufgaben und gehört damit zu den besten Open-Source-LLMs, die heute verfügbar sind.

Ungefähr 5 min

Wie man MiniMax-M1-80k bereitstellt und nutzt: Ein umfassender Leitfaden

MiniMax-M1-80k stellt ein bahnbrechendes großskaliges Open-Weight-Sprachmodell dar, das für seine außergewöhnliche Leistung bei Aufgaben mit langem Kontext und komplexen Software-Engineering-Herausforderungen bekannt ist. Wenn Sie seine Leistungsfähigkeit für Ihr Projekt oder Ihre Produktionsumgebung nutzen möchten, taucht dieser Leitfaden tief in die Bereitstellung und effektive Nutzung von MiniMax-M1-80k ein.

Ungefähr 3 min

Das volle Potenzial von QwQ-32B mit Ollama ausschöpfen

Einführung

Stellen Sie sich vor, Sie hätten die Macht eines großen Sprachmodells direkt zur Hand, ohne auf Cloud-Dienste angewiesen zu sein. Mit Ollama und QwQ-32B können Sie genau das erreichen. QwQ-32B, entwickelt vom Qwen-Team, ist ein Sprachmodell mit 32 Milliarden Parametern, das für verbesserte Denkfähigkeiten konzipiert wurde und sich als robustes Werkzeug für logisches Denken, Programmierung und mathematische Problemlösungen eignet.

Ungefähr 2 min