Tagi: LLM

Jak uruchomić DeepSeek-V4 lokalnie: przewodnik po konfiguracji Pro i Flash

DeepSeek-V4 to jedna z najbardziej ambitnych otwartych wersji modeli z wagami od DeepSeek do tej pory. Rodzina obejmuje DeepSeek-V4-Pro, model Mixture-of-Experts (MoE) o 1,6 biliona parametrów z 49 miliardami aktywowanych parametrów, oraz DeepSeek-V4-Flash, mniejszy model MoE o 284 miliardach parametrów z 13 miliardami aktywowanych parametrów. Oba modele obsługują długość kontekstu do jednego miliona tokenów.

Około 7 minut

Jak uruchomić GLM-5 lokalnie: Kompletny przewodnik krok po kroku

Wprowadzenie

GLM-5 to najnowszy otwartoźródłowy duży model językowy od Z.ai, posiadający 744 miliardy parametrów (40 miliardów aktywnych) z architekturą MoE. Ten potężny model doskonale radzi sobie z rozumowaniem, kodowaniem oraz zadaniami agentowymi, co czyni go jednym z najlepszych dostępnych otwartoźródłowych modeli LLM.

Około 5 minut

Jak wdrożyć i korzystać z MiniMax-M1-80k: Kompleksowy przewodnik

MiniMax-M1-80k to przełomowy, otwarty model językowy o dużej skali, znany z wyjątkowej wydajności w zadaniach z długim kontekstem oraz złożonych wyzwaniach inżynierii oprogramowania. Jeśli chcesz wykorzystać jego moc w swoim projekcie lub środowisku produkcyjnym, ten przewodnik szczegółowo opisuje, jak wdrożyć i efektywnie korzystać z MiniMax-M1-80k.

Około 3 minut

Odblokowanie pełnego potencjału QwQ-32B z Ollama

Wprowadzenie

Wyobraź sobie, że masz moc dużego modelu językowego na wyciągnięcie ręki, bez polegania na usługach chmurowych. Dzięki Ollama i QwQ-32B możesz to osiągnąć. QwQ-32B, opracowany przez zespół Qwen, to model językowy z 32 miliardami parametrów, zaprojektowany z myślą o zwiększonej zdolności do rozumowania, co czyni go solidnym narzędziem do logicznego rozumowania, kodowania i rozwiązywania problemów matematycznych.

Około 2 minut