標籤: LLM

如何本地運行 DeepSeek-V4：Pro 與 Flash 安裝指南

DeepSeek-V4 是 DeepSeek 迄今為止最具野心的開放權重模型發佈之一。該系列包含 DeepSeek-V4-Pro，一個擁有 1.6T 參數的 Mixture-of-Experts 模型，啟用參數達 49B，以及較小的 DeepSeek-V4-Flash，一個擁有 284B 參數的 MoE 模型，啟用參數為 13B。兩款模型均支援最高 一百萬個 token 的上下文長度。

這樣的組合聽起來令人興奮，但也帶來一個實際問題：你真的能在本地運行 DeepSeek-V4 嗎？

大约 11 分鐘

如何在本地運行 GLM-5：完整逐步指南

介紹

GLM-5 是 Z.ai 最新的開源大型語言模型，擁有 744B 總參數（40B 活躍參數）並採用 MoE 架構。這款強大的模型在推理、程式碼編寫和代理任務方面表現優異，是目前最頂尖的開源 LLM 之一。

在本地運行 GLM-5 可讓您完全掌控資料，免除 API 費用，並允許無限制使用。本指南將帶您完整了解如何在您的硬體上設置並運行 GLM-5。

為什麼要在本地運行 GLM-5？

優勢	說明
資料隱私	您的資料永遠不會離開您的系統
節省成本	無需支付 API 費用或使用限制
客製化	可針對特定需求進行微調
無限使用	生成內容無上限
無延遲	無需網路呼叫，回應快速

大约 7 分鐘

如何部署與使用 MiniMax-M1-80k：完整指南

MiniMax-M1-80k 是一款突破性的開放權重大型語言模型，以其在長上下文任務及複雜軟體工程挑戰上的卓越表現聞名。如果你想在專案或生產環境中發揮它的強大能力，本指南將深入介紹如何部署並有效使用 MiniMax-M1-80k。

為什麼選擇 MiniMax-M1-80k？

在進入部署細節之前，先來看看 MiniMax-M1-80k 的獨特優勢：

混合注意力設計，實現高效的長上下文處理，支援一次處理多達 80,000 個標記。
在基準測試中表現優異，特別是在程式編碼、工具使用及推理任務上。
函數調用能力，讓模型能智能觸發並處理外部函數調用。
以 開放權重模型 形式提供，方便研究與商業使用。

大约 5 分鐘

釋放 QwQ-32B 的全部潛力與 Ollama

介紹

想像一下，擁有一個大型語言模型的力量，卻不需要依賴雲端服務。透過 Ollama 和 QwQ-32B，你可以實現這一點。QwQ-32B 由 Qwen 團隊開發，是一個擁有 320 億參數的語言模型，旨在增強推理能力，使其成為邏輯推理、編碼和數學問題解決的強大工具。

在這篇文章中，我們將深入探討 Ollama 的世界，以及它如何簡化 QwQ-32B 的本地部署，避免雲端服務的需求，同時確保數據隱私和成本節省。

大约 4 分鐘