OpenAI 的 GPT-OSS-120B 是一款开源权重的大型语言模型,拥有约1170亿参数(其中活跃参数为51亿),旨在提供强大的推理和自主能力,包括代码执行和结构化输出。与需要多块 GPU 的超大模型不同,GPT-OSS-120B 可以高效运行于单块 Nvidia H100 GPU 上,使得本地部署对追求隐私、低延迟和控制权的组织和高级用户更加可行。
本文汇总了截至2025年8月的最新知识和实操步骤,帮助您本地运行 GPT-OSS-120B,包括硬件需求、安装选项、容器化部署及优化技巧。
为什么要本地运行 GPT-OSS-120B?
大约 5 分钟