OpenAI의 GPT-OSS-120B는 약 1170억 파라미터(활성 파라미터 51억)를 가진 획기적인 오픈 웨이트 대형 언어 모델로, 코드 실행과 구조화된 출력 등 강력한 추론 및 에이전트 기능을 제공합니다. 다중 GPU가 필요한 거대 모델과 달리, GPT-OSS-120B는 단일 Nvidia H100 GPU에서 효율적으로 실행할 수 있어, 프라이버시, 저지연, 제어를 원하는 조직과 고급 사용자에게 로컬 배포를 보다 쉽게 만듭니다.
이 글은 2025년 8월 기준 최신 지식과 실용적인 단계를 종합하여, 하드웨어 요구사항, 설치 옵션, 컨테이너화 배포, 최적화 기법 등을 포함해 GPT-OSS-120B를 로컬에서 실행하는 방법을 안내합니다.
약 1 분