OpenAI gpt-oss-120b 오픈웨이트 공개
OpenAI가 6년 만에 오픈웨이트 모델 'gpt-oss-120b'와 'gpt-oss-20b'를 공개했다. 이는 독점 API 중심에서 벗어나 개발자가 로컬에서 실행·파인튜닝할 수 있는 새로운 전략이다. 애플의 온디바이스와 유사하지만 오픈형 접근법으로, 프라이버시 강화와 맞춤형 AI 서비스 폭증을 예고한다.

OpenAI가 2025년 8월 5일 'gpt-oss-120b'와 'gpt-oss-20b'를 Apache 2.0 라이선스로 무료 공개했다. 이는 2019년 GPT-2 이후 6년 만의 오픈웨이트 복귀 사례로, 이용자는 가중치 파일을 내려받아 로컬에서 실행·파인튜닝할 수 있게 되었다. OpenAI는 독점 API 중심 전략에서 벗어나 개발 생태계의 투명성과 유연성을 동시에 확보하려는 새로운 길을 열었다.
오픈웨이트와 가중치는 무엇인가
딥러닝 모델은 학습 과정에서 수십억 개의 가중치(파라미터의 대부분)를 조정하여 패턴을 배운다. 이 가중치는 뇌 속 시냅스가 경험을 통해 연결 강도를 바꾸는 것에 비유되곤 하는데, 쉽게 말해 입력된 신호가 출력으로 얼마나 강하게 전해질지 결정하는 나사 같은 조정값이다.
오픈웨이트(open-weight) 모델은 이 가중치 파일을 통째로 공개한다. 따라서 누구나 모델을 내려받아 PC·서버·모바일 기기에서 즉시 실행하거나, 자체 데이터로 다시 학습해 특화된 버전을 만들 수 있다. 학습 데이터와 전체 소스코드까지 공개하는 완전 오픈소스보다는 범위가 좁지만, 결과물인 가중치를 손에 쥐는 만큼 투명성과 제어권이 크게 높아진다.
OpenAI가 전략을 바꾼 현실적 배경
최근 메타의 Llama, 미스트랄과 딥시크 같은 신흥 기업이 오픈웨이트 모델로 시장 영향력을 확대했다. 이런 상황에서 OpenAI가 폐쇄형 모델만으로 생태계 우위를 유지하기는 어렵다고 판단한 것으로 보인다.
동시에 기업과 정부 기관은 기밀 데이터를 외부 클라우드에 보내지 않고 자체 인프라에서 AI를 돌리길 원하며 모델의 투명성과 데이터 주권을 요구하고 있다. OpenAI는 가중치를 공개함으로써 커뮤니티에 기여하는 한편(기여하는 이미지를 쌓는 한편) 오픈 모델과 자사 API가 공존하는 선순환 구조를 기대한다. 무엇보다 gpt-oss는 내부적으로 엄격한 위험 평가를 통과했기 때문에 안전성을 확보한 채 오픈 전략을 실행할 수 있다는 자신감도 작용했다.
gpt-oss-120b·20b의 핵심 특징
gpt-oss-120b는 117억 개의 파라미터를 지녔으며 단일 80GB GPU에서 운용 가능하도록 최적화되었다. gpt-oss-20b는 21억 파라미터 규모로 16GB 메모리를 가진 노트북에서도 실행이 가능하다. 두 모델은 체인 오브 쏘트(chain-of-thought) 추론 방식을 기본 탑재해 질문 의도를 단계별로 분석하고, 코드 실행·웹 브라우징·소프트웨어 제어 등 텍스트 기반 에이전트 기능을 수행한다.
Apache 2.0 라이선스 덕분에 상업적 재배포와 서드파티 소프트웨어 통합이 자유롭고 Hugging Face나 주요 클라우드 마켓플레이스에서 손쉽게 내려받을 수 있다. 벤치마크 결과에 따르면 120b는 OpenAI의 기존 경량 모델들과 대등하거나 일부 항목에서 앞서며, 20b는 경량 모델임에도 준수한 성능을 유지한다.
개발자에게 미칠 영향
가장 먼저 체감되는 변화는 비용과 지연시간의 감소다. 이제 많은 애플리케이션이 클라우드 API 호출 없이 온프레미스 서버나 엣지 장치에서 추론을 처리할 수 있으므로 운영비가 내려가고 응답 속도가 빨라진다. 또한 LoRA·RAG 같은 경량 파인튜닝 기법 덕분에 스타트업이나 연구소가 자신만의 특화 모델을 단기간에 출시할 수 있다.
가중치를 직접 보유함으로써 특정 클라우드 플랫폼의 요금 변동이나 정책 변경에도 덜 흔들리는 구조를 설계할 수 있고, 민감 데이터를 조직 내부에만 두어 컴플라이언스 요구에 대응하기 쉬워진다. 반면 모델 성능 모니터링과 취약점 대응은 개발자 측 책임이므로, MLOps 역량과 보안 체계 구축은 필수 과제가 된다.
일반 이용자에게 예상되는 변화
최종 사용자가 가장 먼저 느낄 수 있는 효과는 개인정보 보호의 강화다. AI 기능이 기기 내부에서 돌아가기 때문에 대화 내용이나 이미지가 외부 서버에 저장되지 않는다. 더불어 틈새 시장을 노린 맞춤형 서비스가 폭발적으로 늘어날 가능성이 크다. 예컨대 수험생을 위한 Q&A 봇, 반려동물 행동 분석 AI, 지역 방언 번역기 등 세분화된 솔루션이 빠르게 등장할 수 있다.
이 전략은 애플의 온디바이스와 유사하다. 애플은 Apple Intelligence에서 대부분의 AI 처리를 아이폰·맥 내부에서 실행하는 전략을 택했다. 이용자 데이터가 디바이스를 떠나지 않아 프라이버시가 보장되고, 네트워크 지연 없이 즉시 응답이 가능하다. 다만 애플은 자체 개발한 모델을 기기에 최적화해서 탑재하는 폐쇄형 온디바이스 방식이다.
반면 OpenAI의 gpt-oss는 오픈형 온디바이스 접근법이라 할 수 있다. 개발자들이 자유롭게 가중치를 받아서 각자의 기기나 서버에서 실행할 수 있기 때문이다. 결과적으로는 둘 다 "데이터가 외부로 나가지 않는 로컬 AI"를 구현한다는 점에서 동일한 효과를 창출한다.
차이점은 생태계 접근 방식이다. 애플은 자사 하드웨어와 소프트웨어의 완벽한 통합을 통해 최적화된 경험을 제공하는 반면, OpenAI는 오픈 가중치로 누구나 참여할 수 있는 분산형 혁신을 추구한다. 두 전략 모두 클라우드 의존성을 줄이고 사용자 통제권을 강화한다는 큰 그림에서는 일치하는 셈이다.
API 비용이 줄어든 서비스들은 구독료나 사용료를 낮출 여력이 생기므로 가격 인하 압력도 커질 것이다. 다만 잘못 파인튜닝된 모델이 허위 정보나 피싱·악성 코드 생성에 이용될 위험이 존재해, 플랫폼과 규제 기관의 모니터링이 한층 강화될 전망이다.
열린 가중치 시대, 과제와 전망
gpt-oss 시리즈는 폐쇄 API와 완전 오픈소스 사이에서 투명성과 통제의 균형점을 찾으려는 제3의 길이다. 개발자는 더 빠르고 저렴하게 혁신을 실험할 수 있고, 이용자는 사생활이 보장된 다채로운 AI 서비스를 경험하게 된다.
그러나 가중치 공개는 동시에 오용 가능성의 문도 연다. 따라서 기술 혁신과 함께 윤리 규제, 사용자 교육이 병행되어야 AI 생태계가 건강하게 성장할 수 있다. 앞으로 AI 업계는 공개된 두뇌를 어떻게 안전하고 공정하게 활용할지에 대한 사회적 합의를 바탕으로 진화하게 될 것이다.