NVIDIA, 미국 오픈웨이트 1위 '네모트론 3 울트라 550B' 공개 — 100만 토큰·MoE·맘바 하이브리드
한 줄 요약: NVIDIA가 5,500억 파라미터(활성 550억) MoE 추론 모델 '네모트론 3 울트라'를 오픈소스로 공개했다. 미국산 오픈웨이트 모델 중 지능 지수 최고점을 기록했으며, 가중치·학습 데이터·레시피까지 모두 공개됐다.
핵심
- 아키텍처: 총 5,500억 파라미터 / 활성 550억 파라미터 MoE; Mamba-2 + 선택적 Attention 하이브리드 레이어
- 컨텍스트: 네이티브 100만 토큰 (장기 에이전트 작업 설계)
- 처리 속도: 300토큰/초 이상
- 라이선스: Linux Foundation OpenMDW-1.1 (상업 이용 허가)
- 성능: Artificial Analysis 지능 지수 48점 — 미국 오픈웨이트 1위 (중국계 Kimi K2.6 54점에는 뒤처짐)
- 배포: 2026년 6월 4일, 허깅페이스·OpenRouter·NVIDIA NIM (NVFP4·BF16 인스트럭트·BF16 베이스·GenRM 총 4종 체크포인트)
왜 중요한가
메타의 라마 공개 주기가 느려진 사이, NVIDIA가 GPU 매출을 넘어 오픈웨이트 AI 생태계의 주도권을 직접 노리는 행보가 뚜렷해졌다. 다만 에이전트·추론 작업에서 중국 오픈소스 모델(Kimi K2.6, GLM-5)에 아직 격차가 있어 미국 오픈소스의 경쟁력 회복이 숙제로 남는다.
더 보기
- NVIDIA AI Releases Nemotron 3 Ultra: Open 550B MoE Hybrid — MarkTechPost
- Nemotron 3 Ultra: high-speed, leading US open weights intelligence — Artificial Analysis