NVIDIA, 로봇·자율주행용 오픈 옴니모델 Cosmos 3 공개
한 줄 요약: NVIDIA가 Computex 2026에서 텍스트·이미지·영상·음향·행동을 단일 시스템으로 처리하는 오픈소스 물리적 AI 기반 모델 Cosmos 3를 공개했다.
핵심
- Mixture-of-Transformers 아키텍처로 추론 트랜스포머와 생성 트랜스포머를 결합, 행동 전 물리 법칙 시뮬레이션 수행
- 텍스트·이미지·영상·주변음·행동 5가지 양식을 단일 모델로 생성·이해하는 업계 최초 완전 오픈 옴니모델
- 로봇·자율주행 합성 데이터 생성 및 정책 모델 훈련 사이클을 수개월 → 수일로 단축
- Agile Robots, Runway, Skild AI 등이 참여하는 Cosmos Coalition 구성; HuggingFace에 Cosmos3-Super·Cosmos3-Nano 가중치 공개
왜 중요한가
물리적 AI의 핵심 병목인 실환경 데이터 수집 비용과 시뮬레이션 구축 부담을 단일 오픈 모델로 공략한다. 로봇·자율주행 스타트업이 자체 시뮬레이션 스택 없이도 NVIDIA 인프라 위에서 세계 모델을 바로 활용할 수 있게 돼 체화 AI 개발 장벽이 크게 낮아질 전망이다.
더 보기
- NVIDIA Cosmos 3 공식 발표 — NVIDIA Newsroom
- HuggingFace 모델 블로그 — Hugging Face