OpenAI·브로드컴, 첫 자체 AI 추론 칩 '할라페뇨' 공개
한 줄 요약: OpenAI가 브로드컴과 함께 LLM 추론에 최적화된 첫 자체 칩 '할라페뇨(Jalapeño)'를 발표했다.
핵심
- 최대 다이 크기의 ASIC로 LLM 추론 전용 설계; OpenAI 자체 AI를 활용해 단 9개월 만에 개발 완료
- 브로드컴(제조)·Celestica(양산) 협력; 초기 테스트에서 현세대 최고 성능 칩 대비 와트당 성능 우위 확인
- 마이크로소프트가 초기 생산분의 40% 선구매; 2026년 말 대규모 배포 목표
- 2029년까지 할라페뇨 기반 컴퓨팅 10GW 구축 계획 — 원자력 발전소 10기 규모
왜 중요한가
OpenAI가 추론(inference) 인프라를 독자 칩으로 전환하는 전략을 본격화했다는 신호다. 훈련 단계는 여전히 엔비디아에 의존하지만, 추론 비용은 ChatGPT 운영비의 핵심이다. 전용 ASIC 전환이 성공하면 OpenAI의 단위 수익 구조가 크게 개선될 수 있으며, IPO를 앞두고 투자자에게 비용 효율화 청사진을 제시하는 효과도 있다.