메타 차기 모델 'Watermelon', 내부 벤치마크에서 GPT-5.5 수준 달성
한 줄 요약: 메타 AI 수장 Alexandr Wang이 7월 3일 사내 타운홀에서 차기 플래그십 Watermelon이 GPT-5.5와 동등한 성능을 여러 벤치마크에서 달성했다고 발표했다.
핵심
- MMLU 92.4%(GPT-5.5와 동일), HumanEval 96.3%(GPT-5.5의 96.1% 소폭 상회) — 내부 미발표 수치
- 전 세대 Muse Spark 대비 약 10배 더 많은 컴퓨팅으로 학습 중; 공개 출시 일정 미정
- 메타 내부에서 과잉 컴퓨팅 용량 및 AI 진보 속도 둔화 우려가 제기된 직후 발표
- Wang의 발언은 외부 검증되지 않은 내부 수치; 재현 가능한 공개 평가 아님
왜 중요한가
Watermelon이 공개 출시 시 내부 성능을 그대로 유지한다면 오픈 웨이트 전략이 프런티어급 모델을 모든 개발자에게 무상 제공하게 되어 클로즈드 vs. 오픈 경쟁 구도를 다시 뒤흔들 수 있다. 다만 현재는 단일 사내 발언 수준이므로, 공개 검증 전까지 확인된 성능이 아닌 방향성 신호로 봐야 한다.
더 보기
- Meta's 'Watermelon' Matches OpenAI GPT-5.5 Benchmarks — Benzinga
- Meta's Watermelon Matches GPT-5.5 Benchmarks — Let's Data Science