알리바바 HappyHorse 1.1, 글로벌 AI 비디오 리더보드 2위 등극 — Sora·Seedance 공백 파고든다
알리바바가 AI 동영상 생성 모델 HappyHorse 1.1을 출시하며 글로벌 순위 2위에 올랐다. OpenAI Sora 서비스 종료, ByteDance Seedance 글로벌 롤아웃 중단으로 생긴 공백을 중국 빅테크가 빠르게 메우고 있다.
- 알리바바
- AI비디오
- HappyHorse
- 생성AI
- 멀티모달
새 AI 모델 출시와 연구 동향
31건의 기사
알리바바가 AI 동영상 생성 모델 HappyHorse 1.1을 출시하며 글로벌 순위 2위에 올랐다. OpenAI Sora 서비스 종료, ByteDance Seedance 글로벌 롤아웃 중단으로 생긴 공백을 중국 빅테크가 빠르게 메우고 있다.
NVIDIA가 5,500억 파라미터 MoE 하이브리드 모델 '네모트론 3 울트라'를 오픈웨이트로 공개했다. Artificial Analysis 지능 지수 미국 오픈소스 1위(48점)를 기록했으며, 허깅페이스·NVIDIA NIM에서 상업 이용 가능한 OpenMDW-1.1 라이선스로 배포된다.
애플이 WWDC 2026에서 제3세대 애플 파운데이션 모델(AFM 3) 5종을 공개했다. 온디바이스 20B 파라미터 멀티모달 모델을 포함하며, 클라우드 버전은 Google Cloud의 NVIDIA GPU 위에서 구동된다.
알파폴드·젬마이 공동 연구자인 조나스 애들러와 알렉산더 프리첼이 앤트로픽 합류를 준비 중이라고 블룸버그가 6월 24일 보도했다. 노암 샤지어·존 점퍼 이탈에 이어 일주일 새 네 번째·다섯 번째 이탈이다.
유럽위원회가 이탈리아 스타트업 Domyn 주도의 EUROPA 컨소시엄을 '프런티어 AI 그랜드 챌린지' 우승자로 선정했다. EU 24개 공식 언어를 지원하는 4,000억 매개변수 이상의 오픈소스 AI 모델을 개발한다.
구글 I/O에서 Sundar Pichai CEO가 '다음 달 드리겠다'고 공언했던 제미나이 3.5 Pro가 6월 말을 넘기며 7월 출시로 밀렸다. 구글의 플래그십 AI 모델이 경쟁사 대비 한 달 이상 지연된 셈이다.
OpenAI가 브로드컴과 협력해 LLM 추론에 특화된 첫 자체 설계 ASIC '할라페뇨(Jalapeño)'를 공개했다. 9개월 만에 개발 완료, 2026년 말 대규모 배포 예정이며 엔비디아 의존도를 낮추는 전략적 행보다.
6월 23일부터 Claude Fable 5가 Pro·Max·Team·Enterprise 플랜 무료 사용 기간이 종료되며 크레딧 과금으로 전환된다. 새 거부(refusal) API 동작 등 개발자가 즉시 확인해야 할 변경 사항을 정리했다.
Polymarket 계약 83% 확률이 가리키는 GPT-5.6 출시 예측 윈도우가 6월 22일 열렸다. 누출된 정보에 따르면 150만 토큰 컨텍스트와 GPT-5.5 정렬 실패를 잡는 보상 감사 파이프라인이 포함될 전망이다.
Reflection AI가 SpaceX의 Colossus 2 데이터센터에서 Nvidia GB300 칩을 월 1억 5천만 달러에 임차하는 최대 63억 달러 규모 계약을 맺었다. 오픈소스 프런티어 모델 훈련을 위한 대규모 컴퓨팅 확보 경쟁이 가속화되고 있다.
xAI의 Grok 4.3이 Amazon Bedrock에 정식 출시됐다. 100만 토큰 컨텍스트, 4단계 추론 모드, 네이티브 동영상 입력을 갖추고 OpenAI·Anthropic에 맞서는 엔터프라이즈 선택지로 부상했다.
Microsoft가 Build 2026에서 자사 개발 AI 모델 7종으로 구성된 'MAI(Microsoft AI) 패밀리'를 공개했다. 추론·코딩·이미지·음성·전사 등 전 분야를 커버하며, OpenAI 또는 서드파티 모델 증류 없이 순수 자체 데이터로 학습했다.
OpenAI가 이르면 6월 22~28일 GPT-5.6을 출시할 가능성이 높다는 예측이 나왔다. Polymarket 예측 시장에서 83% 확률이 배정됐고, OpenAI 수석 과학자도 GPT-5.5 대비 '의미 있는 개선'이라 언급한 것으로 알려졌다.
DeepSeek이 4월 24일 V4 Pro를 프리뷰 공개했다. 총 1.6조 파라미터(활성 490억)의 MoE 아키텍처, 100만 토큰 컨텍스트, MIT 라이선스로 SWE-bench Verified 80.6%를 달성하며 출력 토큰당 $0.87에 제공한다.
구글이 Google I/O에서 '다음 달까지' 출시를 공언한 Gemini 3.5 Pro가 6월 19일 현재 Vertex AI 일부 기업 고객 전용 프리뷰에 그치고 있다. 마감까지 11일이 남은 가운데 예측 마켓은 달성 확률을 50~55%로 보고 있다.
구글이 6년 만에 신형 스마트 스피커를 출시했다. $99에 Gemini AI를 내장해 자연스러운 다단계 대화와 스마트홈 제어가 가능하며, 350만 명의 얼리액세스 피드백을 반영한 결과물이다.
알리바바가 오픈소스 코딩 특화 MoE 모델 Qwen3-Coder-Next를 공개했다. 총 800억 파라미터 중 추론 시 30억만 활성화하는 초희소 구조로, 동급 밀집 모델 대비 처리량이 최대 10배 높다.
OpenAI 공동창업자이자 테슬라 AI 전 수장 앤드레이 카르파티가 Anthropic에 합류해 Claude 사전훈련(pre-training) 연구팀을 신설·주도한다. AI 분야 최고 기술 인재가 잇따라 Anthropic으로 집결하고 있다는 신호다.
NVIDIA가 물리적 AI를 위한 첫 오픈 옴니모델 Cosmos 3를 발표했다. 영상·음향·행동을 단일 모델로 처리하며 로봇·자율주행 훈련 기간을 수개월에서 수일로 단축한다.
OpenAI가 제약·바이오 전문가 173명이 만든 750개 과제 벤치마크 LifeSciBench를 발표했다. 최고 성능 모델도 합격률 약 33%에 그쳐 AI의 실제 과학 연구 역량이 아직 제한적임을 드러냈다.
구글이 Android 17과 6월 Pixel Drop을 배포하며 AI 동영상 편집 기능 Gemini Omni와 음악 창작 도구 Lyria 3를 새롭게 선보였다.
Zhipu AI의 Z.ai가 744B 파라미터 MoE 모델 GLM-5.2를 공개했다. 실사용 100만 토큰 컨텍스트와 두 가지 사고 강도를 제공하며, 벤치마크 수치 없이 출시한 점이 이례적이다.
마이크로소프트가 Wave 3 업데이트로 Microsoft 365 Copilot에 Anthropic의 Claude Fable 5를 추가했다. 단일 모델 의존에서 벗어나 GPT·Claude 중 작업에 최적인 모델을 자동 선택하는 구조로 전환됐다.
중국 AI 연구소 MiniMax가 6월 1일 오픈웨이트 모델 M3를 출시했다. 새로운 희소 어텐션 구조(MSA)로 100만 토큰 컨텍스트를 구현하고, SWE-Bench Pro에서 GPT-5.5를 상회하는 성능을 GPT-5.5 비용의 5~10% 수준에 제공한다.
Google I/O 2026에서 공개된 Gemini 3.5 Flash는 전년도 Pro 모델을 코딩·에이전트 벤치마크에서 앞서며, 속도는 4배, 비용은 40% 저렴하다.
OpenAI가 GPT-5.5 Instant를 ChatGPT의 새 기본 모델로 교체하고, 6월 9일부터 무료(Go·Free) 사용자에게도 개인화 기능을 개방했다. 이전 모델 대비 환각 52.5% 감소, 과거 대화·파일·Gmail 참조 가능.
NVIDIA가 6월 12일 Blackwell Ultra B300 칩 양산을 시작했다. HBM3e 288GB 탑재, 추론 워크로드에서 Hopper 대비 메가와트당 처리량 50배, 토큰당 비용 35배 절감을 목표로 에이전트 AI 시대의 핵심 GPU로 자리매김한다.
애플이 WWDC 2026에서 Gemini 기반으로 전면 재설계된 Siri와 Claude·ChatGPT·Grok를 선택할 수 있는 AI 확장 프레임워크를 발표했다.
구글이 추론 특화 오픈 모델 Gemma 4와 LLM 최대 병목인 KV 캐시를 획기적으로 줄이는 TurboQuant 알고리즘을 동시에 발표했다.
메타가 오픈소스 전략을 뒤집고 첫 독점 AI 모델 Muse Spark를 공개했다. 14.3조 원을 들여 AI 스택을 전면 재구축한 결과물이다.
AIWire가 매일 업데이트되는 LLM 최신 소식 코너를 엽니다. 한국어와 영어로 핵심만 정리합니다.