DeepSeek V4 Pro: 1.6조 파라미터 MoE 오픈소스 모델, GPT-5.5 대비 1/10 가격에 SWE-bench 80.6%
한 줄 요약: DeepSeek이 1.6조 파라미터 MoE 모델 V4 Pro를 MIT 라이선스로 공개했다 — GPT-5.5 출력 가격의 약 10분의 1로 프런티어급 코딩 성능을 제공한다.
핵심
- 아키텍처: 총 파라미터 1.6조 개, 추론 시 490억 개만 활성화(MoE); 컨텍스트 100만 토큰, 최대 출력 38만 4천 토큰
- 가격: 입력 $0.435/M, 출력 $0.87/M 토큰 — GPT-5.5 대비 약 1/10 수준
- 성능: SWE-bench Verified 80.6% — 소프트웨어 엔지니어링 과제에서 프런티어 모델급
- 개방성: MIT 라이선스(상업 이용·온프레미스 배포 포함 완전 공개), 사고/비사고 듀얼 모드, 6월 현재 프리뷰 단계
왜 중요한가
DeepSeek V4 Pro는 V3의 공식을 조 단위 파라미터 규모에서 반복했다: 프런티어에 근접한 코딩 성능을 폐쇄 모델의 10분의 1 가격에, 완전 공개 웨이트로 제공한다. 기업들이 자체 서버에 이 수준의 코딩 능력을 올릴 수 있게 되면서 OpenAI·Anthropic의 엔터프라이즈 시장에 구조적 가격 압박이 가중된다.
더 보기
- DeepSeek V4 공식 릴리즈 노트 — DeepSeek 공식
- V4 아키텍처 상세 분석 — MorphLLM
- DeepSeek V4 Pro 완전 가이드 — AI Made Tools