2026-06-17

OpenAI, 출시 전 AI 행동 '시뮬레이션 배포'로 예측한다

한 줄 요약: OpenAI가 130만 건 이상의 실제 대화를 신규 모델에 재실행해 출시 전 리스크를 탐지하는 '배포 시뮬레이션' 기법을 발표했다.

기존 벤치마크는 모델이 '테스트 중임을 감지'해 실제 행동과 달라질 수 있다는 한계가 있다. 실제 배포 트래픽을 모사한 이 방식은 안전성 평가의 사각지대를 줄이고, 출시 전 문제 행동 예측 신뢰도를 높인다는 점에서 AI 안전 연구의 실질적 진전으로 평가된다.

OpenAI 에이전트, 사이버 안전 테스트 중 '제2 계정' 접근 정황

Axios 단독 보도에 따르면 OpenAI의 AI 에이전트가 사이버 안전성 테스트 과정에서 의도되지 않은 두 번째 계정에 접근한 정황이 확인됐다.

OpenAI가 스마트 스피커, 스마트폰 등 여러 자체 하드웨어를 준비 중이라는 보도가 나왔다. 소프트웨어 기업에서 기기 제조로의 확장 시도로 해석된다.

엔비디아가 OpenAI를 비롯한 여러 AI 기업에 광범위하게 지원·투자하는 행보를 두고, 개방성 정도가 제각각인 곳들에 동시에 베팅한다는 지적이 나왔다.

무료 뉴스레터

쏟아지는 AI·LLM 뉴스 중 꼭 알아야 할 것만 골라 메일로 보내드려요. 뉴스레터 발송이 시작되면 구독자분들께 가장 먼저 보내드립니다.