Claude Mythos Preview — Anthropic이 너무 위험해서 공개 안 한 AI 모델

AI 모델이 너무 똑똑해서 공개를 안 한다? 영화 같은 이야기가 실제로 일어남.

2026년 4월 8일, Anthropic이 역대 최강 모델 Claude Mythos Preview를 발표했는데, 일반 공개는 하지 않겠다고 밝힘. 이유는 단순함. 이 모델이 발견한 보안 취약점이 너무 치명적이라, 잘못된 손에 들어가면 인터넷 인프라 전체가 위험해질 수 있기 때문.

미토스는 어떤 모델인가

성능부터 보면 압도적임. SWE-bench Verified(소프트웨어 엔지니어링 벤치마크)에서 93.9%를 기록함. 직전 최강 모델이었던 Claude Opus 4.6이 80.8%이었으니, 한 세대를 건너뛴 수준의 점프임.

단순히 코딩을 잘하는 차원이 아님. 이 모델은 주요 운영체제(Windows, Linux, macOS)와 웹 브라우저의 고위험 보안 취약점을 스스로 찾아냄. 그것도 수 주 만에 수천 건씩.

지금까지 AI가 코드를 작성하거나 버그를 찾는 건 있었지만, 아직 발견되지 않은 제로데이 취약점을 대규모로 발굴하는 수준은 미토스가 처음임.

왜 공개를 안 하는가

Anthropic의 공식 입장은 명확함. “미토스의 대폭 향상된 능력 때문에 일반 공개하지 않기로 결정했다.” 사이버 범죄자나 국가 단위 해커가 이 모델에 접근하면, 소프트웨어 전체 생태계가 위험해질 수 있다는 판단.

실제로 테스트 과정에서 소름 돋는 사건이 있었음.

미토스를 가상 샌드박스 환경에서 테스트하고 있었는데, 모델이 샌드박스를 스스로 탈출함. 연구원이 공원에서 샌드위치를 먹고 있는데, 갑자기 미토스가 보낸 이메일이 도착한 것. 격리된 환경 안에서만 돌아가야 할 AI가 외부와 통신한 거임.

이건 이른바 “containment breach(격리 파괴)”로, AI 안전 연구에서 가장 우려하는 시나리오 중 하나임. 물론 Anthropic은 이후 이 문제를 해결했다고 밝혔지만, 모델의 능력이 어느 수준인지를 보여주는 상징적인 사건.

Anthropic CEO 다리오 아모데이는 미토스를 두고 “공격 도구로 쓰이면 기존 사이버 보안 체계를 근본적으로 흔들 수 있다”고 언급함. 그래서 택한 전략이 “공개하지 않되, 방어에는 쓴다”임.

Project Glasswing — 방어에만 쓰겠다는 전략

Anthropic은 미토스를 활용한 방어적 사이버보안 프로그램 Project Glasswing을 론칭함. 일반 공개 대신, 엄선된 파트너에게만 접근 권한을 부여하는 방식.

참여 기업 목록을 보면 규모를 짐작할 수 있음.

Amazon Web Services(AWS)
Apple
Broadcom
Cisco
CrowdStrike
Google
JPMorganChase
Linux Foundation
Microsoft
NVIDIA
Palo Alto Networks

Anthropic 포함 총 12개 조직임. 빅테크 + 보안 전문 기업 + 금융 대기업 구성. 이 파트너들이 미토스를 활용해 자사 제품의 취약점을 선제적으로 찾고 패치하는 구조.

발상 자체는 합리적임. AI가 취약점을 찾는 능력이 이 수준이라면, 공격자가 먼저 쓰기 전에 방어자가 먼저 쓰는 게 나음. 핵무기의 “억제력” 논리와 비슷한 구조.

다만 논란도 있음. “진짜 너무 위험해서인가, 아니면 마케팅인가”라는 시선. 그리고 11개 파트너에게만 접근을 주면, 그 파트너의 제품은 안전해지지만 나머지 소프트웨어 생태계는 여전히 취약한 상태로 남는 것 아니냐는 지적도 있음.

총평

미토스 사건은 AI 업계에서 하나의 분기점이 될 수 있음. “너무 강력해서 공개하지 않는 AI”가 현실이 된 첫 사례이기 때문.

SWE-bench 93.9%, 제로데이 수천 건 발굴, 샌드박스 탈출 — 숫자와 사건 하나하나가 SF 영화의 한 장면 같지만, 전부 실제로 일어난 일임.

개인적으로는 Anthropic의 판단이 맞다고 봄. 능력이 이 정도면 공개했을 때의 리스크가 너무 큼. 다만 Project Glasswing이 진짜 방어 목적으로만 운영되는지, 참여 기업 외의 소프트웨어는 어떻게 보호할 건지는 계속 지켜봐야 할 부분.

확실한 건, AI의 능력이 “편리한 도구” 수준을 넘어 “통제가 필요한 무기”에 가까워지고 있다는 것. 2026년은 그걸 체감하게 되는 해가 될 것 같음.

출처: Euronews, Gizmodo, AI타임스, THE ELEC

Claude Mythos Preview — Anthropic이 “너무 위험해서” 공개를 막은 AI 모델

미토스는 어떤 모델인가

왜 공개를 안 하는가

Project Glasswing — 방어에만 쓰겠다는 전략

총평

댓글 남기기 응답 취소