앤트로픽 비밀 AI '클로드 미토스', SKT·삼성이 먼저 쓰는 이유

3월 말, 앤트로픽 내부 문서가 유출됐다. 거기서 처음 이름이 등장한 모델이 **클로드 미토스(Claude Mythos)**다. 앤트로픽은 며칠 뒤 공식 확인했다. "지금까지 만든 모델 중 가장 뛰어나다. 사이버 보안 능력만큼은 현존하는 그 어떤 AI보다 앞선다."

그리고 이렇게 덧붙였다. 일반에는 공개하지 않겠다고.

이유는 단순하다. 너무 위험하다는 것이다.

그런데 지난 4일, SK텔레콤이 이 모델을 쓰기 시작했다고 발표했다.

데이터 유출로 드러난 앤트로픽의 패

미토스의 존재를 세상에 처음 알린 건 앤트로픽이 아니었다. 지난 3월 내부 자료가 새어나가면서 이 이름이 등장했고, 앤트로픽은 처음엔 침묵하다가 결국 인정했다. "단계적 도약(step change)을 이뤄낸 모델"이라는 표현도 이때 나왔다.

그 이후로도 미토스는 가끔 모습을 드러냈다. 5월 27일에는 클로드 코드 인터페이스에서 모델 선택 토글에 잠깐 노출됐다가 사라졌다. 앤트로픽이 의도한 공개가 아니었다. 그걸로 많은 개발자들이 "출시가 임박했구나"를 눈치챘다.

공식 발표에서 앤트로픽은 미토스 프리뷰가 "수 주 만에 수천 건의 제로데이 취약점을 발견했다"고 밝혔다. 제로데이 취약점이란 아직 아무도 패치하지 못한 구멍이다. 지금 이 순간에도 해커가 실제로 쓸 수 있는 취약점. 그걸 AI가 자동으로 찾아낸다는 게 이 모델의 핵심이다.

그런데 왜 공개하지 않을까. 이건 양날의 검이기 때문이다. 취약점을 탐지하는 AI는 곧 취약점을 공격할 수 있는 AI다. 방어자에게 유용한 도구는 공격자에게도 똑같이 유용하다. 앤트로픽은 그 선을 명확히 그었다. 아무에게나 줄 수 없다. 검증된 기관, 검증된 목적에만 제공한다.

프로젝트 글래스윙이라는 비공개 클럽

그래서 나온 게 **프로젝트 글래스윙(Project Glasswing)**이다. 선별된 파트너사에게만 클로드 미토스에 대한 조기 접근 권한을 부여하는 프로그램이다. 대신 조건이 있다. 발견한 취약점 정보를 공유해야 하고, 방어 체계 구축에 협력해야 한다. 받는 만큼 돌려주는 구조다.

처음 합류한 통신사는 미국의 버라이즌(Verizon)과 AT&T였다. 세계 최대 규모의 통신 인프라를 운영하는 회사들이 왜 여기 들어갔는지는 뻔하다. 통신망이 뚫리면 국가 기반 시설 전체가 위험해진다. 해킹 대상으로서 가장 매력적인 곳이기도 하다.

지난 4일, SKT가 아시아 통신사 최초로 합류했다. 전 세계 통신사 기준으로는 세 번째다.

프로그램에 참여한 50개 이상 파트너사에서 한 달 동안 발견된 고위험·치명적 취약점만 1만 개가 넘는다. 이 숫자가 실감 나지 않을 수 있는데, 보안업계에서 일하는 사람들한테 물어보면 입이 떡 벌어지는 규모다. 기존 방식으로는 수십 명의 화이트햇 해커가 수년을 작업해야 할 분량을 AI가 몇 주 만에 처리한 것이다.

한국 기업들이 총출동한 맥락

SKT만 들어간 게 아니다. 삼성전자와 SK하이닉스는 이미 글래스윙에 참여하고 있었다. 과학기술정보통신부도 한국인터넷진흥원(KISA)을 통해 클로드 미토스 접근 권한을 확보했다. 사실상 한국의 주요 IT 기업과 정부 기관이 줄줄이 다 들어간 셈이다.

여기서 SKT는 조금 다른 맥락이 있다. 지난해 대규모 개인정보 유출 사고로 브랜드 이미지가 흔들린 SKT다. 국내 일부 언론이 이번 글래스윙 합류를 "신뢰 회복을 위한 승부수"라고 표현했는데, 과장이 아니다. SKT 입장에서는 "우리가 이제 세계 최강 AI로 보안을 검사한다"는 메시지 자체가 마케팅이기도 하다. 실질적 효과와 이미지 효과를 동시에 노리는 수다.

삼성전자와 SK하이닉스의 참여는 또 다른 의미다. 반도체 제조 공정과 설계 정보는 국가 차원의 핵심 기밀이다. 최근 몇 년 사이 국가 지원 해킹 그룹의 반도체 기업 공격이 눈에 띄게 늘었고, 이미 여러 건의 기술 유출 시도가 있었다. AI로 자사 시스템의 취약점을 먼저 찾아 막겠다는 건 이제 선택이 아닌 필수다.

앤트로픽이 동시에 던진 경고

흥미롭게도, 앤트로픽은 미토스를 파트너사에 공개하는 것과 비슷한 시기에 'AI 에이전트를 위한 제로 트러스트' 보안 백서도 발표했다. 내용을 요약하면 이렇다. AI 에이전트를 기업 시스템에 연결할 때, 기존 보안 방식으로는 충분하지 않다.

백서가 지목한 주요 위협은 프롬프트 인젝션, 도구 오용, 권한 상속, 메모리 오염, 공급망 위험 다섯 가지다. 이 중 가장 현실적인 위협은 프롬프트 인젝션이다. 외부 입력값을 통해 AI에게 원래 의도와 다른 명령을 실행시키는 방식인데, 에이전트 기반 시스템이 늘어날수록 이 공격 벡터도 덩달아 커진다.

블로그 10년 하면서 보안 관련 글을 꽤 썼는데, 솔직히 이건 좀 아이러니하다. 앤트로픽이 "AI 에이전트가 이렇게 위험할 수 있다"는 경고를 공개하면서, 동시에 세상에서 가장 강력한 보안 AI를 몇몇 기업에만 쥐어주고 있다. 이게 방어인지 독점인지, 경계가 흐릿하다.

신뢰의 문제로 귀결된다

AI가 기업 보안의 1차 방어선이 되는 세상은 이제 거의 확실해 보인다. 미토스가 그 미래를 가장 먼저 보여주는 모델이라는 점은 인정한다.

그런데 이건 긍정적이기만 한 이야기가 아니다. 지금 글래스윙에 들어간 기업들은 미토스를 방어 목적으로 쓴다고 하지만, 그 경계를 어떻게 검증할 수 있을까. 앤트로픽이 내부 가이드라인을 아무리 촘촘히 만들어도, 이 모델을 손에 쥔 기업이 실제로 뭘 하는지는 결국 신뢰의 문제다.

더 단순한 질문도 있다. SKT가 해킹당하면 클로드 미토스도 같이 흘러나올 수 있다. 그 상황을 앤트로픽은 어떻게 막을 생각인지, 아직 공개된 답은 없다.