MS 보안 AI가 클로드·GPT 제치고 1위 — 윈도우 취약점 16개도 스스로 찾아냈다

보안 업계에서 AI가 취약점을 찾는다는 얘기는 꽤 오래됐다. 그런데 실제로 대형 기업의 실제 제품에서, 사람보다 먼저, 치명적인 구멍을 발견해낸 사례는 지금까지 거의 없었다. 이번엔 달랐다.

마이크로소프트가 5월 12일(현지시간) 자사 보안 블로그를 통해 공개한 'MDASH'는 AI 에이전트 100개 이상을 하나의 파이프라인으로 연결한 사이버보안 시스템이다. 이 시스템이 윈도우 코드베이스를 직접 분석해 취약점 16개를 찾아냈고, 그 중 4개는 심각한 수준의 결함으로 분류됐다. 전부 그날 패치 튜즈데이를 통해 수정됐다.

마이크로소프트 MDASH 보안 AI 시스템 — 100개 에이전트가 코드를 분석하는 제어 화면

KAIST 출신 한국인이 MS 본사에서 해킹을 막는다

MDASH를 만든 핵심 인물이 KAIST 출신 김태수 조지아텍 컴퓨터공학과 교수다. 지금은 마이크로소프트 에이전트 보안 부사장을 겸하고 있다. 작년 미국 방위고등연구국(DARPA)이 최초로 개최한 'AI 사이버 챌린지(AIxCC)'에서 1위를 차지한 팀 애틀랜타를 이끌었고, 그 연장선에서 MS와 협력해 이 프로젝트를 주도했다.

보안 분야에서 한국인 연구자가 이 정도 역할을 하는 경우가 흔치 않아서, 나는 이 부분이 더 크게 다뤄졌어야 했다고 생각한다. 국내 언론은 대부분 벤치마크 숫자에 집중하고 김 부사장 이름은 단신 수준으로 처리했는데, 사실 DARPA 대회 1위부터 MS 핵심 프로젝트까지 이어지는 흐름 자체가 꽤 드라마틱하다.

88.4% 대 83.1%, 클로드를 넘어선 숫자

벤치마크 얘기를 안 할 수가 없다. UC 버클리 연구진이 만든 '사이버짐(CyberGym)'은 현재 사이버보안 AI 분야에서 가장 공신력 있는 평가 기준으로 꼽힌다. 188개 오픈소스 프로젝트에서 추출한 실제 취약점 재현 과제 1,507개를 AI 시스템에 던지고, 얼마나 정확히 탐지·재현하는지를 측정한다.

MDASH는 여기서 88.4%를 기록해 리더보드 1위에 올랐다. 앤트로픽 미토스(Mythos)가 83.1%, OpenAI GPT-5.5가 81.8%였다.

수치만 보면 5~6%p 차이라 별거 아닌 것처럼 보일 수 있다. 그런데 이 격차가 단순히 파인튜닝으로 나온 게 아니다. MDASH는 애초에 단일 모델이 아니다. 보안이라는 목적에 맞게 여러 에이전트를 조합한 시스템 전체가 하나의 '경쟁자'로 나선 것이다. 범용 AI와 전문 시스템의 싸움에서 전문 시스템이 이긴 건데, 그 마진이 이 정도라는 게 오히려 흥미롭다.

100개 에이전트가 분업하는 방식

MDASH의 이름 자체가 구조를 설명한다. 'Multi-model Agentic Scanning Harness', 즉 여러 모델을 에이전트 형태로 묶어 스캐닝하는 틀이다.

안을 들여다보면 여섯 단계로 나뉜다. 코드 준비(code preparation), 취약점 스캔(scanning), 결과 검증(validation), 중복 제거(deduplication), 공격 증명 생성(proof generation), 패치 검증(patch validation). 각 단계마다 특화된 에이전트 그룹이 따로 배정돼 처리하는 구조다.

단일 모델이 처음부터 끝까지 처리하는 방식과 결이 다르다. 한 에이전트가 잠재적 취약점을 스캔하면 별도의 그룹이 "이게 실제로 악용 가능한가"를 따로 검토한다. 중복이 걸러지고, 패치까지 자동으로 검증된다. 사람으로 치면 분석가, 침투 테스터, 검토자, 패치 담당자가 나뉜 보안 팀이 움직이는 것과 비슷하다.

이런 구조가 왜 강점인지는 실전 결과가 보여준다. 단일 모델이 "취약점 같아 보이는데"로 끝나는 경우가 많은 데 반해, MDASH는 실제 악용 가능성 검증까지 이어지고 패치까지 추천한다.

실제 윈도우에서 치명적 결함 4개를 찾아냈다

벤치마크보다 더 인상적인 건 실전 성과다. MS는 MDASH를 자사 윈도우 코드베이스에 직접 적용했다. 탐지된 취약점 총 16개, 그 중 4개는 치명적 수준(critical)으로 분류됐다. 이 취약점들은 5월 12일 패치 튜즈데이를 통해 전부 수정됐다.

버그 바운티 프로그램에서 외부 해커가 해왔던 일을 AI가 내부에서 먼저 해낸 셈이다.

보안 업계가 오랫동안 말해온 '사전 침투 테스트 자동화'가 실제로 대형 기업 제품에 적용된 첫 공개 사례다. 지금까지는 포C(개념 증명) 수준의 시연이 대부분이었는데, MDASH는 실제 코드에서 실제 패치로 이어진 루프를 완성했다.

앞으로 보안 AI 경쟁이 달라진다

MS는 MDASH를 현재 제한된 고객 대상 비공개 프리뷰로 운영 중이다. 정식 출시 시점은 미정이다.

구글, 앤트로픽, OpenAI도 각자의 보안 AI 제품을 개발 중인 건 분명하다. 다만 MDASH처럼 멀티 에이전트 파이프라인을 통해 실제 취약점 발견부터 패치 검증까지 자동화한 사례가 공개된 건 지금까지 없었다.

범용 AI 모델 경쟁과 별개로, 특정 도메인에 특화된 에이전트 시스템이 범용 모델을 앞지르는 흐름이 보안 분야에서 가장 먼저 가시화되고 있다. MDASH가 그 신호탄이다. 앞으로 다른 도메인에서도 비슷한 구조의 전문 에이전트 시스템이 나올 것이고, 그때 범용 AI 모델들이 어떻게 대응하는지가 흥미롭다.

AI 보안 경쟁의 1라운드, MS가 선수를 쳤다.