딥시크 V4 가격 확정, GPT-5.5 30분의 1 — AI 가격 전쟁 재점화

5월 22일, 딥시크가 V4 Pro의 임시 할인을 영구화했다. 4월 말 출시하면서 내걸었던 "5월 31일까지만" 75% 프로모션을 그냥 정식 가격으로 굳혀버린 것이다. 발표 방식도 조용했다. Hacker News에 "DeepSeek makes the V4 Pro price discount permanent"라는 짧은 포스팅이 올라왔고, Engadget이 받아쓴 게 전부다. 하지만 이 결정이 AI 업계에 던지는 파장은 조용하지 않다.

현재 딥시크 V4 Pro의 공식 가격은 입력 1M 토큰당 $0.435, 출력 1M 토큰당$ 0.87이다. GPT-5.5 출력 비용( $25/M)과 비교하면 약 29분의 1이다. Claude Opus 4.7($ 15/M)과 비교해도 17분의 1 수준이다. 캐시 히트 가격은 더 극단적이다. 입력 캐시의 경우 $0.003625/M인데, GPT-5.5 캐시 입력($ 0.5/M)의 약 140분의 1이다. 오픈AI와 앤스로픽이 흡수하지 못하는 가격 공간을 딥시크가 계속 파고들고 있다.

V4는 R1의 후속이 아니다

지난 1월 딥시크 R1이 등장했을 때 AI 업계가 흔들렸던 이유는 성능보다 효율이었다. 비슷한 추론 성능을 훨씬 적은 비용으로 낸다는 것이 충격이었다. V4는 그 연장선이지만 아키텍처 자체가 다르다.

V4 Pro는 1.6조 파라미터 MoE(혼합 전문가) 구조다. 경량 버전인 V4 Flash는 2840억 파라미터다. 두 모델 모두 약 33조 토큰으로 학습됐다. 기술적으로 눈에 띄는 건 딥시크가 자체 개발한 mHC(Manifold-Constrained Hyper-Connections)라는 학습 프레임워크다. 학습 안정성과 효율을 동시에 높이는 구조인데, 이 때문에 비슷한 성능을 더 적은 연산 자원으로 달성했다고 딥시크 측은 주장한다. 장기 컨텍스트 처리를 위한 Engram Memory 기법도 들어갔다.

그리고 오픈소스다. Apache 2.0 라이선스로 공개돼 있어서 누구든 자체 서버에 올려 쓸 수 있다. 데이터가 외부 API를 통해 나가는 걸 꺼리는 기업에게는 이게 실질적인 이점이다. 가격 뿐 아니라 데이터 주권 측면에서도 선택지가 생긴 것이다.

코딩 벤치마크: 프론티어급에 닿았다

성능 얘기를 솔직하게 하자면, V4 Pro는 코딩 분야에서 인상적이다.

SWE-bench Verified는 실제 깃허브 이슈를 자율적으로 해결하는 능력을 측정하는 벤치마크다. 현재 업계에서 AI 코딩 에이전트 능력의 기준선으로 많이 쓰인다. 여기서 V4 Pro는 80.6%, Claude Opus 4.7은 80.8%다. 소수점 0.2% 차이다. 사실상 동점이라고 봐야 한다.

LiveCodeBench에서는 V4 Pro 93.5%, Claude 88.8%로 딥시크가 오히려 앞선다. 알고리즘 코딩 실력에서 프론티어 모델을 제친 오픈소스 모델이 나온 것이다. Terminal-Bench 2.0에서도 V4 Pro 67.9%, Claude 65.4%로 딥시크가 위다.

10년 가까이 개발 관련 글을 쓰면서 이런 숫자를 많이 봤는데, 이건 그냥 흘려듣기 어려운 수치다. "오픈소스니까 어느 정도 뒤처진다"는 암묵적 가정이 코딩 분야에서만큼은 깨진 것이다.

코딩 벤치마크 비교 차트, 딥시크 V4 vs Claude Opus 4.7

여전히 뒤처지는 영역

공평하게 보자면 V4의 약점도 분명하다.

HLE(Humanity's Last Exam)는 최상위 학술 추론 능력을 보는 시험이다. 여기서 V4 Pro는 37.7%인데, Claude는 40.0%, Gemini 3.1 Pro는 44.4%다. SimpleQA 사실 검색에서도 V4 57.9% 대 Gemini 75.6%로 차이가 크다. 복잡한 추론 흐름이나 멀티모달 처리, 긴 에이전트 루프에서는 여전히 Claude와 GPT가 더 안정적이라는 평가가 많다.

결론을 먼저 말하면, V4는 "코딩 집중 + 비용 최소화"가 최우선인 팀에게는 당장 진지하게 검토할 만한 선택지다. 반면 복잡한 추론, 사실 검색 정확도, 범용 에이전트 작업이 중요한 곳은 아직 Claude나 GPT-5.5가 더 적합하다.

이 가격이 업계에 던지는 충격

딥시크의 전략은 단순하다. 성능 격차를 가격 차이로 압도해서 시장 점유율을 선점하겠다는 거다.

실제로 먹힌다. AI 스타트업이나 중소 SaaS 팀 입장에서 월 API 비용이 수십만 원에서 수백만 원씩 나가는 상황에서, 동급 성능을 1/30 비용으로 처리할 수 있다면 마이그레이션을 진지하게 고려하게 된다. 딥시크 가격 인하 소식이 뜰 때마다 개발자 커뮤니티에서 "오픈AI 떠날 이유가 또 생겼다"는 반응이 나오는 게 그냥 나오는 게 아니다.

오픈AI는 이에 대해 Codex 코딩 에이전트, workspace 통합, 실시간 음성 API 등으로 플랫폼화 전략을 가속하고 있다. 단순 API 가격 경쟁에서 벗어나 생산성 플랫폼으로 포지셔닝하려는 것이다. 전략적으로는 맞는 방향이다. 하지만 개발자들이 실제로 지갑을 여는 곳은 결국 원시 API 비용이고, 여기서의 격차가 30배라는 건 무시하기 어렵다.

앤스로픽도 비슷한 압박을 받는다. Claude Opus 4.7은 현재 시장에서 가장 뛰어난 모델 중 하나라는 평가를 받고 있지만, V4 Pro가 코딩 성능에서 동급이라는 게 데이터로 확인되면 코딩 에이전트나 자동화 파이프라인 고객들의 이탈 가능성이 올라간다.

딥시크가 계속 이 게임을 주도하는 이유

솔직히 V4 출시 초기에는 "프론티어급에는 못 미친다"는 평가가 지배적이었다. 실제로 추론이나 사실 지식 쪽에서는 격차가 있으니까. 그런데 한 달 만에 가격을 영구 인하했다.

이 패턴은 딥시크 R1 때도 봤다. 처음에는 "GPT-4o보다 추론 성능이 낫다"는 충격이었고, 그 다음은 그 성능을 훨씬 저렴하게 제공한다는 충격이었다. V4는 R1보다 성능은 더 높아지고 가격은 더 공격적으로 잡았다. 이 패턴이 V5, V6로 계속 이어진다면 미국 빅테크 AI 기업들이 순수 API 가격 경쟁에서 우위를 유지하기가 점점 어려워질 것이다.

물론 제약도 있다. 딥시크에 대한 데이터 보안 우려는 기업 도입의 실질적 걸림돌이다. 학습 데이터 처리 방식, 중국 서버 경유 여부 등에 대한 불안이 기업 고객 쪽에서 여전히 크다. 미국 정부가 중국 AI 모델 사용에 추가 규제를 가할 가능성도 완전히 배제할 수 없다. 그런데 오픈소스라 자체 서버에 올리면 이 문제가 상당 부분 해소된다는 것도 사실이다.

AI 가격 전쟁 재점화, 딥시크 vs OpenAI vs Anthropic

5월 22일의 가격 영구화는 조용한 뉴스였지만, 실질적으로는 딥시크가 "이 가격으로 계속 간다"는 선언이다. AI 가격 전쟁이 다시 시작됐다.