Published on

2조 AI GPU 사업, 삼성SDS·네이버클라우드 선정 — AWS는 왜 탈락했나

Authors
  • Name
    Twitter

과기정통부가 2조805억원짜리 AI GPU 데이터센터 사업의 우선협상대상자를 확정했다. 삼성SDS, 네이버클라우드, 엘리스그룹 컨소시엄이다. 아마존웹서비스(AWS)와 KT는 탈락했다.

솔직히 AWS가 떨어질 거라고 생각한 사람은 많지 않았을 거다. 국내 공공 클라우드 시장에서 AWS의 점유율과 레퍼런스를 생각하면 이런 규모 사업에서 당연히 포함되는 이름이었다. 그런데 결과는 달랐다. 탈락의 핵심 이유는 하나였다 — 엔비디아의 차세대 GPU 아키텍처, 베라루빈(Vera Rubin) 수용 능력.

이 결과가 앞으로 국내 AI 클라우드 판도에 어떤 의미를 갖는지 뜯어봤다.

2조짜리 사업을 따낸 곳

이 사업의 공식 명칭은 국가전략기술 AI 컴퓨팅 인프라 구축 사업이다. 과기정통부와 정보통신산업진흥원(NIPA)이 주관하며, 총 사업비 2조805억원으로 단일 IT 공공 사업으로는 국내 역대 최대 규모다. 국가 AI 경쟁력 강화를 위해 민간 데이터센터에 대규모 GPU 컴퓨팅 자원을 확보하겠다는 취지다.

선정된 컨소시엄은 삼성SDS가 주관사를 맡고, 네이버클라우드와 엘리스그룹이 참여사로 이름을 올렸다. 삼성SDS는 경기도 동탄 데이터센터를, 네이버클라우드는 경기도 고양 하이퍼스케일 데이터센터를 사업 기반으로 제안한 것으로 알려져 있다. 엘리스그룹은 AI 교육·개발 플랫폼을 운영하는 소프트웨어 전문 기업으로, 컨소시엄 내 AI 플랫폼 스택 담당 역할을 맡은 것으로 보인다.

목표 GPU 수량은 엔비디아 블랙웰 기준 최대 1만5,000장이다. 단순 수치로는 와닿지 않는데, 현재 국내 주요 클라우드 기업들이 보유한 고성능 GPU를 전부 합산해도 이 숫자를 넘기기 어렵다는 게 업계 중론이다. 국내 AI 컴퓨팅 자원이 이번 사업 하나로 단숨에 수배 이상 늘어나는 셈이다.

베라루빈이 판을 갈랐다

국가 AI GPU 데이터센터 구축 사업

이번 사업자 평가에서 가장 결정적인 기준은 엔비디아의 차세대 GPU 아키텍처, 베라루빈 수용 능력이었다. 베라루빈은 현재 블랙웰의 후속 제품으로, 2027년부터 본격 공급이 시작될 것으로 전망된다. 엔비디아가 공개한 로드맵에 따르면 베라루빈은 블랙웰 대비 AI 연산 성능이 크게 향상되는 동시에, 물리적 구조와 전력 요구 스펙도 상당히 달라진다.

정부가 이 기준을 핵심 평가 항목으로 삼은 이유는 분명하다. 2조원을 들여 짓는 인프라가 20282030년까지도 경쟁력을 유지해야 한다. 지금 블랙웰로 채워놓고 12년 후 베라루빈이 나올 때 전환하려면 데이터센터 설계 자체가 이를 수용할 수 있어야 한다. 전력 인프라, 냉각 방식, 랙 구조가 달라지면 설계를 처음부터 다시 해야 할 수도 있다. 인프라를 새로 짓는 지금이 아니면 이 부분을 반영하기 어렵다는 판단이다.

삼성SDS와 네이버클라우드 컨소시엄이 이 부분에서 높은 점수를 받은 것으로 전해진다. 두 회사 모두 엔비디아와의 파트너십이 두껍다. 삼성은 HBM 공급망을 통해 엔비디아 하드웨어 로드맵에 깊숙이 관여하고 있고, 네이버클라우드는 국내 최초 초대규모 언어 모델인 하이퍼클로바X를 수천 장의 A100으로 훈련시킨 경험이 있다. 이 경험과 파트너십이 베라루빈 대응 설계에서 차이를 만들었을 것이다.

AWS·KT가 탈락한 이유

AI 클라우드 경쟁 구도

AWS가 탈락한 건 기술 평가 점수만의 문제는 아닐 가능성이 있다. 공공 데이터 주권 이슈가 암묵적으로 작용했을 수 있다. 2조원짜리 국가 전략 AI 인프라를 외국계 기업에 맡기는 게 정치적으로 부담이 될 수 있다. 물론 공식 평가 기준에 명시된 내용은 아니다. 그런데 이 규모의 국가 전략 사업에서 그게 전혀 고려 밖이라고 보기도 어렵다.

기술적 측면에서도 불리함이 있었다. AWS는 자체 AI 가속기인 트레이니엄(Trainium)과 인퍼런티아(Inferentia)에 투자를 집중해왔다. 이번 사업이 엔비디아 GPU 중심으로 설계되다 보니, AWS의 독자 반도체 전략이 오히려 약점으로 작용했을 수 있다. 베라루빈 대응 계획을 엔비디아 파트너십 기준으로 평가하는 상황에서, 자체 칩 생태계를 주로 밀어온 AWS는 구조적으로 불리했을 거다.

KT의 탈락은 상대적으로 납득이 간다. KT는 공공 클라우드 사업을 꾸준히 해왔지만, 하이퍼스케일 데이터센터 인프라와 최신 GPU 확보 능력에서 삼성SDS-네이버클라우드 연합과는 격차가 있다는 평가를 받아왔다. 특히 네이버클라우드가 실제 AI 서비스 운영 경험을 바탕으로 구체적인 기술 로드맵을 제시했다면, KT가 같은 수준으로 경쟁하기는 어려웠을 것이다.

삼성SDS·네이버클라우드는 무엇을 내세웠나

삼성SDS 동탄 데이터센터는 삼성전자 공장 클러스터 인근에 위치한다. 대규모 GPU 클러스터 운영에 필수적인 안정적 전력과 냉각 인프라를 갖추고 있다는 게 핵심 강점이다. 동탄 일대는 삼성전자 캠퍼스를 중심으로 IT 인프라가 밀집한 지역이라 전력망 수용 능력이 이미 검증돼 있고, 향후 증설도 유리한 위치다.

네이버클라우드는 고양 하이퍼스케일 데이터센터를 제안했다. 네이버가 직접 운영하는 대규모 AI 서비스들을 이 시설에서 처리하면서 쌓은 운영 노하우가 강점이다. 네이버 검색, 클로바, 하이퍼클로바X까지 고트래픽 AI 워크로드를 실제로 돌려본 회사와 그렇지 않은 회사는 분명히 다르다.

엘리스그룹의 역할은 AI 플랫폼 레이어다. 하드웨어 인프라를 구축해도 그 위에서 모델을 파인튜닝하고 배포할 수 있는 소프트웨어 플랫폼이 있어야 실제로 쓸 수 있다. 엘리스가 그 역할을 맡은 것으로 보인다. 정부가 이 인프라를 연구기관이나 스타트업에 개방할 경우, 사용자가 접근하는 인터페이스가 엘리스 플랫폼이 될 가능성이 높다.

GPU 1만5천 장의 무게

국내 AI 인프라와 엔비디아 GPU 클러스터

숫자를 뜯어보면 이 사업의 규모가 조금 더 실감된다. 엔비디아 블랙웰 B200 한 장 시장가가 현재 3만4만 달러 수준으로 알려져 있다. 1만5,000장이면 GPU 구매 비용만 한화 기준 4,500억6,000억원 수준이다. 여기에 서버 하우징, 네트워크 인프라, 냉각 시설, 데이터센터 임차 및 운영비까지 더하면 2조원이 나오는 계산이다.

이 인프라가 완성되면 국내 AI 생태계에 실질적인 변화가 생길 수 있다. 지금 한국에서 대형 AI 모델을 훈련하려면 선택지가 두 가지다. 수천억 원을 들여 자체 인프라를 구축하거나, AWS나 구글 클라우드 같은 해외 플랫폼에 의존하거나. 중소기업이나 스타트업, 대학 연구실에게 두 선택지 모두 현실적이지 않다.

공공 인프라가 제대로 열리면 그 장벽이 낮아진다. 연구기관, 스타트업, 대학이 접근할 수 있게 되면 한국 AI 연구 생산성이 올라간다. 다만 '제대로 열리는가'는 별개의 문제다. 이 부분은 아직 구체적으로 확정된 내용이 없다. 개방 범위와 이용 요금, 우선 배정 기준을 어떻게 설계하느냐에 따라 이 인프라가 실제로 생태계 자원이 될지, 소수 기관만 쓰는 폐쇄형 시설이 될지 갈린다.

이 사업이 갖는 진짜 의미

10년 넘게 IT 산업 변화를 지켜보면서 느끼는 건, 인프라 사업이 생각보다 훨씬 큰 파급력을 갖는다는 거다. 2010년대 초 정부 클라우드 전환 사업이 AWS 도입의 물꼬를 텄고, 그게 결국 국내 기업들의 클라우드 채택 속도를 앞당겼다. 이번 GPU 사업도 비슷한 흐름이 될 수 있다.

삼성SDS와 네이버클라우드가 2조원짜리 AI 인프라를 직접 운영하게 되면, 그 경험이 기업 AI 서비스로 곧장 연결된다. 고객사 입장에서는 국내에 검증된 대형 레퍼런스가 생기는 셈이고, 두 회사 입장에서는 기술력을 크게 끌어올릴 수 있는 기회다. AWS가 탈락한 것도 이 맥락에서 의미가 있다. 2조원이 한국 IT 생태계 안에서 돌게 됐다. 투자가 국내에 쌓이면 기술도 쌓인다.

다만 이 사업이 실제로 잘 굴러가려면 넘어야 할 산이 있다. 국내 대형 공공 IT 사업들이 예산은 막대해도 실제 활용도가 낮은 경우가 적지 않았다. GPU 1만5,000장이 제대로 쓰이려면 개방성과 운영 효율성이 담보돼야 한다. 고성능 컴퓨팅 자원이 통계 수치 채우기용으로 방치되는 일은 없어야 하는데, 그건 사업자보다 정부 운영 방식에 달린 문제다.

삼성SDS·네이버클라우드 컨소시엄이 우선협상대상자로 선정됐지만, 최종 계약까지는 협상 절차가 남아있다. 사업 규모와 구체 사양, 개방 운영 모델 등이 협상 과정에서 조율된다. 앞으로 몇 달 간 이 사업의 세부 구조가 확정될 텐데, 그게 한국 AI 생태계에 실질적인 기회가 되느냐를 결정하는 진짜 변수다.