AI 인프라·에이전트·모델의 격돌
젠슨 황은 3월 16일 새너제이 SAP 센터 무대에 올라 칩·소프트웨어·모델·응용까지 이른바 '풀스택' 비전을 발표했다. 주목할 포인트는 두 가지다. 하드웨어 측면에서는 차세대 GPU 아키텍처 '루빈(Rubin)'이 공개될 것으로 예상됐으며, 이 칩은 288GB HBM4 메모리와 현재 Blackwell 대비 최대 5배의 연산 성능을 갖출 것으로 알려졌다. 소프트웨어 측면에서는 기업용 AI 에이전트 오픈소스 플랫폼 'NemoClaw'가 발표될 가능성이 높다고 보도됐으며, 이는 기업들이 자체 시스템 전반에 AI 에이전트를 배포할 수 있는 구조를 제공한다. GTC에서 나오는 로드맵은 단순한 제품 발표를 넘어, 향후 12~18개월간 클라우드·스타트업·기업 IT 예산의 흐름을 사실상 결정한다.
Shopify 사장 Harley Finkelstein은 AI 쇼핑 에이전트가 이커머스 전체를 재편할 것이라고 공개적으로 밝혔다. 지금까지 디지털 비즈니스는 '클릭 = 인간의 의도'라는 20년 묵은 가정 위에 세워져 있었다. 하지만 소프트웨어 에이전트가 사용자를 대신해 웹을 탐색하고 구매를 결정하기 시작하면, 클릭·체류시간·전환율 같은 기존 지표는 모두 의미를 잃는다. Shopify는 이 변화에 대비해 플랫폼 구조 자체를 에이전트 친화적으로 전환하고 있으며, 이는 '사람이 UI를 탐색한다'는 UX 설계의 근본 전제를 흔드는 움직임이다.
구글 딥마인드는 Gemini 3 시리즈 중 가장 빠르고 비용 효율이 높은 모델인 Gemini 3.1 Flash-Lite를 공개했다. 고성능 플래그십 모델 경쟁이 치열한 가운데, 이 발표는 정반대 방향—'더 작고 더 싸게'—을 겨냥한다. 대규모 트래픽 처리, IoT 기기, 실시간 응답이 필요한 서비스에서 추론 비용(inference cost)은 서비스 생존을 좌우하는 핵심 변수다. Flash-Lite의 등장은 OpenAI의 GPT-4o mini, Anthropic의 Haiku와 같은 '경량 고효율' 경쟁이 2026년 AI 시장의 주요 전선임을 다시 확인해준다.
댓글
댓글 쓰기