2026.03.21 오늘의 AI 핵심 뉴스
젠슨 황 CEO는 GTC 2026 기조연설에서 블랙웰·베라 루빈 AI 칩 수주 규모가 2027년까지 최소 1조 달러에 달할 것이라고 선언했다. 이는 1년 전 전망치인 5000억 달러의 두 배다. 핵심 신제품은 차세대 AI 슈퍼컴퓨터 플랫폼인 '베라 루빈'으로, 전작 대비 추론(inference) 토큰 비용을 10분의 1로 낮추겠다는 목표를 내세웠다. 엔비디아는 동시에 기업용 AI 에이전트 프레임워크 'NemoClaw'를 공개했는데, 이는 오픈소스 에이전트 플랫폼 OpenClaw에 기업 보안·정책 레이어를 얹은 구조다. 황 CEO는 '모든 SaaS 기업이 에이전트 서비스 기업이 될 것'이라며, AI 인프라 경쟁이 훈련(training)에서 추론·에이전트 실행으로 무게중심이 옮겨가고 있음을 못 박았다.
OpenAI가 Python 개발자 생태계의 핵심 오픈소스 도구인 uv(패키지 관리), Ruff(린터·포매터), ty(타입 체커)를 만든 스타트업 Astral을 인수한다고 발표했다. Astral의 세 도구는 모두 Rust로 작성돼 기존 Python 도구보다 월등히 빠르며, 이미 수억 건의 월간 다운로드를 기록하는 등 현대 Python 개발의 기반이 됐다. OpenAI의 목표는 Codex를 단순 코드 생성에서 벗어나 의존성 관리·코드 품질 검사·환경 설정까지 개발 전 주기를 다루는 에이전트로 진화시키는 것이다. 경쟁사 Anthropic이 2025년 12월 JavaScript 런타임 Bun을 인수해 Claude Code를 강화한 것과 같은 맥락으로, 코딩 AI 전쟁이 '더 스마트한 모델'을 넘어 '더 깊이 통합된 개발 도구'로 전선을 넓히고 있다.
Mistral AI가 공개한 Small 4는 기존에 별개로 유지하던 추론 모델(Magistral), 비전 모델(Pixtral), 코딩 에이전트(Devstral)를 단 하나로 통합한 오픈소스 모델이다. 구조는 총 1190억 개의 파라미터를 128명의 '전문가' 소규모 네트워크로 나눠 토큰당 4명만 활성화하는 MoE(전문가 혼합) 방식으로, 실제 연산 비용은 65억 파라미터 수준에 머문다. 개발자는 'reasoning_effort' 파라미터 하나로 빠른 일상 응답과 심층 추론 사이를 실시간으로 오갈 수 있어, 서버에 여러 모델을 띄울 필요가 없어진다. 전작(Small 3) 대비 응답 지연은 40% 줄고 처리량은 3배 늘었으며, 주요 코딩 벤치마크에서 GPT-OSS 120B를 앞서면서도 출력 길이는 더 짧아 실질 비용이 낮다. Apache 2.0 라이선스로 상업 이용·파인튜닝·재배포가 모두 자유롭다.
댓글
댓글 쓰기