오늘의 AI 뉴스 브리핑 3선
일론 머스크가 3월 21일 오스틴의 폐발전소 무대에서 'Terafab'을 공식 발표했다. Tesla·SpaceX·xAI 3사가 공동으로 운영하는 이 반도체 공장은 오스틴 기가팩토리 인근 부지에 들어서며, 목표 생산량은 연간 1테라와트(TW)의 컴퓨팅 파워다. 칩은 두 종류로 나뉜다 — Optimus 로봇과 자율주행 차량용 추론 칩, 그리고 우주 궤도 AI 데이터센터용 'D3 칩'. 머스크는 현존 공급사들이 자신의 확장 속도를 따라잡지 못한다며 "칩이 필요하니 직접 짓는다"고 밝혔다. 하지만 TSMC가 애리조나 공장 6개에 1,650억 달러를 수년간 쏟아부었다는 점을 감안하면, 선언과 실현 사이의 간극은 결코 좁지 않다.
아마존이 AWS 오스틴 칩 연구소를 언론에 처음으로 공개했다. 현재 3세대에 걸쳐 140만 개의 Trainium 칩이 배포됐으며, Anthropic의 Claude는 그 중 100만 개 이상의 Trainium2 위에서 구동된다. 핵심은 타이밍이다 — 아마존은 OpenAI에 500억 달러를 투자하며 Trainium 컴퓨팅 용량 2기가와트(GW)를 공급하기로 했고, 애플도 Trainium 칩을 AI 워크로드에 테스트 중인 것으로 알려졌다. 전문가들은 OpenAI가 엔비디아 에코시스템 밖에서 자발적으로 Trainium을 선택했다는 사실 자체가 플랫폼 검증의 강력한 신호라고 평가한다. 현재 엔지니어들은 이미 Trainium4를 설계 중이다.
미스트랄AI가 3월 17일 Mistral Small 4를 출시했다. 총 1,190억 파라미터의 MoE(전문가 혼합) 구조지만, 토큰당 활성 파라미터는 60억 개에 불과해 추론 비용이 대폭 낮다. 가장 주목할 혁신은 `reasoning_effort` 파라미터 — 개발자가 요청마다 '빠른 응답 모드'와 '단계별 심층 추론 모드'를 동적으로 전환할 수 있다. 이로써 추론·비전(Pixtral)·에이전트 코딩(Devstral) 세 모델을 따로 운영하던 복잡한 스택을 단일 엔드포인트로 통합할 수 있게 됐다. Apache 2.0 라이선스로 상업적 활용과 자체 호스팅이 자유롭다는 점은 금융·의료 등 규제 산업에 특히 매력적이다.
댓글
댓글 쓰기