Anthropic 연매출 $30B·Gemma 4 온디바이스 출격
Anthropic이 Google·Broadcom과 차세대 TPU 컴퓨트 계약을 대폭 확대하며 2027년부터 3.5기가와트 규모의 AI 연산 용량을 확보한다고 발표했습니다. 동시에 연환산 매출이 2025년 말 약 $9B에서 $30B을 돌파했으며, 연 $100만 이상 지출 기업 고객 수가 두 달 만에 500곳에서 1,000곳 이상으로 두 배 늘었습니다. OpenAI 역시 팟캐스트 네트워크 TBPN을 인수하며 미디어 확장에 나섰고, 구글 DeepMind는 Gemma 4·Gemini 3.1 Flash Live를 동시 공개했습니다. 인텔은 일론 머스크의 Terafab AI 칩 공장 프로젝트에 합류를 선언해 전통 반도체 기업도 AI 인프라 수주 경쟁에 참전했습니다. AI 수요 폭발이 클라우드·반도체·미디어 전 산업으로 파급 효과를 내고 있습니다.
Claude Code는 2026년 1분기에만 Remote Control(원격 세션 제어), Dispatch(API로 작업 큐잉), Channels, Computer Use(화면 클릭·폼 작성), Auto Mode, AutoDream을 연속 출시했습니다. 이 중 Computer Use는 GUI를 직접 조작해 UI 테스트·레거시 시스템 연동 같은 '코드만으로 자동화할 수 없던 영역'을 커버합니다. 최근 업데이트에서는 대용량 파일 Write 속도가 60% 향상되고 /powerup 인터랙티브 튜토리얼이 추가됐으며, Claude Sonnet 4.6 기반으로 에이전트 검색 성능과 토큰 효율이 개선됐습니다. Dispatch를 쓰면 CI 파이프라인에서 Claude Code를 Lambda처럼 비동기 작업 워커로 활용할 수 있어 팀 단위 자동화가 현실화됩니다.
Google DeepMind가 4월 2일 공개한 Gemma 4는 E2B·E4B·26B MoE·31B Dense 네 가지 크기로, 텍스트·이미지·오디오·영상을 모두 처리하는 멀티모달 오픈 모델 패밀리입니다. 31B 모델은 Arena AI 리더보드에서 오픈 모델 세계 3위를 기록했고, 26B MoE는 추론 시 실제 활성 파라미터가 3.8B에 불과해 4B급 속도로 동작합니다. 특히 E2B·E4B는 RAM 5GB(4비트 양자화) 환경에서도 로컬 실행이 가능하며, 최대 256K 토큰 컨텍스트와 140개 언어를 지원합니다. llama.cpp, MLX, transformers, Ollama 등 주요 추론 엔진이 모두 첫날 지원을 시작했고, Apache 2.0 라이선스로 상업 배포에도 제약이 없어 기업용 온프레미스 배포 수요가 빠르게 몰리고 있습니다.
댓글
댓글 쓰기