MS 자체 AI 3종·OpenAI $852B·Claude코드 유출
Microsoft가 자체 개발한 MAI-Transcribe-1(음성→텍스트), MAI-Voice-1(음성 생성), MAI-Image-2(이미지 생성) 세 모델을 동시 공개했습니다. MAI-Transcribe-1은 25개 언어 기준 평균 오류율 3.8%로 OpenAI Whisper-large-v3를 모든 언어에서 앞선다고 Microsoft는 밝혔으며, Teams 회의 전사(轉寫)에 바로 투입됩니다. MAI-Voice-1은 단 1분짜리 샘플로 브랜드 전용 목소리를 만들 수 있어 콜센터·콘텐츠 업계에 직접 도전장을 냅니다. 같은 날 OpenAI는 Amazon·Nvidia·SoftBank로부터 총 $110B를 조달해 기업 가치가 $852B에 달했고, Anthropic의 Claude Code는 npm 패키징 실수로 50만 줄 소스코드가 전 세계에 유출되는 초유의 사건을 겪었습니다. 한편 Google DeepMind CEO Demis Hassabis가 X에 다이아몬드 이모지를 게시하고, Gemma 4가 LMSYS Arena에서 'significant-otter'라는 이름으로 목격되며 오픈소스 진영의 다음 카드도 임박했다는 신호를 보내고 있습니다.
Claude Code는 터미널에서 자연어 명령으로 파일 편집·git 워크플로·멀티 에이전트 병렬 실행까지 처리하는 AI 코딩 에이전트입니다. 3월 한 달간 컴퓨터 사용(화면 클릭·브라우저 제어) 기능이 Pro·Max 사용자에게 추가됐고, Claude Opus 4.6 기준 최대 출력 토큰이 128k로 확장됐습니다. 이번 소스 유출로 자기회복 메모리(MEMORY.md 포인터 구조), KAIROS(백그라운드 상시 에이전트), 44개 미공개 기능 플래그 등 내부 로드맵이 공개됐습니다 — 경쟁사들이 참고할 청사진이 된 셈입니다. 현재 npm v2.1.88은 삭제됐으며, Anthropic은 네이티브 인스톨러 사용을 공식 권장합니다.
Gemma 3는 Google DeepMind가 공개한 오픈웨이트 모델로, 1B·4B·12B·27B 네 가지 크기에 128K 컨텍스트·140개 이상 언어·이미지 입력까지 지원합니다. Ollama와 결합하면 API 키나 클라우드 없이 맥·윈도우·리눅스 어디서든 명령어 한 줄로 실행할 수 있습니다. 4B 모델은 RAM 4GB 이상이면 대부분의 노트북에서 구동되며, QAT(Quantization-Aware Training) 버전은 일반 모델 대비 메모리를 최대 3배 절감합니다. Gemma 4 출시가 임박한 지금, Gemma 3로 파이프라인을 미리 구축해두면 업그레이드 전환 비용이 거의 없습니다.
댓글
댓글 쓰기