MS 3종 모델·Gemma 4·Codex 개편 물결
Microsoft가 자체 개발한 MAI-Transcribe-1(음성→텍스트), MAI-Voice-1(텍스트→음성), MAI-Image-2(이미지 생성) 3종 모델을 공개했습니다. MAI-Transcribe-1은 기존 Azure Fast 대비 2.5배 빠른 전사 속도로 25개 언어를 지원하며, MAI-Voice-1은 단 1초 안에 60초짜리 음성을 생성할 수 있습니다. 세계 최대 광고그룹 WPP가 MAI-Image-2를 대규모 크리에이티브 작업에 즉시 도입할 정도로 엔터프라이즈 수요가 뜨겁습니다. 같은 날 Google DeepMind는 Gemma 4를 Apache 2.0 오픈소스 라이선스로 공개했는데, 이전 Gemma 시리즈의 제한적 라이선스 때문에 기업 도입을 꺼렸던 팀들이 이제 법적 부담 없이 상업적으로 활용할 수 있게 됐습니다. OpenAI도 Codex의 기업용 요금제를 종량제(pay-as-you-go)로 전환하며 ChatGPT Business 가격을 시트당 월 25달러에서 20달러로 인하했습니다.
OpenAI Codex는 GPT 기반 AI 코딩 에이전트로, 멀티파일 편집·PR 리뷰·CI 자동화까지 처리하는 '개발팀의 AI 동료'입니다. 이번 개편으로 ChatGPT Business·Enterprise 팀이 고정 시트비 없이 토큰 소비량 기준으로 요금을 내는 Codex 전용 시트를 추가할 수 있게 됐습니다. 요금 제한(rate limit)도 없어 대형 코드베이스 작업이나 야간 배치 작업에도 막힘이 없습니다. 1월 이후 ChatGPT Business·Enterprise 내 Codex 사용자가 6배 늘었을 만큼 실제 업무 도입이 빠르게 확산 중이며, Notion·Ramp 같은 테크 기업들이 이미 엔지니어링 워크플로 가속에 활용하고 있습니다.
Google DeepMind가 공개한 Gemma 4는 E2B(2.3B), E4B(4.5B), 26B MoE, 31B Dense 4가지 크기로 출시됐으며, 모두 Apache 2.0 라이선스로 상업적 수정·재배포가 자유롭습니다. 이전 Gemma 시리즈는 기업 법무팀의 라이선스 검토에서 번번이 걸렸지만, 이번 Apache 2.0 전환으로 그 장벽이 사라졌습니다. 31B 모델은 Arena AI 텍스트 리더보드 오픈 모델 3위에 올랐고, E2B 모델은 라즈베리파이에서도 거의 지연 없이 실행될 만큼 경량화됐습니다. 텍스트·이미지·음성을 모두 처리하며, 128K(소형)~256K(대형) 컨텍스트 윈도우와 140개 이상의 언어를 지원해 로컬 코드 어시스턴트부터 온디바이스 에이전트까지 폭넓게 활용할 수 있습니다.
댓글
댓글 쓰기