MS 3종 모델·Gemma 4·Codex 개편 물결

🤖 AI 뉴스·서비스
MS·Google, AI 모델 독립 선언
💡 핵심: 하루 만에 MS 3종 모델 + Google Gemma 4 출시 — 오픈AI·중국 모델 양쪽에 정면 도전

Microsoft가 자체 개발한 MAI-Transcribe-1(음성→텍스트), MAI-Voice-1(텍스트→음성), MAI-Image-2(이미지 생성) 3종 모델을 공개했습니다. MAI-Transcribe-1은 기존 Azure Fast 대비 2.5배 빠른 전사 속도로 25개 언어를 지원하며, MAI-Voice-1은 단 1초 안에 60초짜리 음성을 생성할 수 있습니다. 세계 최대 광고그룹 WPP가 MAI-Image-2를 대규모 크리에이티브 작업에 즉시 도입할 정도로 엔터프라이즈 수요가 뜨겁습니다. 같은 날 Google DeepMind는 Gemma 4를 Apache 2.0 오픈소스 라이선스로 공개했는데, 이전 Gemma 시리즈의 제한적 라이선스 때문에 기업 도입을 꺼렸던 팀들이 이제 법적 부담 없이 상업적으로 활용할 수 있게 됐습니다. OpenAI도 Codex의 기업용 요금제를 종량제(pay-as-you-go)로 전환하며 ChatGPT Business 가격을 시트당 월 25달러에서 20달러로 인하했습니다.

👉 이렇게 써봐: MS Copilot·Teams·Bing이 자체 MAI 모델로 교체되면 음성 회의록 자동 생성, AI 발표 슬라이드 초안 작성 등이 6개월 내 기본 기능으로 자리 잡을 가능성이 높습니다.
🔗 자세히 보기
🛠️ 개발자 도구
OpenAI Codex, 팀 종량제로 문턱 낮춰
💡 핵심: 고정 시트비 0원 — 쓴 만큼만 내는 코딩 AI, 1월 대비 사용자 6배 급증

OpenAI Codex는 GPT 기반 AI 코딩 에이전트로, 멀티파일 편집·PR 리뷰·CI 자동화까지 처리하는 '개발팀의 AI 동료'입니다. 이번 개편으로 ChatGPT Business·Enterprise 팀이 고정 시트비 없이 토큰 소비량 기준으로 요금을 내는 Codex 전용 시트를 추가할 수 있게 됐습니다. 요금 제한(rate limit)도 없어 대형 코드베이스 작업이나 야간 배치 작업에도 막힘이 없습니다. 1월 이후 ChatGPT Business·Enterprise 내 Codex 사용자가 6배 늘었을 만큼 실제 업무 도입이 빠르게 확산 중이며, Notion·Ramp 같은 테크 기업들이 이미 엔지니어링 워크플로 가속에 활용하고 있습니다.

🎯 실전 활용: 중간 규모 스타트업 팀이 새 기능 스프린트 기간에 Codex-only 시트를 일시적으로 추가해 PR 리뷰·버그 픽스를 자동화하고, 스프린트가 끝나면 시트를 제거해 비용을 최소화하는 탄력적 운영이 가능합니다.
👉 이렇게 써봐: ChatGPT Business를 이미 쓰는 팀이라면 워크스페이스 설정에서 'Codex-only 시트 추가'를 눌러 바로 시작할 수 있습니다. 한시적으로 신규 시트당 최대 100달러 크레딧도 제공합니다.
🔗 자세히 보기
🔓 오픈소스 실전
Gemma 4: Apache 2.0 로컬 멀티모달
💡 핵심: 누적 다운로드 4억 회 돌파 + Apache 2.0 첫 적용 — 라즈베리파이부터 RTX GPU까지 실행 가능

Google DeepMind가 공개한 Gemma 4는 E2B(2.3B), E4B(4.5B), 26B MoE, 31B Dense 4가지 크기로 출시됐으며, 모두 Apache 2.0 라이선스로 상업적 수정·재배포가 자유롭습니다. 이전 Gemma 시리즈는 기업 법무팀의 라이선스 검토에서 번번이 걸렸지만, 이번 Apache 2.0 전환으로 그 장벽이 사라졌습니다. 31B 모델은 Arena AI 텍스트 리더보드 오픈 모델 3위에 올랐고, E2B 모델은 라즈베리파이에서도 거의 지연 없이 실행될 만큼 경량화됐습니다. 텍스트·이미지·음성을 모두 처리하며, 128K(소형)~256K(대형) 컨텍스트 윈도우와 140개 이상의 언어를 지원해 로컬 코드 어시스턴트부터 온디바이스 에이전트까지 폭넓게 활용할 수 있습니다.

💻 요구 사양: E2B/E4B: RAM 4GB 이상, GPU 불필요(CPU 실행 가능), Android·Raspberry Pi 포함 / 26B MoE: VRAM 8GB 이상 권장(RTX 3080급) / 31B Dense: VRAM 16GB 이상 권장 / Windows·Mac·Linux 모두 지원
설치·시작: ollama pull gemma4:e4b # 또는 huggingface-cli download google/gemma-4-e4b-it 후 ollama run gemma4:e4b 로 즉시 실행
👉 이렇게 써봐: E4B 모델을 로컬 코드 리뷰 봇으로 세팅하거나, 26B MoE를 사내 문서 요약 API 서버로 띄워 외부 클라우드에 데이터를 보내지 않는 프라이빗 AI 인프라를 구축할 수 있습니다.
🔗 자세히 보기
오늘의 AI 트렌드
오늘 뉴스의 공통 흐름은 'AI의 내재화(in-house)'입니다. Microsoft는 OpenAI 의존도를 줄이고자 자체 모델 스택을 쌓고, Google은 라이선스 장벽을 허물어 기업 로컬 배포를 열었으며, OpenAI는 가격 구조를 유연하게 바꿔 팀 단위 도입을 가속합니다 — 개발 생태계 전체가 '빌려 쓰는 AI'에서 '직접 소유하는 AI'로 무게중심을 옮기고 있습니다.

댓글

이 블로그의 인기 게시물

반도체·플랜트·광반도체·배터리소재 동시 점화

트럼프 이란 강공에 코스피 패닉, 인버스·해운·알루미늄 폭발

호르무즈 봉쇄·스테이블코인·나이키의 3중 충격