Anthropic 연매출 $30B·Gemma 4 온디바이스 출격

🤖 AI 뉴스·서비스
Anthropic 연매출 $30B·AI 인프라 전쟁
💡 핵심: 불과 3개월 만에 매출 3배(연율 $9B → $30B)—AI 군비경쟁이 실물 경제로 직결

Anthropic이 Google·Broadcom과 차세대 TPU 컴퓨트 계약을 대폭 확대하며 2027년부터 3.5기가와트 규모의 AI 연산 용량을 확보한다고 발표했습니다. 동시에 연환산 매출이 2025년 말 약 $9B에서 $30B을 돌파했으며, 연 $100만 이상 지출 기업 고객 수가 두 달 만에 500곳에서 1,000곳 이상으로 두 배 늘었습니다. OpenAI 역시 팟캐스트 네트워크 TBPN을 인수하며 미디어 확장에 나섰고, 구글 DeepMind는 Gemma 4·Gemini 3.1 Flash Live를 동시 공개했습니다. 인텔은 일론 머스크의 Terafab AI 칩 공장 프로젝트에 합류를 선언해 전통 반도체 기업도 AI 인프라 수주 경쟁에 참전했습니다. AI 수요 폭발이 클라우드·반도체·미디어 전 산업으로 파급 효과를 내고 있습니다.

👉 이렇게 써봐: Claude·ChatGPT 구독료 인상 및 사용 제한이 잇따를 수 있고, 기업용 AI 예산이 빠르게 커지고 있어 AI 도구 활용 역량이 취업·이직의 핵심 변수로 부상합니다.
🔗 자세히 보기
🛠️ 개발자 도구
Claude Code, Q1에만 6개 대형 기능 출격
💡 핵심: 터미널 안에서 코드 작성·테스트·배포까지—에이전트가 '혼자서' 한 사이클 완결

Claude Code는 2026년 1분기에만 Remote Control(원격 세션 제어), Dispatch(API로 작업 큐잉), Channels, Computer Use(화면 클릭·폼 작성), Auto Mode, AutoDream을 연속 출시했습니다. 이 중 Computer Use는 GUI를 직접 조작해 UI 테스트·레거시 시스템 연동 같은 '코드만으로 자동화할 수 없던 영역'을 커버합니다. 최근 업데이트에서는 대용량 파일 Write 속도가 60% 향상되고 /powerup 인터랙티브 튜토리얼이 추가됐으며, Claude Sonnet 4.6 기반으로 에이전트 검색 성능과 토큰 효율이 개선됐습니다. Dispatch를 쓰면 CI 파이프라인에서 Claude Code를 Lambda처럼 비동기 작업 워커로 활용할 수 있어 팀 단위 자동화가 현실화됩니다.

🎯 실전 활용: GitHub 이슈 하나를 Dispatch로 보내면 Claude Code가 브랜치 생성→코드 수정→테스트 실행→PR 초안 작성까지 무인 처리—개발자 리뷰 시간만 남길 수 있습니다.
👉 이렇게 써봐: npm install -g @anthropic-ai/claude-code 로 설치 후 claude 명령어로 바로 시작. Anthropic Max 플랜($100/월) 가입자라면 가장 빠르게 풀 기능을 체험할 수 있습니다.
🔗 자세히 보기
🔓 오픈소스 실전
Gemma 4: 폰에서 31B까지 로컬 멀티모달
💡 핵심: HuggingFace 업보트 681개 돌파·Apache 2.0 전면 오픈—상업용 제약 없는 구글 최강 오픈 모델

Google DeepMind가 4월 2일 공개한 Gemma 4는 E2B·E4B·26B MoE·31B Dense 네 가지 크기로, 텍스트·이미지·오디오·영상을 모두 처리하는 멀티모달 오픈 모델 패밀리입니다. 31B 모델은 Arena AI 리더보드에서 오픈 모델 세계 3위를 기록했고, 26B MoE는 추론 시 실제 활성 파라미터가 3.8B에 불과해 4B급 속도로 동작합니다. 특히 E2B·E4B는 RAM 5GB(4비트 양자화) 환경에서도 로컬 실행이 가능하며, 최대 256K 토큰 컨텍스트와 140개 언어를 지원합니다. llama.cpp, MLX, transformers, Ollama 등 주요 추론 엔진이 모두 첫날 지원을 시작했고, Apache 2.0 라이선스로 상업 배포에도 제약이 없어 기업용 온프레미스 배포 수요가 빠르게 몰리고 있습니다.

💻 요구 사양: E2B/E4B: RAM 5GB(4비트) / 15GB(16비트), CPU만으로도 가능. 26B MoE: RAM 18GB(4비트). 31B Dense: RAM 20GB(4비트). Windows/Mac(Apple Silicon)/Linux 모두 지원.
설치·시작: # Ollama로 바로 실행 (가장 간단) ollama run gemma4:e4b # 또는 llama.cpp GGUF 방식 (Mac MLX) curl -fsSL https://unsloth.ai/install.sh | sh && python -m mlx_lm chat --model unsloth/gemma-4-E4B-it-UD-MLX-4bit
👉 이렇게 써봐: E4B 모델로 로컬 코딩 어시스턴트·영수증 OCR·음성 전사 파이프라인을 인터넷 연결 없이 구축할 수 있습니다. 특히 개인정보가 민감한 의료·법무 문서 처리 앱에 즉시 적용 가능합니다.
🔗 자세히 보기
오늘의 AI 트렌드
오늘의 세 흐름을 관통하는 키워드는 '온디바이스 + 에이전트 + 인프라 군비경쟁'입니다. 클라우드 AI는 기업 인프라 필수재로 격상되고, 동시에 Gemma 4처럼 로컬에서 돌아가는 오픈 모델이 진짜 경쟁력을 갖추면서 AI 개발의 무게 중심이 '누가 더 큰 모델을 갖느냐'에서 '누가 데이터와 파이프라인을 통제하느냐'로 급격히 이동하고 있습니다.

댓글

이 블로그의 인기 게시물

반도체·플랜트·광반도체·배터리소재 동시 점화

트럼프 이란 강공에 코스피 패닉, 인버스·해운·알루미늄 폭발

호르무즈 봉쇄·스테이블코인·나이키의 3중 충격