🤖 AI 뉴스·서비스
AI가 일상 앱을 직접 조종한다
💡 핵심: ChatGPT가 Spotify·Uber·DoorDash를 대신 조작 — '말 한마디로 장보기·라이드 호출' 시대 개막
OpenAI가 ChatGPT에 DoorDash·Spotify·Uber 등 외부 앱 계정을 직접 연동하는 기능을 미국·캐나다 사용자에게 공개했다. 채팅창에 앱 이름을 입력하거나 설정→Apps and Connectors에서 한 번에 연결하면, ChatGPT가 플레이리스트를 만들거나 장바구니에 식재료를 채우는 행동을 직접 수행한다. OpenAI는 동시에 AI 코딩 도구 Codex의 요금 구조도 손봤다 — ChatGPT Business 기본 요금을 월 25달러에서 20달러로 낮추고, Codex 전용 시트는 고정 요금 없이 사용한 토큰만큼만 과금하는 종량제로 전환했다. 이미 매주 200만 명 이상의 개발자가 Codex를 사용 중이며, 1월 이후 기업 고객 사용량은 6배 증가했다. 한편 Google DeepMind는 Gemini 3 연구를 기반으로 만든 오픈소스 모델 Gemma 4를 Apache 2.0 라이선스로 공개하며 오픈소스 AI 생태계에 지각변동을 일으켰다.
👉 이렇게 써봐: ChatGPT 앱 연동은 '대화형 OS'의 첫 단계다. 6개월 내 OpenTable·PayPal·Walmart도 합류 예정이어서, 일상의 예약·결제·쇼핑이 AI 한 창에서 처리되는 환경이 빠르게 완성될 것이다. 직장인이라면 Codex 종량제 전환을 주목하라 — 팀 내 AI 코딩 도구 예산 책정 방식이 '구독 고정비'에서 '사용량 변동비'로 바뀐다.
🔗 자세히 보기
🛠️ 개발자 도구
OpenAI Codex CLI: 터미널 AI 짝꿍
💡 핵심: 터미널 한 줄로 레포지토리 전체를 읽고·수정하고·테스트까지 — 승인 버튼 하나로 PR 생성
Codex CLI는 터미널에서 실행되는 OpenAI의 오픈소스 코딩 에이전트로, 현재 디렉토리의 코드를 읽고 수정하며 명령어를 실행한다. '--suggest / --auto-edit / --full-auto' 세 가지 승인 모드로 자율도를 직접 조절할 수 있고, GitHub·CI/CD 파이프라인과도 연결된다. 최근 종량제 가격 전환과 함께 기업 고객의 사용이 급증했으며, Temporal·Superhuman 같은 스타트업들이 기능 개발 속도 향상·반복 테스트 자동화에 이미 실전 적용 중이다. macOS와 Linux 기본 지원, Windows는 WSL 환경에서 사용 가능하다.
🎯 실전 활용: Temporal 팀은 Codex CLI로 대규모 코드베이스 리팩터링·테스트 작성·버그 수정을 백그라운드에서 병렬 실행해 엔지니어가 핵심 작업에만 집중할 수 있는 환경을 구현했다. 'AGENTS.md' 파일 하나에 프로젝트 규칙을 적어두면 Codex가 코딩 컨벤션을 자동으로 따른다.
👉 이렇게 써봐: npm i -g @openai/codex 또는 brew install --cask codex로 설치 후 ChatGPT 계정으로 로그인하면 바로 시작 가능. 처음엔 --suggest 모드로 변경 내용을 눈으로 확인하며 신뢰도를 쌓고, 익숙해지면 --auto-edit으로 전환하는 것을 권장한다.
🔗 자세히 보기
🔓 오픈소스 실전
Gemma 4: 노트북에서 프론티어급 AI
💡 핵심: 출시 5일 만에 오픈모델 세계 랭킹 3위(31B) — Apache 2.0으로 상업 이용 완전 개방
Google DeepMind가 4월 2일 공개한 Gemma 4는 E2B·E4B·26B(MoE)·31B 네 가지 크기로 구성된 오픈소스 멀티모달 모델 패밀리다. Gemini 3 연구를 그대로 이식했고, 31B 모델은 Arena AI 텍스트 리더보드에서 오픈모델 3위(ELO 1452)를 기록하며 자신보다 20배 큰 모델들을 앞질렀다. AIME 2026 수학 벤치마크에서 Gemma 3 대비 무려 68포인트 상승(89.2%)했고, 코딩 벤치마크(LiveCodeBench)도 80%로 51포인트 뛰어올랐다. 140개 이상의 언어를 지원하며 이미지·오디오(E2B·E4B) 입력과 최대 256K 토큰 컨텍스트, 네이티브 함수 호출(function calling)·JSON 구조화 출력까지 갖춰 온디바이스 AI 에이전트 개발의 새 기준이 됐다.
💻 요구 사양: E4B(기본 추천): RAM 8GB 이상, GPU 없이 CPU만으로 실행 가능 / 31B(최고 성능): RAM 20GB 이상(4-bit 양자화 기준), NVIDIA RTX GPU 또는 Apple Silicon 24GB 권장 / Windows·macOS·Linux 모두 지원
⚡ 설치·시작: 1) Ollama 설치 후: ollama run gemma4:e4b (약 5GB 다운로드, E4B 기준) / 2) 또는 Hugging Face에서 직접: pip install transformers 후 google/gemma-4-E4B-it 모델 로드
👉 이렇게 써봐: 로컬 코딩 에이전트로 활용하려면 Ollama로 Gemma 4를 띄운 뒤 Codex CLI나 OpenCode 같은 터미널 코딩 에이전트에 localhost:11434를 로컬 API 엔드포인트로 연결하면 코드가 외부로 전송되지 않는 '완전 프라이빗 AI 개발 환경'을 무료로 구성할 수 있다.
🔗 자세히 보기
오늘의 AI 트렌드
오늘 세 가지 소식을 관통하는 키워드는 '에이전트의 일상화'다 — AI가 단순 답변을 넘어 앱을 조작하고(ChatGPT 통합), 코드를 자율 실행하고(Codex CLI), 개인 하드웨어에서 프론티어급 추론을 수행하는(Gemma 4 로컬) 방향으로 동시에 수렴하고 있으며, 클라우드 종속 없이도 에이전트 워크플로우를 구현할 수 있는 인프라가 빠르게 완성되고 있다.
댓글
댓글 쓰기