에이전트가 현실을 바꾸는 법
글로벌 이커머스 기업 라쿠텐은 OpenAI의 코딩 에이전트 Codex를 CI/CD 파이프라인에 직접 연결해, 장애 발생 시 로그 분석부터 패치 제안까지 자동화했다. 그 결과 평균 복구 시간(MTTR)이 약 50% 줄었고, 엔지니어는 코드를 한 줄씩 짜는 대신 '무엇을 원하는지 명확히 정의하고 결과를 검증하는' 역할로 전환됐다. 한 프로젝트에서는 Python/FastAPI 백엔드와 Swift/SwiftUI iOS 앱을 포함한 풀스택 솔루션을 인간의 단계별 지시 없이 완성했고, 개발 기간은 한 분기에서 몇 주로 단축됐다. 라쿠텐 외에도 Cisco, Nvidia, Ramp, Harvey 등이 이미 Codex를 개발팀 전반에 도입했다는 점은 이 흐름이 실험 단계를 넘어섰음을 보여준다.
오픈소스 AI 에이전트 플랫폼 NanoClaw가 Docker와 손잡고, 에이전트를 마이크로VM(초소형 가상머신) 안에서 실행하는 방식을 공개했다. 일반 컨테이너가 호스트 OS의 커널을 공유하는 것과 달리, Docker Sandbox의 마이크로VM은 독립된 커널과 하드웨어 공간을 가져 진정한 의미의 격리를 실현한다. NanoClaw는 이미 각 에이전트를 개별 컨테이너에 가두고 있었는데, 이번 파트너십으로 '컨테이너가 VM 안에, VM이 호스트 밖에' 있는 이중 격리 구조가 완성됐다. Docker COO는 이를 두고 "에이전트는 처음부터 컨테이너의 불변성 원칙을 위반한다 — 시작하자마자 환경을 뒤지고, 패키지를 설치하고, 파일을 쓰려 한다"고 설명했다. 예측 불가능한 AI 모델을 예측 가능한 컴퓨터 시스템에 안전하게 연결하는 문제는 아직 풀리지 않았지만, 이 구조는 현재로서 가장 현실적인 '경계선'으로 평가받는다.
Google DeepMind가 Gemini 3 시리즈의 가장 빠르고 저렴한 모델, Gemini 3.1 Flash-Lite를 개발자 프리뷰로 공개했다. 이전 세대인 Gemini 2.5 Flash 대비 출력 속도가 45% 빠르며, 초당 307토큰 이상을 처리해 실시간 고빈도 워크플로에 최적화됐다. 1M 토큰의 초대형 컨텍스트 창을 지원하며, 번역·콘텐츠 분류·UI 생성 같은 반복 대량 작업을 겨냥한다. 6가지 주요 벤치마크에서 GPT-5 mini와 Claude 4.5 Haiku를 앞서며 같은 가격대 최강 모델 자리를 노린다. 단, 아직 프리뷰 단계로 SLA(서비스 수준 협약)가 없으므로 프로덕션 미션 크리티컬 용도에는 신중한 검토가 필요하다.
댓글
댓글 쓰기