에이전트 전쟁, 보안 AI, Gemini 도약
마이크로소프트는 오늘 Anthropic과 공동 개발한 'Copilot Cowork'를 발표했다. 단순한 질답(Q&A)을 넘어, 이메일·회의·파일을 넘나들며 수분에서 수시간짜리 복합 업무를 자율적으로 처리하는 에이전트 기능이다. 핵심은 'Work IQ'라는 맥락 엔진 — 사용자의 Outlook, Teams, Excel 데이터를 통합해 AI가 회사 내부 사정을 파악한 채 일을 처리한다. Anthropic의 Claude Cowork가 로컬 기기에서 실행되는 것과 달리, Copilot Cowork는 M365 테넌트 클라우드 안에서 돌아가 기업 보안·감사 체계를 그대로 유지한다. MS는 동시에 모든 기능을 묶은 M365 E7 패키지를 월 $99/인에 출시했고, AI 에이전트 거버넌스 툴 'Agent 365'도 정식 출시했다.
구글 딥마인드는 이번 주 Gemini 3.1 시리즈를 완성했다. 복잡한 추론용 '3.1 Pro'는 ARC-AGI-2 벤치마크에서 77.1%를 기록하며 새 이전 세대 대비 추론 성능을 두 배로 끌어올렸고, 대용량 처리용 '3.1 Flash-Lite'는 1M 입력 토큰당 $0.25라는 파격적 가격에 속도는 전 세대 Flash 대비 2.5배 빠르다. 개발자들이 추론 강도를 직접 조절할 수 있는 '생각 레벨(thinking levels)' 기능도 탑재해, 단순 분류 작업엔 최소 연산, 복잡한 코딩엔 최대 추론을 상황에 따라 선택할 수 있다. Google은 '두뇌(Pro)와 반사신경(Flash-Lite)을 동시에 제공한다'는 전략으로, AI 모델 경쟁의 축을 성능 단일 경쟁에서 '비용 대비 추론 효율' 경쟁으로 이동시키고 있다.
OpenAI가 'Codex Security'를 리서치 프리뷰로 공개했다. 단순히 코드 패턴을 검색하는 기존 스캐너와 달리, 프로젝트 전체의 아키텍처를 파악해 '이 취약점이 실제 환경에서 악용 가능한지'를 샌드박스에서 직접 검증한 뒤 패치 코드까지 제안한다. 베타 테스트에서 오탐률(false positive)을 50% 이상 줄였고, 과장된 심각도 보고는 90% 이상 감소했다. OpenSSH, PHP, Chromium 등 주요 오픈소스 프로젝트에서 발견한 취약점 14건이 CVE(공식 취약점 데이터베이스)에 등록됐으며, 오픈소스 메인테이너를 위한 무료 접근 프로그램 'Codex for OSS'도 함께 출시됐다. AI가 코드 생성 속도를 폭발적으로 높이는 동시에, AI가 그 코드의 보안 허점을 스스로 찾아 수정하는 시대가 열리고 있다.
댓글
댓글 쓰기