에이전트 전쟁, 보안 AI, Gemini 도약

🤖 AI · #1
MS·Anthropic 연합, 사무실을 점령하다
💡 핵심: M365 Copilot 유료 좌석 전년 대비 160% 급증 — 에이전트 AI가 기업 소프트웨어의 새 기준이 됐다.

마이크로소프트는 오늘 Anthropic과 공동 개발한 'Copilot Cowork'를 발표했다. 단순한 질답(Q&A)을 넘어, 이메일·회의·파일을 넘나들며 수분에서 수시간짜리 복합 업무를 자율적으로 처리하는 에이전트 기능이다. 핵심은 'Work IQ'라는 맥락 엔진 — 사용자의 Outlook, Teams, Excel 데이터를 통합해 AI가 회사 내부 사정을 파악한 채 일을 처리한다. Anthropic의 Claude Cowork가 로컬 기기에서 실행되는 것과 달리, Copilot Cowork는 M365 테넌트 클라우드 안에서 돌아가 기업 보안·감사 체계를 그대로 유지한다. MS는 동시에 모든 기능을 묶은 M365 E7 패키지를 월 $99/인에 출시했고, AI 에이전트 거버넌스 툴 'Agent 365'도 정식 출시했다.

👉 이렇게 써봐: Copilot Cowork는 3월 말 Frontier 프로그램을 통해 일반 기업에 공개된다. 지금 당장 주목할 점은 '모델 다양성' 전략 — MS가 OpenAI 단독 의존에서 벗어나 Anthropic Claude를 M365 전면에 도입했다는 사실이다. 기업 AI 도입을 검토 중이라면, 특정 벤더에 lock-in되지 않는 멀티모델 환경을 요구하는 것이 협상력을 높이는 전략이 될 수 있다.
🤖 AI · #2
Gemini 3.1: 두뇌와 반사신경을 동시에
💡 핵심: Flash-Lite, 입력 100만 토큰당 $0.25 — 전 세대 대비 속도 45% 향상, 가격은 경쟁사의 4분의 1.

구글 딥마인드는 이번 주 Gemini 3.1 시리즈를 완성했다. 복잡한 추론용 '3.1 Pro'는 ARC-AGI-2 벤치마크에서 77.1%를 기록하며 새 이전 세대 대비 추론 성능을 두 배로 끌어올렸고, 대용량 처리용 '3.1 Flash-Lite'는 1M 입력 토큰당 $0.25라는 파격적 가격에 속도는 전 세대 Flash 대비 2.5배 빠르다. 개발자들이 추론 강도를 직접 조절할 수 있는 '생각 레벨(thinking levels)' 기능도 탑재해, 단순 분류 작업엔 최소 연산, 복잡한 코딩엔 최대 추론을 상황에 따라 선택할 수 있다. Google은 '두뇌(Pro)와 반사신경(Flash-Lite)을 동시에 제공한다'는 전략으로, AI 모델 경쟁의 축을 성능 단일 경쟁에서 '비용 대비 추론 효율' 경쟁으로 이동시키고 있다.

👉 이렇게 써봐: Flash-Lite는 현재 Google AI Studio와 Vertex AI에서 프리뷰로 무료 사용 가능하다. 대규모 번역·콘텐츠 분류·UI 자동 생성 파이프라인을 운영 중이라면 기존 GPT-4o mini나 Claude Haiku 대비 비용 구조를 재검토해볼 시점이다. '생각 레벨' 조절 기능은 동일 모델로 저비용-고비용 작업을 혼합 처리할 수 있어, 인프라 단순화에도 유리하다.
🤖 AI · #3
AI가 보안 연구원이 됐다: Codex Security
💡 핵심: 베타 30일간 120만 커밋 스캔, 취약점 1만 건 이상 발견 — AI 코딩 시대의 역설적 방패.

OpenAI가 'Codex Security'를 리서치 프리뷰로 공개했다. 단순히 코드 패턴을 검색하는 기존 스캐너와 달리, 프로젝트 전체의 아키텍처를 파악해 '이 취약점이 실제 환경에서 악용 가능한지'를 샌드박스에서 직접 검증한 뒤 패치 코드까지 제안한다. 베타 테스트에서 오탐률(false positive)을 50% 이상 줄였고, 과장된 심각도 보고는 90% 이상 감소했다. OpenSSH, PHP, Chromium 등 주요 오픈소스 프로젝트에서 발견한 취약점 14건이 CVE(공식 취약점 데이터베이스)에 등록됐으며, 오픈소스 메인테이너를 위한 무료 접근 프로그램 'Codex for OSS'도 함께 출시됐다. AI가 코드 생성 속도를 폭발적으로 높이는 동시에, AI가 그 코드의 보안 허점을 스스로 찾아 수정하는 시대가 열리고 있다.

👉 이렇게 써봐: Codex Security는 현재 ChatGPT Enterprise·Business·Edu 고객에게 1개월 무료로 제공된다. GitHub 레포지토리를 직접 연동해 위협 모델을 자동 생성하는 방식이므로, 보안팀이 없는 스타트업이나 소규모 개발팀이 가장 큰 수혜를 받을 수 있다. 단, AI가 제안한 패치도 반드시 사람이 최종 검토해야 한다는 점 — 자동 적용이 아닌 PR(풀 리퀘스트) 방식이 기본값인 이유다.
오늘의 AI 트렌드
오늘 세 이야기의 공통 키워드는 '실행(execution)' — AI는 더 이상 답을 주는 데 그치지 않고, 업무를 위임받아 처리하고, 취약점을 직접 찾아 고치며, 대규모 작업을 저비용으로 자율 수행한다. 인간의 역할은 '질문하는 사람'에서 '방향을 설정하고 결과를 검토하는 사람'으로 빠르게 이동하고 있다.

댓글

이 블로그의 인기 게시물

반도체·플랜트·광반도체·배터리소재 동시 점화

트럼프 이란 강공에 코스피 패닉, 인버스·해운·알루미늄 폭발

호르무즈 봉쇄·스테이블코인·나이키의 3중 충격