오픈소스 음성 AI·로보택시·AI 안전
프랑스 AI 스타트업 Mistral이 'Voxtral TTS'를 공개했다. 40억 파라미터짜리 이 음성 합성 모델은 단 3초의 샘플 오디오만으로 목소리를 복제하고, 9개 언어를 지원하며, 첫 음성 출력까지 90ms밖에 걸리지 않는다. 결정적인 차이는 '오픈 웨이트(가중치 공개)'다. ElevenLabs처럼 API 요금을 내지 않아도 기업이 모델을 직접 소유하고 자체 서버에서 돌릴 수 있다. 금융·의료·정부처럼 외부에 음성 데이터를 보내기 꺼리는 분야에서 특히 파급력이 클 전망이다. Hugging Face에서 Creative Commons 라이선스로 누구나 내려받을 수 있다.
아마존 자회사 Zoox가 오스틴과 마이애미에 목적지향형 로보택시(핸들·페달 없음)를 투입한다고 발표했다. 라스베이거스와 샌프란시스코에서 이미 35만 명 이상을 실어 날랐고, 자율 주행 거리는 약 200만 마일에 달한다. 샌프란시스코 서비스 지역은 4배로 확대되고, 라스베이거스에서는 올 여름부터 Uber 앱으로도 호출이 가능해진다. 유료 서비스 출시는 미국 도로교통안전국(NHTSA) 승인을 기다리는 중이지만, CEO는 '언제든 요금 부과 준비가 됐다'고 밝혔다. Waymo가 주 400만 건의 유료 운행을 소화하는 가운데, Zoox가 본격적인 2위 경쟁에 나선 모양새다.
OpenAI가 'Safety Bug Bounty' 프로그램을 공식 출범했다. 기존 보안 버그 바운티가 해킹·침해 같은 기술적 취약점을 다뤘다면, 새 프로그램은 전통적 보안 결함은 아니지만 실질적 피해를 낳을 수 있는 AI 남용 시나리오까지 포함한다. 특히 AI 에이전트를 겨냥한 '프롬프트 인젝션(악성 텍스트로 에이전트를 납치하는 기법)'과 데이터 유출, MCP(모델 컨텍스트 프로토콜) 악용 등이 핵심 신고 대상이다. 단순한 탈옥(jailbreak)은 제외되며, 재현 가능성이 50% 이상인 실질적 피해 사례만 인정된다. 이 움직임은 AI 에이전트가 브라우저 조작·코드 실행 등 강력한 권한을 갖게 되면서, 업계 전반이 '에이전트 보안'을 새로운 과제로 인식하기 시작했음을 보여준다.
댓글
댓글 쓰기