AI 주권·아키텍처·맥락의 3대 전선
지금까지 대부분의 기업은 OpenAI나 Anthropic의 모델을 빌려 쓰거나, 기존 모델을 살짝 손보는 파인튜닝(fine-tuning)에 의존해 왔다. 그러나 Mistral AI가 공개한 Forge는 다른 길을 제안한다. 기업의 내부 문서, 코드베이스, 운영 절차를 처음부터 학습시켜 '우리 회사만의 AI 모델'을 바닥부터 만드는 플랫폼이다. Mistral이 자사 모델 훈련에 쓰는 데이터 파이프라인 레시피와 전문 엔지니어를 함께 제공한다는 점에서, 이 모델은 소프트웨어 판매보다 IBM·Palantir식의 '임베디드 전문가' 서비스에 가깝다. ASML, 유럽우주국, Ericsson 같은 데이터 민감 산업의 파트너를 이미 확보했고, CEO Arthur Mensch는 올해 연간 반복매출(ARR) $1B 돌파를 예고하고 있다.
ChatGPT 이후 모든 AI 모델의 기반이 된 트랜스포머(Transformer) 아키텍처는 강력하지만 치명적 약점이 있다. 문장이 길어질수록 연산량이 제곱으로 늘어나는 것이다. Carnegie Mellon과 Princeton 연구진이 Apache 2.0 오픈소스 라이선스로 공개한 Mamba-3는 '상태 공간 모델(SSM, State Space Model)'이라는 대안 구조로 이 문제를 정면 돌파한다. 16,384 토큰 길이 기준으로 Meta의 Llama-3.2-1B 대비 추론 완료 시간을 140초 대 976초로 단축했으며, 벤치마크 정확도는 트랜스포머 기준선 대비 약 4% 향상됐다. IBM Granite 4.0과 Nvidia Nemotron 등 대형 기업들이 이미 Mamba 기반 하이브리드 모델을 상용화에 올리기 시작했다는 점에서, 이번 릴리스는 단순 연구 논문을 넘어선 실전 신호탄이다.
2026년 기업 AI의 현실은 이렇다. 영업팀 에이전트가 말하는 '고객'과 물류팀 에이전트가 말하는 '고객'이 서로 다른 데이터를 가리키고 있다. Microsoft는 이 문제를 Fabric IQ 업데이트로 정면 겨냥했다. Fabric IQ의 비즈니스 온톨로지(ontology) — 기업의 개념, 관계, 규칙을 구조화한 지식 지도 — 를 MCP(Model Context Protocol)를 통해 타사 에이전트까지 포함한 모든 AI가 공유할 수 있게 개방한 것이다. Microsoft Fabric CTO Amir Netz는 이를 영화 '첫 키스만 50번째'에 비유했다.
댓글
댓글 쓰기