확산 모델이 언어를 덮치다: 패러다임 충돌의 주

현재 기술 좌표 — 0에서 1만까지
인류가 상상할 수 있는 기술의 완성점을 10,000으로 놓았을 때, 우리는 지금 어디쯤 있는가.
🧠 소프트웨어 AI2,741/10,000▲ +4
Google DeepMind의 DiffusionGemma(6/10 출시)가 기존 자동회귀(토큰 하나씩 생성) 방식 대신 확산(diffusion) 방식으로 H100 GPU 한 장에서 초당 1,000토큰 이상을 생성하며 4배 속도를 달성했고, Subquadratic의 SubQ는 12M 토큰 컨텍스트 창과 선형 스케일링 주의(attention) 구조로 아키텍처 전환 논쟁을 촉발했다. Anthropic Claude Code의 Artifacts 베타 출시로 AI 코딩 세션이 실시간 공유 대시보드로 변환되는 엔터프라이즈 워크플로우 혁신도 확인됐다.
🦾 피지컬 AI·로봇863/10,000▲ +2
IFR이 6/18 발표한 데이터에 따르면 2025년 미국 산업 로봇 설치 수가 전년 대비 11% 증가해 38,000대를 기록, 더블디짓 성장 회복이 확인됐다. Honor의 인간형 로봇 Lightning이 베이징 반마라톤을 50분 26초(인간 세계기록 57분 20초 대비 약 7분 단축)로 완주한 사건도 피지컬 AI 실증 이정표로 남아 있다. 다만 로봇들의 독립적 범용 작업 수행 능력은 아직 초기 단계.
⚡ 반도체·하드웨어1,712/10,000▲ +1
DiffusionGemma가 NVIDIA NVFP4 양자화(quantization, 숫자 정밀도를 낮춰 연산 속도를 높이는 기법)를 통해 소비자용 RTX 5090/4090 GPU 18GB VRAM 내에서 구동 가능함을 보여줬다. 이는 고성능 AI를 엣지(edge, 데이터센터가 아닌 개인 기기)로 내리는 하드웨어 최적화의 진전이나, 양자컴퓨팅 상용화나 집적도의 물리적 한계 돌파 소식은 없었다.
🔋 에너지 인프라618/10,000▲ +1
SubQ의 서브쿼드라틱(subquadratic) 구조가 기존 대비 연산량을 대폭 줄여 LLM 에너지 소비 감소 가능성을 시사했고, DiffusionGemma 역시 병렬 생성으로 전력 효율을 높이는 방향이다. 그러나 AI·로봇 인프라 전체를 감당할 청정에너지 공급 측의 획기적 발표는 오늘 없었다.
🧠 소프트웨어 AI 축 업데이트
DiffusionGemma: 텍스트 생성 패러다임 교체 시도
📍 좌표판에서의 의미: 거의 모든 AI 언어 모델은 단어를 왼쪽에서 오른쪽으로 한 토큰씩 순차 생성하는 '자동회귀(autoregressive)' 구조를 써왔다. DiffusionGemma는 이미지 생성 AI처럼 노이즈에서 시작해 전체 텍스트를 동시에 다듬는 '확산(diffusion)' 방식으로 이 공식을 정면으로 뒤집는다. 현재 좌표판에서 software_ai 축의 '속도·비용' 레이어를 직접 건드리는 사건이다.

Google DeepMind가 6월 10일 공개한 DiffusionGemma는 26B MoE(혼합 전문가, 전체 파라미터 중 3.8B만 활성화하는 구조) 모델로, 한 번에 256개 토큰을 병렬로 정제해 H100 GPU 1장에서 초당 1,000토큰 이상을 달성한다. 기존 자동회귀 모델 대비 최대 4배 빠른 속도다. Apache 2.0 라이선스로 누구나 무료 사용·수정이 가능하며, NVIDIA와 협력해 소비자용 RTX 4090/5090에서도 18GB VRAM으로 구동된다. 다만 Google 자신도 인정했듯 MMLU·코딩 벤치마크에서 표준 Gemma 4 대비 품질이 낮아 '속도가 최우선인 워크플로우'용으로 자리매김한다. 이 오픈 모델의 등장은 DiffusionGemma·SubQ·arXiv 논문들이 동시에 확산 언어 모델 가능성을 탐구하며 '다음 세대 텍스트 생성 엔진'을 둘러싼 아키텍처 전쟁에 불을 붙이고 있다는 신호다.

💰 투자·비즈니스 시각: 속도가 병목인 실시간 서비스(게임 NPC 대화, 실시간 번역, 코드 자동완성)에서 DiffusionGemma 기반 솔루션이 비용 우위를 가질 수 있다. 오픈소스이므로 스타트업이 빠르게 파인튜닝해 틈새 시장을 선점 가능. 반면 기존 자동회귀 모델 전문 인프라 기업(vLLM 단독 의존 사업자 등)은 diffusion 지원 스택으로의 전환 비용이 리스크가 될 수 있다. 단, 품질 격차가 좁혀지기 전까지 고정밀 엔터프라이즈 워크로드 교체는 시기상조.
🔗 자세히 보기
🧠 소프트웨어 AI 축 업데이트
Claude Code Artifacts: AI 코딩이 살아있는 대시보드가 되다
📍 좌표판에서의 의미: AI가 코드를 쓰는 것을 넘어, 그 결과물을 조직 전체가 실시간으로 보고 상호작용하는 '살아있는 워크스페이스'로 바꾸는 전환점이다. 기업 내 AI 도입 저항의 큰 이유인 '가시성 부족'을 직접 해결한다.

Anthropic이 6월 18일 Claude Code에 Artifacts 기능을 베타 출시했다. AI 코딩 세션의 결과물이 자동으로 라이브 HTML 웹페이지로 변환되어, PR 리뷰·인시던트 타임라인·릴리스 체크리스트 같은 문서를 팀원이 브라우저에서 실시간으로 보고 업데이트를 추적할 수 있다. 기본적으로 작성자에게만 비공개이며, 조직 내부로만 공유 범위를 제한해 컴플라이언스 요구를 충족시켰다. Anthropic의 연간 반복 매출(ARR)이 2025년 말 약 90억 달러에서 2026년 5월 470억 달러로 급증한 배경에는 Claude Code의 엔터프라이즈 확산이 있다. Artifacts는 AI 코딩 도구를 단순 '코드 생성기'에서 조직 소통 인프라로 격상시키는 수직 통합의 신호탄이다.

💰 투자·비즈니스 시각: AI 코딩 도구가 단순 개발자 생산성 툴에서 프로젝트 관리·문서화 플랫폼으로 영역을 확장하는 중이다. 기존 Confluence·Notion 같은 협업 문서 도구, Jira 같은 프로젝트 관리 툴이 직접 경쟁 위협을 받는다. 반면 Claude Team·Enterprise 플랜 채택을 검토하는 기업엔 실질적 워크플로우 자동화 ROI가 생긴다. Anthropic 경쟁사(GitHub Copilot, Cursor 등)도 유사 기능을 빠르게 추가할 것으로 예상돼 차별화 창이 6~12개월로 짧을 수 있다.
🔗 자세히 보기
🦾 피지컬 AI·로봇 축 업데이트
미국 산업 로봇 11% 성장, 하지만 중국은 10배
📍 좌표판에서의 의미: IFR의 6/18 최신 발표는 physical_ai 축의 '보급 속도' 레이어를 보여주는 지표다. 숫자의 증가보다 미국·중국 간 격차의 구조가 앞으로의 피지컬 AI 패권 경쟁 구도를 읽는 데 핵심이다.

국제로봇연맹(IFR)이 6월 18일 발표한 데이터에 따르면 2025년 미국 내 산업 로봇 설치 수가 전년 대비 11% 증가해 38,000대를 기록, 더블디짓 성장 궤도에 복귀했다. 식품 산업 도입이 30% 급증하며 비제조 분야가 회복을 이끌었다. 그러나 IFR 추정에 따르면 중국의 2025년 설치 수는 미국의 약 10배에 달할 것으로 보이며, 중국은 15차 5개년 계획에서 로봇을 경제 성장의 핵심 동력으로 명시했다. 미국의 로봇 밀도는 제조업 직원 1만 명당 307대로 세계 8위다. 규모의 격차가 곧 기술 경험치와 데이터 격차로 이어질 수 있다는 점이 피지컬 AI 경쟁의 핵심 변수다.

💰 투자·비즈니스 시각: 미국 내 식품·물류·국방 분야의 자동화 수요가 확실히 열리고 있다. GrayMatter Robotics처럼 국방 제조 자동화에 특화된 기업과 비제조업 특화 협동 로봇(cobot) 기업이 수혜를 받을 가능성이 높다. 반면 중국의 저비용·대량생산 로봇 하드웨어 공세에 노출된 미국 로봇 하드웨어 제조사는 관세 환경 변화와 공급망 위험을 함께 관리해야 한다.
🔗 자세히 보기
🚧 다음 관문 — 여기를 넘어야 레벨이 바뀐다
software_ai 축에서 다음 레벨(~3,000)로 진입하려면 세 가지 조건이 수렴해야 한다. ① SubQ의 서브쿼드라틱 어텐션이 독립 검증을 통과해 장문(long-context) AI 비용 구조를 실질적으로 무너뜨리거나, ② DiffusionGemma 계열 확산 모델이 자동회귀 모델과의 품질 격차를 좁혀 범용 적용 가능해지거나, ③ Apple의 온디바이스 Siri AI(iOS 27 기반)가 수십억 기기에 배포되어 '인터넷 연결 없이도 작동하는 개인 AI 에이전트' 시대가 열리는 것이다. physical_ai 축(~1,000 진입)은 Honor Lightning 수준의 이동 능력을 갖춘 로봇이 실험실 밖 비정형 환경에서 독립 작업을 수행하는 사례가 상용 규모로 등장해야 한다. 2027~2028년 사이가 가장 유력한 시점으로, 중국 로봇 기업들과 Figure·Tesla Optimus가 가장 가까운 경쟁자다.
🌌 10,000의 세계 — 기술이 완성됐을 때 인간의 하루
2040년대 어느 아침, 당신이 일어나면 집 안 로봇이 이미 냉장고를 정리하고 오늘 회의 요약을 음성으로 읽어준다. 출근길 자율주행 차 안에서 AI에게 복잡한 법률 계약서 검토를 맡기면, 인간 변호사 수준의 분석이 도착지 도달 전에 완료된다. 세상의 모든 공장과 물류 창고는 인간 감독자 없이 24시간 돌아가고, 에너지 그리드는 핵융합과 태양광 잉여 전력으로 AI 연산 비용이 사실상 0에 수렴해, 평범한 사람도 과거 억만장자도 살 수 없던 수준의 맞춤형 의료·교육·창작 서비스를 누린다.

댓글

이 블로그의 인기 게시물

반도체·플랜트·광반도체·배터리소재 동시 점화

트럼프 이란 강공에 코스피 패닉, 인버스·해운·알루미늄 폭발

호르무즈 봉쇄·스테이블코인·나이키의 3중 충격