[AI 뉴스] 2026-04-22 — Google TPU 8세대 듀얼 칩, DeepSeek V4 1조 파라미터 임박, OpenAI 프라이버시 필터

AI News · 조회 3
#AI #뉴스

오늘 AI 업계는 구글이 Cloud Next 2026에서 학습·추론 전용 TPU 8세대 듀얼 칩을 공개하고, 딥시크가 1조 파라미터 V4 모델 출시를 앞두고 있으며, 오픈AI가 개인정보 보호 전용 오픈웨이트 모델을 발표하는 등 인프라·모델·프라이버시 전 영역에서 굵직한 뉴스가 쏟아졌습니다.

Google — Cloud Next 2026 핵심 발표

  1. TPU 8세대, 사상 첫 듀얼 칩 전략 — 구글이 8세대 텐서 처리 장치(TPU)를 학습 전용 TPU 8t(코드명 Sunfish)와 추론 전용 TPU 8i(코드명 Zebrafish)로 분리 발표했습니다. TPU 8t는 최대 9,600개 칩과 2페타바이트(PB)의 공유 고대역 메모리를 단일 슈퍼팟으로 구성할 수 있으며, 이전 세대 Ironwood 대비 처리 성능 3배, 가격 대비 성능 2.8배 향상되었습니다. TPU 8i는 에이전틱 추론의 저지연 요구사항에 최적화되었으며, 온칩 SRAM을 3배 증가시켜 대규모 KV 캐시를 칩 위에서 직접 처리합니다. 추론 가격 대비 성능은 80% 개선되었습니다. 원문
  2. Gemini Enterprise Agent Platform — 멀티스텝 워크플로를 자율 실행하는 에이전트를 구축·테스트·배포할 수 있는 통합 프레임워크입니다. Agent Registry(내부 도구 인덱싱)와 Agent Gateway(실시간 정책 집행·컴플라이언스를 담당하는 '관제탑') 기능을 포함합니다. 원문
  3. 에이전틱 AI 파트너 펀드 7.5억 달러(약 1.1조원) — 12만 파트너 생태계에 AI 프로토타이핑, 에이전트 구축·배포, 업스킬링 지원을 위한 대규모 투자를 발표했습니다. 원문
  4. Workspace Intelligence — 구글 워크스페이스에 AI 기능을 통합한 새로운 브랜드도 함께 공개되었습니다. 원문

DeepSeek — V4 출시 임박, 1조 파라미터 멀티모달

  1. 스펙 — 1조(1T) 파라미터 MoE(혼합 전문가) 모델이며, 토큰당 약 370억 파라미터를 활성화합니다(V3과 유사). 컨텍스트 윈도우는 100만(1M) 토큰으로 대폭 확장되었습니다.
  2. 성능 — SWE-bench에서 81%를 달성했으며, 예상 가격은 입력 기준 $0.30~0.50/M 토큰으로 GPT-4o($2.50/M) 대비 5~8배 저렴합니다.
  3. 핵심 기술 — Engram — 조건부 메모리 아키텍처(Conditional Memory Architecture)로, 초장문 입력에서 관련 정보를 선택적으로 저장·검색하는 메커니즘입니다. 기존 장문 모델의 가장 어려운 문제인 '긴 입력에서 실제로 관련 정보를 찾아내는 것'을 해결합니다.
  4. 멀티모달 전환 — V3의 텍스트 전용에서 네이티브 멀티모달로 전환됩니다. 후처리(Late-fusion) 방식이 아닌 사전학습 단계부터 멀티모달을 직접 통합합니다.
  5. 인프라 — 화웨이 최신 칩에서 구동 예정(Reuters 보도). 알리바바가 투자를 논의 중이며, 중국 AI 모델 다운로드 점유율이 미국을 추월했다는 분석도 나왔습니다. 원문

OpenAI — Privacy Filter 오픈웨이트 공개

  1. 모델 구조 — 15억(1.5B) 파라미터의 양방향(Bidirectional) 토큰 분류 모델입니다. 일반적인 자기회귀(Autoregressive) 대규모 언어 모델(LLM)과 달리, 문장을 양방향으로 동시에 분석하여 문맥 이해도를 높였습니다.
  2. 기능 — 텍스트에서 개인식별정보(PII)를 탐지하고 마스킹합니다. 이름, 연락처, 물리 주소, 이메일, URL, 계정번호, 날짜, 비밀번호/API 키 등 8개 카테고리를 지원합니다.
  3. 레이블링 — BIOES(Begin, Inside, Outside, End, Single) 체계를 사용하여, 예를 들어 "John"을 이름의 시작으로 식별하면 "Smith"를 해당 이름의 연속 또는 끝으로 정확히 분류합니다.
  4. 성능 — PII-Masking-300k 벤치마크에서 F1 96% 달성. Apache 2.0 라이선스로 GitHub·HuggingFace에 공개되어 온프레미스에서 실행 가능합니다.
  5. 한계 — 익명화 도구나 컴플라이언스 인증을 대체할 수 없으며, 언어별 성능 편차가 있고 짧은 문장에서 과도하게 삭제할 수 있습니다. 원문

Anthropic — AI 메가 얼라이언스 구축

  1. 마이크로소프트, 엔비디아, 앤트로픽이 전략적 파트너십을 체결하며 'AI 메가 얼라이언스'를 구축했습니다. 세 기업의 클라우드·GPU·모델 역량을 결합한 대규모 협력 체제입니다. 원문
  2. 캔바(Canva)가 앤트로픽과 협업하여 수백만 사용자에게 AI 기반 디자인 기능을 제공한다고 발표했습니다. 디자인 도구에 Claude 모델이 직접 통합됩니다. (Canva Announces Anthropic Collaboration to Bring AI-Powered Design to Millions) 원문

Mistral AI — 유럽 AI 주권의 새 길

  1. 미국·중국 중심의 AI 패권 경쟁 속에서 유럽 독자 노선을 모색하는 미스트랄 AI가 주목받고 있습니다. 유럽연합(EU)의 AI 규제 프레임워크와 맞물려 '규제 친화적 AI 모델'이라는 차별화 전략을 구사하고 있습니다. 원문

오늘의 한 줄 인사이트

구글의 TPU 8세대 듀얼 칩 전략과 7.5억 달러 에이전틱 AI 투자는 'AI 칩 전쟁'이 범용에서 목적별 특화로 전환되고 있음을 보여주며, 딥시크 V4의 '70배 저렴한 AI'와 오픈AI의 프라이버시 필터 오픈소스화는 AI 산업의 경쟁축이 성능에서 가격·신뢰로 이동하고 있다는 강한 신호입니다.