2026년 6월 29일 AI 업계 핵심 흐름
이번 주 글로벌 AI 업계의 시선은 크게 두 갈래로 모아지고 있습니다. 한쪽에서는 앤트로픽(Anthropic)이 자사 챗봇 클로드(Claude)의 사용자 신원 확인 절차를 강화하고, 미 정부 시스템을 대상으로 한 보안 테스트에서 자사 모델의 취약점 탐지 능력을 입증하면서 ‘AI 책임성’과 ‘안보 활용’ 논쟁이 동시에 격화되고 있습니다. 다른 한쪽에서는 중국 딥시크(DeepSeek)가 추론 속도를 최대 85%까지 끌어올리는 신기술 ‘D스파크(D-Spark)’를 오픈소스로 공개하며, 고가 반도체에 의존하지 않는 효율화 경쟁의 새로운 카드를 던졌습니다. 오늘은 이 세 가지 흐름을 차분히 짚어보겠습니다.
앤트로픽, 클로드 사용자 신원 확인 절차 도입
앤트로픽은 오는 7월 8일부터 특정 사용자에 한해 정부 발급 신분증을 요구하는 신원 확인 절차를 도입합니다. 대상이 되는 사용자는 여권, 운전면허증 등 공식 신분증을 제출해야 하며, 경우에 따라 셀카 또는 짧은 영상 촬영을 통해 얼굴 형상(face geometry) 데이터까지 수집될 수 있습니다. 단순한 본인 확인을 넘어 생체 정보까지 범위가 확장된다는 점에서 업계의 관심이 집중되고 있습니다.
인증 파트너 ‘페르소나’에 쏠리는 시선
신원 인증 절차를 실제로 처리하는 곳은 미국 샌프란시스코에 본사를 둔 인증 전문 기업 ‘페르소나(Persona)’입니다. 페르소나는 피터 틸이 이끄는 펀더스 펀드로부터 투자를 유치한 이력이 있으며, 정부의 법적 요구가 있을 경우 보관 중인 정보를 제공할 수 있다는 점에서 일부 사용자들 사이에 우려가 제기되고 있습니다. 특히 얼굴 형상 데이터와 같은 민감 정보가 제3자 인증 기업에 저장된다는 점은 프라이버시 측면에서 추가 검토가 필요한 부분입니다.
앤트로픽의 입장
앤트로픽 측은 이번 조치가 사기 행위가 의심되는 소수의 사용자에게만 적용되며, 일반적인 계정 정지 절차와는 무관하다고 밝혔습니다. 또한 수집된 데이터는 앤트로픽이 직접 저장하지 않고 페르소나 측이 보관한다는 점도 강조했습니다. AI 챗봇 서비스가 점차 금융, 코딩, 업무 자동화 등 민감한 영역으로 확장되는 가운데, 신원 인증을 어디까지 강화할 것인가는 다른 AI 기업들에게도 유사한 고민거리로 번질 가능성이 큽니다.
앤트로픽 ‘미토스’, 미 정부 시스템 취약점 탐지
같은 앤트로픽의 또 다른 모델 ‘미토스(Mythos)’가 미국 정부 시스템을 대상으로 한 보안 테스트에서 주목할 만한 성과를 냈습니다. 이 테스트는 ‘프로젝트 글래스윙(Project Glasswing)’이라는 이름으로 진행됐으며, 미 정부 컴퓨터 시스템의 잠재적 보안 취약점을 AI가 얼마나 빠르게 찾아낼 수 있는지를 검증하는 데 초점이 맞춰졌습니다.
"몇 시간 만에" 취약점 발견
익명을 요구한 미국 당국자는 미토스가 "몇 시간 만에 일부 취약점을 찾아냈다"고 전했습니다. 다만 같은 관계자는 "실제로 취약점을 악용할 수 있었다는 의미는 아니다"라며 결과 해석에 신중함을 보였습니다. 즉, 탐지 능력은 입증되었지만 공격 가능성을 곧바로 의미하지는 않는다는 단서를 단 것입니다. 이는 AI 보안 도구의 평가에서 ‘발견 능력’과 ‘실행 가능성’을 구분해야 한다는 업계의 오랜 논쟁과도 맞닿아 있습니다.
트럼프 행정부의 외국인 사용 제한
한편 트럼프 행정부는 보안 우려를 이유로 미토스5와 페이블5의 사용을 외국 국적자에게 제한하는 조치를 취했습니다. AI 모델이 정부의 핵심 시스템 점검에 활용되는 만큼, 모델 자체에 대한 접근 권한 역시 안보 기준에 따라 통제하겠다는 의도로 풀이됩니다. 이에 대해 사이버보안 업계 일각에서는 반발이 이어지고 있으며, 정부와 민간 보안 전문가, AI 기업 사이에서 권한과 책임의 경계를 둘러싼 논의가 활발해질 전망입니다.
딥시크, 추론 속도 최대 85% 끌어올린 ‘D스파크’ 오픈소스 공개
중국 딥시크(DeepSeek)는 LLM 추론 속도를 최대 85%까지 끌어올리는 ‘D스파크(D-Spark)’ 기술을 공개했습니다. 가장 큰 특징은 코드와 학습 프레임워크를 함께 오픈소스로 공개했다는 점으로, 추론 비용 절감이 절실한 글로벌 개발자 커뮤니티의 호응이 예상됩니다.
핵심 기술: 추측형 디코딩의 진화
D스파크는 추측형 디코딩(speculative decoding) 계열의 기법을 한 단계 발전시켰습니다. 딥시크 측 설명에 따르면, 이 기술은 "여러 토큰을 먼저 생성한 뒤 문맥에 맞게 차례대로 보완하고, GPU 작업량에 따라 검증하는 토큰 수를 자동으로 조절"하는 방식으로 작동합니다. 즉, 빠른 사전 생성과 정교한 사후 검증을 결합해 속도와 품질을 동시에 노리는 구조입니다.
또한 D스파크는 반자기회귀(semi-autoregressive) 구조를 채택했습니다. 이는 토큰을 한 개씩 순차적으로 생성하는 기존 자기회귀 방식과, 다수의 토큰을 한꺼번에 생성하는 병렬 방식의 장점을 결합한 형태로, 병렬 처리의 속도와 순차 처리의 정확성을 함께 추구합니다.
모델별 성능 향상 수치
- 딥시크-V4-플래시: 기존 대비 60~85% 속도 향상
- 딥시크-V4-프로: 57~78% 속도 개선
- 기존 기법 대비 검증 통과 토큰 수 16~31% 증가
이러한 수치는 단순한 가속을 넘어, 동일한 GPU 자원으로 처리할 수 있는 요청 수가 크게 늘어남을 의미합니다. 특히 검증 통과 토큰 비율이 함께 향상됐다는 점은 ‘속도만 빠르고 결과는 나빠지는’ 일반적인 가속화의 부작용을 상당 부분 완화했음을 시사합니다.
‘비싼 반도체 없이도’ 가능한 운영 비용 절감
딥시크는 D스파크를 통해 고가 반도체에 의존하지 않고도 운영 비용을 대폭 절감할 수 있다는 점을 강조했습니다. 미국 주도의 첨단 GPU 공급망 제약 속에서, 알고리즘 효율화로 하드웨어 격차를 메우려는 전략이 다시 한 번 부각된 셈입니다. 오픈소스 공개와 맞물려, 추론 비용을 핵심 변수로 보는 스타트업과 연구 기관에는 의미 있는 선택지가 될 것으로 보입니다.
오늘의 한 줄 인사이트
AI 경쟁의 무게중심은 ‘더 큰 모델’에서 ‘더 책임 있고, 더 빠른 모델’로 빠르게 이동하고 있습니다. 앤트로픽이 신원 확인과 정부 보안 협력으로 ‘AI의 책임 경계’를 다시 그리는 사이, 딥시크는 오픈소스 기반의 추론 효율화로 ‘비용 경계’를 흔들고 있습니다. 사용자와 기업 모두 모델의 성능 지표만큼이나 데이터 거버넌스, 접근 통제, 추론 비용이라는 세 축을 함께 평가해야 하는 시대로 들어선 모습입니다.
댓글 0
아직 댓글이 없습니다.