AI 에이전트가 내 PC에서 돈다, RTX Spark가 노리는 다음 Windows

핵심 요약

NVIDIA와 Microsoft가 2026년 5월 31일 공개한 RTX Spark는 단순한 새 노트북 칩이 아니다. 두 회사가 붙인 메시지는 분명하다. 앞으로의 Windows PC는 앱을 실행하는 도구가 아니라, 사용자가 맡긴 일을 로컬에서 처리하는 에이전트 컴퓨터가 되어야 한다는 것이다.

핵심 스펙만 보면 방향이 바로 보인다. RTX Spark는 Blackwell RTX GPU, 20코어급 Arm CPU, 최대 128GB 통합 메모리, 1페타플롭 FP4 AI 성능을 한 패키지로 묶는다. NVIDIA는 이 하드웨어로 120B 파라미터급 로컬 LLM, 최대 100만 토큰 컨텍스트, 90GB 이상 3D 장면 렌더링, 12K 4:2:2 영상 편집, 1440p 100fps 이상 게임까지 한 PC에서 처리할 수 있다고 설명했다.

하지만 더 중요한 변화는 숫자가 아니라 실행 위치다. 지금까지 “AI 에이전트”라고 부른 제품 대부분은 클라우드 브라우저, 원격 VM, 또는 서버 기반 작업 큐에서 돌았다. RTX Spark는 그 일부를 사용자의 Windows PC 안으로 끌어오려 한다. 개인정보가 들어 있는 문서, 코드, 영상 프로젝트, 회사 파일을 클라우드에 올리지 않고도 에이전트가 읽고 조작하는 그림이다.

Surface Laptop Ultra 공식 이미지. RTX Spark 기반 Windows AI PC가 노트북 폼팩터로 들어오는 방향을 보여준다.

출처: Microsoft Devices Blog

왜 지금 PC가 다시 중요해졌나

지난 2년 동안 AI 서비스의 중심은 클라우드였다. ChatGPT, Claude, Gemini 모두 서버에서 모델을 돌리고 사용자는 브라우저나 앱으로 접속했다. 이 구조는 편하다. 사용자가 GPU를 살 필요도 없고, 모델 업데이트도 서비스 제공자가 알아서 한다.

문제는 에이전트가 “대답”을 넘어 “작업”을 하기 시작하면서 생긴다. 에이전트가 메일을 정리하고, 로컬 파일을 읽고, 디자인 툴을 열고, IDE에서 코드를 고치고, 브라우저에서 결제 직전까지 움직이려면 사용자의 작업 환경과 훨씬 가까워져야 한다. 클라우드 세션에 파일을 업로드하는 방식은 매번 보안·권한·비용 문제가 붙는다.

NVIDIA가 공식 블로그에서 강조한 문장도 이 지점이다. OpenClaw, Hermes Agent 같은 오픈소스 개인 에이전트가 빠르게 퍼졌지만, 사용자 주 PC에서 안전하고 비공개로 실행하기 어렵다는 점이 대중화의 병목이었다는 설명이다. RTX Spark는 이 병목을 하드웨어와 플랫폼 양쪽에서 풀겠다는 시도다.

Microsoft도 같은 방향을 말한다. Windows 블로그는 RTX Spark PC가 “그래픽 집약 작업, 고성능 AI 모델, 로컬 에이전트를 간단하고 안전하게 실행하는 플랫폼”을 필요로 하는 개발자와 크리에이터를 겨냥한다고 설명했다. 즉, Copilot 버튼 하나를 더 붙이는 수준이 아니라 Windows 자체를 로컬 에이전트 실행 환경으로 바꾸겠다는 이야기다.

이 변화는 우리가 앞서 다룬 Codex의 Windows 원격 제어 흐름과도 연결된다. 그 글의 핵심이 “에이전트가 실제 PC를 어디까지 만질 수 있는가”였다면, RTX Spark는 그 질문을 하드웨어 구매 기준으로 끌고 온다.

RTX Spark의 실제 의미는 128GB 통합 메모리다

1페타플롭이라는 숫자는 눈에 잘 띈다. 그러나 로컬 AI 작업에서 더 실질적인 병목은 메모리다. 모델을 PC 안에서 돌리려면 GPU 성능뿐 아니라 모델 가중치, KV 캐시, 컨텍스트, 도구 호출 상태, 작업 파일을 담을 메모리 풀이 필요하다.

RTX Spark가 최대 128GB 통합 메모리를 전면에 내세우는 이유가 여기에 있다. CPU와 GPU가 메모리를 따로 나눠 쓰는 기존 PC에서는 큰 모델을 올리다가 VRAM 한도에 먼저 막힌다. 통합 메모리 구조에서는 전체 RAM 풀을 CPU와 GPU 작업이 동적으로 나눠 쓸 수 있다. Microsoft는 Windows가 RTX Spark의 통합 메모리를 제대로 활용하도록 GPU가 접근할 수 있는 시스템 메모리 한도를 더 높이고 똑똑하게 조정했다고 밝혔다.

이것이 개발자에게 주는 의미는 분명하다. 로컬에서 70B~120B급 모델을 테스트하고, 코드베이스 일부를 길게 물고, 도구 호출과 브라우저 조작을 같은 세션 안에 묶을 수 있는 여지가 커진다. 크리에이터에게는 ComfyUI, Adobe, Blender, 3D 렌더링 워크플로가 한 장치 안에서 더 큰 프로젝트를 다룰 수 있다는 뜻이다.

다만 “120B 모델을 로컬로 돌릴 수 있다”는 문장을 곧바로 “클라우드 GPT·Claude급 품질을 노트북에서 무료로 쓴다”로 받아들이면 안 된다. 모델 품질, 양자화 방식, 토큰 속도, 발열, 배터리, 앱 최적화가 모두 결과를 바꾼다. RTX Spark의 의미는 클라우드 모델을 완전히 대체한다기보다, 민감한 작업과 반복 추론을 PC 안에서 처리할 수 있는 새로운 층이 생긴다는 쪽에 가깝다.

항목	RTX Spark 공식 발표 기준
AI 성능	최대 1페타플롭 FP4
GPU	Blackwell RTX GPU, 최대 6,144 CUDA 코어
CPU	NVIDIA Grace 계열 20코어 Arm CPU
메모리	최대 128GB 통합 메모리
로컬 AI 예시	120B 파라미터 LLM, 최대 100만 토큰 컨텍스트
폼팩터	얇은 Windows 노트북, 소형 데스크톱
출시 시점	2026년 가을 예정

Windows 작업표시줄 옆 에이전트 UI 공식 이미지. RTX Spark 전략은 칩뿐 아니라 Windows UI 안의 로컬 에이전트 경험까지 포함한다.

출처: Microsoft Windows Experience Blog

로컬 에이전트의 장점과 위험

로컬 에이전트의 가장 큰 장점은 세 가지다. 첫째, 데이터가 가까이 있다. 회사 문서, 코드, 영상 원본, 개인 파일을 매번 외부 서버로 올리지 않아도 된다. 둘째, 반복 작업의 한계비용이 낮다. 클라우드 API 호출량을 걱정하며 짧게 쓰는 대신, PC가 켜져 있는 동안 백그라운드 추론을 오래 돌릴 수 있다. 셋째, 지연 시간이 줄어든다. 화면을 보고, 마우스를 움직이고, 앱 상태를 읽는 컴퓨터 사용 에이전트는 네트워크 왕복이 줄어들수록 자연스러워진다.

반대로 위험도 더 구체적이다. 클라우드 에이전트는 서비스 제공자가 만든 샌드박스 안에서 움직이는 경우가 많다. 로컬 에이전트는 사용자의 실제 PC와 더 가까워진다. 잘못 설계하면 파일 삭제, 민감 정보 노출, 업무 계정 오작동, 프롬프트 인젝션에 의한 명령 탈취가 모두 개인 장치에서 벌어진다.

그래서 이번 발표에서 “보안 프리미티브”와 NVIDIA OpenShell이 중요한 키워드로 등장한다. NVIDIA는 Microsoft의 새 보안 프리미티브 위에서 에이전트를 안전하게 배포하는 Windows용 OpenShell 런타임을 예고했다. OpenClaw와 Hermes Agent도 이 구조를 Windows 앱에 통합할 예정이라고 밝혔다. 용어는 어렵지만 핵심은 간단하다. 에이전트가 PC를 마음대로 만지게 둘 수 없으니, OS 차원에서 격리·권한·관찰 가능한 실행 공간을 만들어야 한다는 뜻이다.

여기서 AI 하네스의 역할도 커진다. H Company는 RTX와 DGX PC에 최적화된 컴퓨터 사용 도구와 데스크톱 에이전트 하네스를 내놓을 예정이라고 밝혔다. 하네스는 모델이 화면을 보고 마우스·키보드를 조작하며 작업을 이어가도록 묶는 실행 구조다. 모델 성능만 좋아서는 충분하지 않고, 실제 앱을 다루는 하네스와 OS 권한 모델이 함께 성숙해야 한다.

누가 살 만한가

RTX Spark PC는 일반 사무용 노트북의 후계라기보다, 고성능 로컬 AI 작업을 매일 돌리는 사람을 위한 새 상위 카테고리로 보는 편이 맞다. 발표에 나온 파트너도 ASUS ProArt, Dell XPS 16 Creator Edition, HP OmniBook, Lenovo Yoga Pro, Microsoft Surface Laptop Ultra, MSI Prestige처럼 크리에이터·개발자·전문가 라인에 가깝다.

첫 번째 대상은 로컬 모델을 실제로 테스트하는 개발자다. llama.cpp, vLLM, CUDA, TensorRT, WSL 기반 워크플로를 쓰고, 회사 코드나 내부 문서를 외부 API로 보내기 어려운 팀이라면 RTX Spark가 의미 있다. 특히 에이전트가 IDE, 브라우저, 터미널을 오가며 긴 작업을 수행하는 흐름에서는 로컬 실행의 이점이 커진다.

두 번째 대상은 영상·3D·생성 이미지 작업자가 될 수 있다. NVIDIA는 Adobe가 Photoshop과 Premiere를 RTX Spark에 맞춰 재설계하고, Premiere가 통합 메모리와 Blackwell GPU, TensorRT를 활용하는 새 비디오 파이프라인을 갖게 된다고 밝혔다. Blender는 DLSS 4.5 Ray Reconstruction, ComfyUI는 고해상도 멀티모달 워크플로 최적화가 언급됐다.

세 번째는 기업의 AI 실험팀이다. 단, 이 경우 노트북 한 대보다 더 큰 그림을 봐야 한다. Microsoft는 같은 발표에서 DGX Station for Windows도 연결했다. 개인용 RTX Spark에서 프로토타입을 만들고, 더 큰 로컬·온프레미스 장비로 확장하는 흐름이다. 이 방향은 Dell 온프레미스 Codex 분석에서 다룬 “클라우드 밖 AI 실행” 요구와 같은 선 위에 있다.

일반 사용자는 조금 더 기다리는 편이 낫다. 가격이 공개되지 않았고, 한국 출시 모델·A/S·배터리·Windows on Arm 앱 호환성·게임 호환성도 실제 제품 리뷰가 나와야 판단할 수 있다. NVIDIA와 Microsoft는 Xbox, DirectX, Prism 호환성, Windows ML을 언급했지만, 사용자가 쓰는 특정 앱과 드라이버가 문제 없이 도는지는 별개의 문제다.

Microsoft Windows 블로그 공식 히어로 이미지. RTX Spark 발표는 Windows, NVIDIA 실리콘, 로컬 에이전트 플랫폼의 결합으로 포지셔닝됐다.

출처: Microsoft Windows Experience Blog

한국 사용자가 지금 확인할 것

지금 당장 결론을 내리면 이렇다. RTX Spark는 “AI PC”라는 말을 처음으로 꽤 구체적인 구매 기준으로 바꿨다. 기존 AI PC가 NPU TOPS와 Copilot+ 기능을 중심으로 설명됐다면, RTX Spark는 로컬 LLM, CUDA, 통합 메모리, Windows 보안 샌드박스, 에이전트 하네스까지 묶는다. 이 정도면 단순 마케팅 용어를 넘어 실제 워크플로를 바꿀 수 있다.

하지만 2026년 6월 2일 현재 기준으로 아직 빈칸도 많다. 가격, 한국 출시일, 실제 배터리 시간, 발열, 소음, Windows on Arm 앱 호환성, 로컬 에이전트 권한 관리 UI, 기업 관리 정책은 모두 확인이 필요하다. Microsoft Build 2026이 6월 2~3일 열리므로, Windows 에이전트 기능과 보안 프리미티브의 개발자 세부 정보가 이어서 공개될 가능성이 크다.

구매 판단은 이렇게 나누면 된다. 로컬 LLM·생성 AI·영상·3D·AI 코딩 에이전트를 매일 돌리는 개발자나 크리에이터라면 가을 출시 모델을 관심 목록에 넣을 만하다. 회사 보안 정책 때문에 클라우드 AI 사용이 막혀 있는 팀이라면 파일럿 장비 후보가 될 수 있다. 반면 웹 브라우징, 문서 작업, 가벼운 ChatGPT 사용이 중심이라면 RTX Spark는 과하다. 그 사용자는 일반 Copilot+ PC나 기존 RTX 노트북이 더 현실적일 가능성이 높다.

RTX Spark의 진짜 관전 포인트는 “노트북이 얼마나 빠른가”가 아니다. 에이전트가 사용자 PC에서 실제 일을 할 때, Windows가 그것을 얼마나 안전하게 통제하고, NVIDIA 생태계가 얼마나 쉽게 개발·배포하게 해 주는가다. 이 답이 좋으면 PC 시장은 다시 고급 개발 장비 중심으로 재편될 수 있다. 답이 흐리면 RTX Spark는 강력하지만 비싼 크리에이터 노트북 카테고리에 머물 것이다.

출처 / 더 읽을 거리

NVIDIA Newsroom — NVIDIA and Microsoft Reinvent Windows PCs for the Age of Personal AI: RTX Spark의 공식 발표문으로, 1페타플롭 성능, 128GB 통합 메모리, 파트너 제조사, 가을 출시 계획을 확인할 수 있다.
NVIDIA RTX Spark 제품 페이지: RTX Spark의 제품 포지셔닝, 주요 스펙, 노트북·데스크톱 폼팩터, 공식 이미지 출처를 확인할 수 있는 페이지다.
Microsoft Windows Experience Blog — Introducing a powerful new chapter for Windows PCs, accelerated by NVIDIA RTX Spark: Windows 스케줄러, 전력·열 관리, 통합 메모리 최적화, Windows ML과 TensorRT 지원 등 OS 관점의 세부 내용을 담고 있다.
Microsoft Devices Blog — Introducing Surface Laptop Ultra: Microsoft Surface Laptop Ultra가 RTX Spark 기반 Windows AI PC로 어떤 사용자와 작업을 겨냥하는지 설명한 공식 발표다.
NVIDIA Blog — NVIDIA Levels Up Local AI Agents Across RTX PCs and DGX Spark: NVIDIA OpenShell, NemoClaw, Hermes Agent, OpenClaw, H Company 데스크톱 에이전트 하네스 등 로컬 에이전트 소프트웨어 생태계 발표를 정리한 자료다.
Microsoft Build 2026 공식 페이지: Build 2026의 2026년 6월 2일 일정과 개발자용 AI 도구·플랫폼 발표 맥락을 확인할 수 있는 Microsoft 공식 안내다.

AI에이전트 CUDA Microsoft Nvidia RTX Spark Surface Laptop Ultra Windows AI PC 로컬AI