NVIDIA GTC 2026 기조연설【속보】Vera Rubin·Isaac GR00T·NIM——Jensen Huang 발표 정리

NVIDIA GTC 2026 기조강연이 2026년 3월 16일, 산호세 SAP 센터에서 개최되었다. Jensen Huang CEO는 약 2시간에 걸쳐 차세대 GPU 아키텍처 “Vera Rubin”의 양산 개시, 물리 AI 기반 모델 “GR00T N1.6”, 엔터프라이즈용 AI 에이전트 기반 “NemoClaw”, 그리고 2028년 투입 예정인 “Feynman” 아키텍처의 로드맵을 발표했다. 190개국에서 39,000명이 참가했으며, AI가 소프트웨어에서 인프라로 진화하는 시대의 개막을 알리는 이벤트가 되었다.

Table of Contents

Toggle

GTC 2026 기조강연의 전체상: AI 인프라 시대의 도래

올해 GTC에서 반복된 키워드는 “Physical AI”와 “AI Factory”다. Huang CEO는 AI가 클라우드 상의 소프트웨어 서비스에서 물리 세계에서 가동되는 인프라로 이행하고 있다고 말했다. 기조강연은 칩→소프트웨어→모델→애플리케이션이라는 풀스택 구성으로 진행되었으며, NVIDIA가 단순한 GPU 제조사가 아닌 AI 플랫폼 기업임을 다시금 보여주었다.

행사장인 SAP 센터(NHL 산호세 샤크스의 홈구장)에는 개발자·연구자·경영자가 전 세계에서 모였다. 700개 이상의 세션이 4일간에 걸쳐 개최되었으며, “Physical AI Days”로 2일간이 로보틱스와 자율주행에 특화되어 마련되었다.

Vera Rubin 플랫폼: 6칩 통합의 차세대 AI 슈퍼컴퓨터

기조강연의 핵심을 차지한 것이 Vera Rubin 플랫폼의 상세 내용이다. CES 2026에서 처음 공개된 이 플랫폼은 GTC 2026에서 양산 체제와 구체적인 파트너 전개가 발표되었다.

6칩 구성의 상세

Vera Rubin은 NVIDIA 최초의 “익스트림 코디자인”에 의한 6칩 통합 플랫폼이다. 구성은 다음과 같다.

Vera CPU: 88코어 Olympus 기반 ARM 프로세서. “Spatial Multi-Threading” 기술을 탑재하고 128GB GDDR7 메모리를 장착
Rubin GPU: 336억 트랜지스터, 2개의 레티클 다이로 구성. 288GB HBM4 메모리, NVFP4 추론으로 50 PFLOPS 달성
NVLink 6 Switch: GPU 간 고속 연결을 실현
ConnectX-9 SuperNIC: 차세대 네트워크 인터페이스
BlueField-4 DPU: 데이터 처리 유닛
Spectrum-6 Ethernet Switch: 데이터센터 네트워킹

Vera Rubin NVL72의 성능

랙스케일의 플래그십 구성인 Vera Rubin NVL72는 72기의 Rubin GPU와 36기의 Vera CPU를 NVLink 6로 연결한다. 주요 스펙은 다음과 같다.

NVFP4 추론 성능: 3.6 EFLOPS
학습 성능: 2.5 EFLOPS
HBM4 용량: 20.7TB
스케일업 대역폭: 260 TB/s
Blackwell 대비 추론 토큰 비용 10분의 1, MoE 모델 학습에 필요한 GPU 수는 4분의 1

2026년 Q1 시점에서 양산 개시 완료. AWS, Google Cloud, Microsoft Azure, OCI가 2026년 하반기에 Vera Rubin 기반 인스턴스를 제공 개시한다.

GTC 2026 주요 발표 카드

🔧

Vera Rubin GPU

336B 트랜지스터 / 288GB HBM4
Blackwell 대비 5배 추론 성능
2026년 H2부터 파트너 출하

🤖

GR00T N1.6

휴머노이드용 VLA 모델
Chain-of-Thought 추론 탑재
Newton 엔진과 연계

⚡

NemoClaw

오픈소스 AI 에이전트 기반
Apache 2.0 라이선스
멀티에이전트 협조

🗺

Feynman 아키텍처

2028년 투입 예정
TSMC A16(1.6nm) 채용
실리콘 포토닉스 탑재

🚗

Alpamayo

자율주행용 오픈 VLA 모델
10B 파라미터
1,700시간 이상의 주행 데이터

💻

N1 / N1X CPU

ARM 탑재 노트북용 CPU
MediaTek 공동 개발
Dell/Lenovo 탑재 예정

Feynman 아키텍처: 2028년 로드맵 최초 공개

Huang CEO는 기조강연에서 Vera Rubin의 차세대인 “Feynman” 아키텍처의 로드맵을 최초 공개했다. 지금까지 리크 정보로 단편적으로 알려져 있던 내용이 여기서 공식적으로 확인된 셈이다.

Feynman의 기술적 특징

프로세스 기술: TSMC A16(1.6nm) 채용
실리콘 포토닉스: 전기 신호가 아닌 광신호로 데이터 전송을 수행하는 기술을 최초 탑재
설계 사상: “Inference-First”——장문맥·다단계 추론을 요하는 AI 에이전트용으로 최적화
전력 사양: 5,000W 이상(기존 시설 인프라로는 대응이 어려운 수준)
메모리: ICMS(Integrated Chip-on-Memory Storage) 기술 채용 예정

2028년 데이터센터용 출하를 목표로 하고 있으며, 양산 상황에 따라 2029년으로 밀릴 가능성도 있다. 주목해야 할 것은 추론 처리에 특화된 “Inference-First”라는 설계 사상이다. 학습과 추론 양쪽을 커버해 온 기존 접근법에서 자율 에이전트의 추론 워크로드를 최우선으로 하는 방향으로 키를 잡았다.

NVIDIA GPU 로드맵(2024~2028)

Blackwell

2024

4nm / HBM3e
GB200 NVL72
208B transistors

→

Blackwell Ultra

2025

4nm / 288GB HBM3e
GB300 NVL72
15 PFLOPS FP4

→

Vera Rubin

2026

288GB HBM4
NVL72: 3.6 EFLOPS
336B transistors

→

Feynman

2028

1.6nm A16
실리콘 포토닉스
Inference-First 설계

※ Vera Rubin이 현행 세대(보라색 테두리), Feynman은 예정(점선 테두리)

물리 AI: GR00T N1.6과 Newton 엔진

GTC 2026에서는 “Physical AI Days”로 2일간이 로보틱스에 할당되어 휴머노이드 로봇, 자율주행, 산업 AI, 디지털 트윈 각 분야에서 성과가 발표되었다.

Isaac GR00T N1.6

NVIDIA의 휴머노이드 로봇용 기반 모델 “Isaac GR00T N1.6″은 시각·언어·행동을 통합하는 VLA(Vision-Language-Action) 모델이다. 이전 버전으로부터의 최대 진화는 Chain-of-Thought 추론의 탑재에 있다. 로봇이 패턴 매칭이 아닌 단계적으로 상황을 추론하여 행동을 결정할 수 있게 되었다.

멀티모달 입력(언어와 이미지)을 받아 다양한 환경에서의 매니퓰레이션 태스크를 실행한다. 크로스 엠바디먼트 대응으로 서로 다른 로봇의 신체 구조에도 적용 가능하다.

Newton 오픈소스 물리 엔진

Google DeepMind 및 Disney Research와 공동 개발 중인 “Newton”은 로봇 개발에 특화된 오픈소스 물리 엔진이다. Disney Research는 이 Newton을 활용하여 차세대 엔터테인먼트 로봇의 개발을 진행하고 있다. 기조강연에서는 스타워즈에 등장하는 BDX 드로이드가 무대에 등장하여 화제를 모았다.

📌 당신의 AI 활용 레벨을 무료로 진단해 보시겠습니까? → Instagram @taro_taro609에 DM으로 “진단”이라고 보내주세요.

NemoClaw: 엔터프라이즈 AI 에이전트 기반

GTC 2026에 앞서 발표된 NemoClaw는 기조강연에서 정식으로 데모가 공개되었다. Apache 2.0 라이선스의 오픈소스 플랫폼으로, 기업이 멀티스텝 자율 태스크를 실행하는 AI 에이전트를 구축·배포할 수 있다.

NemoClaw의 주요 기능

멀티에이전트 협조: 복수의 AI 에이전트가 연계하여 태스크를 수행
툴 통합: 외부 API 및 데이터베이스와의 연결
하드웨어 비의존: NVIDIA GPU 이외의 환경에서도 배포 가능
NeMo/NIM 에코시스템 통합: NVIDIA의 추론·모델 관리 기반과 심리스하게 연계

OpenAI나 Anthropic, 각 클라우드 프로바이더가 제공하는 유사 서비스에 대해 NVIDIA는 오픈소스와 엔터프라이즈 그레이드의 보안을 무기로 차별화를 꾀한다.

🔰 회원 한정 콘텐츠를 받아보세요

태일러의 은신처에서는 AI·바이브 코딩의 최신 정보를 회원 대상으로 정기 배포하고 있습니다. GTC 속보의 후속 보도도 가장 빨리 전해드립니다.

무료 회원 가입하기 →

N1 / N1X: NVIDIA의 노트북용 CPU 진출

기조강연에서 큰 반향을 일으킨 것이 NVIDIA의 노트북용 ARM 기반 CPU “N1” “N1X”의 공식 발표다. MediaTek과의 공동 개발로 CPU·GPU 기능을 통합한 올인원 모바일 SoC이다.

아키텍처: ARM 기반(Qualcomm Snapdragon X Elite와 동일한 ARM 에코시스템)
차별화 포인트: 게이밍 성능에 주력. x86 게임의 ARM 상 동작 최적화에 투자
파트너: Dell과 Lenovo가 2026년 상반기에 탑재 노트북 발매 예정
지원 OS: Windows on ARM

NVIDIA가 Intel이나 AMD와 같은 무대에서 PC용 CPU 시장에 진출하는 것은 처음이다. GPU 기술의 강점을 살린 게이밍 성능이 최대의 차별화 요인이 된다.

RTX PRO Blackwell 시리즈와 워크스테이션용 NIM

워크스테이션 시장에서는 RTX PRO Blackwell 시리즈가 발표되었다. AI 구동 워크로드용으로 설계된 새로운 세대의 프로페셔널 GPU로, NIM microservices와의 통합이 최대 특징이다.

ChatRTX 업데이트: NIM microservices에 대응하여 새로운 기반 모델에의 접근이 가능
OpenUSD용 NIM: 세계 최초의 OpenUSD 개발용 생성 AI 모델. USD Code NIM이 Python 코드를 자동 생성
USD Search NIM: 자연어나 이미지 입력으로 OpenUSD·3D 데이터를 검색

파트너십과 인프라 전개

GTC 2026에서는 복수의 대형 파트너십도 발표되었다.

주요 파트너십 일람

파트너	내용	규모
Thinking Machines Lab	Vera Rubin 시스템의 복수년 전략 제휴. 프론티어 모델 학습용으로 1GW 이상의 GPU를 전개	1GW+
Equinix	AI Factory 솔루션. 분산 AI 허브를 Palo Alto Networks와 공동 전개	글로벌
Lenovo	AI Cloud Super Factory. Vera Rubin 플랫폼 대응	엔터프라이즈
Cisco	6G AI-Native 플랫폼 공동 개발(다이아몬드 스폰서)	통신 인프라
클라우드 4사	AWS / Google Cloud / Microsoft / OCI가 Vera Rubin 인스턴스를 2026년 하반기에 제공	클라우드 전역

세대별 GPU 성능 비교

항목	GB200 (Blackwell)	GB300 (Blackwell Ultra)	Vera Rubin NVL72
트랜지스터 수	208B	208B+	336B
메모리 종별	HBM3e	HBM3e 288GB	HBM4 288GB
메모리 대역폭	8 TB/s	8 TB/s	22 TB/s
NVL72 추론 성능(FP4)	1.1 EFLOPS	1.1 EFLOPS	3.6 EFLOPS
GPU 단체 추론(NVFP4)	10 PFLOPS	15 PFLOPS	50 PFLOPS
냉각 방식	액냉	액냉	액냉

개발자에게 주목할 포인트

GTC 2026의 발표 내용을 개발자의 입장에서 정리하면 3가지 축이 보인다.

1. 추론 비용의 극적인 저하

Vera Rubin 플랫폼에 의해 추론 토큰 비용이 기존의 10분의 1로 내려간다. 이로 인해 지금까지 비용 면에서 포기했던 실시간 추론 애플리케이션이 현실적이 된다. 개인 개발자가 API 비용 산출을 재검토할 타이밍이다. 에이전트형 AI의 운용 비용이 대폭 내려가면 개발의 우선순위도 바뀔 것이다.

2. NIM 에코시스템의 확대

NIM microservices가 OpenUSD, ChatRTX, 워크스테이션용 툴에 통합됨으로써 NVIDIA 플랫폼 상의 개발 워크플로가 일관된 것이 되어가고 있다. 특히 OpenUSD용 코드 자동 생성은 3D/메타버스 개발자에게 즉전력이 된다. NeMo, NIM, NemoClaw(에이전트 기반)가 하나의 에코시스템으로 통합되어 있는 점도 놓칠 수 없다.

3. 물리 AI 개발의 민주화

GR00T N1.6의 오픈 모델 공개와 Newton 오픈소스 물리 엔진, Alpamayo의 1,700시간 이상의 주행 데이터 공개로 로보틱스·자율주행 개발의 진입 장벽이 낮아졌다. 이전에는 로보틱스 기반 모델을 학습하려면 막대한 리소스가 필요했지만, 오픈 모델의 파인튜닝부터 시작할 수 있는 환경이 갖춰지고 있다.

관련 기사: NVIDIA GTC 2026의 개요 해설은 이쪽에서 5대 발표의 전체상을 해설하고 있다. 또한 AI 에이전트 개발에 관심이 있는 분은 에이전틱 엔지니어링 입문 가이드도 참고하기 바란다.

자주 묻는 질문(FAQ)

Q1. GTC 2026의 기조강연은 언제, 어디서 열렸나?

2026년 3월 16일 오전 11시(태평양 시간), 산호세 SAP 센터에서 개최되었다. 약 2시간의 강연으로 NVIDIA 웹사이트에서 라이브 스트리밍과 온디맨드 시청이 가능. 참가 등록은 불필요.

Q2. Vera Rubin GPU의 성능은 Blackwell과 비교하여 어느 정도 향상되었나?

NVFP4 추론 성능에서 약 5배(50 PFLOPS vs 10 PFLOPS), 학습 성능에서 약 3.5배 향상. 메모리 대역폭은 22 TB/s로 Blackwell의 8 TB/s에서 2.8배 확대되었다. 추론 토큰 비용은 약 10분의 1로 저감된다.

Q3. Feynman 아키텍처란? 언제 등장하나?

Vera Rubin의 차세대가 되는 GPU 아키텍처. TSMC의 1.6nm 프로세스를 채용하며 실리콘 포토닉스 기술을 탑재한다. 2028년 데이터센터용 출하를 목표로 하고 있으나 2029년으로 밀릴 가능성도 있다. AI 에이전트용 “Inference-First” 설계가 특징.

Q4. NemoClaw는 어떤 플랫폼인가?

NVIDIA가 제공하는 오픈소스 엔터프라이즈 AI 에이전트 구축 플랫폼. Apache 2.0 라이선스로 공개되며, 멀티에이전트 협조, 외부 툴 통합, 하드웨어 비의존 배포가 가능. NeMo나 NIM 에코시스템과 통합되어 있다.

Q5. GR00T N1.6과 Newton 엔진의 관계는?

GR00T N1.6은 휴머노이드 로봇용 기반 모델(VLA), Newton은 로봇 개발용 오픈소스 물리 엔진이다. Newton은 시뮬레이션 환경에서 GR00T N1.6을 학습·검증하기 위해 사용된다. Google DeepMind와 Disney Research와의 공동 개발.

Q6. NVIDIA의 노트북 CPU “N1″은 언제 구매할 수 있나?

Dell과 Lenovo가 2026년 상반기에 탑재 노트북을 발매 예정. MediaTek과의 공동 개발에 의한 ARM 기반 SoC로 게이밍 성능에 중점을 두고 있다. 가격이나 모델명은 미공표.

Q7. GTC 2026의 강연은 온라인으로 시청할 수 있나?

기조강연은 nvidia.com에서 무료 라이브 배포되었다. 등록 불필요로 온디맨드 시청도 가능. 700개 이상의 세션도 순차 공개될 예정.

정리: NVIDIA가 그리는 AI의 현재 위치와 미래

GTC 2026의 기조강연에서 명확해진 것은 NVIDIA의 전략이 “AI 칩의 공급”에서 “AI 실행 환경 그 자체의 제공”으로 완전히 전환되었다는 것이다. Vera Rubin에 의한 추론 비용의 극적인 저하, NemoClaw에 의한 에이전트 개발의 표준화, GR00T N1.6과 Newton에 의한 물리 AI 개발의 민주화——이 모든 것은 개발자가 AI 애플리케이션을 “만드는” 단계에서 “운영하는” 단계로 이행하기 위한 기반 정비다.

2028년의 Feynman 아키텍처까지의 로드맵이 제시됨으로써 적어도 향후 2년간의 기술적 방향성은 명확해졌다. 개발자로서 주시해야 할 것은 추론 비용 10분의 1이 가져올 애플리케이션 설계의 변화와 NIM 에코시스템의 확대 속도다.

관련 기사: AI 코드 에디터의 활용법은 Claude Code Agent Teams에서 자세히 해설하고 있다.

🎯 당신의 AI 활용 레벨을 무료 진단

“AI가 궁금한데 뭐부터 시작해야 할지…” 그런 분에게 최적인 3분 진단.
당신에게 맞는 AI 활용 플랜을 개별적으로 제안해 드립니다.

Instagram @taro_taro609에 DM으로 “진단” →

소스 리스트

저자: 바이브코딩 태일러(Lovable 공식 앰배서더)
태일러의 은신처 관리인. AI·바이브 코딩을 축으로 개발자와 비개발자 모두를 대상으로 정보를 발신 중.

📌 관련 기사

Post Views: 335