На конференции GTC 2026 Jensen Huang представил Vera Rubin — GPU с производительностью вывода 50 PFLOPS, что в 5 раз превышает возможности предыдущего поколения Blackwell. Чип уже находится в полном производстве с первого квартала 2026 года.
NVIDIA официально запустила платформу Vera Rubin с рекордными характеристиками для инференса искусственного интеллекта. Компания также представила архитектуру Feynman на процессе TSMC 1.6nm и платформу NemoClaw для корпоративных AI-агентов. Это объявление приходит в момент, когда инвесторы сомневались в темпах развития AI-индустрии.
Vera Rubin: новый стандарт инференса
Каждый GPU Vera Rubin NVL72 обеспечивает 50 PFLOPS производительности инференса в формате NVFP4 — пятикратное увеличение по сравнению с Blackwell. На уровне стойки конфигурация NVL72 доставляет 3.6 EFLOPS вычислительной мощности. Чип построен из двух кристаллов размером с рецикл, содержит 336 миллиардов транзисторов и использует память HBM4 с пропускной способностью до 22 TB/s. Стойка Rubin Ultra мощностью 600 кВт поступит в 2027 году. Облачные партнеры, включая AWS, Google Cloud, Microsoft Azure и Oracle Cloud, начнут получать оборудование во втором полугодии 2026 года.
NemoClaw: платформа для корпоративных AI-агентов
NVIDIA представила NemoClaw — открытую платформу для развертывания AI-агентов в корпоративной среде. В отличие от OpenClaw, ориентированной на индивидуальных пользователей, NemoClaw разработана специально для компаний. Платформа интегрирует три существующих компонента NVIDIA: фреймворк NeMo для обучения моделей и конвейеров рассуждений агентов, семейство моделей Nemotron (выпущено в декабре 2025) и микросервисы NIM для развертывания инференса. Это объявление позиционирует NVIDIA как игрока в растущем рынке корпоративного ПО для AI.
Физический AI и робототехника
Jensen Huang уделил значительное внимание физическому AI — конвергенции искусственного интеллекта с робототехникой и физическим миром. NVIDIA продемонстрировала развитие своей платформы робототехники с момента GTC 2025, когда компания впервые представила модель-основу гуманоидного робота Isaac GR00T N1, робота Blue (разработанного совместно с Disney Research и Google DeepMind) и физический движок Newton для обучения движениям робота в масштабе. На GTC 2026 были по��азаны новые развертывания и обновления платформы, демонстрирующие роботов, выполняющих все более сложные манипуляционные задачи в реальных промышленных условиях.
Что это значит для Казахстана
Для компаний в Казахстане и Центральной Азии, работающих с облачными вычислениями и AI, эти анонсы NVIDIA критически важны. Поставщики облачных услуг, использующие инфраструктуру AWS, Google Cloud и Microsoft Azure, получат доступ к Vera Rubin во втором полугодии 2026 года. Это позволит локальным предприятиям и стартапам региона использовать передовые возможности инференса AI без необходимости собственных инвестиций в оборудование. Компании, подобные Alashed IT (it.alashed.kz), могут интегрировать NemoClaw в решения для корпоративных клиентов, предоставляя доступ к инструментам enterprise-grade AI-а��ентов.
Vera Rubin обеспечивает 50 PFLOPS инференса — в 5 раз больше, чем Blackwell, и уже находится в полном производстве с Q1 2026.
NVIDIA продемонстрировала, что AI-индустрия далека от замедления, представив чип, уже находящийся в производстве, с рекордными характеристиками инференса, и корпоративную платформу для развертывания AI-агентов. Успех этих объявлений будет зависеть от того, смогут ли реальные производственные нагрузки соответствовать заявленным спецификациям и будут ли корпоративные клиенты принимать NemoClaw в ожидаемых масштабах.
Часто задаваемые вопросы
- Что такое NVFP4 и почему это важно для 50 PFLOPS?
- NVFP4 — это формат данных с низкой точностью, оптимизированный для инференса. Показатель 50 PFLOPS применим именно к эт��му формату, поэтому реальная производительность зависит от архитектуры модели, размера батча и типа операций в конкретном рабочем процессе.
- Когда Vera Rubin будет доступна облачным провайдерам?
- Стойки Vera Rubin начнут поступать к облачным партнерам (AWS, Google Cloud, Microsoft Azure, Oracle Cloud) во втором полугодии 2026 года. Сам чип уже находится в полном производстве с первого квартала 2026.
- Чем NemoClaw отличается от OpenClaw?
- OpenClaw разработана для индивидуальных пользователей, а NemoClaw специально создана для корпоративного использования. NemoClaw интегрирует фреймворк NeMo, модели Nemotron и микросервисы NIM для полного цикла развертывания AI-агентов в компаниях.