Nemotron 3 Ultra: NVIDIA’nın güçlü açık modeli

Nemotron 3 Ultra çıktı: ABD’nin en güçlü açık modeli

Yayın 04 Haz 2026, 06:04 Güncelleme 04 Haz 2026, 06:23 3 dk okuma Talia Emily Rogic (Editor-in-Chief & Founder)

NVIDIA Nemotron 3 Ultra açık yapay zekâ modeli için ajan iş akışı görseli

NVIDIA Nemotron 3 Ultra, 550B parametreli açık MoE model olarak ajan iş akışlarına geliyor. Endeks 48 güçlü; Kimi K2.6 ise 54 ile hâlâ önde.

NVIDIA Nemotron 3 Ultra, şirketin açık model stratejisinde en iddialı adımlardan biri olarak öne çıkıyor. NVIDIA modeli 550 milyar parametreli bir mixture-of-experts yapı olarak tanımlıyor; çıkarım sırasında yaklaşık 55 milyar parametrenin aktif olduğu belirtiliyor. Şirketin resmî duyurusunda erişim planı 4 Haziran için Hugging Face, ModelScope, OpenRouter ve build.nvidia.com üzerindeki NVIDIA NIM mikroservisleri olarak veriliyor. Bu nedenle haber yalnızca “yeni bir model çıktı” başlığından ibaret değil; NVIDIA’nın açık modeli ajan altyapısı, kurumsal dağıtım ve geliştirici araçlarıyla birlikte paketleme denemesi.

NVIDIA ne vaat ediyor?

NVIDIA’nın ana iddiası ölçek ile verimliliği birlikte sunmak. Şirket, Nemotron 3 Ultra’nın sınıfındaki açık frontier modellere göre beş kata kadar daha hızlı çıkarım ve yüzde 30’a kadar daha düşük maliyet sağlayabileceğini söylüyor. Bu cümleler bağımsız üretim testi değil, şirket iddiası olarak okunmalı. Farklı sağlayıcı, quantization, batch ayarı ve gerçek iş yüklerinde sonuçlar değişebilir. Yine de konumlandırma net: Ultra, yalnızca sohbet modeli değil, uzun görevleri yürüten ajanlar için tasarlanmış bir açık model olarak sunuluyor.

Bu ayrım önemli çünkü ajan sistemlerinde model kalitesi tek başına yeterli değil. Kod yazan, araç çağıran, dosya okuyan, uzun oturumlarda bağlam taşıyan ve kurumsal sistemlerle konuşan ajanlarda gecikme, maliyet, güvenlik kontrolleri ve orkestrasyon desteği belirleyici hale geliyor. NVIDIA’nın Hermes Agent, LangChain Deep Agents, OpenClaw, OpenHands ve OpenCode gibi agent harness’lerini anması bu yüzden dikkat çekici. Şirket, modeli yalnızca indirilip denenecek bir ağırlık seti olarak değil, üretim ortamına taşınabilecek bir ajan bileşeni olarak anlatıyor.

Benchmark çizgisi: ABD’de zirve, dünyada değil

Artificial Analysis, Nemotron 3 Ultra’ya Intelligence Index’te 48 puan veriyor. Bu puan, değerlendirme içinde onu ABD merkezli açık ağırlıklı modeller arasında en üst sıraya taşıyor. Ancak aynı tabloda Moonshot AI’ın Kimi K2.6 modeli 54 puanla önde duruyor. Bu yüzden başlığı doğru kurmak gerekiyor: Nemotron 3 Ultra, ABD açık model ekosistemi için güçlü bir sıçrama; fakat küresel açık model yarışında liderlik hâlâ Çin tarafında görünüyor.

Hız tarafı da önemli. Artificial Analysis, ön sürüm DeepInfra erişim noktasında Ultra’nın 300 token/saniye üzeri hız verdiğini, pazardaki bazı büyük Çinli rakiplerin ise genellikle 50–100 token/saniye aralığında sunulduğunu aktarıyor. Bu rakam ajan iş akışları için değerli olabilir; çünkü çok adımlı görevlerde her model çağrısı toplam süreye ve maliyete eklenir. Yine de bu hızın her dağıtımda birebir görüleceğini söylemek doğru olmaz. Ön sürüm endpoint performansı, üretim ortamındaki nihai maliyet ve gecikme testlerinin yerine geçmez.

Geliştiriciler için anlamı

Geliştirici açısından asıl soru “Ultra herkesi geçti mi?” değil. Daha doğru soru, bu ölçekte açık bir modelin kapalı API bağımlılığını ne kadar azaltabileceği. Regülasyon, veri gizliliği, özel kod depoları veya alan uzmanlığı isteyen ekipler için açık ağırlık ve kontrollü dağıtım seçenekleri ciddi avantaj sağlayabilir. Ancak Ultra büyüklüğünde bir modelin yerel çalıştırılması sıradan masaüstü donanımıyla gerçekçi değil; çoğu ekip modeli API, bulut sağlayıcısı veya NIM mikroservisi üzerinden kullanacaktır.

Bu tablo, NVIDIA’nın Computex çizgisindeki daha geniş AI bilgisayar hikâyesiyle de birleşiyor. Şirketin yakın zamanda anlattığı RTX Spark ve DGX Station hamlesi, AI iş yüklerinin bir kısmını geliştiriciye, kuruma veya iş istasyonuna yaklaştırma hedefini gösteriyordu. Nemotron 3 Ultra bu çizginin model tarafındaki büyük ölçekli karşılığı gibi duruyor; daha küçük Nemotron varyantları ise yerel deneyler için daha uygun kalıyor.

Sonuç olarak Nemotron 3 Ultra, NVIDIA için güçlü bir açık model vitrini. Endeks 48 puanla ABD tarafında önemli bir eşik aşılıyor, hız iddiaları ajan sistemleri için cazip görünüyor ve NIM paketlemesi kurumsal dağıtımı kolaylaştırmayı hedefliyor. Fakat haberin sınırı korunmalı: Kimi K2.6 hâlâ daha yüksek benchmark puanına sahip, NVIDIA’nın maliyet ve hız iddiaları gerçek iş yüklerinde test edilmeli ve modelin asıl etkisi lansman gününde değil, üretim sistemlerindeki güvenilirliğiyle ölçülecek.

Kaynak referansları

NVIDIA Newsroom - Nemotron 3 Ultra duyurusu, 550B MoE konumu, ajan platformları, hız/maliyet iddiaları ve 4 Haziran erişim planı
Artificial Analysis - 550B/55B aktif yapı, Intelligence Index 48, Kimi K2.6’nın 54 puanı ve 300 token/saniye üzeri ön sürüm hızı
NVIDIA Blog - GTC Taipei/Computex keynote bağlamı, açık model stratejisi, agentic AI ve daha düşük maliyetli çıkarım anlatısı
NVIDIA Nemotron docs - Nemotron 3 Ultra base model ve dağıtım odaklı teknik model ailesi bilgileri
The Decoder - Nemotron 3 Ultra’nın ABD açık model sıralamasındaki yeri ve Çinli açık modellerle farkına dair bağımsız haber bağlamı