NVIDIA hat die ersten Vera-CPU-Systeme an mehrere große KI-Infrastrukturkunden ausgeliefert. Laut NVIDIA gingen die ersten Systeme an Anthropic in San Francisco, OpenAI in Mission Bay und SpaceXAI in Palo Alto; kurz darauf folgte Oracle Cloud Infrastructure in Santa Clara. Ian Buck, NVIDIAs Vizepräsident für Hyperscale und High-Performance Computing, übergab die Systeme persönlich und erklärte den Teams die Hardware vor Ort.
Die Inszenierung ist auffällig, aber sie ist nicht der Kern der Nachricht. Vera steht für NVIDIAs Versuch, die CPU-Schicht im KI-Rechenzentrum strategisch aufzuwerten. Bisher wird NVIDIAs KI-Geschäft vor allem über GPUs verstanden. Vera zielt dagegen auf Aufgaben, die rund um KI-Agenten entstehen: Tool-Aufrufe, Datei- und Datenbankzugriffe, Sandbox-Ausführung, Speicherverwaltung und die Koordination mehrstufiger Workflows.
Warum Vera nicht nur ein weiterer Chip ist
Vera ist kein Ersatz für die GPU. Training und große Inferenzläufe bleiben GPU-lastig. NVIDIA argumentiert jedoch, dass agentische KI andere Engpässe sichtbar macht. Wenn ein Modell nicht nur antwortet, sondern handelt, wartet es häufig auf Systeme außerhalb des Modells: Code muss ausgeführt, ein Dokument geholt, eine Datenbank abgefragt oder ein externer Dienst angesprochen werden. Diese Orchestrierung ist klassische CPU-Arbeit.
Genau hier setzt Vera an. NVIDIA beschreibt die CPU als Nachfolger von Grace und als Teil der Vera-Rubin-Plattform. Die Botschaft ist klar: Wer KI-Agenten in großem Maßstab betreibt, soll nicht nur GPUs kaufen, sondern ein eng abgestimmtes System aus CPU, GPU, Speicher, Netzwerk und Software nutzen. Für NVIDIA ist das ein Weg, mehr vom KI-Stack zu kontrollieren.
Die Leistungszahlen bleiben Herstellerangaben
NVIDIA nennt deutliche Vorteile für Vera-Rubin-NVL72-Konfigurationen, darunter niedrigere Token-Kosten, schnellere Agent-Sandboxes und bessere Verarbeitung von Unternehmensdatenabfragen. Diese Angaben sollten nicht als allgemeingültiges Versprechen für jeden Kunden gelesen werden. In der Praxis hängt der Effekt davon ab, ob ein Unternehmen tatsächlich agentenlastige Workloads betreibt, wie die Software angepasst ist und welche Rolle Speicher, Netzwerk und Datenzugriffe spielen.
Die Empfänger der ersten Systeme sind trotzdem relevant. Anthropic und OpenAI betreiben große Modellinfrastruktur, Oracle will mehr KI-Workloads in seine Cloud ziehen, und SpaceXAI steht für den breiteren Infrastrukturbedarf rund um xAI und Elon Musks Unternehmen. In solchen Umgebungen kann NVIDIA schneller sehen, ob Vera in realen Agenten-Workloads mehr bringt als in einer Demo.
Was das für den Markt bedeutet
Für Intel und AMD ist Vera ein Warnsignal, weil NVIDIA nicht beim Beschleuniger stehen bleibt. Das Unternehmen verkauft GPUs, Netzwerk-Hardware, Systemplattformen und Software; mit einer eigenen CPU kommt eine weitere Ebene hinzu. Wenn sich KI-Agenten im Unternehmensalltag durchsetzen, wird die CPU nicht mehr als Hintergrundkomponente wahrgenommen, sondern als Teil der Kosten- und Leistungsrechnung.
Das heißt nicht, dass Vera den Markt bereits gewonnen hat. Unternehmen müssen erst prüfen, ob die versprochenen Vorteile in ihren eigenen Workloads ankommen. Auch der Preis, die Verfügbarkeit und die Bindung an NVIDIAs Plattform spielen eine Rolle. Die erste Auslieferung markiert deshalb vor allem einen Übergang: Vera ist nicht mehr nur eine GTC-Ankündigung, sondern liegt bei den ersten großen Kunden im Rechenzentrum. Ob daraus ein neues Milliarden-Geschäft wird, entscheidet sich an den Benchmarks im Betrieb, nicht an der Übergabe mit Schraubenzieher.