L'exécution asynchrone des agents autonomes génère des coûts d'API insoutenables et des pertes de contexte. Pour résoudre cela, NVIDIA déploie Nemotron 3 Ultra, un modèle hybride 550B optimisant le calcul. Résultat : une analyse sans dérive sur 1 million de tokens et une facture divisée par trois pour les déploiements B2B.