Que se passerait-il si vous pouviez poser une question à un chatbot de la taille d'une encyclopédie entière—et obtenir une réponse en temps réel ? Des requêtes de plusieurs millions de tokens avec 32 fois plus d'utilisateurs sont désormais possibles grâce au parallélisme Helix, une innovation de #NVIDIAResearch qui permet l'inférence à grande échelle. 🔗
14,08K