je veux vraiment un modèle qui produise des vidéos de haute qualité/riche en informations qui répondent à mes questions mieux qu'une recherche approfondie avec de superbes visualisations/références/aides à la mémoire/etc.
cela semble techniquement possible, mais cela serait définitivement lent. Je me demande combien d'années de progrès nous devons pour réduire la latence du pipeline à moins de 5 secondes.
4,57K