Etwas, das neu Qwen oft macht und irgendwie süß ist, ist, dass es zunächst halluziniert, dann sagt, dass es etwas nicht weiß, und schließlich erkennt, dass es es tatsächlich weiß, und sich selbst korrigiert. Große Fortschritte bei der Minderung von Halluzinationen, das ist schwierig für nicht-argumentierende Modelle.
feedsImage
4o, 4.1 und V3 gehen mit ihren Halluzinationen voran. Sonnet (nicht denkend) weiß einfach, dass es so ist.
5,84K