新 Qwen 做的有點可愛的事情是,最初會出現幻覺,然後說自己不知道某件事,最後卻意識到自己其實知道,並自我修正。 在減少幻覺方面取得了重大進展,這對於非推理模型來說是很困難的。
feedsImage
4o、4.1 和 V3 繼續他們的幻覺。Sonnet(非思考)只是知道這一點。
7.01K