Подводя итоги этой недели: - мы выпустили универсальный компьютер с использованием агента - нас обыграл один человек на соревновании по эвристике atcoder - мы решили 5 из 6 новых задач IMO с помощью доказательств на естественном языке Все это основано на одной и той же системе обучения с подкреплением.
135,22K