ChatPaper.aiChatPaper

Золотой призер в решении олимпиадной геометрии с AlphaGeometry2.

Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2

February 5, 2025
Авторы: Yuri Chervonyi, Trieu H. Trinh, Miroslav Olšák, Xiaomeng Yang, Hoang Nguyen, Marcelo Menegali, Junehyuk Jung, Vikas Verma, Quoc V. Le, Thang Luong
cs.AI

Аннотация

Мы представляем AlphaGeometry2, значительно улучшенную версию AlphaGeometry, представленную в работе Trinh и др. (2024), которая теперь превзошла среднего золотого медалиста в решении олимпиадных задач по геометрии. Для достижения этого мы сначала расширили оригинальный язык AlphaGeometry для решения более сложных задач, включающих движения объектов, а также задачи, содержащие линейные уравнения углов, отношений и расстояний. Это, вместе с другими дополнениями, значительно улучшило покрытие языка AlphaGeometry задачами по геометрии на Международных математических олимпиадах (IMO) с 2000 по 2024 год с 66% до 88%. Процесс поиска AlphaGeometry2 также значительно улучшен за счет использования архитектуры Gemini для более точного моделирования языка и нового механизма обмена знаниями, объединяющего несколько деревьев поиска. Вместе с дальнейшими улучшениями символьного движка и генерации синтетических данных, мы значительно увеличили общий процент решения задач AlphaGeometry2 до 84% для всех геометрических задач за последние 25 лет, по сравнению с предыдущими 54%. AlphaGeometry2 также была частью системы, которая достигла стандарта серебряной медали на IMO 2024 https://dpmd.ai/imo-silver. Наконец, мы сообщаем о продвижении в использовании AlphaGeometry2 в качестве части полностью автоматизированной системы, которая надежно решает задачи геометрии непосредственно из естественного языка.
English
We present AlphaGeometry2, a significantly improved version of AlphaGeometry introduced in Trinh et al. (2024), which has now surpassed an average gold medalist in solving Olympiad geometry problems. To achieve this, we first extend the original AlphaGeometry language to tackle harder problems involving movements of objects, and problems containing linear equations of angles, ratios, and distances. This, together with other additions, has markedly improved the coverage rate of the AlphaGeometry language on International Math Olympiads (IMO) 2000-2024 geometry problems from 66% to 88%. The search process of AlphaGeometry2 has also been greatly improved through the use of Gemini architecture for better language modeling, and a novel knowledge-sharing mechanism that combines multiple search trees. Together with further enhancements to the symbolic engine and synthetic data generation, we have significantly boosted the overall solving rate of AlphaGeometry2 to 84% for all geometry problems over the last 25 years, compared to 54% previously. AlphaGeometry2 was also part of the system that achieved silver-medal standard at IMO 2024 https://dpmd.ai/imo-silver. Last but not least, we report progress towards using AlphaGeometry2 as a part of a fully automated system that reliably solves geometry problems directly from natural language input.

Summary

AI-Generated Summary

PDF445February 7, 2025