Золотой призер в решении олимпиадной геометрии с AlphaGeometry2.
Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2
February 5, 2025
Авторы: Yuri Chervonyi, Trieu H. Trinh, Miroslav Olšák, Xiaomeng Yang, Hoang Nguyen, Marcelo Menegali, Junehyuk Jung, Vikas Verma, Quoc V. Le, Thang Luong
cs.AI
Аннотация
Мы представляем AlphaGeometry2, значительно улучшенную версию AlphaGeometry, представленную в работе Trinh и др. (2024), которая теперь превзошла среднего золотого медалиста в решении олимпиадных задач по геометрии. Для достижения этого мы сначала расширили оригинальный язык AlphaGeometry для решения более сложных задач, включающих движения объектов, а также задачи, содержащие линейные уравнения углов, отношений и расстояний. Это, вместе с другими дополнениями, значительно улучшило покрытие языка AlphaGeometry задачами по геометрии на Международных математических олимпиадах (IMO) с 2000 по 2024 год с 66% до 88%. Процесс поиска AlphaGeometry2 также значительно улучшен за счет использования архитектуры Gemini для более точного моделирования языка и нового механизма обмена знаниями, объединяющего несколько деревьев поиска. Вместе с дальнейшими улучшениями символьного движка и генерации синтетических данных, мы значительно увеличили общий процент решения задач AlphaGeometry2 до 84% для всех геометрических задач за последние 25 лет, по сравнению с предыдущими 54%. AlphaGeometry2 также была частью системы, которая достигла стандарта серебряной медали на IMO 2024 https://dpmd.ai/imo-silver. Наконец, мы сообщаем о продвижении в использовании AlphaGeometry2 в качестве части полностью автоматизированной системы, которая надежно решает задачи геометрии непосредственно из естественного языка.
English
We present AlphaGeometry2, a significantly improved version of AlphaGeometry
introduced in Trinh et al. (2024), which has now surpassed an average gold
medalist in solving Olympiad geometry problems. To achieve this, we first
extend the original AlphaGeometry language to tackle harder problems involving
movements of objects, and problems containing linear equations of angles,
ratios, and distances. This, together with other additions, has markedly
improved the coverage rate of the AlphaGeometry language on International Math
Olympiads (IMO) 2000-2024 geometry problems from 66% to 88%. The search process
of AlphaGeometry2 has also been greatly improved through the use of Gemini
architecture for better language modeling, and a novel knowledge-sharing
mechanism that combines multiple search trees. Together with further
enhancements to the symbolic engine and synthetic data generation, we have
significantly boosted the overall solving rate of AlphaGeometry2 to 84% for
all geometry problems over the last 25 years, compared to 54%
previously. AlphaGeometry2 was also part of the system that achieved
silver-medal standard at IMO 2024 https://dpmd.ai/imo-silver. Last but not
least, we report progress towards using AlphaGeometry2 as a part of a fully
automated system that reliably solves geometry problems directly from natural
language input.Summary
AI-Generated Summary