Ученики, которые победили там, где их учителя проиграли: рождается новое определение гениальности
Июль 2025 года. В экзаменационной аудитории в Австралии, под неумолимо тикающие часы, сотни подростков пытаются решить самые сложные и запутанные математические задачи. У них нет доступа к калькуляторам или интернету. Только бумага, карандаши и их изобретательность. В этом году выдающимся был не только человеческий талант, собранный на Международной математической олимпиаде (ММО), но и тот факт, что впервые искусственный интеллект достиг чего-то немыслимого всего год назад. И хотя машины блистали как никогда прежде… люди победили, по крайней мере, пока.
Еще один вопрос, который поднимает эта история, заключается в том, не возникает ли неизбежного вопроса по мере того, как ИИ становится все более влиятельным явлением в академической среде: что значит быть блестящим в эпоху, когда ИИ может решить практически что угодно?
IMO — это не обычное соревнование. В течение двух дней учащиеся решают шесть задач, требующих не только логики и техники, но и креативности и математической интуиции. Задания, охватывающие широкий спектр вопросов — от алгебры до теории чисел, — разработаны таким образом, чтобы быть уникальными. Если они похожи на что-то уже решённое где-либо в мире, они отбрасываются.
В этом году среди участников были одни из самых ярких молодых людей планеты, а среди приглашенных гостей – ведущие технологические компании, которые особо отметили модель искусственного интеллекта Gemini Deep Think от Google DeepMind. Этот ИИ оценивался по тем же критериям и за то же время, что и люди: четыре с половиной часа на экзамен, без посторонней помощи. В IMO решаются оригинальные, новые и нестандартные задачи , в то время как ИИ обучается на огромном количестве задач и повторяет процесс. Тем не менее, ИИ завоевал золотую медаль, идеально решив пять из шести задач и набрав 35 баллов из 42 возможных, но это были не самые высокие результаты мероприятия.
Двадцать шесть учеников превзошли машины. Из американской команды, которая финишировала позади китайской, выделялся Александр Ван , ученик из Нью-Джерси, завоевавший третью золотую медаль подряд и, по словам The Wall Street Journal, один из самых титулованных молодых математиков всех времён. Другим был Цяо «Тигр» Чжан , который мужественно справился с пугающей шестой задачей, самой сложной в этом году. Эта последняя задача, комбинаторная, поставила в тупик как искусственный интеллект, так и 569 из 630 участников. Только шесть учеников полностью решили её.
Чжан не был одним из них, но его частичное решение стоило больше, чем полное отсутствие идей у машин. Тем не менее, сам Чжан предсказал, что в следующем году ИИ сможет достичь идеального результата. «В тот день, когда ИИ сможет решить Задачу 6, — сказал Чжан, — я начну беспокоиться».
-
Рассмотрим сетку размером 2025x2025, состоящую из единичных квадратов. Матильда хочет разместить на ней несколько прямоугольных плиток, возможно, разных размеров, так, чтобы каждая сторона каждой плитки лежала на одной линии сетки, а каждая единичная клетка была покрыта не более чем одной плиткой. Определите минимальное количество плиток, которое Матильда должна разместить, чтобы в каждой строке и каждом столбце сетки был ровно один единичный квадрат, не закрытый ни одной плиткой.
А когда Танга Луонга, руководителя команды Google DeepMind, спросили , станет ли этот год последним годом, когда люди превзойдут ИИ, он ответил: «Вполне возможно» .
Создатели этих ИИ отпраздновали свои достижения. Google назвала выступление Gemini историческим скачком не только из-за полученного результата, но и потому, что, в отличие от предыдущего года, модель смогла рассуждать непосредственно на естественном языке, без необходимости переводить задачи в код. Она также выдержала испытание, что было бы немыслимо ещё год назад. OpenAI, в свою очередь, протестировала свою модель вне официального мероприятия, но с независимыми оценщиками и на тех же задачах. Результат был тот же: золото.
За несколько месяцев до этого соревнования , в мае 2025 года, в кампусе Калифорнийского университета в Беркли состоялась необычная встреча. Тридцать самых известных математиков мира собрались на секретном конклаве не для того, чтобы подискутировать друг с другом, а чтобы сразиться с искусственным интеллектом: o4-mini. Это передовая языковая модель, разработанная OpenAI, способная рассуждать с беспрецедентной скоростью и точностью. Они пытались сформулировать сложнейшие задачи, которые были бы непосильны для ИИ, но он продемонстрировал беспрецедентную способность к решению задач. Участники отметили, что это было похоже на встречу с невероятно компетентным аспирантом, «даже более того».
Означает ли это, что эти исследователи потерпели поражение, а молодые одержали победу? Ответ — нет, поскольку контекст и подход к решению проблем иные, но есть и интересная предыстория.
Если спросить саму Gemini, то её вывод заключается в том, что в IMO студенты опережают ИИ в решении задач, разработанных для подготовленных на соревнованиях людей, применяя креативность, строгость и математическую интуицию в условиях ограниченного времени. Задачи IMO разработаны для развития изобретательности и нестандартного мышления, а не только грубой логики, и ИИ всё ещё с трудом справляется с задачами такого типа, требующими неочевидных рассуждений. Однако ИИ всё чаще побеждает в формальных, структурированных или масштабных исследовательских задачах, например, в чисто исследовательских .
Опытные математики работают над открытием новых теорий, а не просто над решением головоломок. Сравнение показывает, что путь развития человеческой математики нелинеен: можно преуспеть, решая задачи, которые ставят перед вами другие (на мой взгляд), а затем попытаться создать задачи, которые никто ещё не решал. Так что дело не в том, что одни проигрывают, а другие выигрывают. Дело в том, что они находятся на разных этапах одного и того же процесса.
Некоторые из тех же людей, которые разрабатывали эти машины, не видят в этой эволюции угрозы, а скорее рассматривают её как новую форму сотрудничества. «Этот ИИ подобен новому калькулятору», — сказал Тханг Лыонг, руководитель команды DeepMind. «Инструмент, который может продвинуть нас вперёд, а не заменить нас».
Сам Чжан, несмотря на победу над ИИ, видит в нём не соперника, а скорее стимул мыслить лучше, глубже и смелее. Бывший золотой медалист, а ныне исследователь DeepMind Джунхёк Чон согласен: по-настоящему сложные задачи, такие как знаменитая Задача №6, будут ещё долгие годы бросать вызов машинам.
Математики на секретной встрече размышляли о том, смогут ли они в конечном итоге стать «задающими вопросы», направляя ИИ к новым открытиям. И если да, то они пока не знают, что это повлечёт за собой.
Несколько лет назад быть блестящим математиком означало, помимо прочего, умение решать задачи, которые не мог решить никто другой. Сегодня этого уже недостаточно. Когда машины смогут достичь того же уровня, новая сфера гениальности будет заключаться в другом: в способности, прежде всего, формулировать новые вопросы. Ведь, хотя ИИ может искусно решать задачи, он пока не знает, какие вопросы стоит задавать.
ABC.es