Uczniowie, którzy wygrali tam, gdzie ich nauczyciele przegrali: narodziła się nowa definicja geniuszu
Lipiec 2025 roku, w australijskiej sali egzaminacyjnej, gdy zegar nieubłaganie tyka, setki nastolatków próbuje rozwiązać jedne z najtrudniejszych i najbardziej wymagających zadań matematycznych. Nie mają dostępu do kalkulatorów ani internetu. Tylko papier, ołówki i własna pomysłowość. Tym, co było niezwykłe w tym roku, był nie tylko ludzki talent zgromadzony na Międzynarodowej Olimpiadzie Matematycznej (IMO), ale także fakt, że po raz pierwszy sztuczna inteligencja osiągnęła coś nie do pomyślenia zaledwie rok temu. I choć maszyny błyszczały jak nigdy dotąd… to ludzie zwyciężyli, przynajmniej na razie.
Innym pytaniem, jakie nasuwa się w tej historii, jest to, czy wraz ze wzrostem znaczenia sztucznej inteligencji w środowisku akademickim nie pojawi się nieuniknione pytanie: co oznacza bycie genialnym w erze, w której sztuczna inteligencja może rozwiązać niemal wszystko?
IMO to nie jest zwykły konkurs. Przez dwa dni uczniowie mierzą się z sześcioma problemami wymagającymi nie tylko logiki i techniki, ale także kreatywności i intuicji matematycznej. Pytania, obejmujące zagadnienia od algebry po teorię liczb, są unikatowe. Jeśli przypominają coś, co zostało już rozwiązane gdziekolwiek na świecie, są odrzucane.
W tym roku wśród uczestników znaleźli się jedni z najbystrzejszych młodych ludzi na świecie, a wśród zaproszonych gości znalazły się czołowe firmy technologiczne, a wśród nich model sztucznej inteligencji Gemini Deep Think firmy Google DeepMind. Sztuczna inteligencja została oceniona według tych samych kryteriów i czasu, co ludzie: cztery i pół godziny na egzamin, bez pomocy z zewnątrz. IMO zajmuje się oryginalnymi, nowatorskimi i niekonwencjonalnymi problemami , podczas gdy sztuczna inteligencja jest trenowana na ogromnej liczbie problemów i powtarza proces. Mimo to sztuczna inteligencja zdobyła złoty medal, perfekcyjnie rozwiązując pięć z sześciu problemów i uzyskując 35 na 42 możliwe punkty, ale nie były to najlepsze wyniki w konkursie.
Dwudziestu sześciu studentów pokonało maszyny. Z amerykańskiego zespołu, który uplasował się za Chińczykami, wyróżnił się Alexander Wang , student z New Jersey, który zdobył swój trzeci z rzędu złoty medal, będąc, jak ujął to „The Wall Street Journal”, jednym z najbardziej utytułowanych młodych matematyków wszech czasów. Drugim był Qiao „Tiger” Zhang , który dzielnie zmierzył się z przerażającym Zadaniem 6, najtrudniejszym w tym roku. To ostatnie zadanie, zadanie kombinatoryczne, zaskoczyło zarówno sztuczne inteligencje, jak i 569 z 630 uczestników. Tylko sześciu studentów rozwiązało je w pełni.
Zhang nie był jednym z nich, ale jego częściowe rozwiązanie było warte więcej niż całkowity brak pomysłów maszyn. Niemniej jednak sam Zhang przewidywał, że w przyszłym roku SI osiągnie wynik idealny. „W dniu, w którym SI rozwiąże Problem 6” – powiedział Zhang – „zacznę się martwić”.
-
Rozważ siatkę kwadratów jednostkowych o wymiarach 2025x2025. Matylda chce umieścić na siatce kilka prostokątnych kafelków, możliwie o różnych rozmiarach, tak aby każda strona każdego kafelka leżała na linii siatki, a każdy kwadrat jednostkowy był pokryty co najwyżej jednym kafelkiem. Określ minimalną liczbę kafelków, które Matylda musi umieścić, aby każdy wiersz i każda kolumna siatki miała dokładnie jeden kwadrat jednostkowy, który nie jest pokryty żadnym kafelkiem.
A gdy Thang Luong, lider zespołu Google DeepMind, został zapytany , czy ten rok przejdzie do historii jako ostatni, w którym ludzie prześcigną sztuczną inteligencję, odpowiedział: „Bardzo możliwe, że tak” .
Twórcy tych SI świętowali swoje osiągnięcia. Google okrzyknął wydajność Gemini historycznym skokiem, nie tylko ze względu na uzyskany wynik, ale także dlatego, że w przeciwieństwie do poprzedniego roku, model był w stanie rozumować bezpośrednio w języku naturalnym, bez konieczności tłumaczenia problemów na kod. Zdążył również sprostać wymaganiom testowym, co jeszcze rok temu byłoby nie do pomyślenia. OpenAI z kolei przetestowało swój model poza oficjalnym wydarzeniem, ale z udziałem niezależnych ewaluatorów i z tymi samymi problemami. Rezultat był ten sam: złoto.
Kilka miesięcy przed zawodami , w maju 2025 roku, na kampusie Uniwersytetu Kalifornijskiego w Berkeley odbyło się niezwykłe spotkanie. Trzydziestu najbardziej prestiżowych matematyków świata zebrało się na tajnym spotkaniu, nie po to, by debatować między sobą, lecz by zmierzyć się ze sztuczną inteligencją: o4-mini. To najnowocześniejszy model językowy opracowany przez OpenAI, zdolny do rozumowania z niespotykaną dotąd szybkością i dokładnością. Próbowali oni stawiać niezwykle złożone problemy, które przytłoczyłyby sztuczną inteligencję, ale ta wykazała się niespotykaną dotąd zdolnością rozwiązywania problemów. Uczestnicy zauważyli, że to było jak spotkanie z niezwykle kompetentnym doktorantem, „a nawet bardziej”.
Czy to oznacza, że ci badacze ponieśli porażkę, podczas gdy młodzi odnieśli sukces? Odpowiedź brzmi: nie, ponieważ kontekst i sposób rozwiązywania problemów są różne, ale istnieje interesujące tło.
Jeśli zapytamy samego Gemini, jego konkluzja jest taka, że w IMO uczniowie pokonują sztuczną inteligencję w rozwiązywaniu problemów przeznaczonych dla osób wyszkolonych na poziomie konkurencyjnym, wykorzystując kreatywność, rygor i intuicję matematyczną w ograniczonym czasie. Zadania IMO mają na celu stymulowanie pomysłowości i myślenia lateralnego, a nie tylko brutalnej siły logicznej, a sztuczne inteligencje wciąż mają problemy z tego typu problemami, które wymagają nieoczywistych skoków rozumowania. Jednak sztuczna inteligencja coraz częściej wygrywa w problemach formalnych, ustrukturyzowanych lub masowo eksploracyjnych, takich jak badania naukowe .
Doświadczeni matematycy pracują nad odkrywaniem nowych teorii, a nie tylko nad rozwiązywaniem zagadek. Porównanie to pokazuje, że ścieżka ludzkiej matematyki nie jest liniowa; można osiągnąć sukces, rozwiązując to, co inni przed nami stawiają (moim zdaniem), a następnie próbować tworzyć problemy, których nikt nigdy nie rozwiązał. Nie chodzi więc o to, że jedni przegrywają, a inni wygrywają. Chodzi o to, że znajdują się na różnych etapach tego samego procesu.
Daleko im do postrzegania tej ewolucji jako zagrożenia, niektórzy z tych samych ludzi, którzy zaprojektowali te maszyny, widzą w niej nową formę współpracy. „Ta sztuczna inteligencja jest jak nowy kalkulator” – powiedział Thang Luong, lider zespołu DeepMind. „Narzędzie, które może nas rozwinąć, a nie zastąpić”.
Sam Zhang, mimo że pokonał sztuczną inteligencję, nie postrzega jej jako rywala, lecz raczej jako zachętę do lepszego, głębszego i odważniejszego myślenia. Były złoty medalista i obecny badacz DeepMind, Junehyuk Jung, zgadza się: prawdziwie złożone problemy – takie jak słynny Problem 6 – będą stanowić wyzwanie dla maszyn przez lata.
Matematycy na tajnym spotkaniu zastanawiali się, czy w przyszłości mogliby stać się „autorami pytań”, kierującymi SI w stronę nowych odkryć. A jeśli tak, to jeszcze nie wiedzą, co by to oznaczało.
Kilka lat temu bycie genialnym w matematyce oznaczało między innymi umiejętność rozwiązywania problemów, których nikt inny nie potrafił. Dziś to już nie wystarcza. Kiedy maszyny osiągną ten sam poziom, nowy obszar geniuszu leży gdzie indziej: przede wszystkim w umiejętności formułowania nowych pytań. Bo choć sztuczna inteligencja potrafi umiejętnie rozwiązywać problemy, to jeszcze nie wie, o co warto pytać.
ABC.es