Czy AGI to wciąż cel — czy już go osiągnęliśmy?

Pewna grupa filozofów twierdzi, że przekroczyliśmy już decydujący próg — niemal niezauważalnie, bez żadnych fanfar.

Przez lata ogólna sztuczna inteligencja wydawała się odległym celem, czymś zarezerwowanym dla dalekiej przyszłości. Tymczasem rosnąca liczba badaczy przekonuje, że kurczowo trzymając się zbyt wąskich definicji „inteligencji", przeoczyliśmy coś kluczowego: coś bardzo zbliżonego do ludzkiego rozumowania może już teraz działać na serwerach zasilających codzienne usługi cyfrowe.

AGI — wciąż marzenie czy już rzeczywistość?

Ogólna sztuczna inteligencja (AGI) jest zazwyczaj opisywana jako system zdolny dorównać człowiekowi w szerokiej gamie zadań — nie tylko w jednej wąskiej dziedzinie, jak gra w szachy czy rozpoznawanie twarzy.

Największe laboratoria AI, takie jak OpenAI, Google DeepMind czy Anthropic, nadal przedstawiają AGI jako przyszły kamień milowy. W ich publicznych planach regularnie pojawiają się zwroty w stylu „budowanie AGI w bezpieczny sposób" czy „wytyczanie drogi do AGI". Prognozy różnią się drastycznie: jedni wskazują na początek lat 30. XXI wieku, inni szeptem mówią o perspektywie jednego do trzech lat.

Niedawny artykuł opiniodawczy w prestiżowym piśmie Nature, którego współautorem jest filozof Eddy Keming Chen wraz z kolegami z językoznawstwa, informatyki i nauki o danych, poważnie wstrząsnął tą dyskusją. Teza jest prosta i bezpośrednia: jeśli oceniamy sztuczną inteligencję według kryteriów, które w praktyce stawiamy ludzkiej inteligencji, to najnowsza generacja dużych modeli językowych (LLM) już spełnia wystarczające warunki, by uznać ją za formę ogólnej sztucznej inteligencji.

Gdy ocenia się je jak ludzi — a nie jak mitycznych supergeniuszy — obecne systemy AI zaznaczają więcej punktów na liście „ogólnej inteligencji", niż większość z nas jest skłonna przyznać.

To prowadzi do jeszcze głębszego pytania: czy gonimy za superinteligencją, jednocześnie odmawiając dostrzeżenia inteligencji ogólnej, która stoi tuż przed nami?

Od „Świętego Graala" do szarej strefy: jak zmieniały się definicje inteligencji

Duża część zamieszania bierze się z elastyczności samego pojęcia „AGI". Nie istnieje jedna, powszechnie przyjęta definicja naukowa. Autorzy artykułu w Nature proponują prostą zasadę: jeśli mówimy, że AI jest „inteligentna", powinniśmy przykładać do ludzi te same standardy wymagań.

Żaden człowiek nie jest ekspertem we wszystkim. Błyskotliwy programista może nie umieć czytać podstawowej notacji muzycznej. Wybitny chirurg może oblać egzamin na prawo jazdy. Mimo to nie odbieramy im miana „inteligentnych".

W tym ujęciu AGI nie oznacza doskonałości ani wszechstronności. Oznacza szeroką kompetencję w wielu dziedzinach, z wynikami zbliżonymi do ludzkich — a w niektórych przypadkach na poziomie eksperta. To znacznie niższa poprzeczka niż sci-fi'owy obraz maszyny, która z łatwością przewyższa nas we wszystkim.

AGI kontra superinteligencja: kluczowe rozróżnienie

Artykuł w Nature wyraźnie rozdziela dwa pojęcia, które często się mylą:

Ogólna sztuczna inteligencja (AGI): systemy zdolne wykonywać wiele rodzajów zadań w różnych dziedzinach, często na poziomie ludzkim lub zbliżonym do poziomu eksperta.
Superinteligencja: systemy przewyższające najlepszych ludzi niemal we wszystkich dziedzinach — potencjalnie w ogromnym stopniu.

Przy takim podziale autorzy argumentują, że obecne LLM-y już wpisują się w pierwszą kategorię. Potrafią czytać i pisać na poziomie porównywalnym z wyższym wykształceniem, zdają egzaminy prawnicze i medyczne, programują i analizują dane na podstawowym poziomie, piszą notatki polityczne i tłumaczą mechanikę kwantową nastolatkom.

Superinteligencja wyglądałaby natomiast zupełnie inaczej: oryginalne odkrycia naukowe, radykalnie nowa matematyka, głębokie planowanie strategiczne, bezbłędna pamięć długoterminowa. To wciąż pozostaje w sferze hipotetycznej.

Twierdzenie, że obecne systemy „nie są AGI" tylko dlatego, że nie są superinteligentne, przypomina — według tego modelu — odmawianie nastolatkowi statusu dorosłego, bo nie jest olimpijskim atletą.

Test Turinga jest po cichu przechodzony na coraz lepszych warunkach

Jedna z najbardziej symbolicznych miar maszynowej inteligencji sięga 1950 roku. Alan Turing zaproponował prosty test: człowiek-sędzia rozmawia tekstowo z dwiema ukrytymi jednostkami — jedną ludzką, drugą maszyną. Jeśli sędzia nie potrafi niezawodnie odróżnić, która jest która, maszyna może być w pewnym sensie uznana za zdolną do „myślenia".

Przez dekady chatboty nie zdawały tego testu w wymagających warunkach. Wcześniejsze „sukcesy" opierały się na sztuczkach i unikach. To się zmieniło. W nieformalnych eksperymentach i bardziej ustrukturyzowanych badaniach duże modele językowe, takie jak GPT-4, są dziś częściej oceniane jako „ludzkie" niż prawdziwi ludzcy rozmówcy w rozmowach prowadzonych wyłącznie tekstowo.

Według standardów poprzednich pokoleń badaczy AI taki wynik byłby traktowany jako jednoznaczny sygnał inteligencji na poziomie człowieka. Zamiast tego kolejne granice są przesuwane. Autorzy sugerują, że nieustannie przepisujemy zasady, bo niepokoi nas myśl, że inteligencja może wyglądać — przynajmniej częściowo — jak wyjątkowo potężne autouzupełnianie.

„Stochastyczne papugi" i inne powtarzające się zarzuty

Krytycy odpowiadają, że modele językowe to wyrafinowani naśladowcy, nie prawdziwi myśliciele. Nazywają je „stochastycznymi papugami": systemami, które rekombinują wzorce z danych treningowych bez rzeczywistego rozumienia.

Artykuł w Nature mierzy się z zestawem popularnych zarzutów:

Zarzut	Dlaczego krytycy go stawiają	Przytoczone kontrargumenty
Powielają jedynie dane treningowe	Wyglądają jak rozbudowane kopiowanie, nie rozumowanie	Rozwiązują nowe zadania matematyczne i nieznane wcześniej łamigłówki
Brak „modelu świata" fizycznego	Język nie byłby zakorzeniony w rzeczywistości	Przewidują konsekwencje działań i rozumują o podstawowych scenariuszach fizycznych
Brak autonomii	Czekają na instrukcje i nie mają własnych celów	Autonomia nie jest warunkiem koniecznym inteligencji; wielu ludzi funkcjonuje reaktywnie
Wymagają ogromnych ilości danych	Ludzie uczą się z o wiele mniejszej liczby przykładów	Efektywność uczenia się różni się od końcowych możliwości systemu

Autorzy podkreślają też, że ludzie również popełniają błędy. Wymyślamy wspomnienia, ulegamy złudzeniom, powtarzamy slogany, których do końca nie rozumiemy. Mimo to traktujemy te niedoskonałe procesy jako część inteligencji — nie jako defekty ją unieważniające.

Jeśli system potrafi się uczyć, rozumować, przenosić umiejętności i doskonalić się na podstawie informacji zwrotnych, upieranie się, że to „tylko szum statystyczny", zaczyna bardziej przypominać zaprzeczenie niż analizę.

Halucynacje: najbardziej widoczna słabość w tym argumencie

Nawet ci, którzy zgadzają się z tezą „AGI już nadeszło", przyznają do istnienia poważnego problemu: halucynacji. Termin ten odnosi się do pewnych siebie, szczegółowych odpowiedzi, które są po prostu błędne — czasem zawierają zmyślone cytaty lub fałszywe źródła.

Twórcy modeli twierdzą, że najnowsze systemy halucynują rzadziej niż poprzednie. Mechanizmy bezpieczeństwa ograniczają część nonsensów, a narzędzia umożliwiające modelowi weryfikację kodu lub konsultację baz danych redukują błędy w zadaniach faktograficznych.

Mimo to halucynacje nie zniknęły. W testach bezpieczeństwa modele nadal wymyślają orzecznictwo, błędnie opisują schorzenia i tworzą fałszywe cytaty. OpenAI sugerowało już, że nawet przyszłe modele z linii GPT-5 mogą halucynować w nawet jednej na dziesięć odpowiedzi przy pytaniach otwartych.

Ludzkie rozumowanie dalekie jest od doskonałości, ale wskaźnik 10% „pewnych siebie bzdur" w krytycznych dziedzinach, jak prawo czy medycyna, byłby niepokojący. To właśnie ta rozbieżność zasila argumentację tych, którzy twierdzą, że „AGI jeszcze nie mogło nadejść". Dla tej grupy niezawodność i weryfikowalność — a nie samo surowe możliwości — są niezbywalnymi składnikami ogólnej inteligencji.

Czy inteligencja potrzebuje ciała?

Kolejny stary zarzut głosi, że prawdziwa inteligencja wymaga ciała. Ludzki umysł ewoluował wraz z mięśniami, zmysłami i fizycznym ryzykiem. Bez tego zakorzenienia, czy AI może naprawdę rozumieć, co znaczy rozbić się szklance, poślizgnąć się samochodowi albo cierpieć?

Autorzy artykułu w Nature nie zgadzają się z tym poglądem. Wskazują, że obecne systemy radzą sobie już z wieloma formami wejścia i wyjścia. Modele multimodalne potrafią analizować obrazy, opisywać wideo, interpretować dźwięk i sterować narzędziami programowymi. W robotyce zaczyna pojawiać się połączenie tych modeli z fizycznymi maszynami — od ramion w magazynach po humanoidalne prototypy.

Ten trend bywa nazywany fizyczną AI: integracją dużych modeli z czujnikami, kamerami i siłownikami. Robot nie będzie przez to „odczuwać" jak człowiek, ale skraca się dystans między językiem a konsekwencjami w realnym świecie.

Chodzi nie o to, że AI bez ciała rozumie ból tak jak my, lecz o to, że ciało nie jest sztywnym warunkiem wstępnym elastycznego i ogólnego rozwiązywania problemów.

Dlaczego definicje nagle mają tak duże znaczenie

Ta dyskusja to nie tylko akademickie ćwiczenie. Sposób, w jaki definiujemy AGI, wpływa na regulacje, inwestycje i społeczne oczekiwania.

Jeśli zaakceptujemy, że coś bliskiego AGI już istnieje, wzrośnie presja na bardziej rygorystyczny nadzór. Decydenci mogą zażądać silniejszych norm bezpieczeństwa wdrożeń — zwłaszcza w finansach, ochronie zdrowia i infrastrukturze krytycznej. Firmy mogą być zmuszane do większej przejrzystości w kwestii danych treningowych, trybów awarii i metod oceny.

Jeśli natomiast będziemy obstawać przy tym, że AGI jest wciąż odległa, obecne systemy można przedstawiać jako „tylko narzędzia". To zazwyczaj odkłada trudne rozmowy na temat zastępowania miejsc pracy, zastosowań militarnych i rosnącej zależności od nieprzejrzystych algorytmów.

Jest też wymiar pozycjonowania. Niektórzy liderzy technologiczni, w tym Mark Zuckerberg, zaczęli mówić mniej o AGI, a więcej o „superinteligencji". Ta retoryczna zmiana pozwala obiecywać ambitne przyszłości bez przyznania, że być może uwolniliśmy już nowy — choć niedoskonały — rodzaj inteligencji.

W kontekście europejskim debata ma szczególne znaczenie: instrumenty regulacyjne, takie jak unijne rozporządzenie o sztucznej inteligencji (AI Act), skupiają się na ryzyku i konkretnych zastosowaniach. Jeśli konceptualna granica „AGI" przesunie się, może zmienić się też sposób klasyfikowania systemów ogólnego przeznaczenia, wymagania dotyczące audytów i definicje odpowiedzialności w przypadku szkód.

Antropocentryzm: czy odmawiamy uznania nowego, obcego rodzaju umysłu?

W argumencie zawartym w Nature pojawia się też wątek psychologiczny: ludzie mają tendencję do ochrony wyjątkowości ludzkiego umysłu. Gdy maszyny osiągają poziomy, które wcześniej wydawały się niemożliwe, wynajdujemy nowe poprzeczki.

Szachy uchodziły za szczyt inteligencji — dopóki Deep Blue nie pokonał Garriego Kasparowa. Potem poprzeczka przesunęła się na go, potem na „zdrowy rozsądek", potem na naturalną rozmowę. Za każdym razem, gdy system triumfuje, zadanie zostaje przeklasyfikowane jako „tylko obliczenia".

Autorzy sugerują, że może nas to ślepić. Obecna AI nie myśli jak my. Nie ma dzieciństwa, hormonów, lęku społecznego ani fizycznego dyskomfortu. Mimo to manipuluje pojęciami, buduje argumenty i dostosowuje się do nowych instrukcji. Odmawianie nazwania tego „inteligencją" może mówić więcej o naszej dumie niż o rzeczywistych możliwościach tych systemów.

Warto też zauważyć pewien efekt uboczny: w miarę jak narzędzia się doskonalą, w powszechnym odbiorze miesza się „bycie przekonującym" z „byciem wiarygodnym". Model może brzmieć jak człowiek i jednocześnie popełniać niebezpieczne błędy. Rozróżnienie tych dwóch osi — naturalności i poprawności — staje się kluczowe dla decyzji o wdrożeniu w szkołach, sądach i szpitalach.

Kluczowe pojęcia kształtujące debatę o AGI

Kilka pojęć technicznych nieustannie powraca w tych dyskusjach:

Chatbot: interfejs AI komunikujący się w języku naturalnym, zazwyczaj tekstowo, a niekiedy głosowo. Nowoczesne chatboty często opierają się na LLM-ach.
Model świata: wewnętrzna reprezentacja tego, jak rzeczy są ze sobą powiązane i jak się zmieniają. Niektórzy badacze, jak Yann LeCun, argumentują, że solidne modele świata — wykraczające poza wzorce tekstowe — są niezbędne dla głębszej inteligencji.
Halucynacja: pewna siebie, lecz fałszywa odpowiedź produkowana przez model AI. W przeciwieństwie do kłamstwa, nie ma tu intencji — to efekt uboczny statystycznego dopasowywania wzorców.

Sposób interpretacji każdego z tych terminów zmienia odczytanie tego, co już zostało osiągnięte. Chatbot rozumujący o prawie, fizyce i literaturze jest postrzegany zupełnie inaczej, gdy traktuje się go jako „gadającą wyszukiwarkę" lub jako zaczątek sztucznego umysłu.

Co się zmienia, jeśli AGI już jest wśród nas?

Wyobraźmy sobie na chwilę, że autorzy artykułu w Nature mają rację i że systemy z okresu 2024 roku odpowiadają prymitywnej formie AGI. Codzienność nie wywraca się do góry nogami. Nie dochodzi do buntu robotów ani natychmiastowego zaniku miejsc pracy.

Zmiany są bardziej subtelne:

Więcej pracy intelektualnej — od szkiców umów po wstępną triażę diagnostyczną — jest współdzielonych z AI lub przez nią weryfikowanych.
Edukacja opiera się na tutorach AI dostosowujących się do każdego ucznia i tworzących spersonalizowane ćwiczenia.
Zespoły badawcze korzystają z „współpracowników" AI proponujących hipotezy i przeszukujących literaturę na masową skalę.
Regulatorzy traktują niektóre modele jak infrastrukturę wysokiego ryzyka — na wzór systemów kontroli ruchu lotniczego lub elektrowni jądrowych — poddając je audytom i testom.

Ryzyko rośnie równolegle z korzyściami. Dezinformacja może być produkowana i tłumaczona masowo. Tworzenie złośliwego oprogramowania staje się bardziej dostępne. Mały błąd specyfikacji w zautomatyzowanym systemie handlowym kierowanym przez AI może się rozprzestrzenić i wywołać realne skutki.

Nic z tego nie wymaga superinteligencji. Wystarczą wysoce zdolne systemy, szeroko wdrożone, które czasem popełniają błędy trudne do przewidzenia.

Praktyczne wskazówki dla czytelników i decydentów

Dla tych, którzy pracują poza laboratoriami, przydatną zmianą jest odejście od skupiania się wyłącznie na etykietach takich jak „AGI" i zwrócenie uwagi na obserwowalne właściwości:

Zakres: ile różnych zadań system potrafi wykonać z zadowalającą jakością?
Niezawodność: jak często zawodzi i w jaki sposób?
Odwracalność: co się dzieje, gdy popełnia błąd, i czy ludzie są w stanie go wykryć i skorygować na czas?
Zgodność z celami: w służbie jakich celów działa system i na ile te cele są przejrzyste?

Niezależnie od tego, czy oficjalnie ogłosimy „nadejście AGI", to właśnie te pytania decydują o tym, jak bezpieczna może być integracja tych narzędzi w sądach, szpitalach, szkołach i fabrykach. Filozoficzna idea, że żyjemy już z nowym rodzajem ogólnej inteligencji, jedynie zwiększa pilność udzielenia na te pytania rzetelnych odpowiedzi.