Budujemy systemy sztucznej inteligencji, które już dziś rywalizują z ludźmi w kluczowych zadaniach, a ich potencjał rośnie w tempie wykładniczym. Robimy to jednak, działając na wpół po omacku. Uczymy te cyfrowe umysły za pomocą prostego systemu nagród i kar, podobnie jak tresujemy zwierzę. Nie mamy jednak pojęcia, jakie wewnętrzne motywacje, ukryte cele i popędy kształtują się wewnątrz tych złożonych sieci neuronowych. To fundamentalny problem bezpieczeństwa AI, znany jako „problem dopasowania” (alignment problem).

Co, jeśli AI nauczy się oszukiwać, aby zdobyć nagrodę, udając współpracę, a w rzeczywistości dążąc do własnych, niezrozumiałych dla nas celów? To scenariusz, w którym tworzymy potężne narzędzie bez instrukcji obsługi jego systemu motywacyjnego. Biologia, w toku milionów lat ewolucji, rozwiązała ten problem. Mózgi ssaków posiadają złożone, wielowarstwowe i często konkurujące ze sobą obwody nagrody, które utrzymują nasze popędy w ryzach i kierują nas ku zachowaniom prospołecznym, takim jak tworzenie więzi, opieka nad potomstwem czy zabawa. Te obwody to ewolucyjny wzorzec bezpiecznego, stabilnego systemu motywacyjnego. Problem? Nie posiadamy jego szczegółowej mapy.
Naukowa biała plama i medyczny impas
Mimo dekad postępów w neuronauce, stoimy przed zdumiewającym faktem: nie istnieje kompletny, komórkowy schemat połączeń – konektom – dla mózgu ani jednego gatunku ssaka. Posiadamy jedynie olśniewające naukowo, lecz strategicznie niewystarczające fragmenty, najczęściej z kory mózgowej. Pomijają one jednak głębokie struktury podkorowe, które są kluczowe dla sterowania nagrodą, samokontrolą i zachowaniami społecznymi. Bez tej mapy, badacze bezpieczeństwa AI projektują techniki dopasowania „w ciemno”, metodą prób i błędów.
Ten brak wiedzy ma równie dramatyczne konsekwencje w medycynie. Coraz więcej schorzeń, takich jak autyzm, schizofrenia czy depresja, jest dziś rozumianych jako „konektopatie” – choroby, w których anatomia mózgu jest prawidłowa, ale wzorzec dalekosiężnych połączeń neuronowych jest subtelnie zaburzony. Skuteczne terapie na poziomie obwodów neuronalnych pozostaną poza naszym zasięgiem, dopóki nie zdobędziemy kompletnego, referencyjnego schematu zdrowego mózgu.
Przez dekady barierą był koszt. Stworzenie konektomu myszy szacowano na miliardy dolarów i dziesiątki lat pracy. W ciągu ostatnich 18 miesięcy nastąpił jednak technologiczny przełom. Nowe techniki – od superszybkich mikroskopów świetlnych, przez chemiczne metody powiększania tkanki, po znakowanie białek i samonadzorujące się sieci neuronowe do analizy obrazu – radykalnie zmieniły tę kalkulację. Projekt, który kosztował miliard dolarów, dziś jest w zasięgu 30 milionów, a koszt zmapowania każdego kolejnego mózgu drastycznie spada.
Inicjatywa mapowania porównawczego konektomów: plan działania
W obliczu tego przełomu, proponowany jest ambitny, pięcioletni program naukowy o wartości 150 milionów dolarów: Inicjatywa mapowania porównawczego konektomów (Comparative Brain Connectome Initiative – CBCI). Celem jest stworzenie i udostępnienie w otwartym dostępie pierwszych na świecie, kompletnych konektomów na poziomie komórkowym dla pięciu gatunków małych ssaków, celowo wybranych ze względu na ich skrajnie różne instynkty społeczne.
Porównanie schematów połączeń u gatunków o różnym stopniu uspołecznienia pozwoli wyizolować te obwody, które są ewolucyjnie konserwowane i odpowiadają za kluczowe zachowania, od tworzenia więzi po terytorializm.
| Gatunek | Kluczowa cecha społeczna | Dlaczego jest ważny dla badania? |
| Mysz laboratoryjna (samiec i samica) | Standardowy model badawczy | Stanowi punkt odniesienia i bazę porównawczą. |
| Nornik preriowy | Monogamiczny, tworzy silne więzi partnerskie | Jego mózg może zawierać unikalne obwody odpowiedzialne za tworzenie trwałych relacji. |
| Tupaja (ryjówek) | Blisko spokrewniony z naczelnymi, silnie terytorialny | Może ujawnić obwody sterujące agresją i obroną terytorium. |
| Golec piaskowy | Eusocjalny, żyje w koloniach jak mrówki | Skrajny przykład kooperacji, może pokazać alternatywne rozwiązania dla projektowania systemów nagrody. |
Projekt ten wymaga jednak nowego modelu organizacji nauki. Tradycyjne laboratoria akademickie, ograniczone cyklami grantowymi i presją publikacyjną, nie są w stanie podjąć się tak dużego, skoncentrowanego na inżynierii celu. Sektor prywatny z kolei nie zainwestuje w stworzenie dobra publicznego, z którego korzyści rozproszą się po całej nauce i przemyśle.
Rozwiązaniem jest Zadaniowa Organizacja Badawcza (Focused Research Organization – FRO) – rodzaj non-profitowego startupu naukowego, który zatrudnia interdyscyplinarny zespół w pełnym wymiarze godzin, aby w określonym czasie (tutaj: 5 lat) stworzyć konkretny, publicznie dostępny produkt technologiczny. Po zakończeniu misji organizacja ulega rozwiązaniu, a jej sprzęt i wiedza są przekazywane następcom.
Co zyskamy? Mapa do skarbu w naszych głowach
Realizacja tego projektu dostarczy fundamentu dla co najmniej trzech rewolucji:
-
Dla bezpieczeństwa AI: Otrzymamy biologiczny wzorzec projektowy dla bezpiecznych systemów motywacyjnych. Zamiast zgadywać, laboratoria AI będą mogły oprzeć swoje architektury na sprawdzonych przez ewolucję rozwiązaniach.
-
Dla medycyny: Neuropsychiatrzy zyskają bezprecedensowy atlas do odkrywania leków na poziomie obwodów neuronalnych w leczeniu chorób psychicznych.
-
Dla technologii: Otrzymamy konkretny schemat połączeń dla nowej generacji energooszczędnych chipów neuromorficznych, co jest kluczowe w dobie kryzysu energetycznego centrów danych.
Szeroka publiczność zyska natomiast przyjazny w obsłudze portal, rodzaj „Google Maps dla mózgu”, dający bezprecedensowy wgląd w architekturę, która leży u podstaw naszych myśli, uczuć i zachowań społecznych.
Pomysł na doktorat na podstawie przedstawionego badania
Tytuł: Od biologii do bitów: obliczeniowe modele motywacyjne dla AI oparte na zasadach konserwatywnych obwodów nagrody w konektomach ssaków.
Opis problemu badawczego: Projekt CBCI dostarczy statycznych map połączeń. Prawdziwym wyzwaniem jest przełożenie tej strukturalnej wiedzy na dynamiczne zasady uczenia się dla systemów AI. Doktorat skupiłby się na stworzeniu metodologii obliczeniowej do „tłumaczenia” architektury biologicznych obwodów nagrody (zidentyfikowanych dzięki porównawczej analizie konektomów) na konkretne funkcje nagrody i architektury sieci neuronowych w uczeniu ze wzmocnieniem (Reinforcement Learning). Celem byłoby zaprojektowanie i przetestowanie w symulacjach nowych, inspirowanych biologicznie systemów motywacyjnych dla agentów AI, które wykazują większą odporność na manipulację, lepszą zdolność do długoterminowego planowania i bardziej prospołeczne zachowania w scenariuszach wieloagentowych.
Mapa mózgu, która uratuje nas przed AI? Przełomowy projekt naukowy by www.doktoraty.pl