Fascynuje Cię przyszłość sztuki i kreatywności? Chcesz zgłębić tajemnice „czarnej skrzynki” AI?
Jeśli potrzebujesz wsparcia w badaniach, analizie lub tworzeniu projektów na styku technologii i sztuki, jesteśmy gotowi pomóc. Skontaktuj się z nami, aby wspólnie odkrywać nowe horyzonty.
Gdybyś przypadkiem natknął się na dzieło sztuki generowane przez AI, zatytułowane „(un)stable equilibrium” (niestabilna równowaga), twoje pierwsze skojarzenie byłoby oczywiste: to musi być model wytrenowany na obrazach Marka Rothko. Widzisz te same proste pola czystego koloru, te same subtelne przejścia tonalne. Z jedną różnicą – te obrazy nieustannie się zmieniają, płynnie przechodząc z jednej formy w drugą.
Jednak autor tych prac, artysta i naukowiec Terence Broad, nie wytrenował swojej AI na obrazach Rothko. Nie wytrenował jej na żadnych obrazach. Ani na żadnych innych danych. Hakując sieć neuronową i zapętlając jej elementy w rekurencyjnej pętli, zmusił ją do tworzenia obrazów z absolutnej pustki. Bez danych wejściowych, bez wpływów, bez inspiracji.
Zależnie od perspektywy, sztuka Broada to albo pionierski pokaz czystej, sztucznej kreatywności, albo wgląd w samą duszę AI, albo po prostu sprytny, ale pozbawiony znaczenia elektroniczny produkt uboczny, bliższy sprzężeniu zwrotnemu gitary niż muzyce. Niezależnie od oceny, jego praca wskazuje nową, bardziej kreatywną i etyczną drogę dla sztucznej inteligencji generatywnej – drogę, która wykracza poza masową produkcję wtórnej papki wizualnej, zalewającej dziś naszą kulturę.
Od nudnej pracy do artystycznej rewolucji
Główną inspiracją Broada nie była filozofia, lecz… beznadziejna praca. W 2016 roku, po ukończeniu studiów, znalazł zatrudnienie w firmie zarządzającej siecią kamer drogowych. „Moja praca polegała na trenowaniu modeli i zarządzaniu ogromnymi zbiorami danych, jak 150 000 zdjęć z najbardziej nudnego miasta w Wielkiej Brytanii” – wspomina. „I po prostu miałem tego serdecznie dość. Gdy zacząłem swoją praktykę artystyczną, powiedziałem sobie: nie będę tego robić. Nie będę tworzyć zbiorów danych”.
Jednak to nie tylko nuda pchnęła go w stronę „sztuki bez danych”. Były to również groźby prawne ze strony międzynarodowej korporacji. Jednym z jego wczesnych sukcesów artystycznych był projekt, w którym wytrenował sieć neuronową (autoenkoder) na każdej klatce filmu „Łowca androidów” (1982), a następnie kazał jej odtworzyć film z pamięci. Efekt był fascynującym komentarzem na temat ograniczeń ówczesnej AI i jednocześnie na temat ludzkiej inteligencji. Film szybko zdobył popularność w internecie, a wraz z nią – notę o naruszeniu praw autorskich (DMCA) od Warner Bros.
„Zawsze możesz oprotestować taką notę” – mówi Broad. „Ale wtedy narażasz się na pozew w amerykańskim sądzie, a jako świeżo upieczony absolwent z masą długów nie byłem gotów na takie ryzyko”. Mimo że po interwencji dziennikarzy nota została na chwilę wycofana, lęk pozostał. „Od tamtej pory, od 2016 roku, nie wytrenowałem żadnego modelu generatywnego AI na cudzych danych, aby tworzyć moją sztukę”.
Jak stworzyć coś z niczego? Hakowanie GAN-a
Podczas studiów doktoranckich w Londynie Broad stanął przed pozornie nierozwiązywalnym problemem: jak trenować model generatywny, nie imitując żadnych danych? „Zajęło mi chwilę, aby zdać sobie sprawę, że to oksymoron. Model generatywny to po prostu statystyczny model danych, który imituje dane, na których został wytrenowany”.
Jego uwagę przykuły wówczas generatywne sieci przeciwstawne (GAN). W klasycznym GAN-ie dwie sieci neuronowe – generator i dyskryminator – trenują się nawzajem. Dyskryminator uczy się rozpoznawać prawdziwe dane (np. zdjęcia kotów), a generator próbuje go oszukać, tworząc fałszywe dane. Ten „pojedynek” prowadzi do powstania generatora, który potrafi tworzyć niezwykle realistyczne obrazy.
Momentem „eureka” dla Broada była intuicja, że mógłby zastąpić zbiór danych treningowych… drugim generatorem. Zapętlił dwie sieci-generatory tak, aby próbowały imitować siebie nawzajem.
Początkowe efekty były rozczarowujące – „szare plamy, nic ekscytującego”. Ale gdy wprowadził do systemu dodatkowy parametr, zmuszający sieci do generowania większej wariancji kolorów, obrazy ożyły. Stały się bardziej złożone, wibrujące. Dalsze eksperymenty z wewnętrznymi elementami sieci, takimi jak „wektor utajony” (rodzaj numerycznego adresu w przestrzeni możliwości modelu), pozwoliły mu na płynne poruszanie się po tej przestrzeni i generowanie nieskończonej liczby nowych form.
Czy to prawdziwa kreatywność? Tajemnica czarnej skrzynki
Czy Broadowi udało się odkryć „czystą” sztuczną kreatywność? Nawet on nie jest do końca pewien. „Żadna zewnętrzna reprezentacja ani cecha nie jest narzucana wyjściom sieci jako takim, ale spekulowałem, że moje osobiste preferencje estetyczne miały pewien wpływ na ten proces jako forma 'meta-heurystyki'” – przyznaje. „Myślę też, że to, co sieć generuje, jest w pewnym stopniu tajemnicą. Wielu akademików sugerowało mi, abym spróbował zbadać i zrozumieć, dlaczego generuje to, co generuje, ale szczerze mówiąc, jestem całkiem zadowolony z tej tajemnicy!”.
Rozmowy z nim i lektura jego doktoratu prowadzą do jednego, kluczowego wniosku: nawet na najwyższym poziomie akademickim, ludzie tak naprawdę nie rozumieją, jak dokładnie działa generatywna AI. Narzędzia takie jak Midjourney, z ich naciskiem na „inżynierię promptów”, przypominają raczej magiczne zaklęcia niż precyzyjne narzędzia. Wiemy, że jeśli wrzucimy do czarnej skrzynki dane, po drugiej stronie wyjdzie ich kompozyt. Ale co dzieje się w środku, na poziomie granularnym, pozostaje w dużej mierze zagadką.
Prace Broada, choć on sam porównuje je czasem do wczesnych prób lobotomii z użyciem szpikulca do lodu, rzucają nieco światła na te wewnętrzne procesy. Demistyfikują AI, co jest kluczowe w czasach, gdy zarówno technooptymiści, jak i apokaliptyczni pesymiści ulegają, jak to nazywa Broad, „iluzji” wszechmocnej, quasi-mistycznej sztucznej inteligencji.
„Myślimy, że one robią o wiele więcej, niż robią w rzeczywistości” – mówi. „Ale to tylko kupa mnożenia macierzy. Bardzo łatwo jest tam wejść i zacząć zmieniać rzeczy”. Jego sztuka to dowód, że prawdziwa kreatywność w erze AI może leżeć nie w doskonaleniu imitacji, ale w odważnym zaglądaniu do wnętrza maszyny i zadawaniu pytań, których nikt wcześniej nie zadał.