Tekst czytelnika: Dlaczego boję się postępu graficznego. Rzecz o dolinie niesamowitości
Gracze oczekują coraz bardziej realistycznej grafiki w grach. Grafika musi być zbliżona do fotorealizmu, by zadowolić coraz bardziej wymagających odbiorców. Jednak w naśladujących rzeczywistość wizualizacjach czyha niebezpieczeństwo, które może sprawić, że zamiast cieszyć się realizmem - z niesmakiem odłożymy pada na bok. Mowa o dolinie niesamowitości.
Czy grając w Skyrima bądź Mass Effect 3 nie mieliście czasem odczucia, że z postaciami NPC jest coś nie tak? Nie mogliście dokładnie określić co, ale animacja ruchów postaci czy ich twarze w żaden sposób nie wydawały się naturalne i ludzkie, pomimo wszystkich starań twórców, by te jak najbardziej rzeczywistość przypominały. Jeżeli opisany przypadek dotyczy także Was, wiedzcie, że Wasze umysły na widok tych postaci znalazły się w dolinie niesamowitości.
Ta dosyć pretensjonalna nazwa (będąca próbą przełożenia na polski nie-do-końca przetłumaczalnego anglojęzycznego pojęcia „uncanny valley”) została wymyślona przez japońskiego inżyniera robotyki Masahiro Moriego w roku 1978. Dotyczy zjawiska z pola psychiki estetyki, które powoduje, że wizerunki i zachowania mające w założeniu imitować te ludzkie, a nie będące do końca identyczne z naturalnymi, budzą w obserwatorze uczucie niepewności, awersję, a w skrajnych przypadkach nawet lęk i wstręt. Sama nazwa odnosi się odnosi się do badań Moriego dotyczących emocjonalnych reakcji ludzi na wygląd robotów, których wyniki japoński badacz przeprowadził na wykresie.
źródło: Wikipedia
Czerwona linia oznacza reakcję na obiekty nieruchome, niebieska zaś - na poruszające się podobizny człowieka, na przykład roboty antropomorficzne. Pierwsze wyniki badań Moriego pokrywały się z przewidywaniami - im coś bardziej podobne do natury, tym większa sympatia, jaką człowiek odczuwa względem badanego wizerunku. Jednak przychylność kończy się, kiedy tylko robota od człowieka różni mała liczba szczegółów - a jeżeli do tego jeszcze dołożymy ruch, reakcja obserwatora nie może być inna niż negatywna. Właśnie ten spadek komfortu na wykresie został ochrzczony mianem doliny niesamowitości.
Przyczyny tego typu reakcji odkryto dopiero w 2011 roku - po serii badań dowiedziono, że mózg, rejestrując niemalże ludzki wizerunek oczekuje ludzkich zachowań - a gdy takowych nie zaobserwuje, wysyła sygnały niepewności i zagrożenia. Na temat przyczyn tego typu zachowań teoretyzuje się wiele - być może mają podłoże ewolucyjne (podobne reakcje zaobserwowano m.in. u małp naczelnych), być może wiążą się z wychowaniem. Nie jest to w tej chwili sprawą najważniejszą. W jaki sposób problem ten przekłada się na rynek gier wideo?
Android Q2, przykład doliny niesamowitości w robotyce, źródło - wikipedia.org.
Okazuje się, że dla gier starających osiągnąć się fotorealistyczną grafikę problem doliny niesamowitości może stać się największym wyzwaniem nowej generacji. Nie jest trudno osiągnąć jakość grafiki zbliżonej do rzeczywistości - problemem jest nadanie jej cech realizmu. Prosty dowód - wystarczy w Google wpisać frazę „3d room render” i wybrać wyszukiwanie grafiki. Znajdziemy mnóstwo grafik, a żadna z nich nie będzie fotografią, a doskonałą grafiką wyrenderowaną na stacjach graficznych. Teraz wpisujemy „3d face render”. Tym razem nie ma wątpliwości, że wyświetlone obrazy nie są zdjęciami, pomimo równie wielkiej pracy włożonej w renderowanie twarzy. W ruchu jeszcze łatwiej o efekt doliny niesamowitości - odpalcie zwiastun dowolnej gry z PS4/XOne, przyjrzyjcie się twarzom postaci i odpowiedzcie - czy chociaż raz daliście się przekonać, że oglądacie nie animację komputerową, a film z żywymi aktorami?
Obecna, odchodząca już generacja nie miała problemów z tym zjawiskiem. Jakkolwiek świetnie animowane i bogate w szczegóły, postaci z gier nie zbliżyły się jeszcze do „granicy załamania” momentu, gdzie wygląd postaci wydaj nam się wręcz nierealistyczny w swoim realizmie. Wymienione na początku gry były blisko, najbliżej do granicy doliny niesamowitości zbliżyło się na obecnej generacji Beyond: Dwie Dusze. Kolejna generacja przyniesie postęp graficzny, ale istnieje ryzyko, że wraz z nim jako poważny problem zaistnieje sposób odbioru wizerunku postaci przez graczy. Nie osiągniemy chyba sytuacji, gdzie po ekranie ostrzegającym przed epilepsją znajdziemy informację, że postaci występujące w grze mogą wywołać w odbiorcy efekt doliny niesamowitości, jednak warto mieć na uwadze fakt, że problem ten może w poważny sposób wpłynąć na przyjęcie gry na rynku.
LightStage, urządzenie wykorzystywane przy technologii Digitai Ira, wykonujące kilka tysięcy zdjęć przy zmiennym oświetleniu na minutę. źródło - http://gl.ict.usc.edu/Research/DigitalIra/
Z podobnym problemem spotkał się kilka lat temu rynek filmowy. W okresie boomu na animacje komputerowe (zapoczątkowane filmami Pixara i DreamWorks) wyłonił się nowy nurt - animacje z digitalizowanymi postaciami aktorów. Do najgłośniejszych tytułów tego typu należą „Beowulf”, „Polar Express” i (nie)sławny „Final Fantasy: Spirits Within”. Oprócz (w założeniu) hiperrealistycznego przedstawienia postaci, filmy te łączy jeszcze jedna cecha - żaden nie odniósł finansowego sukcesu. Abstrahując już od sfery scenariusza, recenzje tych filmów - przykładowo z cnn.com czy nytimes.com - wskazywały na problem przedstawienia ludzkich postaci, określając je niejednokrotnie mianem „przerażających”, co nie było z pewnością zamiarem twórców. Dopiero filmy takie jak „Avatar” czy „The Adventures of Tintin” przełamały ten trend, jednak radząc sobie niejako naokoło - nie zawierały hiperrealistycznych renderów ludzkich postaci, a kosmitów („Avatar”), bądź karykaturalne postaci („Tintin”). Jednak nie jest to droga, którą powinny podążać gry - nie można opowiedzieć mocnej, dojrzałej historii, w roli protagonisty obsadzając postać przedstawioną w stylu super-deformed. Jest jednak światełko w tunelu.
Paul Debevec, dyrektor współprowadzący działu badań nad grafiką komputerową US Institute of Creative Technology (wyniki jego badań zostały wykorzystywane do tworzenia efektów specjalnych takich filmów, jak „King Kong” z 2006 roku, trylogii „Matrix” czy wspominanego już „Avatara”) uważa, że możliwy jest przeskok nad doliną niesamowitości - a to dzięki nowej technologii Digital Ira, opracowanej we współpracy z Activision (tak, tymi od CoD-a). Zakłada ona nie renderowanie od podstaw ludzkiej twarzy, a wykonanie naraz kilkuset zdjęć ludzkiej twarzy przy odpowiednim oświetleniu, co daje możliwość stworzenia animacji twarzy o ruchach odwzorowanych z dokładnością do jednej dziesiątej milimetra. Należy zaznaczyć, że ta technika nie bazuje na motion capture - zdjęcia służą jedynie za bazę wyjściową dla tworzenia obrazu i animacji twarzy. Wykonany w tej technologii render jest w pełni modyfikowalny w silniku graficznym, co daje twórcom animacji możliwość ingerowania nie tylko w ruchy twarzy, ale także jej oświetlenie. Zdaniem Paula Debeveca to właśnie wykorzystanie szczegółowej animacji i odpowiedniego, zgodnego z naturą oświetlenia jest kluczem do przekroczenia doliny niesamowitości. Efekty działania silnika Digital Ira można zobaczyć m.in. na stronie domowej Uniwersytetu Południowej Kalifornii.
Czy ten poziom grafiki, umożliwiający tworzenie tak zaawansowanych modeli ludzi (a tym samym niwelujący problem doliny niesamowitości) jest do osiągnięcia na nowej generacji konsol? Cóż, pokaże to przyszłość, jednak Activision - znane wszak ze swojego asekuracyjnego podejścia do dysponowania budżetem - nie inwestowałoby w technologię, która nie miałaby się w najbliższej przyszłości zwrócić. Jedno jest pewne - rewolucja jest tuż za rogiem, a my będziemy jej świadkami.
Adam Tobojka