Komputer nauczył się języka, czytania tekstu ze zrozumieniem
Czy to kolejny krok na drodze do skonstruowania sztucznej inteligencji?
Grupa naukowców z Massachusetts Institute of Technology napisała specjalny zestaw instrukcji, dzięki którym komputer był w stanie przeczytać instrukcję do popularnej gry Civilization II. I choć nie brzmi to sensacyjnie, to sposób w jaki maszyna to zrobiła i wyniki, które osiągnęła po zapoznaniu się z instrukcją, są imponujące.
Wszystko zaczęło się w roku 2009, kiedy na dorocznym zjeździe Stowarzyszenia Lingiwstyki Komputerowej, swoją nową pracę przedstawili studenci profesor Reginy Barzilay. Został w niej opisany system generujący komputerowe skrypty. Umożliwiały one komputerowi zainstalowanie wybranego oprogramowania w środowisku Windows. Robił on to, czytając tekst zawarty na internetowych stronach pomocy technicznej Microsoftu.
Na tegorocznym spotkaniu, profesor Barzilay i dwójka jej studentów - S.R.K. Branavan i David Silver - pokazali coś natomiast coś bardzo imponującego. Naukowcom udało się udoskonalić system zarządzający procesem "uczenia się" przez komputer. Umożliwił on maszynie przeczytanie instrukcji gry Civilization II, opracowanie własnych strategii prowadzących do zwycięstwa i zwiększenie ilości wygranych rozgrywek z 46% do 79%. Zaskakujący jest natomiast sposób w jaki maszynie udało się to osiągnąć.
Maszyna czytać, maszyna uczyć się System skonstruowany przez Barzilay i jej pomocników zaczyna pracę, nie posiadając praktycznie żadnej wiedzy na temat zadania, które ma wykonać. Nie potrafi też zrozumieć w jakim języku napisany jest tekst - instrukcja. Jego możliwości, początkowo ograniczają się jedynie do wykonywania prostych zadań odpowiadających kliknięciu prawym lub lewym przyciskiem myszki czy poruszaniu kursorem. Nie rozumie jednak mechaniki gry, nie zna strategii prowadzących do zwycięstwa czy możliwości poszczególnych jednostek. Nie wie również czy wykonywane przez czynności przekładają się na dany fragment instrukcji. Maszyna potrafi natomiast oszacować czy udało się jej wygrać kampanię w Cywilizacji.
W początkowej fazie "rozwoju", czynności wykonywane przez system są w zasadzie losowe. Wykonując kolejne kroki, "widzi" on słowa pojawiające się na ekranie i wyszukuje je w instrukcji. Następnie znajduje w tekście te same słowa i te, które są z nimi w jakikolwiek sposób powiązane. To umożliwia mu tworzenie hipotez dotyczących znaczenia coraz większych partii tekstu i tego, do czego się odnoszą. Te hipotezy, które wciąż prowadzą do osiągnięcia pożądanych rezultatów, maszyna oznacza jako wiarygodne. Te, które wciąż nie dają odpowiednich wyników, są natomiast odrzucane.
"Gry używane są w charakterze środowiska testowego dla mechanizmów zarządzających sztuczną inteligencją, ze względu na ich wielką złożoność. Poszczególne czynności wykonywane w grze nie dają jednego, ściśle określonego rezultatu, ponieważ sama gra lub przeciwnik, może w losowy sposób zareagować na nasze posunięcia. Potrzebujesz więc mechanizmu, który potrafi zająć się bardzo skomplikowanymi scenariuszami, w których rzeczy teoretycznie dzieją się w zupełnie losowy sposób" - tak Branavan tłumaczy, dlaczego tworzony przez niego system testuje się na grach komputerowych. Wyniki Na ile skuteczny był komputer używający systemu opracowanego przez naukowców z MIT? W przypadku instalowania oprogramowania, był on w stanie odtworzyć 80% czynności, które wykonuje człowiek czytający tę samą instrukcję. W przypadku Civilization II wygrał on 79% rozgrywek, w których wziął udział. Maszyna, która nie używała systemu, wygrała zaledwie 46% gier, w których uczestniczyła. Postęp w tym przypadku jest więc bardzo duży.
Głównym celem projektu było udowodnienie, że systemy mogące nauczyć się znaczenia słów poprzez wchodzenie w interakcję ze środowiskiem, w którym funkcjonują, po prostu działają i są rzeczą, którą warto dalej badać. Ten cel udało się osiągnąć. Barzilay i jej zespół nie spocznie jednak na laurach. Zamierzają oni tak zmodyfikować swój system, by działał on w skomplikowanych urządzeniach - robotach.
„Gdyby ktoś spytał mnie wcześniej o to, czy obecnie da się zrobić coś takiego, powiedziałbym, że nie. Budujesz przecież coś, co posiada bardzo niewiele informacji na temat domeny, w której się porusza, ale to coś wyciąga wskazówki, podpowiedzi, z samej domeny” - komentował profesor Eugene Charniak z Uniwersytetu Browna. Pełną wersję pracy profesor Barzilay i jej zespołu znaleźć można na stronach internetowych MIT.