Wszechwiedza, uczenie się i autonomia

Musimy być ostrożni, aby odróżnić racjonalność od wszechwiedzy. Wszechwiedzący podmiot zna rzeczywisty wynik swoich działań i może odpowiednio działać; ale wszechwiedza jest w rzeczywistości niemożliwa. Rozważmy następujący przykład: pewnego dnia spaceruję wzdłuż Pól Elizejskich i po drugiej stronie ulicy widzę starego przyjaciela. W pobliżu nie ma ruchu i nie jestem zaangażowany w żaden inny sposób, więc racjonalnie zaczynam przechodzić przez ulicę. Tymczasem na wysokości 33 000 stóp z przelatującego samolotu odpadają drzwi ładunkowe i zanim przedostaję się na drugą stronę ulicy, miażdżę. Czy nieracjonalne było przejście przez ulicę? Jest mało prawdopodobne, aby mój nekrolog brzmiał „Idiota próbuje przejść przez ulicę”. Ten przykład pokazuje, że racjonalność to nie to samo co doskonałość. Racjonalność maksymalizuje oczekiwaną wydajność, podczas gdy doskonałość maksymalizuje rzeczywistą wydajność. Wycofanie się z wymogu perfekcji to nie tylko kwestia uczciwości wobec agentów. Chodzi o to, że jeśli oczekujemy, że agent wykona to, co po fakcie okaże się najlepszym działaniem, nie da się zaprojektować agenta spełniającego tę specyfikację – chyba że poprawimy działanie kryształowych kul lub wehikułów czasu. Nasza definicja racjonalności nie wymaga zatem wszechwiedzy, ponieważ racjonalny wybór zależy tylko od dotychczasowej sekwencji percepcji. Musimy również upewnić się, że nie pozwoliliśmy nieumyślnie agentowi zaangażować się w zdecydowanie nieinteligentne działania. Na przykład, jeśli agent nie rozejrzy się w obie strony przed przejściem przez ruchliwą drogę, jego sekwencja percepcji nie powie mu, że nadjeżdża duża ciężarówka z dużą prędkością. Czy nasza definicja racjonalności mówi, że teraz można przejść przez ulicę? Daleko stąd! Po pierwsze, przejście przez jezdnię nie byłoby racjonalne, biorąc pod uwagę tę pozbawioną informacji sekwencję percepcji: ryzyko wypadku w przypadku przejścia bez patrzenia jest zbyt duże. Po drugie, racjonalny agent powinien wybrać działanie „patrzenia” przed wyjściem na ulicę, ponieważ patrzenie pomaga zmaksymalizować oczekiwaną wydajność. Wykonywanie działań w celu modyfikacji przyszłych spostrzeżeń – czasami nazywane zbieranie informacji – jest ważną częścią racjonalności. Drugim przykładem gromadzenia informacji jest eksploracja, którą musi podjąć czynnik odkurzający w początkowo nieznanym środowisku. Nasza definicja wymaga od racjonalnego agenta nie tylko zbierania informacji, ale także uczenia się jak najwięcej z tego, co postrzega. Początkowa konfiguracja agenta może odzwierciedlać pewną wcześniejszą wiedzę o środowisku, ale w miarę zdobywania doświadczenia przez agenta można ją modyfikować i rozszerzać. Istnieją skrajne przypadki, w których środowisko jest całkowicie znane a priori i całkowicie przewidywalne. W takich przypadkach agent nie musi postrzegać ani uczyć się; po prostu działa poprawnie. Oczywiście takie środki są kruche. Pomyśl o skromnym chrząszczu gnojowym. Po wykopaniu gniazda i złożeniu jaj, pobiera z pobliskiej sterty kłębek łajna, aby zatkać wejście. Jeśli kula łajna zostanie usunięta z jego uścisku po drodze, chrząszcz kontynuuje swoje zadanie i pantomimy zatyka gniazdo nieistniejącą kulą łajna, nigdy nie zauważając, że jej brakuje. Ewolucja wbudowała założenie w zachowanie chrząszcza, a gdy zostanie ono naruszone, skutkuje nieudanym zachowaniem. Nieco inteligentniejsza jest osa shex. Samica shex wykopie norę, wyjdzie, użądli gąsienicę i przeciągnie ją do nory, ponownie wejdzie do nory, aby sprawdzić, czy wszystko jest w porządku, wciągnie gąsienicę do środka i złoży jaja. Gąsienica służy jako źródło pożywienia podczas wykluwania się jaj. Jak dotąd dobrze, ale jeśli entomolog przesunie gąsienicę kilka cali dalej, podczas gdy shex wykonuje kontrolę, powróci do kroku „przeciągnij gąsienicę” swojego planu i będzie kontynuował plan bez modyfikacji, ponownie sprawdzając nory, nawet po dziesiątkach interwencji poruszających gąsienice. Shex nie jest w stanie dowiedzieć się, że jej wrodzony plan zawodzi i dlatego nie zmieni go. W zakresie, w jakim agent opiera się na wcześniejszej wiedzy swojego twórcy, a nie na własnych percepcjach i procesach uczenia się, mówimy, że agentowi brakuje autonomii. Racjonalny podmiot powinien być autonomiczny – powinien nauczyć się tego, co może kompensować częściową lub niepoprawną wcześniejszą wiedzę. Na przykład środek odkurzający, który nauczy się przewidywać, gdzie i kiedy pojawi się dodatkowy brud, sprawdzi się lepiej niż ten, który tego nie robi. W praktyce rzadko wymaga się pełnej autonomii od samego początku: gdy agent ma niewielkie doświadczenie lub nie ma go wcale, musiałby działać losowo, chyba że projektant udzieliłby jakiejś pomocy. Tak jak ewolucja zapewnia zwierzętom wystarczająco dużo wbudowanych odruchów, aby przetrwać wystarczająco długo, aby same się uczyć, rozsądne byłoby dostarczenie sztucznemu inteligentnemu agentowi pewnej początkowej wiedzy, a także zdolności uczenia się. Po wystarczającym doświadczeniu swojego otoczenia zachowanie racjonalnego podmiotu może skutecznie uniezależnić się od jego wcześniejszej wiedzy. W związku z tym włączenie uczenia się pozwala zaprojektować pojedynczy racjonalny agent, który odniesie sukces w wielu różnych środowiskach.