Uniwersalna kwantyfikacja (∀)

Przypomnijmy sobie trudność, jaką mieliśmy z wyrażeniem ogólnych zasad w logice zdań. Reguły takie jak „Kwadraty sąsiadujące z wumpusem śmierdzą” i „Wszyscy królowie są osobami” to chleb powszedni logiki pierwszego rzędu. Pierwszym z nich zajmiemy się później. Druga zasada, „Wszyscy królowie są osobami”, jest napisana w logice pierwszego rzędu jako

Uniwersalny kwantyfikator jest zwykle wymawiany „Dla wszystkich … ”. (Pamiętaj, że odwrócone A oznacza „wszystko”). Zatem zdanie mówi: „Dla wszystkich, jeśli jest królem, to x jest osobą”. Symbol x nazywa się zmienną. Zgodnie z konwencją, zmienne są małymi literami. Zmienna jest terminem samym w sobie i jako taka może również służyć jako argument funkcji – na przykład LeftLeg(x). Termin bez zmiennych nazywany jest terminem podstawowym.

Intuicyjnie, zdanie ∀x P , gdzie P jest dowolnym zdaniem logicznym, mówi, że jest prawdziwe dla każdego obiektu x. Dokładniej, ∀x P jest prawdziwe w danym modelu, jeśli P jest prawdziwe we wszystkich możliwych interpretacjach rozszerzonych zbudowanych z interpretacji podanej w modelu, gdzie każda interpretacja rozszerzona określa element domeny, do której się odnosi x.

Brzmi to skomplikowanie, ale tak naprawdę jest to tylko ostrożny sposób na określenie intuicyjnego znaczenia uniwersalnej kwantyfikacji. Rozważ model pokazany na rysunku i zamierzoną interpretację, która się z nim wiąże. Interpretację możemy rozszerzyć na pięć sposobów:

Zdanie uniwersalnie kwantyfikowane ∀x King(x) => Person(x)  jest prawdziwe w oryginalnym modelu, jeśli zdanie King(x) => Person(x) jest prawdziwe w każdej z pięciu rozszerzonych interpretacji. Oznacza to, że zdanie powszechnie kwantyfikowalne jest równoważne stwierdzeniu następujących pięciu zdań:

Przyjrzyjmy się uważnie temu zestawowi twierdzeń. Ponieważ w naszym modelu król Jan jest jedynym królem, drugie zdanie stwierdza, że ​​jest on osobą, jak byśmy mieli nadzieję. Ale co z pozostałymi czterema zdaniami, które wydają się zawierać twierdzenia dotyczące nóg i koron? Czy to część znaczenia słowa „Wszyscy królowie są osobami”? W rzeczywistości pozostałe cztery twierdzenia są prawdziwe w modelu, ale nie podawaj żadnych roszczeń co do cech osobowości nóg, koron, czy też Richarda. To dlatego, że żaden z tych obiektów nie jest królem. Patrząc na tabelę prawdy, widzimy, że implikacja jest prawdziwa zawsze, gdy jej założenie jest fałszywe – niezależnie od prawdziwości wniosku. Tak więc, stwierdzając zdanie powszechnie skwantyfikowane, co jest równoważne stwierdzeniu całej listy indywidualnych implikacji, w końcu stwierdzamy konkluzję reguły tylko dla tych przedmiotów, dla których przesłanka jest prawdziwa, i nie mówimy w ogóle o tych przedmiotach, dla których założenie jest fałszywe. Tak więc definicja tabeli prawdy okazuje się idealna do pisania ogólnych reguł za pomocą uniwersalnych kwantyfikatorów. Częstym błędem, popełnianym często nawet przez pilnych czytelników, którzy przeczytali ten paragraf kilka razy, jest użycie spójnika zamiast implikacji. Zdanie

byłoby równoznaczne z twierdzeniem

i tak dalej. Oczywiście to nie oddaje tego, czego chcemy.

Kwantyfikatory

Kiedy już mamy logikę dopuszczającą obiekty, naturalne jest, że chcemy wyrażać właściwości całych kolekcji obiektów, zamiast wymieniać obiekty po nazwie. Pozwalają nam na to kwantyfikatory. Logika pierwszego rzędu zawiera dwa standardowe kwantyfikatory, zwane uniwersalnym (∀) i egzystencjalnym (∃). 

Zdania złożone

[wp_ad_camp_1

Możemy używać spójników logicznych do konstruowania bardziej złożonych zdań, z taką samą składnią i semantyką jak w rachunku zdań. Oto cztery zdania, które są prawdziwe w modelu  zgodnie z naszą zamierzoną interpretacją:

Zdania atomowe

Teraz, gdy mamy terminy odnoszące się do obiektów i symbole predykatów odnoszące się do relacji, możemy je połączyć, aby stworzyć zdania atomowe, które stwierdzają fakty. Zdanie atomowe (lub w skrócie atom) składa się z symbolu predykatu, po którym opcjonalnie następuje lista terminów w nawiasach, takich jak

Brother(Richard,John)

Stwierdza to, zgodnie z zamierzoną interpretacją podaną wcześniej, że Ryszard Lwie Serce jest bratem króla Jana. Zdania atomowe mogą zawierać złożone terminy jako argumenty. Zatem,

Żonaty (Ojciec (Richard), Matka (John))

stwierdza, że ojciec Ryszarda Lwie Serce jest żonaty z matką króla Jana (znowu pod odpowiednią interpretacją).

Zdanie atomowe jest prawdziwe w danym modelu, jeśli relacja, do której odwołuje się symbol predykatu, zachodzi między przedmiotami, do których odwołują się argumenty.

Warunki

Termin to wyrażenie logiczne, które odnosi się do obiektu. Symbole stałe to terminy, ale nie zawsze wygodnie jest mieć odrębny symbol, aby nazwać każdy obiekt. W języku angielskim możemy użyć wyrażenia „lewa noga króla Jana” zamiast nadawać nazwę jego nodze. Do tego służą symbole funkcyjne: zamiast używania stałego symbolu używamy LeftLeg(John).

3- λwyrażenia (wyrażenia lambda) zapewniają użyteczną notację w której nowe symbole funkcyjne są konstruowane „w locie”. Na przykład funkcja, która podnosi swój argument do kwadratu, może być zapisana jako (λx : x  x x ) i może być stosowana do argumentów, tak jak każdy inny symbol funkcji. λ – wyrażenie może być również zdefiniowane i używane jako symbol predykatu. Operator lambda w Lispie i Pythonie pełni dokładnie tę samą rolę. Zauważ, że użycie w ten sposób nie zwiększa formalnej mocy ekspresyjnej logiki pierwszego rzędu, ponieważ każde zdanie zawierające λ-wyrażenie  może zostać przepisane przez „podłączenie” jego argumentów w celu uzyskania równoważnego zdania.

W ogólnym przypadku termin złożony jest tworzony przez symbol funkcji, po którym następuje umieszczona w nawiasach lista terminów jako argumenty symbolu funkcji. Należy pamiętać, że złożony termin to po prostu skomplikowany rodzaj nazwy. Nie jest to „wywołanie podprogramu”, które „zwraca wartość”. Nie ma podprogramu LeftLeg, który pobiera osobę jako dane wejściowe i zwraca odnogę. Możemy wnioskować o lewych nogach (np. stwierdzając ogólną zasadę, że każdy ma jedną, a następnie dedukując, że John musi ją mieć) bez podawania definicji lewej nogi. To jest coś, czego nie można zrobić za pomocą podprogramów w językach programowania. Formalna semantyka terminów jest prosta. Rozważ termin f(t1…tn) . Symbol funkcji f odnosi się do jakiejś funkcji w modelu (nazwij ją F ); terminy argumentów odnoszą się do obiektów w domenie (nazwijmy je d1, …, dn ); a termin jako całość odnosi się do obiektu, który jest wartością funkcji  F zastosowanej do d1, …, dn . Załóżmy na przykład, że symbol funkcji LeftLeg odnosi się do funkcji pokazanej w równaniu (8.2), a Jan odnosi się do króla Jana, a następnie LeftLeg(John) odnosi się do lewej nogi króla Jana. W ten sposób interpretacja ustala desygnat każdego terminu.

Symbole i interpretacje

Przejdźmy teraz do składni logiki pierwszego rzędu. Niecierpliwy czytelnik może uzyskać pełny opis z gramatyki formalnej na rysunku

Podstawowymi elementami składniowymi logiki pierwszego rzędu są symbole reprezentujące obiekty, relacje i funkcje. Symbole występują zatem w trzech rodzajach: symbole stałe, które oznaczają przedmioty; symbole predykatów, które oznaczają relacje; i symbole funkcyjne, które oznaczają funkcje. Przyjmujemy konwencję, że te symbole zaczynają się od wielkich liter. Na przykład możemy użyć stałych symboli Richard i John; symbole predykatu Brother, OnHead, Person, King i Crown; oraz symbol funkcji LewaNoga. Podobnie jak w przypadku symboli propozycji, wybór nazw zależy wyłącznie od użytkownika. Każdy predykat i symbol funkcji ma arity, która ustala liczbę argumentów. Każdy model musi dostarczyć informacji wymaganych do ustalenia, czy dane zdanie jest prawdziwe czy fałszywe. Tak więc, oprócz swoich obiektów, relacji i funkcji, każdy model zawiera interpretację, która dokładnie określa, do których obiektów, relacji i funkcji odnoszą się symbole stałej, predykatu i funkcji. Jedna z możliwych interpretacji dla naszego przykładu – którą logik nazwałby interpretacją zamierzoną – jest następująca:

* Ryszard odnosi się do Ryszarda Lwie Serce, a Jan do złego króla Jana.

* Brat odnosi się do relacji braterskiej – czyli zbioru krotek obiektów; OnHead to relacja, która utrzymuje się między koroną a królem Janem; Osoba, Król i Korona to relacje jednoargumentowe, które identyfikują osoby, królów i korony.

* LeftLeg odnosi się do funkcji „lewej nogi” zdefiniowanej w równaniu.

Oczywiście istnieje wiele innych możliwych interpretacji. Na przykład jedna z interpretacji odwzorowuje Ryszarda na koronę, a Jana na lewą nogę króla Jana. W modelu jest pięć obiektów, więc istnieje 25 możliwych interpretacji tylko dla stałych symboli Richard i John. Zauważ, że nie wszystkie obiekty muszą mieć nazwę – na przykład zamierzona interpretacja nie nazywa korony ani nóg. Możliwe jest również, że obiekt ma kilka nazw; istnieje interpretacja, w której zarówno Ryszard, jak i Jan odnoszą się do korony. Jeśli uważasz, że ta możliwość jest myląca, pamiętaj, że w logice zdań całkiem możliwe jest posiadanie modelu, w którym zarówno Cloudy, jak i Sunny są prawdziwe; zadaniem bazy wiedzy jest wykluczenie modeli, które są niezgodne z naszą wiedzą. Podsumowując, model w logice pierwszego rzędu składa się ze zbioru obiektów i interpretacji, która odwzorowuje stałe symbole na obiekty, symbole funkcyjne na funkcje na tych obiektach i symbole predykatów na relacje. Podobnie jak w przypadku logiki zdań, implikacja, słuszność itd. są definiowane w kategoriach wszystkich możliwych modeli. Aby zorientować się, jak wygląda zestaw wszystkich możliwych modeli, zobacz Rysunek. Pokazuje, że modele różnią się liczbą obiektów, które zawierają – od jednego do nieskończoności – oraz sposobem, w jaki symbole stałe mapują się na obiekty.

Ponieważ liczba modeli pierwszego rzędu jest nieograniczona, nie możemy sprawdzić implikacji przez wyliczenie ich wszystkich (tak jak zrobiliśmy to w przypadku logiki zdań). Nawet jeśli liczba obiektów jest ograniczona, liczba kombinacji może być bardzo duża. W przykładzie na rysunku 8.4 istnieje 137 506 194 466 modeli z sześcioma lub mniej obiektami.

Modele dla logiki pierwszego rzędu

Wcześniej mówiliśmy, że modele języka logicznego są strukturami formalnymi, które konstytuują rozważane światy możliwe. Każdy model łączy słownik zdań logicznych z elementami świata możliwego, dzięki czemu można ustalić prawdziwość dowolnego zdania. W ten sposób modele logiki zdań łączą symbole zdań z predefiniowanymi wartościami prawdy. Modele logiki pierwszego rzędu są znacznie ciekawsze. Po pierwsze, mają w sobie przedmioty! Dziedziną modelu jest zbiór obiektów lub elementów domeny, które zawiera. Domena musi być niepusta – każdy możliwy świat musi zawierać przynajmniej jeden obiekt. Matematycznie rzecz biorąc, nie ma znaczenia, jakie są te obiekty – liczy się tylko to, ile jest ich w każdym konkretnym modelu – ale dla celów pedagogicznych użyjemy konkretnego przykładu. Rysunek przedstawia model z pięcioma obiektami: Ryszard Lwie Serce, król Anglii od 1189 do 1199; jego młodszy brat, zły król Jan, który rządził od 1199 do 1215 roku; lewe nogi Richarda i Johna; i koronę.

Obiekty w modelu mogą być powiązane na różne sposoby. Na rysunku Richard i John są braćmi. Formalnie rzecz biorąc, relacja to po prostu zbiór krotek obiektów, które są ze sobą powiązane. (Krótka jest zbiorem obiektów ułożonych w ustalonym porządku i jest zapisana w nawiasach ostrych otaczających obiekty.) Zatem relacja braterstwa w tym modelu jest zbiorem

{⟨Richard the Lionheart, King John⟩, ⟨King John, Richard the Lionheart⟩}

(Tu nazwaliśmy obiekty w języku angielskim, ale jeśli chcesz, możesz w myślach zastąpić je obrazkami.) Korona znajduje się na głowie króla Jana, więc relacja „na głowie” zawiera tylko jedną krotkę, 〈korona , króla Jana. Relacje „brat” i „na głowie” są relacjami binarnymi – to znaczy łączą pary obiektów. Model zawiera również jednoargumentowe relacje lub właściwości: właściwość „osoby” jest prawdziwa zarówno w przypadku Richarda, jak i Johna; własność „króla” dotyczy tylko Jana (przypuszczalnie dlatego, że Ryszard nie żyje w tym momencie); a właściwość „korony” dotyczy tylko korony. Pewne rodzaje relacji najlepiej traktować jako funkcje, ponieważ dany obiekt musi być w ten sposób powiązany z dokładnie jednym obiektem. Na przykład każda osoba ma jedną lewą nogę, więc model ma jednoargumentową funkcję „lewa noga” – mapowanie z jednoelementowej krotki na obiekt – która obejmuje następujące mapowania:

Ściśle mówiąc, modele w logice pierwszego rzędu wymagają funkcji całkowitych, to znaczy, że każda krotka wejściowa musi mieć wartość. Zatem korona musi mieć lewą nogę, podobnie jak każda z lewych nóg. Istnieje techniczne rozwiązanie tego niezręcznego problemu, polegające na dodatkowym „niewidzialnym” obiekcie, jakim jest lewa noga wszystkiego, co nie ma lewej nogi, łącznie z nim samym. Na szczęście tak długo, jak nie czyni się twierdzeń o lewych nogach rzeczy, które nie mają lewych nóg, te szczegóły techniczne nie mają znaczenia. Do tej pory opisaliśmy elementy, które wypełniają modele dla logiki pierwszego rzędu. Inną istotną częścią modelu jest powiązanie tych elementów ze słownictwem zdań logicznych, które wyjaśnimy dalej.

Składnia i semantyka rzędu logiki pierwszego

Rozpoczniemy tę część od dokładniejszego określenia, w jaki sposób możliwe światy logiki pierwszego rzędu odzwierciedlają ontologiczne zaangażowanie w przedmioty i relacje. Następnie wprowadzamy różne elementy języka, wyjaśniając ich semantykę w miarę postępów. Główne kwestie dotyczą tego, w jaki sposób język ułatwia zwięzłe reprezentacje i jak jego semantyka prowadzi do solidnych procedur rozumowania.

Łączenie najlepszych języków formalnych i naturalnych

Możemy przyjąć fundament logiki zdaniowej – deklaratywnej, kompozycyjnej semantyki niezależnej od kontekstu i jednoznacznej – i zbudować na tym fundamencie bardziej ekspresyjną logikę, zapożyczając idee reprezentacyjne z języka naturalnego, unikając jego wad. Kiedy patrzymy na składnię języka naturalnego, najbardziej oczywistymi elementami są rzeczowniki i wyrażenia rzeczownikowe, które odnoszą się do przedmiotów (kwadraty, doły, wumpuses) oraz czasowniki i frazy czasownikowe wraz z przymiotnikami i przysłówkami, które odnoszą się do relacji między przedmiotami (jest przewiewny, sąsiaduje z pędami). Niektóre z tych relacji są funkcjami – relacjami, w których istnieje tylko jedna „wartość” dla danego „dane wejściowego”. Łatwo jest zacząć wymieniać przykłady obiektów, relacji i funkcji:

* Przedmioty: ludzie, domy, liczby, teorie, Ronald McDonald, kolory, gry w baseball, wojny, wieki…

* Relacje: mogą to być relacje jednoargumentowe lub właściwości, takie jak czerwony, okrągły, fałszywy, pierwszy, wielopiętrowy … lub bardziej ogólne relacje -arne, takie jak brat, większy niż, wewnątrz, część, ma kolor, wystąpił po, posiada, wchodzi pomiędzy, …

* Funkcje: ojciec, najlepszy przyjaciel, trzecia runda, jeszcze jedna, początek …

Rzeczywiście, prawie każde stwierdzenie może być traktowane jako odnoszące się do przedmiotów i właściwości lub relacji. Oto kilka przykładów:

* „Jeden plus dwa równa się trzy”. Przedmioty: jeden, dwa, trzy, jeden plus dwa; Relacja: równa się; Funkcja: plus. („Jeden plus dwa” to nazwa obiektu otrzymywana przez zastosowanie funkcji „plus” do obiektów „jeden” i „dwa”. „Trzy” to inna nazwa tego obiektu.)

* „Kwadraty sąsiadujące z wumpusem śmierdzą”. Obiekty: wumpusy, kwadraty; Właściwość: śmierdząca; Relacja: sąsiedztwo.

* „Zły król Jan rządził Anglią w 1200 roku”. Obiekty: Jan, Anglia, 1200; Relacja: rządził podczas; Właściwości: zło, król.

Język logiki pierwszego rzędu, którego składnię i semantykę zdefiniujemy w następnym podrozdziale, zbudowany jest wokół obiektów i relacji. Było to ważne dla matematyki, filozofii i sztucznej inteligencji właśnie dlatego, że te dziedziny – a nawet większość codziennej ludzkiej egzystencji – można pożytecznie traktować jako zajmujące się przedmiotami i relacjami między nimi. Logika pierwszego rzędu może również wyrażać fakty dotyczące niektórych lub wszystkich obiektów we wszechświecie. Umożliwia to reprezentowanie ogólnych praw lub zasad, takich jak stwierdzenie „Kwadraty sąsiadujące z wumpusem są śmierdzące”. Podstawowa różnica między logiką zdaniową a logiką pierwszego rzędu leży w ontologicznym zobowiązaniu każdego języka — to znaczy w tym, co on zakłada na temat natury rzeczywistości. Matematycznie to zobowiązanie wyraża się w naturze modeli formalnych, w odniesieniu do których określa się prawdziwość zdań. Na przykład logika zdań zakłada, że ​​istnieją fakty, które albo obowiązują w świecie, albo nie. Każdy fakt może być w jednym z dwóch stanów – prawda lub fałsz – i każdy model przypisuje prawdę lub fałsz każdemu symbolowi zdania . Logika pierwszego rzędu zakłada więcej; mianowicie, że świat składa się z przedmiotów, które mają między sobą pewne relacje, które utrzymują się lub nie.  Modele formalne są odpowiednio bardziej skomplikowane niż te dla logiki zdań. To ontologiczne zobowiązanie jest wielką siłą logiki (zarówno propozycjonalnej, jak i pierwszego rzędu), ponieważ pozwala nam zacząć od prawdziwych stwierdzeń i wywnioskować inne prawdziwe. Jest szczególnie skuteczny w dziedzinach, w których każde twierdzenie ma wyraźne granice, takich jak matematyka lub świat wumpusów, gdzie kwadrat albo ma wgłębienie, albo nie; nie ma możliwości kwadratu z niejasnym wcięciem przypominającym wgłębienie. Ale w prawdziwym świecie wiele propozycji ma niejasne granice: Czy Wiedeń jest dużym miastem? Czy ta restauracja służy pysznym jedzeniem? Czy ta osoba jest wysoka? To zależy, kogo zapytasz, a ich odpowiedź może być „w pewnym sensie”. Jedną z odpowiedzi jest udoskonalenie reprezentacji: jeśli prymitywna linia dzieląca miasta na „duże” i „niewielkie” pozostawia zbyt wiele informacji dla danej aplikacji, można zwiększyć liczbę kategorii rozmiaru lub użyć symbolu funkcji populacji. Inne proponowane rozwiązanie pochodzi z logiki rozmytej, która zakłada ontologiczne zobowiązanie, że zdania mają stopień prawdziwości od 0 do 1. Na przykład zdanie „Wiedeń to duże miasto” może być prawdziwe w stopniu 0,8 w logice rozmytej, podczas gdy „Paryż to duże miasto” może mieć wartość 0,9. Odpowiada to lepiej naszej intuicyjnej koncepcji świata, ale utrudnia wnioskowanie: zamiast jednej reguły do ​​ustalenia prawdziwości A Λ B , logika rozmyta potrzebuje różnych reguł w zależności od dziedziny. Inną możliwością, opisaną , jest przypisanie każdej koncepcji do punktu w przestrzeni wielowymiarowej, a następnie zmierzenie odległości między pojęciem „duże miasto” a pojęciem „Wiedeń” lub „Paryż”. Różne logiki specjalnego przeznaczenia czynią jeszcze dalsze zobowiązania ontologiczne; na przykład logika temporalna zakłada, że fakty zachodzą w określonych czasach i że te czasy (które mogą być punktami lub odstępami) są uporządkowane. Zatem logiki specjalnego przeznaczenia nadają pewnym rodzajom obiektów (i aksjomatów na ich temat) status „pierwszej klasy” w logice, zamiast po prostu definiować je w bazie wiedzy. Logika wyższego rzędu postrzega relacje i funkcje, do których odwołuje się logika pierwszego rzędu, jako same w sobie obiekty. Pozwala to na wysuwanie twierdzeń o wszystkich relacjach – na przykład można by chcieć zdefiniować, co to znaczy, że relacja jest przechodnia. W przeciwieństwie do większości logik specjalnego przeznaczenia, logika wyższego rzędu jest ściślej bardziej ekspresyjna niż logika pierwszego rzędu, w tym sensie, że niektóre zdania logiki wyższego rzędu nie mogą być wyrażone przez dowolną skończoną liczbę zdań logicznych pierwszego rzędu. Logikę można też scharakteryzować przez jej epistemologiczne zobowiązania – możliwe stany wiedzy, na które pozwala w odniesieniu do każdego faktu. Zarówno w logice zdaniowej, jak i pierwszego rzędu, zdanie reprezentuje fakt, a podmiot albo wierzy, że zdanie jest prawdziwe, wierzy, że jest fałszywe, albo nie ma opinii. Logiki te mają zatem trzy możliwe stany wiedzy o każdym zdaniu. Z drugiej strony systemy wykorzystujące teorię prawdopodobieństwa mogą mieć dowolny stopień przekonania lub subiektywnego prawdopodobieństwa, od 0 (całkowite niewiara) do 1 (całkowite przekonanie). Ważne jest, aby nie mylić stopnia wiary w teorię prawdopodobieństwa ze stopniem prawdziwości logiki rozmytej. Rzeczywiście, niektóre systemy rozmyte dopuszczają niepewność (stopień wiary) co do stopni prawdy. Na przykład, probabilistyczny agent świata wumpusa może sądzić, że wumpus jest w [1,3] z prawdopodobieństwem 0,75 i w [2, 3] z prawdopodobieństwem 0,25 (chociaż wumpus jest zdecydowanie w jednym konkretnym kwadracie).

Język myśli

Języki naturalne (takie jak angielski czy hiszpański) są rzeczywiście bardzo ekspresyjne. Udało nam się napisać prawie całą książkę w języku naturalnym, z rzadkimi tylko przeskokami do innych języków (głównie matematyki i diagramów). Językoznawstwo i filozofia języka mają długą tradycję, która postrzega język naturalny jako deklaratywny język reprezentacji wiedzy. Gdybyśmy mogli odkryć zasady języka naturalnego, moglibyśmy ich użyć w systemach reprezentacji i rozumowania i uzyskać korzyści z miliardów stron które zostały napisane w języku naturalnym. Współczesny pogląd na język naturalny polega na tym, że służy on jako środek komunikacji, a nie czysta reprezentacja. Kiedy mówca wskazuje i mówi: „Spójrz!” słuchacz dowiaduje się, że, powiedzmy, Superman wreszcie pojawił się nad dachami. Nie chcielibyśmy jednak powiedzieć, że zdanie „Spójrz!” reprezentuje ten fakt. Znaczenie zdania zależy raczej zarówno od samego zdania, jak i od kontekstu, w jakim zdanie zostało wypowiedziane. Najwyraźniej nie można było zapisać zdania takiego jak „Spójrz!” w bazie wiedzy i oczekiwać odzyskania jego znaczenia bez przechowywania reprezentacji kontekstu — co rodzi pytanie, w jaki sposób można przedstawić sam kontekst. Języki naturalne również cierpią z powodu niejednoznaczności, co jest problemem dla języka reprezentacji. Jak ujął to Pinker (1995): „Kiedy ludzie myślą o wiośnie, z pewnością nie są zdezorientowani, czy myślą o porze roku, czy o czymś, co się dzieje – a jeśli jedno słowo może odpowiadać dwóm myślom, myśli nie mogą być słowa.” Słynna hipoteza Sapira – Whorfa. Whorfa głosi, że na nasze rozumienie świata silny wpływ ma język, którym mówimy. Z pewnością prawdą jest, że różne wspólnoty językowe w różny sposób dzielą świat. Francuzi mają dwa słowa „chaise” i „fauteuil”, na określenie koncepcji, którą anglojęzyczni określają jednym: „krzesło”. Ale osoby mówiące po angielsku mogą łatwo rozpoznać kategorię fauteuil i nadać jej nazwę – z grubsza „fotel z otwartymi ramionami” – więc czy język naprawdę robi różnicę? Whorf opierał się głównie na intuicji i spekulacjach, a jego idee zostały w dużej mierze odrzucone, ale w międzyczasie mamy rzeczywiste dane z badań antropologicznych, psychologicznych i neurologicznych. Na przykład, czy pamiętasz, które z poniższych dwóch fraz stanowiło początek sekcji ?

„W tej sekcji omawiamy naturę języków reprezentacji . . ”.

„Ta sekcja obejmuje temat języków reprezentacji wiedzy . . ”.

Wanner przeprowadził podobny eksperyment i stwierdził, że badani dokonywali właściwego wyboru na poziomie losowym – w około 50% przypadków – ale pamiętali treść tego, co czytali z dokładnością lepszą niż 90%. Sugeruje to, że ludzie interpretują słowa, które czytają i tworzą wewnętrzną reprezentację niewerbalną, a dokładne słowa nie mają konsekwencji. Bardziej interesujący jest przypadek, w którym pojęcie jest całkowicie nieobecne w języku. Osoby posługujące się australijskim językiem aborygeńskim Guugu Yimithirr nie mają słów na określenie kierunków względnych (lub egocentrycznych), takich jak przód, tył, prawo lub lewo. Zamiast tego używają bezwzględnych wskazówek, mówiąc na przykład ekwiwalent „boli mnie północne ramię”. Ta różnica w języku ma wpływ na zachowanie: osoby mówiące w języku Guugu Yimithirr są lepsze w nawigacji w otwartym terenie, podczas gdy osoby mówiące po angielsku lepiej radzą sobie z umieszczaniem widełek po prawej stronie tablicy. Język wydaje się również wpływać na myślenie poprzez pozornie arbitralne cechy gramatyczne, takie jak rodzaj rzeczowników. Na przykład „most” to rodzaj męski w języku hiszpańskim i żeński w języku niemieckim. Boroditsky (2003) poprosił badanych o wybranie angielskich przymiotników opisujących zdjęcie konkretnego mostu. Hiszpanie wybrali duże, niebezpieczne, mocne i wysokie, podczas gdy niemieccy wybrali piękne, eleganckie, delikatne i smukłe.

Słowa mogą służyć jako punkty zaczepienia, które wpływają na to, jak postrzegamy świat. Loftus i Palmer pokazali badanym eksperymentalnym film o wypadku samochodowym. Osoby, którym zadano pytanie: „Jak szybko jechały samochody, gdy się ze sobą kontaktowały? ” zgłosiło średnią 32 mil na godzinę, podczas gdy osoby, którym zadano pytanie ze słowem „rozbity” zamiast „skontaktowano”, zgłosiły 41 mil na godzinę dla tych samych samochodów w tym samym filmie. Ogólnie rzecz biorąc, istnieją wymierne, ale niewielkie różnice w przetwarzaniu poznawczym przez osoby mówiące różnymi językami, ale nie ma przekonujących dowodów na to, że prowadzi to do poważnych różnic w światopoglądzie. W logicznym systemie rozumowania, który wykorzystuje spójną postać normalną (CNF), widzimy, że Formy językowe „¬(A ∨ B) ” i „¬A ∧ ¬B” są takie same, ponieważ możemy zajrzeć do wnętrza systemu i zobaczyć, że te dwa zdania są przechowywane jako ta sama kanoniczna forma CNF. Z ludzkim mózgiem można zrobić coś podobnego. Mitchell i inni umieścili badanych w funkcjonalnej maszynie do obrazowania metodą rezonansu magnetycznego (fMRI), pokazali im słowa takie jak „selery” i zobrazowali ich mózgi. Program uczenia maszynowego wyszkolony na parach (słowo, obraz) był w stanie poprawnie przewidzieć 77% czasu w przypadku zadań wyboru binarnego (np. „seler” lub „samolot”). System może nawet przewidywać na poziomie powyżej szansy słowa, których nigdy wcześniej nie widział na obrazie fMRI (poprzez uwzględnienie obrazów powiązanych słów) oraz ludzi, których nigdy wcześniej nie widział (dowodząc, że fMRI ujawnia pewien poziom wspólnej reprezentacji ludzi ). Tego typu prace są wciąż w powijakach, ale fMRI (i inne technologie obrazowania, takie jak elektrofizjologia wewnątrzczaszkowa (Sahin i in., 2009)) obiecują dostarczyć nam znacznie bardziej konkretnych pomysłów na to, jak wyglądają reprezentacje wiedzy ludzkiej. Z punktu widzenia logiki formalnej reprezentowanie tej samej wiedzy na dwa różne sposoby nie ma absolutnie żadnego znaczenia; te same fakty można wyprowadzić z obu reprezentacji. W praktyce jednak jedno przedstawienie może wymagać mniejszej liczby kroków, aby wyciągnąć wniosek, co oznacza, że ​​osoba prowadząca rozumowanie mająca ograniczone zasoby może dojść do wniosku przy użyciu jednej reprezentacji, ale nie drugiej. W przypadku zadań niededukcyjnych, takich jak uczenie się na podstawie doświadczenia, wyniki są z konieczności zależne od formy użytych reprezentacji. Później pokażemy, że kiedy program nauczania bierze pod uwagę dwie możliwe teorie świata, z których obie są zgodne ze wszystkimi danymi, najczęstszym sposobem na zerwanie więzi jest wybranie najbardziej zwięzłej teorii — a to zależy od języka używane do reprezentowania teorii. Tak więc wpływ języka na myślenie jest nieunikniony dla każdego podmiotu, który się uczy.