*

Historia Sztucznej InteligencjiArtificial Intelligence Experts

Uzasadnienie i reprezentacja

Rozumowanie niemonotoniczne lub niemożliwe do uzasadnienia

Ci badacze AI zwani logikami, którzy preferują używanie języków logicznych do reprezentowania wiedzy i stosowanie metod logicznych do rozumowania, uznają jeden problem ze zwykłą logiką; mianowicie jest monotoniczny. Oznacza to, że zestaw logicznych wniosków, które można wyciągnąć z zestawu instrukcji logicznych, nie zmniejsza się, gdy do zestawu dodaje się więcej instrukcji. Gdyby można było udowodnić stwierdzenie z danej bazy wiedzy, można by udowodnić to samo stwierdzenie (z tym samym dowodem!), Gdy dodana jest większa wiedza. Jednak wydaje się, że wiele ludzkich rozumowań nie działa w ten sposób - fakt dobrze zauważony (i doceniony) przez krytyków AI. Często dochodzimy do wniosku na podstawie faktów, które mamy, wraz z rozsądnymi założeniami, a następnie musimy wycofać ten wniosek, gdy dowiadujemy się o nowym fakcie, który jest sprzeczny z założeniami. Ten sposób rozumowania nazywany jest niemonotonicznym lub niemożliwym do zaakceptowania (co oznacza, że "można go uczynić lub uznać za nieważny"), ponieważ nowe fakty mogą wymagać wycofania czegoś, co zostało wcześniej zawarte. Można nawet znaleźć przykłady niemonotonicznego rozumowania w opowieściach dla dzieci. W "To dobrze! To źle!", autorstwa Margery Cuyler, mały chłopie wzbija się wysoko w niebo, trzymając balon, który rodzice kupili mu w zoo. "Wow! Och, to dobrze" - opowiada historia. Balon pęka na gałęzi wysokiego, kłującego drzewa. "Pop! Och, to źle" - kontynuuje historia. Chłopiec wpada do błotnistej rzeki, wspina się na hipopotama i jedzie na brzeg. "Oh to dobrze." Historia toczy się w ten sposób - zmieniając w kółko, czy jazda balonem okazuje się "dobra" czy "zła". W sztucznej inteligencji (i innych dziedzinach informatyki) istniały już pewne metody uzasadnienia. Na przykład w języku rozwiązywania problemów PLANNER zaproponowanym przez Carla Hewitta, jeśli cel, powiedzmy G, nie mógłby zostać osiągnięty przez program, wówczas nie można było twierdzić, że Not G (przy założeniu, że G było stwierdzeniem, że program próbował ustalić). Takie rozumowanie jest niemożliwe do uniknięcia, ponieważ jeśli później do programu zostaną dodane dodatkowe instrukcje lub do jej bazy wiedzy, wówczas ustalenie G może stać się możliwe. Podobnie w języku programowania PROLOG, jeśli program nie mógł udowodnić instrukcji, to uznano ją za fałszywą. Wnioskowanie, że coś jest fałszywe, jeśli nie można tego udowodnić, nazywa się "negacją jako porażką". System planowania SRI, STRIPS, był także rodzajem niemonotonicznego systemu wnioskowania. Założenia dotyczące rzeczy "pozostających niezmienionych" po wykonaniu działań były z pewnością właśnie tym - założeniami. Wnioski wyciągnięte po dokonaniu takich założeń mogą zostać odrzucone po dodaniu nowych informacji, których implikacje mogą negować te założenia. W świecie baz danych zastosowano inną metodę niemożliwego do uzasadnienia. Bazy danych są używane do kodowania szerokiej gamy informacji. Na przykład firma może mieć bazę danych o swoich pracownikach. Można zapytać o taką bazę danych, aby znaleźć wynagrodzenie pracownika, dział, w którym on lub ona pracuje i tak dalej. Załóżmy, że próbujemy znaleźć w jednej z tych baz danych pracowników informacje o osobie, powiedzmy Jack Smith, której nazwiska nie ma w bazie danych. Możemy zatem rozsądnie dojść do wniosku, że Pan Smith nie jest pracownikiem tej firmy i tak zrobiliby niektóre systemy baz danych. Wniosek ten byłby oparty na założeniu, że baza danych wymienia wszystkich pracowników tej firmy {przykład tzw. Założenia świata zamkniętego (CWA). Oczywiście Jack Smith może później dołączyć do firmy, a następnie jego nazwisko zostanie dodane do bazy danych. W tym czasie musielibyśmy cofnąć wniosek, że Jack Smith nie jest jednym z pracowników firmy; to kolejny przykład niemożliwego do uzasadnienia rozumowania. Możecie sobie przypomnieć, że już w 1964 r. System SIR Bertrama Raphaela zawierał styl niemożliwego do uzasadnienia, który nazwał "zasadą wyjątku". W SIR: ogólna informacja o wszystkich elementach zestawu zastosowanych do poszczególnych elementów {ale tylko przy braku bardziej szczegółowych informacji o tych konkretnych elementach. Kilka schematów reprezentacji wiedzy AI przedstawia część swojej wiedzy w "hierarchiach taksonomicznych", podobnie jak ten, którego użył Raphael, i używa zasady wyjątku, która obecnie jest często nazywana "anulowaniem dziedziczenia" z niemożliwego do uzasadnienia. Na rysunku pokazano hierarchię taksonomiczną niektórych maszyn biurowych.



Program wykorzystujący tę hierarchię stwierdziłby, że źródłem energii drukarki laserowej jest na przykład gniazdko ścienne, ponieważ ta właściwość jest dziedziczona z ogólnej klasy "maszyn biurowych". Jednak bardziej szczegółowe informacje o źródle energii dla robotów zmusiłyby do wniosku, że źródłem energii na przykład dla R2D2 jest bateria, przesłaniająca dziedziczenie właściwości ogólnej klasy maszyn biurowych. W latach 80. niektórzy z najbardziej kreatywnych badaczy AI stali się zafascynowani problemem niemożliwego do uzasadnienia rozumowania i przedstawił kilka nowych propozycji, jak to zrobić. Ich propozycjom towarzyszyła wiele analiz teoretycznych porównujących i kontrastujących ze sobą różne podejścia oraz tego, jak niektóre z nich można uznać za specjalizacje lub uogólnienia innych. Kanadyjski badacz AI Raymond Reiter zaproponował jedną z nowych metod. W najprostszej formie wykorzystuje specjalne reguły wnioskowania, które pozwalają wyciągać wnioski z bazy wiedzy, jeśli spełniony jest określony warunek i jeżeli wnioskowi temu nie przeczy to, co zwykle można wywnioskować z tej bazy wiedzy. Specjalne reguły wnioskowania Reitera nazywane są regułami domyślnymi, a jego system, który ich używa, nazywa się logiką domyślną. Jako przykład jego zastosowania załóżmy, że mamy bazę wiedzy używaną przez robota, która określa, do których pomieszczeń w budynku biurowym może wejść robot. Możemy mieć regułę, która mówi, że w przypadku pomieszczeń na drugim piętrze, jeśli nie można udowodnić, że robot nie może wejść do pokoju, można dojść do wniosku, że robot może wejść do tego pokoju. Ponownie, rozumowanie jest nie do przyjęcia, ponieważ ktoś może później dodać do bazy wiedzy fakt, który pozwala wnioskować, że do pokoju na drugim piętrze nie można wejść. John McCarthy, pomysłodawca wniosku, że wiedza powinna być zakodowana jako logiczne stwierdzenia, był również zaniepokojony problemem niemonotoniczności. Aby poradzić sobie z tym problemem, zaproponował metodę o nazwie opis. Opis jest raczej trudny do wyjaśnienia bez użycia logicznego żargonu. Zasadniczo jego wersja zwana "orzeczeniem obwodowym" (tylko jedna z kilku wersji opisu) obejmuje ograniczenie (a więc "opisanie") zbioru bytów, które sprawiają, że predykaty są prawdziwe tylko do tych, które można udowodnić, że są prawdziwe. Na przykład, jeśli mamy bazę wiedzy, która zawiera takie stwierdzenia jak Tall (John) i Tall (Frank), a także wiele innych faktów, możemy ograniczyć (jeśli chcemy) predykat Tall. Takie postępowanie pozwala nam stwierdzić: Wysoki (Susy), jeśli Wysoki (Susy) nie jest logicznie implikowany przez bazę wiedzy. Jedną z motywacji zainteresowania McCarthy'ego niemonotonicznym rozumowaniem była możliwość, że będzie to klucz do rozwiązania problemu ramowego. Przypomnij sobie, że problem z ramką dotyczy trudności w przedstawieniu, które rzeczy się zmieniają, a które nie zmieniają się po podjęciu działania (np. Przez robota). Jednym z podejść jest przyjęcie takiego założenia jeśli orzeczenie opisujące jakiś stan świata nie jest wspomniane w opisie działania (w tym warunków wstępnych i efektów działania), wówczas orzeczenie to nie jest zmieniane przez działanie. To założenie jest niemonotoniczne, ponieważ późniejsze (lub bardziej szczegółowe) informacje mogą sugerować, że nie wymieniony predykat rzeczywiście został zmieniony. Niektóre wczesne próby rozwiązania problemu z ramą za pomocą niemonotonicznego wnioskowania napotkały różne trudności techniczne (które są zbyt techniczne, aby się tym zajmować), ale prace były kontynuowane. Niedawny artykuł twierdził, że "Problem z ramą w pierwotnym brzmieniu został rozwiązany za pomocą podejść Shanahana i Thielschera oraz że przynajmniej logiczny rozdział Problemu z ramą został zamknięty" .(Dwie wspomniane osoby to Murray Shanahan z Imperial College, Londyn i Michael Thielscher z Uniwersytetu Technicznego w Dreźnie.) Być może nie zauważyłeś, że wiele propozycji niemonotonicznego rozumowania jest raczej podobnych, ale istnieje wiele subtelnych różnic technicznych. Są nawet inne propozycje, o których nie wspomniałem, w tym logiki autoepistemiczne, logiki niemonotoniczne, rozumowanie uprowadzające, systemy utrzymywania prawdy oraz metody oparte na teorii prawdopodobieństwa. Tę obfitość niemożliwych do uzasadnienia metod wnioskowania można prawdopodobnie przypisać kreatywności i matematycznemu wyrafinowaniu wielu zaangażowanych badaczy AI i ich bystrości umiejętności dostrzegania i próbowania wymykania się ograniczeniom wzajemnych propozycji.

Uzasadnienie jakościowe

Wielu z was prawdopodobnie uczestniczyło w kursach fizyki, w liceum, na studiach lub w obu. Zadaniem fizyki jest budowanie teorii świata fizycznego, a teorie te są zwykle formułowane przy użyciu matematyki. Na przykład wzór F = Ma wiąże siłę F działającą na obiekt z masą obiektu M i jego przyspieszeniem a. Wiele wzorów matematycznych opisujących procesy fizyczne jest bardziej złożonych. Na przykład do obliczenia prędkości fali wodnej można użyć następującego "równania falowego":



Inżynierowie mogą na przykład użyć go do przewidzenia, kiedy szczyt fali przejdzie przez określony punkt. My, ludzie, jesteśmy w stanie przewidzieć, z przydatnymi dokładnościami, przyszły przebieg wielu procesów fizycznych, których zwykle doświadczamy. Na przykład, gdy ludzie bawią się w fale oceanu na plaży, zwykle są w stanie przewidzieć, kiedy nadejdzie szczyt fali, aby mogli skoczyć w czasie. Czy nasze mózgi używają czegoś takiego jak pokazane równanie, aby dokonać takiej prognozy? Prawdopodobnie nie. Zamiast tego, na podstawie powtarzalnych doświadczeń uczą się rutynowe przewidywanie prowadzenia odpowiednich działań. Są one częścią tego, co psychologowie nazywają "wiedzą proceduralną". Oprócz działania w sposób automatyczny i efektywny, wykorzystując wiedzę proceduralną zawartą w naszych różnych umiejętnościach motorycznych, możemy również składać deklaratywne stwierdzenia przewidujące, co stanie się w pewnych sytuacjach. Na przykład surfer spoglądający na nadchodzące fale może powiedzieć przyjacielowi: "Weź następną falę; to będzie duża". Najwyraźniej mamy jakąś łatwość do reprezentowania i wykorzystywania "jakościowej wiedzy" na temat procesów fizycznych - wiedzy, która nie jest ani częścią naszej procedury \ pamięci mięśniowej, ani też nie jest reprezentowana w naszych mózgach za pomocą skomplikowanych wzorów matematycznych. Mógłbym podać kilka przykładów. Skąd to wiemy kiedy przewrócimy szklankę wody na stół, woda ostatecznie dojdzie do krawędzi stołu i rozleje się OFF? Skąd wiemy, że jeśli ułożymy ciężkie pudła na lekkich, delikatnych pudłach, delikatne pudła mogą się zapaść? Skąd wiemy, że jeśli dotrzemy do celu nieco szybciej, dotrzemy tam nieco wcześniej? Kilku badaczy AI pracowało nad systemami posiadającymi zdolność reprezentowania i rozumowania za pomocą wiedzy jakościowej. Scott Fahlman napisał taki program do swojej pracy magisterskiej, gdy był studentem MIT. Program o nazwie BUILD był w stanie zaplanować układanie klocków zabawek, biorąc pod uwagę różne siły działające na bloki, takie jak grawitacja i tarcie. zrobił to w sposób bardziej lub mniej jakościowy niż przy użyciu dokładnych modeli matematycznych. Tak więc BUILD można uznać za jedną z pierwszych prób sztucznej inteligencji w zakresie wnioskowania jakościowego na temat fizyki. Niedługo potem inny student MIT, Johan de Kleer , napisał program o nazwie NEWTON w swojej pracy magisterskiej, który zawierał komponent zdolny do rozumowania jakościowego. NEWTON, jak twierdzi de Kleer, "rozumie i rozwiązuje problemy w mechanicznym mini-świecie obiektów poruszających się po powierzchniach". NEWTON wykorzystał swoją jakościową wiedzę na temat fizyki do opracowania przybliżonych rozwiązań problemów, które następnie wykorzystał do planowania i przeprowadzania kolejnych obliczeń ilościowych. Większość nauczycieli fizyki powie ci, że jakościowe rozumowanie na temat "fizyki" problemu jest niezbędne przed zanurzeniem się w matematyce. Robiąc rozumowanie jakościowe, NEWTON wykorzystał proces o nazwie "przewidywanie" do "generowania postępu scen zakodowanych w symbolicznym opisie opisującym to, co może się zdarzyć". Wykorzystano opisy sześciu podstawowych działań odpowiednich do rodzajów problemów, które NEWTON mógł rozwiązać. Jeden z tych opisów dotyczy na przykład FLY. Zakodował on wiedzę, że "jeśli obiekt porusza się po powierzchni wklęsłej od ruchu, obiekt może się od niego oderwać". Głównym wkładem de Kleera było pokazanie, w jaki sposób obliczenia jakościowe i rozumowanie ilościowe można połączyć w programie komputerowym. W 1979 r. Pat Hayes opublikował "Manifest naiwnej fizyki". "Zmieniona wersja pojawiła się w 1985 r. Zaproponował, aby społeczność badająca sztuczną inteligencję rozpoczęła" budowę formalizacji sporej części zdrowego rozsądku wiedzy o codziennym świecie fizycznym: o przedmiotach, kształcie, przestrzeni, ruchu, substancjach (ciałach stałych i cieczach), czasie itp. "Tematy te od dawna stanowiły szczególnie trudne wyzwania dotyczące reprezentacji i rozumowania dla sztucznej inteligencji. Kodowanie naszej codziennej wiedzy na te tematy, aby komputery mogły je zrozumieć, jest w sercu fizyki jakościowej, którą Hayes nazwał "fizyką naiwną". Jego manifesty przedstawiały kilka ogólnych pomysłów na temat tego, jak reprezentować "skupiska" zdrowego rozsądku na temat świata fizycznego. Jako przykład zaproponował pojęcie "historii" do reprezentowania wydarzeń, zamiast stanów i funkcji państw, jak wcześniej opowiadał się on i John McCarthy. Określił historię jako "czasoprzestrzeń z naturalnymi granicami, zarówno czasowymi, jak i przestrzennymi". "Na przykład" zdarzenie polegające na złożeniu czterech bloków w kwadrat jest początkiem historii platformy i jej końcem. historia jest wtedy, gdy i gdzie są one oddzielone od siebie. "Hayes powiedział w efekcie, że nie powinniśmy być" zbyt pochopni "w pisaniu naiwnych programów fizyki {woląc zamiast tego opóźniać wdrażanie, dopóki nie zostaną wykonane bardziej fundamentalne prace nad samymi reprezentacjami Naszkicował już część tej pracy na cieczach. Te wstępne eksploracje w rozumowaniu jakościowym wkrótce doprowadziły do szybko rozwijającego się obszaru sztucznej inteligencji o wielu zastosowaniach, zwłaszcza w diagnozowaniu usterek na podstawie jakościowych modeli sprzętu. Wybitne grupy zostały utworzone przez profesora Kennetha D. Forbusa z Northwestern University i Benjamina Kuipersa z University of Teksas w Austin. (Kuipers przeprowadził się teraz na University of Michigan). Pojawiły się specjalne wydania czasopism oraz zredagowanych tomów i książek poświęconych temu tematowi. Zakończę ten rozdział dotyczący rozumowania i reprezentacji, przechodząc obok nowych osiągnięć w zakresie wykorzystania sieci semantycznych do reprezentacji wiedzy.

Sieci semantyczne

We wcześniejszej dyskusji na temat niemożliwego do zrozumienia rozumowania pokazano sieć semantyczną reprezentującą taksonomiczną hierarchię maszyn biurowych. sieci taksonomiczne są szeroko stosowane w sztucznej inteligencji i informatyce do reprezentowania tak zwanych "ontologii". W sztucznej inteligencji ontologia składa się z zestawu pojęć i relacji między tymi pojęciami. (W filozofii oznacza to badanie bytu lub istnienia). Systemy AI do wnioskowania za pomocą tych sieci zwykle miałyby mechanizmy dziedziczenia własności przy użyciu zasad wyjątków. Chociaż najlepiej rozumiemy sieci taksonomiczne, myśląc o nich w formie drzew, to w tym przypadku stosuje się zbiór specjalnych struktur danych kodowanie ich dla komputerów. Struktury te są często nazywane "ramkami" po oryginalnym użyciu tego słowa przez Minsky′ego. Na przykład jedną z ram dla sieci maszyn biurowych można przedstawić jak na rysunku



Zazwyczaj istnieje ramka dla każdej klasy osób lub podmiotów w taksonomii, a także dla każdej z tych jednostek. Ramki dla klas nazwaliby nadklasę, do której należała, i należące do niej podklasy. Określiłby także właściwości podmiotów należących do klasy. Często zdarza się, że ramka ma "meta-informacje", takie jak data utworzenia ramki.

Opis Logika

Wcześniej w historii AI istniały kontrowersje dotyczące tego, czy wiedza powinna być reprezentowana przez struktury danych, takie jak sieci semantyczne (zakodowane, powiedzmy, jako ramki), czy przez zestawy instrukcji logicznych. Stopniowo kontrowersje łagodziły się, ponieważ naukowcy zaczęli akceptować ideę, że sieci semantyczne można traktować jako specjalny sposób reprezentowania pewnych rodzajów logicznych stwierdzeń, umożliwiając w ten sposób dokonywanie pewnych dedukcji bezpośrednio z sieci. Dwóch badaczy, którzy pomogli ustalić ten pogląd, to Ronald J. Brachman i Hector J. Levesque. (Każdy z nich wykonał również powiązane prace podstawowe w zakresie reprezentacji wiedzy i ogólnego rozumowania.

Brachman zrobił doktorat w Harvardzie pod kierunkiem Billa Woodsa. (Oprócz pracy w przetwarzaniu języka naturalnego, Woods pisał także o związku między sieciami semantycznymi a logiką.) Rozwijając pomysły w swojej pracy, Brachman wraz z innymi kolegami z BBN (w tym Woods) i USC-ISI, opracował oparty na ramkach system reprezentacji wiedzy o nazwie KL-ONE, który stał się podstawą tak zwanej logiki opisu. Levesque wykonał całą pracę w collegeu (B.S., M.S. i doktorat) na University of Toronto. Po otrzymaniu stopnia doktora dyplom w 1981 r. dołączył do Brachmana w Fairchild Laboratory for Artiial Intelligence Research w Palo Alto, grupie założonej przez Petera Harta po odejściu Hart z SRI. Tam Brachman i Levesque wraz z Richardem Fikessem (wówczas w Xerox PARC) opracowali system reprezentacji i rozumowania KRYPTON. KRYPTON był systemem hybrydowym - co oznacza, że reprezentował wiedzę zarówno za pomocą formuł logicznych, jak i sieci semantycznej. Chociaż sieci semantyczne ułatwiają rozumowanie osób i ich właściwości w hierarchii, trudno im reprezentować stwierdzenia zawierające negacje i rozbieżności. Jak stwierdza papier KRYPTON, "… oświadczenie takie jak "Elsie lub Bessie jest krową stojącą w polu Farmera Jonesa" nie może być sformułowane w typowym systemie asercyjnym" .Rozwiązaniem KRYPTON jest użycie kombinacji obu rodzajów reprezentacji:… podzieliliśmy [ rozumowanie] na dwa osobne rodzaje, uzyskując dwa główne komponenty dla naszego systemu reprezentacji: terminologiczny [to znaczy oparty na sieci] lub T Box oraz asercjonalny [to znaczy oparty na logice] lub A Box. T Box pozwala nam ustalać taksonomie ustrukturyzowanych terminów i odpowiadać na pytania dotyczące analitycznych relacji między tymi terminami; A Box pozwala nam budować opisowe teorie domen zainteresowań i odpowiadać na pytania dotyczące tych domen. Schemat z papieru KRYPTON przedstawiony na ryc. 26.4 ilustruje budowę układu.



Jak napisali autorzy, składa się on z "T-Boxa ustrukturyzowanych terminów zorganizowanych taksonomicznie, A-Box z (z grubsza) zdań pierwszego rzędu, których predykaty pochodzą z T-Box, oraz tablicy symboli z nazwami terminów T-Box aby użytkownik mógł się do nich odwołać ". Pole T na schemacie reprezentuje (między innymi), że dziecko jest osobą. A Box stwierdza, że istnieje lekarz, który ma dziecko. KRYPTON był prekursorem kilku systemów opisowych, w tym CLASSIC, opracowanych przez Brachmana i współpracowników po przejściu do AT&T Bell Laboratories. Oprócz ich zastosowania w systemach wnioskowania AI, logiki opisu są używane w językach ontologii dla sieci semantycznej, na przykład DAML-ONT23 i OWL.

WordNet

WordNet to duży "konceptualny" słownik angielskich słów, zorganizowany nieco jak sieć semantyczna i zainspirowany psycholingwistycznymi i obliczeniowymi teoriami ludzkiej pamięci leksykalnej. Jego rozwój rozpoczął się na Uniwersytecie Princeton w latach 80. pod kierunkiem profesora George′a A. Millera (tego samego George′a Millera, o którym wspominałem wcześniej i który napisał "The Magical Number Seven, Plus or Minus Two "). W artykule z 1990 roku Miller i jego koledzy powiedzieli o początkach projektu:

"W 1985 r. Grupa psychologów i lingwistów z Princeton University zobowiązała się do opracowania leksykalnej bazy danych zgodnie z sugestiami z wcześniejszych badań [psycholingwistycznych]. Pierwotnym pomysłem było zapewnienie pomocy w wyszukiwaniu słowników pojęciowo, a nie tylko alfabetycznie {miał być używany w połączeniu ze słownikiem on-line konwencjonalnego typu. W miarę upływu czasu praca wymagała jednak bardziej ambitnego sformułowania własnych zasad i celów. WordNet jest wynikiem. Ponieważ WordNet tworzy hipotezy oparte na wynikach badań psycholingwistycznych, można powiedzieć, że jest słownikiem opartym na zasadach psycholingwistycznych." WordNet grupuje słowa w kolekcje zwane "synsetami". Każdy zestaw zawiera grupę słów synonimicznych, to znaczy słów o mniej więcej tym samym znaczeniu. Korzystam z narzędzia wyszukiwania online WordNet, aby podać przykłady synchronizacji i relacji między nimi. Na przykład słowo "komputer" występuje w dwóch różnych zestawach. Jeden z tych synsetów zawiera, oprócz "komputera", maszyny komputerowej "synonimy", "urządzenia komputerowego", "procesora danych", "komputera elektronicznego" i "systemu przetwarzania informacji". Drugi zestaw synonimów zawiera synonimy dla starszych zastosowań słowo "komputer" (gdy odnosi się do ludzi wykonujących obliczenia), a mianowicie "kalkulator", "licznik", "gurer" i "estymator". Synsetowi może także towarzyszyć skrót, zwany " połysk ", który nadaje znaczenie słowom w synsecie. W przypadku pierwszego zestawu połysk to" urządzenie do automatycznego wykonywania obliczeń. "Po drugie, połysk to" ekspert w dziedzinie obliczeń (lub obsługi maszyn liczących) "Czasami połysk zawiera także przykładowe zdanie ilustrujące typowe użycie. Synsety są połączone z innymi synsetami za pomocą relacji podobnych do tych używanych w sieci semantycznej. Jedna taka relacja nazywana jest "hipernym", odpowiadającym (z grubsza) "rodzajowi". Na przykład, nasz synset zawierający "komputer" i "urządzenie komputerowe" itp. jest synsetem zawierającym słowo "maszyna" (i ewentualnie także inne słowa) o połysku "dowolne urządzenie mechaniczne lub elektryczne, które transmituje lub modyfikuje energia do wykonania lub pomocy w wykonywaniu ludzkich czynności. " "Hiponim", odpowiadający (z grubsza) "jest ogólnym przypadkiem", jest przeciwieństwem hipernymu. Wspomniany wcześniej zestaw "komputerowy" ma kilka hiponimów, między innymi zawierające słowa "komputer cyfrowy" i dowolny z jego synonimów (komputer, który reprezentuje informacje za pomocą cyfr numerycznych), "moduł liczbowy" i dowolny z jego synonimów (komputer zdolny do wykonywania dużej liczby operacji matematycznych na sekundę), "maszynę Turinga" i dowolny z jego synonimów (hipotetyczny komputer z prawie długą taśmą pamięci) i inne. Istnieją również inne relacje. W przypadku synsetów zawierających rzeczowniki istnieje relacja zwana "meronimem" odpowiadająca "ma jako części". Synset zawierający "komputer" i "urządzenie komputerowe" itp. Ma kilka meronimów, wśród nich te zawierające słowa "chip" i jego synonimy (wszystkie z połyskliwym "sprzętem elektronicznym składającym się z małego kryształu półprzewodnika krzemowego wykonanego z realizują szereg funkcji elektronicznych w układzie scalonym "), "monitorze"i jego synonimach (wszystkie z połyskiem" wyświetlacza wytwarzanego przez urządzenie, które odbiera sygnały i wyświetla je na ekranie telewizyjnym lub monitorze komputera ") oraz kilka inni "Holonim" jest przeciwieństwem meronimu. Każdy synset wspomina także część mowy zawartych w nim słów: rzeczownik, czasownik, przymiotnik lub przysłówek. Relacje między synsetami różnią się nieco w zależności od części mowy. Na przykład, zestawy czasowników mają relację zwaną "pociąganiem". Na przykład jeden z synsetów czasownika "chodzić" (poruszać się nogami; krok po kroku) pociąga za sobą synset zawierający czasownik "krok" (przesunięcie lub ruch wykonując krok). Według strony internetowej (w chwili pisania tego tekstu) WordNet zawiera 155 287 słów i 117 659 synsetów. Jest utrzymywany i rozwijany w Princeton i jest dostępny bezpłatnie do publicznego pobrania. Oprócz wykorzystania jako słownika online i tezaurusa, jest on używany do wspierania automatycznej analizy tekstu, w aplikacjach do przetwarzania języka naturalnego, jako baza wiedzy do odpowiedzi na pytania oraz w semantycznych aplikacjach internetowych. Podobne "sieci słowne" zostały utworzone w kilkudziesięciu innych językach. Zastosowanie WordNet jako ontologii w bazie wiedzy taksonomicznej zależy od relacji hipernym / hiponimu między synsetami rzeczowników i od użycia przez WordNet mechanizmu dziedziczenia do wnioskowania o właściwościach obiektów reprezentowanych przez synsety na podstawie właściwości ich przodków. Na przykład jeden łańcuch (od konkretnego do ogólnego) w takiej hierarchii jest następujący:

stacja robocza → komputer cyfrowy → komputer! maszyna → urządzenie →instrumentalność → artefakt→ … Oczywiście wzdłuż tego łańcucha znajdują się gałęzie boczne (które można eksplorować za pomocą funkcji wyszukiwania online WordNet). Jednak niektóre modyfikacje mogą być potrzebne, gdy używa się WordNet jako ontologii, ponieważ według Wikipedii "… zawiera setki podstawowych niekonsekwencje semantyczne, takie jak (i) istnienie wspólnych specjalizacji dla kategorii wyłącznych oraz (ii) zwolnienia w hierarchii specjalizacji, "między innymi." W ramach powiązanego wysiłku Karin Kipper Schuler stworzyła "VerbNet" zgodnie ze stroną internetową o VerbNet jest największym dostępnym obecnie słownikiem czasowników online dla języka angielskiego. Jest to hierarchiczny niezależny od domeny, szeroko zakrojony słownik czasowników z odwzorowaniami na inne zasoby leksykalne, takie jak WordNet, Xtag i FrameNet. "

Cyc

W 1984 r., Zdając sobie sprawę, że do wielu zastosowań sztucznej inteligencji potrzebna będzie duża wiedza ze zdrowego rozsądku, szczególnie do rozumienia języka naturalnego, profesor Stanford Douglas Lenat, który wcześniej pracował nad automatyzacją odkrywania pojęć matematycznych i heurystyk postanowił podjąć się ogromnego zadania polegającego na dostarczeniu komputerom zdrowej wiedzy. Pierwszym krokiem, pomyślał, byłoby "zalanie pompy milionami codziennych terminów, pojęć, faktów i praktycznych zasad", które zawierają zdrowy rozsądek. Jak to później opisał, projekt rozpoczął się w ten sposób: "jesienią 1984 r. Admirał Bobby Ray Inman przekonał mnie, że jeśli poważnie podchodzę do tego pierwszego kroku, muszę opuścić środowisko akademickie i przybyć do jego nowo utworzonego MCC (Microelectronics i Computer Consortium) w Austin w Teksasie i zebrać zespół, aby to zrobić. Pomysł polegał na tym, że w ciągu następnej dekady dziesiątki osób stworzy program, Cyc, ze zdrowym rozsądkiem. "Zalewamy pompę wiedzy" ręcznie i karmimy łyżeczką Cyc kilkoma milionami ważnych faktów i praktycznych zasad."

Nazwa "Cyc" (wymawiane jak "psych") pochodzi od trzech liter w środku słowa "encyklopedia". Pomysł polegał na tym, że jeśli Cyc miałby wystarczającą wiedzę, aby zrozumieć artykuły w encyklopedii, byłby w stanie czytać wszystkie rodzaje materiałów i samodzielnie zdobywać dodatkową wiedzę - "drugi krok" w kierunku inteligentnych komputerów. ("Trzecim krokiem" byłoby wymyślenie i przeprowadzenie eksperymentów w celu zdobycia większej wiedzy, to znaczy wiedzy wykraczającej poza to, co ludzie już wiedzą.) Aby zrozumieć artykuły z encyklopedii, ludzie muszą już sporo wiedzieć o świecie. Jak to ujął Lenat :

"Jeśli weźmiemy jakieś zdanie z encyklopedii i pomyślimy o tym, co autor zakłada, że czytelnik już wie o świecie, będziemy mieli coś, co warto powiedzieć Cycowi. Alternatywnie, możemy zrobić akapit i spojrzeć na "przeskoki" z jednego zdania do następnego i zastanówcie się, co autor zakłada, że czytelnik będzie wnioskować "między" zdaniami. [Rozważmy na przykład zdania] "Napoleon zmarł na Świętą Helenę. Wellington był bardzo zasmucony. "Autor oczekuje, że czytelnik wywnioskuje, że Wellington dowiedział się o śmierci Napoleona, że Wellington przeżył Napoleona itd."

Jak wiele wiedzy musiałby Cykl, aby zrozumieć artykuły w encyklopedii? Lenat powiedział niedawno, że początkowo sądził, że Cyc będzie potrzebował "kilku milionów ogólnych stwierdzeń, takich jak" ssaki mają włosy "(plus znacznie większa liczba konkretnych faktów, takich jak to, jaka jest stolica Kalifornii)." Teraz wierzy, że "liczba jest więcej niż 200 milionów. "Lenat i jego zespół programistów i" entuzjastów wiedzy "pracowali nad Cycem, ręcznie wprowadzając wiedzę przez około dziesięć lat w MCC. Napisano kilka raportów, szereg artykułów i książkę opisującą projekt i jego cele. W 1994 r., Częściowo z powodu trudności w MCC, Lenat założył Cycorp w Austin w Teksasie, "aby badać, rozwijać i komercjalizować sztuczną inteligencję". Prace nad Cycem trwają tam pod rządami Lenata i jego personelu. Język używany przez Cyc do reprezentowania wiedzy nazywa się CycL, rozszerzenie rachunku predykatów pierwszego rzędu. Klasy obiektów, o których wie Cyc, są ułożone w hierarchii taksonomicznej, która pozwala klasom obiektów odziedziczyć właściwości klas obiektów wyższych w hierarchii. Na przykład w hierarchii Cyc "klasa zdarzeń", taka jak "włączenie włącznika światła", jest podklasą "rzeczy doczesnej", która jest podklasą "osoby", która jest podklasą najbardziej ogólnej klasa w Cyc, a mianowicie "rzecz". Cyc używa "reguł" (określonych w języku logicznym) aby opisywać relacje między obiektami. Na przykład angielska wersja jednej z jej zasad brzmi: "Dla wszystkich zdarzeń A i B, A powoduje, że B oznacza, że A poprzedza B." Baza wiedzy Cyc (KB) podzielona jest na tysiące "mikro-teorii" - zbiory pojęć i faktów na temat określonego obszaru. Na przykład jedna mikro-teoria zawiera wiedzę o geografii europejskiej. Inni poświęcają się wiedzy eksperckiej na temat \ chemii, biologii, organizacji wojskowych, choroby i systemy uzbrojenia. "Każda mikro-teoria jest spójna, chociaż cała baza wiedzy Cyc, traktowana jako całość, może mieć sprzeczności. KB Cyc zawiera ponad miliony ogólnych twierdzeń. Większość z nich przechwytuje zdroworozsądkową wiedzę na temat" przedmioty i wydarzenia codziennego życia, takie jak kupno i sprzedaż, relacje pokrewieństwa, sprzęt AGD, jedzenie, budynki biurowe, pojazdy, czas i przestrzeń. "Ponadto KB zawiera wiedzę gramatyczną i leksykalną potrzebną do przetwarzania języka naturalnego. Cyc używa "silnika wnioskowania", aby wyciągać nowe fakty z innych istniejących faktów i reguł w swoim KB. Stosowane są dwie główne metody wnioskowania, zasada wnioskowania zwana rezolucją. Aby skutecznie argumentować przy pomocy rozwiązania, Cyc opracował zastrzeżoną heurystykę i ogranicza zakres swoich procesów wyszukiwania za pomocą mikro-teorii. Inną metodą wnioskowania jest dziedziczenie właściwości, co jest powszechnie stosowane w reprezentacjach sieci semantycznej. "Cykl obejmuje również ponad 1000 modułów wnioskowania specjalnego do obsługi określonych klas wnioskowania. Jeden taki moduł obsługuje rozumowanie dotyczące przynależności do zbioru / rozłączności. Inne obsługują rozumowanie równości, rozumowanie czasowe i rozumowanie matematyczne. CycL używa pewnej formy omijania. … i może w stosownych przypadkach skorzystać z założenia zamkniętego świata. " Cycorp pracuje nad kilkoma aplikacjami, w tym inteligentnym wyszukiwaniem i wyszukiwaniem informacji z sieci WWW oraz zrozumieniem języka naturalnego. Jego strona internetowa twierdzi, że "jest teraz działającą technologią z aplikacjami do wielu rzeczywistych problemów biznesowych". Istnieje jednak kilka uwag krytycznych dotyczących Cyc. Wpadają w kłopoty z niektórymi problemami z rozumowaniem, które są łatwe dla ludzi. Ogromna baza wiedzy stanowi jego część rozumowania jest niepraktycznie wolne (i niewątpliwie będzie jeszcze wolniejsze w miarę dodawania większej wiedzy). Nie ma satysfakcjonujących rozwiązań dla niektórych problemów związanych z reprezentacją, które badacze AI wciąż starają się rozwiązać - takich jak reprezentacja substancji. Ponadto, ponieważ większość pracy nad Cyc odbywa się w warunkach prywatnych, nie jest ogólnie dostępna do oceny rówieśniczej. Chociaż Cyc ma pretensje do posiadania wystarczającej wiedzy, aby zrozumieć naturalny język, nie może jeszcze automatycznie (to znaczy bez interakcji użytkownika) odpowiednio przetłumaczyć typowe angielskie pytania na CycL. Aby wysłać zapytanie do Cyc, należy albo użyć niewygodnego języka CycL, albo pracować w interaktywny sposób. Lenat opisał mi praktyczny przykład takiej interakcji zastosowanej w Cleveland Clinic, gdzie badacze medyczni używają Cyc do uzyskiwania informacji z baz danych pacjentów. Badacz wpisuje zapytanie w języku angielskim. "Cyc analizuje, co może, rozpoznając niektóre części zapytania i przedstawia użytkownikowi zestaw częściowych" fragmentów "zapytania, które są jak szablony puste." Cyc następnie wykorzystuje swoją specjalistyczną wiedzę na temat medycyny oraz zdrową rozsądek, aby dowiedzieć się, jak sparafrazować zapytanie do sprawdzenia przez użytkownika. Po uzyskaniu zgody użytkownika na to, o co pytał użytkownik, wykorzystuje swoją wiedzę na temat organizacji bazy danych do generowania zapytań do bazy danych w celu uzyskania pożądanych informacji. Istnieją dwie wersje Cyc dostępne do pobrania. Jeden nazywa się ResearchCyc i jest dostępny dla społeczności badawczej (wyłącznie do celów badawczych) na podstawie licencji ResearchCyc. Poza silnikiem wnioskowania Cyc zawiera prawie 3 000 000 twierdzeń (faktów i zasad), używając ponad 26 000 relacji, które są powiązane, ograniczają , a w efekcie (częściowo) zdefiniować pojęcia. "Kolejna, zwana OpenCyc, jest publicznie dostępną wersją technologii Cyc. Zawiera "setki tysięcy terminów, długie z milionami twierdzeń odnoszących się do terminów wzajemnie. . . ." Można również zbadać hierarchię pojęć w OpenCyc za pomocą przeglądarki internetowej. Nikt nie wie dokładnie, jak ludzie organizują i stosują zdrowy rozsądek (i ekspercka) wiedza. To, czy fakty i relacje, które zostały już zgromadzone (a które dopiero zostaną zebrane) w ramach projektu Cyc, będą wystarczające pod względem ilości i organizacji, aby umożliwić rozumowanie na poziomie ludzkim, muszą jeszcze zostać wykazane. Jednak pochwalam wysiłek i życzę powodzenia temu projektowi. Z pewnością uważam, że wymagane będzie coś co najmniej tak ambitnego, jak Cyc. (Inną próbą zebrania zdrowego rozsądku jest wiedza z "Commonsense Computing Initiative" w MIT Media Lab. Możliwe, że Cyc może dojść do punktu, w którym (przy pewnej pomocy człowieka) będzie w stanie zebrać więcej wymaganej wiedzy bezpośrednio z Internetu. Lenat wspomina o grze "FACTory", której celem jest pomoc w gromadzeniu wiedzy od ludzi, którzy w nią grają. W grze Cyc generuje wypowiedzi w języku naturalnym, które zgromadził na podstawie angielskich zdań znalezionych w Internecie. Przedstawia te stwierdzenia dziesięciu losowo wybranym graczom w grze. Jeśli wystarczająco dużo z nich odpowie, że stwierdzenie jest prawdziwe, "Cyc dodaje ten fakt do swojego KB (a gracze zdobywają punkty w grze). Próbowałem gry, a Cyc zapytał mnie, czy "Cała marinara spaghetti zawiera trochę czosnku . " Odpowiedziałem "prawda", a Cyc powiedział, że zgadzam się z 66% pozostałych graczy i że teraz (dlatego) uważa, że zdanie jest "prawdziwe".