Uzasadnienie i reprezentacja

Rozumowanie niemonotoniczne lub niemo�liwe do uzasadnienia

Ci badacze AI zwani logikami, kt�rzy preferuj� u�ywanie j�zyk�w logicznych do reprezentowania wiedzy i stosowanie metod logicznych do rozumowania, uznaj� jeden problem ze zwyk�� logik�; mianowicie jest monotoniczny. Oznacza to, �e zestaw logicznych wniosk�w, kt�re mo�na wyci�gn�� z zestawu instrukcji logicznych, nie zmniejsza si�, gdy do zestawu dodaje si� wi�cej instrukcji. Gdyby mo�na by�o udowodni� stwierdzenie z danej bazy wiedzy, mo�na by udowodni� to samo stwierdzenie (z tym samym dowodem!), Gdy dodana jest wi�ksza wiedza. Jednak wydaje si�, �e wiele ludzkich rozumowa� nie dzia�a w ten spos�b - fakt dobrze zauwa�ony (i doceniony) przez krytyk�w AI. Cz�sto dochodzimy do wniosku na podstawie fakt�w, kt�re mamy, wraz z rozs�dnymi za�o�eniami, a nast�pnie musimy wycofa� ten wniosek, gdy dowiadujemy si� o nowym fakcie, kt�ry jest sprzeczny z za�o�eniami. Ten spos�b rozumowania nazywany jest niemonotonicznym lub niemo�liwym do zaakceptowania (co oznacza, �e "mo�na go uczyni� lub uzna� za niewa�ny"), poniewa� nowe fakty mog� wymaga� wycofania czego�, co zosta�o wcze�niej zawarte. Mo�na nawet znale�� przyk�ady niemonotonicznego rozumowania w opowie�ciach dla dzieci. W "To dobrze! To �le!", autorstwa Margery Cuyler, ma�y ch�opie wzbija si� wysoko w niebo, trzymaj�c balon, kt�ry rodzice kupili mu w zoo. "Wow! Och, to dobrze" - opowiada historia. Balon p�ka na ga��zi wysokiego, k�uj�cego drzewa. "Pop! Och, to �le" - kontynuuje historia. Ch�opiec wpada do b�otnistej rzeki, wspina si� na hipopotama i jedzie na brzeg. "Oh to dobrze." Historia toczy si� w ten spos�b - zmieniaj�c w k�ko, czy jazda balonem okazuje si� "dobra" czy "z�a". W sztucznej inteligencji (i innych dziedzinach informatyki) istnia�y ju� pewne metody uzasadnienia. Na przyk�ad w j�zyku rozwi�zywania problem�w PLANNER zaproponowanym przez Carla Hewitta, je�li cel, powiedzmy G, nie m�g�by zosta� osi�gni�ty przez program, w�wczas nie mo�na by�o twierdzi�, �e Not G (przy za�o�eniu, �e G by�o stwierdzeniem, �e program pr�bowa� ustali�). Takie rozumowanie jest niemo�liwe do unikni�cia, poniewa� je�li p�niej do programu zostan� dodane dodatkowe instrukcje lub do jej bazy wiedzy, w�wczas ustalenie G mo�e sta� si� mo�liwe. Podobnie w j�zyku programowania PROLOG, je�li program nie m�g� udowodni� instrukcji, to uznano j� za fa�szyw�. Wnioskowanie, �e co� jest fa�szywe, je�li nie mo�na tego udowodni�, nazywa si� "negacj� jako pora�k�". System planowania SRI, STRIPS, by� tak�e rodzajem niemonotonicznego systemu wnioskowania. Za�o�enia dotycz�ce rzeczy "pozostaj�cych niezmienionych" po wykonaniu dzia�a� by�y z pewno�ci� w�a�nie tym - za�o�eniami. Wnioski wyci�gni�te po dokonaniu takich za�o�e� mog� zosta� odrzucone po dodaniu nowych informacji, kt�rych implikacje mog� negowa� te za�o�enia. W �wiecie baz danych zastosowano inn� metod� niemo�liwego do uzasadnienia. Bazy danych s� u�ywane do kodowania szerokiej gamy informacji. Na przyk�ad firma mo�e mie� baz� danych o swoich pracownikach. Mo�na zapyta� o tak� baz� danych, aby znale�� wynagrodzenie pracownika, dzia�, w kt�rym on lub ona pracuje i tak dalej. Za��my, �e pr�bujemy znale�� w jednej z tych baz danych pracownik�w informacje o osobie, powiedzmy Jack Smith, kt�rej nazwiska nie ma w bazie danych. Mo�emy zatem rozs�dnie doj�� do wniosku, �e Pan Smith nie jest pracownikiem tej firmy i tak zrobiliby niekt�re systemy baz danych. Wniosek ten by�by oparty na za�o�eniu, �e baza danych wymienia wszystkich pracownik�w tej firmy {przyk�ad tzw. Za�o�enia �wiata zamkni�tego (CWA). Oczywi�cie Jack Smith mo�e p�niej do��czy� do firmy, a nast�pnie jego nazwisko zostanie dodane do bazy danych. W tym czasie musieliby�my cofn�� wniosek, �e Jack Smith nie jest jednym z pracownik�w firmy; to kolejny przyk�ad niemo�liwego do uzasadnienia rozumowania. Mo�ecie sobie przypomnie�, �e ju� w 1964 r. System SIR Bertrama Raphaela zawiera� styl niemo�liwego do uzasadnienia, kt�ry nazwa� "zasad� wyj�tku". W SIR: og�lna informacja o wszystkich elementach zestawu zastosowanych do poszczeg�lnych element�w {ale tylko przy braku bardziej szczeg�owych informacji o tych konkretnych elementach. Kilka schemat�w reprezentacji wiedzy AI przedstawia cz�� swojej wiedzy w "hierarchiach taksonomicznych", podobnie jak ten, kt�rego u�y� Raphael, i u�ywa zasady wyj�tku, kt�ra obecnie jest cz�sto nazywana "anulowaniem dziedziczenia" z niemo�liwego do uzasadnienia. Na rysunku pokazano hierarchi� taksonomiczn� niekt�rych maszyn biurowych.

Program wykorzystuj�cy t� hierarchi� stwierdzi�by, �e �r�d�em energii drukarki laserowej jest na przyk�ad gniazdko �cienne, poniewa� ta w�a�ciwo�� jest dziedziczona z og�lnej klasy "maszyn biurowych". Jednak bardziej szczeg�owe informacje o �r�dle energii dla robot�w zmusi�yby do wniosku, �e �r�d�em energii na przyk�ad dla R2D2 jest bateria, przes�aniaj�ca dziedziczenie w�a�ciwo�ci og�lnej klasy maszyn biurowych. W latach 80. niekt�rzy z najbardziej kreatywnych badaczy AI stali si� zafascynowani problemem niemo�liwego do uzasadnienia rozumowania i przedstawi� kilka nowych propozycji, jak to zrobi�. Ich propozycjom towarzyszy�a wiele analiz teoretycznych por�wnuj�cych i kontrastuj�cych ze sob� r�ne podej�cia oraz tego, jak niekt�re z nich mo�na uzna� za specjalizacje lub uog�lnienia innych. Kanadyjski badacz AI Raymond Reiter zaproponowa� jedn� z nowych metod. W najprostszej formie wykorzystuje specjalne regu�y wnioskowania, kt�re pozwalaj� wyci�ga� wnioski z bazy wiedzy, je�li spe�niony jest okre�lony warunek i je�eli wnioskowi temu nie przeczy to, co zwykle mo�na wywnioskowa� z tej bazy wiedzy. Specjalne regu�y wnioskowania Reitera nazywane s� regu�ami domy�lnymi, a jego system, kt�ry ich u�ywa, nazywa si� logik� domy�ln�. Jako przyk�ad jego zastosowania za��my, �e mamy baz� wiedzy u�ywan� przez robota, kt�ra okre�la, do kt�rych pomieszcze� w budynku biurowym mo�e wej�� robot. Mo�emy mie� regu��, kt�ra m�wi, �e w przypadku pomieszcze� na drugim pi�trze, je�li nie mo�na udowodni�, �e robot nie mo�e wej�� do pokoju, mo�na doj�� do wniosku, �e robot mo�e wej�� do tego pokoju. Ponownie, rozumowanie jest nie do przyj�cia, poniewa� kto� mo�e p�niej doda� do bazy wiedzy fakt, kt�ry pozwala wnioskowa�, �e do pokoju na drugim pi�trze nie mo�na wej��. John McCarthy, pomys�odawca wniosku, �e wiedza powinna by� zakodowana jako logiczne stwierdzenia, by� r�wnie� zaniepokojony problemem niemonotoniczno�ci. Aby poradzi� sobie z tym problemem, zaproponowa� metod� o nazwie opis. Opis jest raczej trudny do wyja�nienia bez u�ycia logicznego �argonu. Zasadniczo jego wersja zwana "orzeczeniem obwodowym" (tylko jedna z kilku wersji opisu) obejmuje ograniczenie (a wi�c "opisanie") zbioru byt�w, kt�re sprawiaj�, �e predykaty s� prawdziwe tylko do tych, kt�re mo�na udowodni�, �e s� prawdziwe. Na przyk�ad, je�li mamy baz� wiedzy, kt�ra zawiera takie stwierdzenia jak Tall (John) i Tall (Frank), a tak�e wiele innych fakt�w, mo�emy ograniczy� (je�li chcemy) predykat Tall. Takie post�powanie pozwala nam stwierdzi�: Wysoki (Susy), je�li Wysoki (Susy) nie jest logicznie implikowany przez baz� wiedzy. Jedn� z motywacji zainteresowania McCarthy'ego niemonotonicznym rozumowaniem by�a mo�liwo��, �e b�dzie to klucz do rozwi�zania problemu ramowego. Przypomnij sobie, �e problem z ramk� dotyczy trudno�ci w przedstawieniu, kt�re rzeczy si� zmieniaj�, a kt�re nie zmieniaj� si� po podj�ciu dzia�ania (np. Przez robota). Jednym z podej�� jest przyj�cie takiego za�o�enia je�li orzeczenie opisuj�ce jaki� stan �wiata nie jest wspomniane w opisie dzia�ania (w tym warunk�w wst�pnych i efekt�w dzia�ania), w�wczas orzeczenie to nie jest zmieniane przez dzia�anie. To za�o�enie jest niemonotoniczne, poniewa� p�niejsze (lub bardziej szczeg�owe) informacje mog� sugerowa�, �e nie wymieniony predykat rzeczywi�cie zosta� zmieniony. Niekt�re wczesne pr�by rozwi�zania problemu z ram� za pomoc� niemonotonicznego wnioskowania napotka�y r�ne trudno�ci techniczne (kt�re s� zbyt techniczne, aby si� tym zajmowa�), ale prace by�y kontynuowane. Niedawny artyku� twierdzi�, �e "Problem z ram� w pierwotnym brzmieniu zosta� rozwi�zany za pomoc� podej�� Shanahana i Thielschera oraz �e przynajmniej logiczny rozdzia� Problemu z ram� zosta� zamkni�ty" .(Dwie wspomniane osoby to Murray Shanahan z Imperial College, Londyn i Michael Thielscher z Uniwersytetu Technicznego w Dre�nie.) By� mo�e nie zauwa�y�e�, �e wiele propozycji niemonotonicznego rozumowania jest raczej podobnych, ale istnieje wiele subtelnych r�nic technicznych. S� nawet inne propozycje, o kt�rych nie wspomnia�em, w tym logiki autoepistemiczne, logiki niemonotoniczne, rozumowanie uprowadzaj�ce, systemy utrzymywania prawdy oraz metody oparte na teorii prawdopodobie�stwa. T� obfito�� niemo�liwych do uzasadnienia metod wnioskowania mo�na prawdopodobnie przypisa� kreatywno�ci i matematycznemu wyrafinowaniu wielu zaanga�owanych badaczy AI i ich bystro�ci umiej�tno�ci dostrzegania i pr�bowania wymykania si� ograniczeniom wzajemnych propozycji.

Uzasadnienie jako�ciowe

Wielu z was prawdopodobnie uczestniczy�o w kursach fizyki, w liceum, na studiach lub w obu. Zadaniem fizyki jest budowanie teorii �wiata fizycznego, a teorie te s� zwykle formu�owane przy u�yciu matematyki. Na przyk�ad wz�r F = Ma wi��e si�� F dzia�aj�c� na obiekt z mas� obiektu M i jego przyspieszeniem a. Wiele wzor�w matematycznych opisuj�cych procesy fizyczne jest bardziej z�o�onych. Na przyk�ad do obliczenia pr�dko�ci fali wodnej mo�na u�y� nast�puj�cego "r�wnania falowego":

In�ynierowie mog� na przyk�ad u�y� go do przewidzenia, kiedy szczyt fali przejdzie przez okre�lony punkt. My, ludzie, jeste�my w stanie przewidzie�, z przydatnymi dok�adno�ciami, przysz�y przebieg wielu proces�w fizycznych, kt�rych zwykle do�wiadczamy. Na przyk�ad, gdy ludzie bawi� si� w fale oceanu na pla�y, zwykle s� w stanie przewidzie�, kiedy nadejdzie szczyt fali, aby mogli skoczy� w czasie. Czy nasze m�zgi u�ywaj� czego� takiego jak pokazane r�wnanie, aby dokona� takiej prognozy? Prawdopodobnie nie. Zamiast tego, na podstawie powtarzalnych do�wiadcze� ucz� si� rutynowe przewidywanie prowadzenia odpowiednich dzia�a�. S� one cz�ci� tego, co psychologowie nazywaj� "wiedz� proceduraln�". Opr�cz dzia�ania w spos�b automatyczny i efektywny, wykorzystuj�c wiedz� proceduraln� zawart� w naszych r�nych umiej�tno�ciach motorycznych, mo�emy r�wnie� sk�ada� deklaratywne stwierdzenia przewiduj�ce, co stanie si� w pewnych sytuacjach. Na przyk�ad surfer spogl�daj�cy na nadchodz�ce fale mo�e powiedzie� przyjacielowi: "We� nast�pn� fal�; to b�dzie du�a". Najwyra�niej mamy jak�� atwo�� do reprezentowania i wykorzystywania "jako�ciowej wiedzy" na temat proces�w fizycznych - wiedzy, kt�ra nie jest ani cz�ci� naszej procedury \ pami�ci mi�niowej, ani te� nie jest reprezentowana w naszych m�zgach za pomoc� skomplikowanych wzor�w matematycznych. M�g�bym poda� kilka przyk�ad�w. Sk�d to wiemy kiedy przewr�cimy szklank� wody na st�, woda ostatecznie dojdzie do kraw�dzi sto�u i rozleje si� OFF? Sk�d wiemy, �e je�li u�o�ymy ci�kie pud�a na lekkich, delikatnych pud�ach, delikatne pud�a mog� si� zapa��? Sk�d wiemy, �e je�li dotrzemy do celu nieco szybciej, dotrzemy tam nieco wcze�niej? Kilku badaczy AI pracowa�o nad systemami posiadaj�cymi zdolno�� reprezentowania i rozumowania za pomoc� wiedzy jako�ciowej. Scott Fahlman napisa� taki program do swojej pracy magisterskiej, gdy by� studentem MIT. Program o nazwie BUILD by� w stanie zaplanowa� uk�adanie klock�w zabawek, bior�c pod uwag� r�ne si�y dzia�aj�ce na bloki, takie jak grawitacja i tarcie. zrobi� to w spos�b bardziej lub mniej jako�ciowy ni� przy u�yciu dok�adnych modeli matematycznych. Tak wi�c BUILD mo�na uzna� za jedn� z pierwszych pr�b sztucznej inteligencji w zakresie wnioskowania jako�ciowego na temat fizyki. Nied�ugo potem inny student MIT, Johan de Kleer , napisa� program o nazwie NEWTON w swojej pracy magisterskiej, kt�ry zawiera� komponent zdolny do rozumowania jako�ciowego. NEWTON, jak twierdzi de Kleer, "rozumie i rozwi�zuje problemy w mechanicznym mini-�wiecie obiekt�w poruszaj�cych si� po powierzchniach". NEWTON wykorzysta� swoj� jako�ciow� wiedz� na temat fizyki do opracowania przybli�onych rozwi�za� problem�w, kt�re nast�pnie wykorzysta� do planowania i przeprowadzania kolejnych oblicze� ilo�ciowych. Wi�kszo�� nauczycieli fizyki powie ci, �e jako�ciowe rozumowanie na temat "fizyki" problemu jest niezb�dne przed zanurzeniem si� w matematyce. Robi�c rozumowanie jako�ciowe, NEWTON wykorzysta� proces o nazwie "przewidywanie" do "generowania post�pu scen zakodowanych w symbolicznym opisie opisuj�cym to, co mo�e si� zdarzy�". Wykorzystano opisy sze�ciu podstawowych dzia�a� odpowiednich do rodzaj�w problem�w, kt�re NEWTON m�g� rozwi�za�. Jeden z tych opis�w dotyczy na przyk�ad FLY. Zakodowa� on wiedz�, �e "je�li obiekt porusza si� po powierzchni wkl�s�ej od ruchu, obiekt mo�e si� od niego oderwa�". G��wnym wk�adem de Kleera by�o pokazanie, w jaki spos�b obliczenia jako�ciowe i rozumowanie ilo�ciowe mo�na po��czy� w programie komputerowym. W 1979 r. Pat Hayes opublikowa� "Manifest naiwnej fizyki". "Zmieniona wersja pojawi�a si� w 1985 r. Zaproponowa�, aby spo�eczno�� badaj�ca sztuczn� inteligencj� rozpocz�a" budow� formalizacji sporej cz�ci zdrowego rozs�dku wiedzy o codziennym �wiecie fizycznym: o przedmiotach, kszta�cie, przestrzeni, ruchu, substancjach (cia�ach sta�ych i cieczach), czasie itp. "Tematy te od dawna stanowi�y szczeg�lnie trudne wyzwania dotycz�ce reprezentacji i rozumowania dla sztucznej inteligencji. Kodowanie naszej codziennej wiedzy na te tematy, aby komputery mog�y je zrozumie�, jest w sercu fizyki jako�ciowej, kt�r� Hayes nazwa� "fizyk� naiwn�". Jego manifesty przedstawia�y kilka og�lnych pomys��w na temat tego, jak reprezentowa� "skupiska" zdrowego rozs�dku na temat �wiata fizycznego. Jako przyk�ad zaproponowa� poj�cie "historii" do reprezentowania wydarze�, zamiast stan�w i funkcji pa�stw, jak wcze�niej opowiada� si� on i John McCarthy. Okre�li� histori� jako "czasoprzestrze� z naturalnymi granicami, zar�wno czasowymi, jak i przestrzennymi". "Na przyk�ad" zdarzenie polegaj�ce na z�o�eniu czterech blok�w w kwadrat jest pocz�tkiem historii platformy i jej ko�cem. historia jest wtedy, gdy i gdzie s� one oddzielone od siebie. "Hayes powiedzia� w efekcie, �e nie powinni�my by�" zbyt pochopni "w pisaniu naiwnych program�w fizyki {wol�c zamiast tego op�nia� wdra�anie, dop�ki nie zostan� wykonane bardziej fundamentalne prace nad samymi reprezentacjami Naszkicowa� ju� cz�� tej pracy na cieczach. Te wst�pne eksploracje w rozumowaniu jako�ciowym wkr�tce doprowadzi�y do szybko rozwijaj�cego si� obszaru sztucznej inteligencji o wielu zastosowaniach, zw�aszcza w diagnozowaniu usterek na podstawie jako�ciowych modeli sprz�tu. Wybitne grupy zosta�y utworzone przez profesora Kennetha D. Forbusa z Northwestern University i Benjamina Kuipersa z University of Teksas w Austin. (Kuipers przeprowadzi� si� teraz na University of Michigan). Pojawi�y si� specjalne wydania czasopism oraz zredagowanych tom�w i ksi��ek po�wi�conych temu tematowi. Zako�cz� ten rozdzia� dotycz�cy rozumowania i reprezentacji, przechodz�c obok nowych osi�gni�� w zakresie wykorzystania sieci semantycznych do reprezentacji wiedzy.

Sieci semantyczne

We wcze�niejszej dyskusji na temat niemo�liwego do zrozumienia rozumowania pokazano sie� semantyczn� reprezentuj�c� taksonomiczn� hierarchi� maszyn biurowych. sieci taksonomiczne s� szeroko stosowane w sztucznej inteligencji i informatyce do reprezentowania tak zwanych "ontologii". W sztucznej inteligencji ontologia sk�ada si� z zestawu poj�� i relacji mi�dzy tymi poj�ciami. (W filozofii oznacza to badanie bytu lub istnienia). Systemy AI do wnioskowania za pomoc� tych sieci zwykle mia�yby mechanizmy dziedziczenia w�asno�ci przy u�yciu zasad wyj�tk�w. Chocia� najlepiej rozumiemy sieci taksonomiczne, my�l�c o nich w formie drzew, to w tym przypadku stosuje si� zbi�r specjalnych struktur danych kodowanie ich dla komputer�w. Struktury te s� cz�sto nazywane "ramkami" po oryginalnym u�yciu tego s�owa przez Minsky′ego. Na przyk�ad jedn� z ram dla sieci maszyn biurowych mo�na przedstawi� jak na rysunku

Zazwyczaj istnieje ramka dla ka�dej klasy os�b lub podmiot�w w taksonomii, a tak�e dla ka�dej z tych jednostek. Ramki dla klas nazwaliby nadklas�, do kt�rej nale�a�a, i nale��ce do niej podklasy. Okre�li�by tak�e w�a�ciwo�ci podmiot�w nale��cych do klasy. Cz�sto zdarza si�, �e ramka ma "meta-informacje", takie jak data utworzenia ramki.

Opis Logika

Wcze�niej w historii AI istnia�y kontrowersje dotycz�ce tego, czy wiedza powinna by� reprezentowana przez struktury danych, takie jak sieci semantyczne (zakodowane, powiedzmy, jako ramki), czy przez zestawy instrukcji logicznych. Stopniowo kontrowersje �agodzi�y si�, poniewa� naukowcy zacz�li akceptowa� ide�, �e sieci semantyczne mo�na traktowa� jako specjalny spos�b reprezentowania pewnych rodzaj�w logicznych stwierdze�, umo�liwiaj�c w ten spos�b dokonywanie pewnych dedukcji bezpo�rednio z sieci. Dw�ch badaczy, kt�rzy pomogli ustali� ten pogl�d, to Ronald J. Brachman i Hector J. Levesque. (Ka�dy z nich wykona� r�wnie� powi�zane prace podstawowe w zakresie reprezentacji wiedzy i og�lnego rozumowania.

Brachman zrobi� doktorat w Harvardzie pod kierunkiem Billa Woodsa. (Opr�cz pracy w przetwarzaniu j�zyka naturalnego, Woods pisa� tak�e o zwi�zku mi�dzy sieciami semantycznymi a logik�.) Rozwijaj�c pomys�y w swojej pracy, Brachman wraz z innymi kolegami z BBN (w tym Woods) i USC-ISI, opracowa� oparty na ramkach system reprezentacji wiedzy o nazwie KL-ONE, kt�ry sta� si� podstaw� tak zwanej logiki opisu. Levesque wykona� ca�� prac� w collegeu (B.S., M.S. i doktorat) na University of Toronto. Po otrzymaniu stopnia doktora dyplom w 1981 r. do��czy� do Brachmana w Fairchild Laboratory for Artiial Intelligence Research w Palo Alto, grupie za�o�onej przez Petera Harta po odej�ciu Hart z SRI. Tam Brachman i Levesque wraz z Richardem Fikessem (w�wczas w Xerox PARC) opracowali system reprezentacji i rozumowania KRYPTON. KRYPTON by� systemem hybrydowym - co oznacza, �e reprezentowa� wiedz� zar�wno za pomoc� formu� logicznych, jak i sieci semantycznej. Chocia� sieci semantyczne u�atwiaj� rozumowanie os�b i ich w�a�ciwo�ci w hierarchii, trudno im reprezentowa� stwierdzenia zawieraj�ce negacje i rozbie�no�ci. Jak stwierdza papier KRYPTON, "… o�wiadczenie takie jak "Elsie lub Bessie jest krow� stoj�c� w polu Farmera Jonesa" nie mo�e by� sformu�owane w typowym systemie asercyjnym" .Rozwi�zaniem KRYPTON jest u�ycie kombinacji obu rodzaj�w reprezentacji:� podzielili�my [ rozumowanie] na dwa osobne rodzaje, uzyskuj�c dwa g��wne komponenty dla naszego systemu reprezentacji: terminologiczny [to znaczy oparty na sieci] lub T Box oraz asercjonalny [to znaczy oparty na logice] lub A Box. T Box pozwala nam ustala� taksonomie ustrukturyzowanych termin�w i odpowiada� na pytania dotycz�ce analitycznych relacji mi�dzy tymi terminami; A Box pozwala nam budowa� opisowe teorie domen zainteresowa� i odpowiada� na pytania dotycz�ce tych domen. Schemat z papieru KRYPTON przedstawiony na ryc. 26.4 ilustruje budow� uk�adu.

Jak napisali autorzy, sk�ada si� on z "T-Boxa ustrukturyzowanych termin�w zorganizowanych taksonomicznie, A-Box z (z grubsza) zda� pierwszego rz�du, kt�rych predykaty pochodz� z T-Box, oraz tablicy symboli z nazwami termin�w T-Box aby u�ytkownik m�g� si� do nich odwo�a� ". Pole T na schemacie reprezentuje (mi�dzy innymi), �e dziecko jest osob�. A Box stwierdza, �e istnieje lekarz, kt�ry ma dziecko. KRYPTON by� prekursorem kilku system�w opisowych, w tym CLASSIC, opracowanych przez Brachmana i wsp�pracownik�w po przej�ciu do AT&T Bell Laboratories. Opr�cz ich zastosowania w systemach wnioskowania AI, logiki opisu s� u�ywane w j�zykach ontologii dla sieci semantycznej, na przyk�ad DAML-ONT23 i OWL.

WordNet

WordNet to du�y "konceptualny" s�ownik angielskich s��w, zorganizowany nieco jak sie� semantyczna i zainspirowany psycholingwistycznymi i obliczeniowymi teoriami ludzkiej pami�ci leksykalnej. Jego rozw�j rozpocz�� si� na Uniwersytecie Princeton w latach 80. pod kierunkiem profesora George′a A. Millera (tego samego George′a Millera, o kt�rym wspomina�em wcze�niej i kt�ry napisa� "The Magical Number Seven, Plus or Minus Two "). W artykule z 1990 roku Miller i jego koledzy powiedzieli o pocz�tkach projektu:

"W 1985 r. Grupa psycholog�w i lingwist�w z Princeton University zobowi�za�a si� do opracowania leksykalnej bazy danych zgodnie z sugestiami z wcze�niejszych bada� [psycholingwistycznych]. Pierwotnym pomys�em by�o zapewnienie pomocy w wyszukiwaniu s�ownik�w poj�ciowo, a nie tylko alfabetycznie {mia� by� u�ywany w po��czeniu ze s�ownikiem on-line konwencjonalnego typu. W miar� up�ywu czasu praca wymaga�a jednak bardziej ambitnego sformu�owania w�asnych zasad i cel�w. WordNet jest wynikiem. Poniewa� WordNet tworzy hipotezy oparte na wynikach bada� psycholingwistycznych, mo�na powiedzie�, �e jest s�ownikiem opartym na zasadach psycholingwistycznych." WordNet grupuje s�owa w kolekcje zwane "synsetami". Ka�dy zestaw zawiera grup� s��w synonimicznych, to znaczy s��w o mniej wi�cej tym samym znaczeniu. Korzystam z narz�dzia wyszukiwania online WordNet, aby poda� przyk�ady synchronizacji i relacji mi�dzy nimi. Na przyk�ad s�owo "komputer" wyst�puje w dw�ch r�nych zestawach. Jeden z tych synset�w zawiera, opr�cz "komputera", maszyny komputerowej "synonimy", "urz�dzenia komputerowego", "procesora danych", "komputera elektronicznego" i "systemu przetwarzania informacji". Drugi zestaw synonim�w zawiera synonimy dla starszych zastosowa� s�owo "komputer" (gdy odnosi si� do ludzi wykonuj�cych obliczenia), a mianowicie "kalkulator", "licznik", "gurer" i "estymator". Synsetowi mo�e tak�e towarzyszy� skr�t, zwany " po�ysk ", kt�ry nadaje znaczenie s�owom w synsecie. W przypadku pierwszego zestawu po�ysk to" urz�dzenie do automatycznego wykonywania oblicze�. "Po drugie, po�ysk to" ekspert w dziedzinie oblicze� (lub obs�ugi maszyn licz�cych) "Czasami po�ysk zawiera tak�e przyk�adowe zdanie ilustruj�ce typowe u�ycie. Synsety s� po��czone z innymi synsetami za pomoc� relacji podobnych do tych u�ywanych w sieci semantycznej. Jedna taka relacja nazywana jest "hipernym", odpowiadaj�cym (z grubsza) "rodzajowi". Na przyk�ad, nasz synset zawieraj�cy "komputer" i "urz�dzenie komputerowe" itp. jest synsetem zawieraj�cym s�owo "maszyna" (i ewentualnie tak�e inne s�owa) o po�ysku "dowolne urz�dzenie mechaniczne lub elektryczne, kt�re transmituje lub modyfikuje energia do wykonania lub pomocy w wykonywaniu ludzkich czynno�ci. " "Hiponim", odpowiadaj�cy (z grubsza) "jest og�lnym przypadkiem", jest przeciwie�stwem hipernymu. Wspomniany wcze�niej zestaw "komputerowy" ma kilka hiponim�w, mi�dzy innymi zawieraj�ce s�owa "komputer cyfrowy" i dowolny z jego synonim�w (komputer, kt�ry reprezentuje informacje za pomoc� cyfr numerycznych), "modu� liczbowy" i dowolny z jego synonim�w (komputer zdolny do wykonywania du�ej liczby operacji matematycznych na sekund�), "maszyn� Turinga" i dowolny z jego synonim�w (hipotetyczny komputer z prawie d�ug� ta�m� pami�ci) i inne. Istniej� r�wnie� inne relacje. W przypadku synset�w zawieraj�cych rzeczowniki istnieje relacja zwana "meronimem" odpowiadaj�ca "ma jako cz�ci". Synset zawieraj�cy "komputer" i "urz�dzenie komputerowe" itp. Ma kilka meronim�w, w�r�d nich te zawieraj�ce s�owa "chip" i jego synonimy (wszystkie z po�yskliwym "sprz�tem elektronicznym sk�adaj�cym si� z ma�ego kryszta�u p�przewodnika krzemowego wykonanego z realizuj� szereg funkcji elektronicznych w uk�adzie scalonym "), "monitorze"i jego synonimach (wszystkie z po�yskiem" wy�wietlacza wytwarzanego przez urz�dzenie, kt�re odbiera sygna�y i wy�wietla je na ekranie telewizyjnym lub monitorze komputera ") oraz kilka inni "Holonim" jest przeciwie�stwem meronimu. Ka�dy synset wspomina tak�e cz�� mowy zawartych w nim s��w: rzeczownik, czasownik, przymiotnik lub przys��wek. Relacje mi�dzy synsetami r�ni� si� nieco w zale�no�ci od cz�ci mowy. Na przyk�ad, zestawy czasownik�w maj� relacj� zwan� "poci�ganiem". Na przyk�ad jeden z synset�w czasownika "chodzi�" (porusza� si� nogami; krok po kroku) poci�ga za sob� synset zawieraj�cy czasownik "krok" (przesuni�cie lub ruch wykonuj�c krok). Wed�ug strony internetowej (w chwili pisania tego tekstu) WordNet zawiera 155 287 s��w i 117 659 synset�w. Jest utrzymywany i rozwijany w Princeton i jest dost�pny bezp�atnie do publicznego pobrania. Opr�cz wykorzystania jako s�ownika online i tezaurusa, jest on u�ywany do wspierania automatycznej analizy tekstu, w aplikacjach do przetwarzania j�zyka naturalnego, jako baza wiedzy do odpowiedzi na pytania oraz w semantycznych aplikacjach internetowych. Podobne "sieci s�owne" zosta�y utworzone w kilkudziesi�ciu innych j�zykach. Zastosowanie WordNet jako ontologii w bazie wiedzy taksonomicznej zale�y od relacji hipernym / hiponimu mi�dzy synsetami rzeczownik�w i od u�ycia przez WordNet mechanizmu dziedziczenia do wnioskowania o w�a�ciwo�ciach obiekt�w reprezentowanych przez synsety na podstawie w�a�ciwo�ci ich przodk�w. Na przyk�ad jeden �a�cuch (od konkretnego do og�lnego) w takiej hierarchii jest nast�puj�cy:

stacja robocza → komputer cyfrowy → komputer! maszyna → urz�dzenie →instrumentalno�� → artefakt→ … Oczywi�cie wzd�u� tego �a�cucha znajduj� si� ga��zie boczne (kt�re mo�na eksplorowa� za pomoc� funkcji wyszukiwania online WordNet). Jednak niekt�re modyfikacje mog� by� potrzebne, gdy u�ywa si� WordNet jako ontologii, poniewa� wed�ug Wikipedii "… zawiera setki podstawowych niekonsekwencje semantyczne, takie jak (i) istnienie wsp�lnych specjalizacji dla kategorii wy��cznych oraz (ii) zwolnienia w hierarchii specjalizacji, "mi�dzy innymi." W ramach powi�zanego wysi�ku Karin Kipper Schuler stworzy�a "VerbNet" zgodnie ze stron� internetow� o VerbNet jest najwi�kszym dost�pnym obecnie s�ownikiem czasownik�w online dla j�zyka angielskiego. Jest to hierarchiczny niezale�ny od domeny, szeroko zakrojony s�ownik czasownik�w z odwzorowaniami na inne zasoby leksykalne, takie jak WordNet, Xtag i FrameNet. "

Cyc

W 1984 r., Zdaj�c sobie spraw�, �e do wielu zastosowa� sztucznej inteligencji potrzebna b�dzie du�a wiedza ze zdrowego rozs�dku, szczeg�lnie do rozumienia j�zyka naturalnego, profesor Stanford Douglas Lenat, kt�ry wcze�niej pracowa� nad automatyzacj� odkrywania poj�� matematycznych i heurystyk postanowi� podj�� si� ogromnego zadania polegaj�cego na dostarczeniu komputerom zdrowej wiedzy. Pierwszym krokiem, pomy�la�, by�oby "zalanie pompy milionami codziennych termin�w, poj��, fakt�w i praktycznych zasad", kt�re zawieraj� zdrowy rozs�dek. Jak to p�niej opisa�, projekt rozpocz�� si� w ten spos�b: "jesieni� 1984 r. Admira� Bobby Ray Inman przekona� mnie, �e je�li powa�nie podchodz� do tego pierwszego kroku, musz� opu�ci� �rodowisko akademickie i przyby� do jego nowo utworzonego MCC (Microelectronics i Computer Consortium) w Austin w Teksasie i zebra� zesp�, aby to zrobi�. Pomys� polega� na tym, �e w ci�gu nast�pnej dekady dziesi�tki os�b stworzy program, Cyc, ze zdrowym rozs�dkiem. "Zalewamy pomp� wiedzy" r�cznie i karmimy �y�eczk� Cyc kilkoma milionami wa�nych fakt�w i praktycznych zasad."

Nazwa "Cyc" (wymawiane jak "psych") pochodzi od trzech liter w �rodku s�owa "encyklopedia". Pomys� polega� na tym, �e je�li Cyc mia�by wystarczaj�c� wiedz�, aby zrozumie� artyku�y w encyklopedii, by�by w stanie czyta� wszystkie rodzaje materia��w i samodzielnie zdobywa� dodatkow� wiedz� - "drugi krok" w kierunku inteligentnych komputer�w. ("Trzecim krokiem" by�oby wymy�lenie i przeprowadzenie eksperyment�w w celu zdobycia wi�kszej wiedzy, to znaczy wiedzy wykraczaj�cej poza to, co ludzie ju� wiedz�.) Aby zrozumie� artyku�y z encyklopedii, ludzie musz� ju� sporo wiedzie� o �wiecie. Jak to uj�� Lenat :

"Je�li we�miemy jakie� zdanie z encyklopedii i pomy�limy o tym, co autor zak�ada, �e czytelnik ju� wie o �wiecie, b�dziemy mieli co�, co warto powiedzie� Cycowi. Alternatywnie, mo�emy zrobi� akapit i spojrze� na "przeskoki" z jednego zdania do nast�pnego i zastan�wcie si�, co autor zak�ada, �e czytelnik b�dzie wnioskowa� "mi�dzy" zdaniami. [Rozwa�my na przyk�ad zdania] "Napoleon zmar� na �wi�t� Helen�. Wellington by� bardzo zasmucony. "Autor oczekuje, �e czytelnik wywnioskuje, �e Wellington dowiedzia� si� o �mierci Napoleona, �e Wellington prze�y� Napoleona itd."

Jak wiele wiedzy musia�by Cykl, aby zrozumie� artyku�y w encyklopedii? Lenat powiedzia� niedawno, �e pocz�tkowo s�dzi�, �e Cyc b�dzie potrzebowa� "kilku milion�w og�lnych stwierdze�, takich jak" ssaki maj� w�osy "(plus znacznie wi�ksza liczba konkretnych fakt�w, takich jak to, jaka jest stolica Kalifornii)." Teraz wierzy, �e "liczba jest wi�cej ni� 200 milion�w. "Lenat i jego zesp� programist�w i" entuzjast�w wiedzy "pracowali nad Cycem, r�cznie wprowadzaj�c wiedz� przez oko�o dziesi�� lat w MCC. Napisano kilka raport�w, szereg artyku��w i ksi��k� opisuj�c� projekt i jego cele. W 1994 r., Cz�ciowo z powodu trudno�ci w MCC, Lenat za�o�y� Cycorp w Austin w Teksasie, "aby bada�, rozwija� i komercjalizowa� sztuczn� inteligencj�". Prace nad Cycem trwaj� tam pod rz�dami Lenata i jego personelu. J�zyk u�ywany przez Cyc do reprezentowania wiedzy nazywa si� CycL, rozszerzenie rachunku predykat�w pierwszego rz�du. Klasy obiekt�w, o kt�rych wie Cyc, s� u�o�one w hierarchii taksonomicznej, kt�ra pozwala klasom obiekt�w odziedziczy� w�a�ciwo�ci klas obiekt�w wy�szych w hierarchii. Na przyk�ad w hierarchii Cyc "klasa zdarze�", taka jak "w��czenie w��cznika �wiat�a", jest podklas� "rzeczy doczesnej", kt�ra jest podklas� "osoby", kt�ra jest podklas� najbardziej og�lnej klasa w Cyc, a mianowicie "rzecz". Cyc u�ywa "regu�" (okre�lonych w j�zyku logicznym) aby opisywa� relacje mi�dzy obiektami. Na przyk�ad angielska wersja jednej z jej zasad brzmi: "Dla wszystkich zdarze� A i B, A powoduje, �e B oznacza, �e A poprzedza B." Baza wiedzy Cyc (KB) podzielona jest na tysi�ce "mikro-teorii" - zbiory poj�� i fakt�w na temat okre�lonego obszaru. Na przyk�ad jedna mikro-teoria zawiera wiedz� o geografii europejskiej. Inni po�wi�caj� si� wiedzy eksperckiej na temat \ chemii, biologii, organizacji wojskowych, choroby i systemy uzbrojenia. "Ka�da mikro-teoria jest sp�jna, chocia� ca�a baza wiedzy Cyc, traktowana jako ca�o��, mo�e mie� sprzeczno�ci. KB Cyc zawiera ponad miliony og�lnych twierdze�. Wi�kszo�� z nich przechwytuje zdroworozs�dkow� wiedz� na temat" przedmioty i wydarzenia codziennego �ycia, takie jak kupno i sprzeda�, relacje pokrewie�stwa, sprz�t AGD, jedzenie, budynki biurowe, pojazdy, czas i przestrze�. "Ponadto KB zawiera wiedz� gramatyczn� i leksykaln� potrzebn� do przetwarzania j�zyka naturalnego. Cyc u�ywa "silnika wnioskowania", aby wyci�ga� nowe fakty z innych istniej�cych fakt�w i regu� w swoim KB. Stosowane s� dwie g��wne metody wnioskowania, zasada wnioskowania zwana rezolucj�. Aby skutecznie argumentowa� przy pomocy rozwi�zania, Cyc opracowa� zastrze�on� heurystyk� i ogranicza zakres swoich proces�w wyszukiwania za pomoc� mikro-teorii. Inn� metod� wnioskowania jest dziedziczenie w�a�ciwo�ci, co jest powszechnie stosowane w reprezentacjach sieci semantycznej. "Cykl obejmuje r�wnie� ponad 1000 modu��w wnioskowania specjalnego do obs�ugi okre�lonych klas wnioskowania. Jeden taki modu� obs�uguje rozumowanie dotycz�ce przynale�no�ci do zbioru / roz��czno�ci. Inne obs�uguj� rozumowanie r�wno�ci, rozumowanie czasowe i rozumowanie matematyczne. CycL u�ywa pewnej formy omijania. … i mo�e w stosownych przypadkach skorzysta� z za�o�enia zamkni�tego �wiata. " Cycorp pracuje nad kilkoma aplikacjami, w tym inteligentnym wyszukiwaniem i wyszukiwaniem informacji z sieci WWW oraz zrozumieniem j�zyka naturalnego. Jego strona internetowa twierdzi, �e "jest teraz dzia�aj�c� technologi� z aplikacjami do wielu rzeczywistych problem�w biznesowych". Istnieje jednak kilka uwag krytycznych dotycz�cych Cyc. Wpadaj� w k�opoty z niekt�rymi problemami z rozumowaniem, kt�re s� �atwe dla ludzi. Ogromna baza wiedzy stanowi jego cz�� rozumowania jest niepraktycznie wolne (i niew�tpliwie b�dzie jeszcze wolniejsze w miar� dodawania wi�kszej wiedzy). Nie ma satysfakcjonuj�cych rozwi�za� dla niekt�rych problem�w zwi�zanych z reprezentacj�, kt�re badacze AI wci�� staraj� si� rozwi�za� - takich jak reprezentacja substancji. Ponadto, poniewa� wi�kszo�� pracy nad Cyc odbywa si� w warunkach prywatnych, nie jest og�lnie dost�pna do oceny r�wie�niczej. Chocia� Cyc ma pretensje do posiadania wystarczaj�cej wiedzy, aby zrozumie� naturalny j�zyk, nie mo�e jeszcze automatycznie (to znaczy bez interakcji u�ytkownika) odpowiednio przet�umaczy� typowe angielskie pytania na CycL. Aby wys�a� zapytanie do Cyc, nale�y albo u�y� niewygodnego j�zyka CycL, albo pracowa� w interaktywny spos�b. Lenat opisa� mi praktyczny przyk�ad takiej interakcji zastosowanej w Cleveland Clinic, gdzie badacze medyczni u�ywaj� Cyc do uzyskiwania informacji z baz danych pacjent�w. Badacz wpisuje zapytanie w j�zyku angielskim. "Cyc analizuje, co mo�e, rozpoznaj�c niekt�re cz�ci zapytania i przedstawia u�ytkownikowi zestaw cz�ciowych" fragment�w "zapytania, kt�re s� jak szablony puste." Cyc nast�pnie wykorzystuje swoj� specjalistyczn� wiedz� na temat medycyny oraz zdrow� rozs�dek, aby dowiedzie� si�, jak sparafrazowa� zapytanie do sprawdzenia przez u�ytkownika. Po uzyskaniu zgody u�ytkownika na to, o co pyta� u�ytkownik, wykorzystuje swoj� wiedz� na temat organizacji bazy danych do generowania zapyta� do bazy danych w celu uzyskania po��danych informacji. Istniej� dwie wersje Cyc dost�pne do pobrania. Jeden nazywa si� ResearchCyc i jest dost�pny dla spo�eczno�ci badawczej (wy��cznie do cel�w badawczych) na podstawie licencji ResearchCyc. Poza silnikiem wnioskowania Cyc zawiera prawie 3 000 000 twierdze� (fakt�w i zasad), u�ywaj�c ponad 26 000 relacji, kt�re s� powi�zane, ograniczaj� , a w efekcie (cz�ciowo) zdefiniowa� poj�cia. "Kolejna, zwana OpenCyc, jest publicznie dost�pn� wersj� technologii Cyc. Zawiera "setki tysi�cy termin�w, d�ugie z milionami twierdze� odnosz�cych si� do termin�w wzajemnie. . . ." Mo�na r�wnie� zbada� hierarchi� poj�� w OpenCyc za pomoc� przegl�darki internetowej. Nikt nie wie dok�adnie, jak ludzie organizuj� i stosuj� zdrowy rozs�dek (i ekspercka) wiedza. To, czy fakty i relacje, kt�re zosta�y ju� zgromadzone (a kt�re dopiero zostan� zebrane) w ramach projektu Cyc, b�d� wystarczaj�ce pod wzgl�dem ilo�ci i organizacji, aby umo�liwi� rozumowanie na poziomie ludzkim, musz� jeszcze zosta� wykazane. Jednak pochwalam wysi�ek i �ycz� powodzenia temu projektowi. Z pewno�ci� uwa�am, �e wymagane b�dzie co� co najmniej tak ambitnego, jak Cyc. (Inn� pr�b� zebrania zdrowego rozs�dku jest wiedza z "Commonsense Computing Initiative" w MIT Media Lab. Mo�liwe, �e Cyc mo�e doj�� do punktu, w kt�rym (przy pewnej pomocy cz�owieka) b�dzie w stanie zebra� wi�cej wymaganej wiedzy bezpo�rednio z Internetu. Lenat wspomina o grze "FACTory", kt�rej celem jest pomoc w gromadzeniu wiedzy od ludzi, kt�rzy w ni� graj�. W grze Cyc generuje wypowiedzi w j�zyku naturalnym, kt�re zgromadzi� na podstawie angielskich zda� znalezionych w Internecie. Przedstawia te stwierdzenia dziesi�ciu losowo wybranym graczom w grze. Je�li wystarczaj�co du�o z nich odpowie, �e stwierdzenie jest prawdziwe, "Cyc dodaje ten fakt do swojego KB (a gracze zdobywaj� punkty w grze). Pr�bowa�em gry, a Cyc zapyta� mnie, czy "Ca�a marinara spaghetti zawiera troch� czosnku . " Odpowiedzia�em "prawda", a Cyc powiedzia�, �e zgadzam si� z 66% pozosta�ych graczy i �e teraz (dlatego) uwa�a, �e zdanie jest "prawdziwe".

Historia Sztucznej InteligencjiArtificial Intelligence Experts

Uzasadnienie i reprezentacja