AI : Technologie, Aplikacje i Wyzwania : Wczesne i dokładne wykrywanie raka

https://aie24.pl/

Najczęściej ręczne testy na raka dają fałszywie dodatnie lub fałszywie ujemne wyniki, co prowadzi do opóźnionego lub niedokładnego leczenia. Dzięki wykrywaniu raka wspomaganego sztuczną inteligencją odsetek fałszywych trafień spadł o 11% i negatywów o 5% . W zakresie ulepszenia skanowania raka z wykorzystaniem sztucznej inteligencji, w przyszłości możliwa jest większa dokładność i wcześniejsze wykrywanie.

Dokonywanie odkryć za pomocą indukcyjnego programowania logicznego

https://aie24.pl/

Procedura odwrotnego rozwiązywania, która odwraca pełną strategię rozwiązywania, jest w zasadzie kompletnym algorytmem do uczenia się teorii pierwszego rzędu. Oznacza to, że jeśli jakaś nieznana Hipoteza generuje zestaw przykładów, wówczas procedura odwrotnego rozwiązywania może wygenerować Hipotezę na podstawie przykładów. Ta obserwacja sugeruje interesującą możliwość: Załóżmy, że dostępne przykłady obejmują różne trajektorie spadających ciał. Czy program odwrotnej rozdzielczości byłby teoretycznie zdolny do wywnioskowania prawa grawitacji? Odpowiedź jest oczywiście tak, ponieważ prawo grawitacji pozwala wyjaśnić przykłady, biorąc pod uwagę odpowiednie podstawy matematyczne. Podobnie można sobie wyobrazić, że elektromagnetyzm, mechanika kwantowa i teoria względności również wchodzą w zakres programów ILP. Oczywiście są one również w zasięgu małpy z maszyną do pisania; wciąż potrzebujemy lepszych heurystyk i nowych sposobów strukturyzowania przestrzeni wyszukiwania. Jedną z rzeczy, które zrobią dla ciebie systemy odwróconej rozdzielczości, jest wymyślenie nowych predykatów. Ta zdolność jest często postrzegana jako nieco magiczna, ponieważ komputery są często postrzegane jako „tylko pracujące z tym, co im dane”. W rzeczywistości nowe predykaty wypadają bezpośrednio z kroku rozwiązywania odwrotnego. Najprostszym przypadkiem jest postawienie hipotezy o dwóch nowych klauzulach C1 i C2, biorąc pod uwagę klauzulę C. Rozwiązanie C1 i C2 eliminuje dosłowny wspólny dla dwóch klauzul; stąd całkiem możliwe, że wyeliminowany literał zawierał orzeczenie, które nie występuje w C. Tak więc podczas pracy wstecz jedną z możliwości jest wygenerowanie nowego predykatu, z którego można zrekonstruować brakujący literał. 

Po wygenerowaniu P może być używane w późniejszych krokach rozdzielczości odwrotnej. Na przykład, późniejszy krok może postawić hipotezę, że Mother(x;y) ) P(x;y). Zatem nowy predykat P ma swoje znaczenie ograniczone przez generowanie hipotez, które go dotyczą. Inny przykład może prowadzić do ograniczenia Ojciec(x;y) ) P(x;y). Innymi słowy, predykat P jest tym, o czym zwykle myślimy jako o relacji rodzicielskiej. Jak wspomnieliśmy wcześniej, wynalezienie nowych predykatów może znacznie zmniejszyć rozmiar definicji predykatu celu. W związku z tym, dzięki możliwości wymyślania nowych predykatów, systemy odwrotnego rozwiązywania często mogą rozwiązywać problemy uczenia się, które są niewykonalne przy użyciu innych technik. Niektóre z najgłębszych rewolucji w nauce pochodzą z wynalezienia nowych predykatów i funkcji — na przykład wynalezienie przyspieszenia przez Galileusza lub wynalezienie energii cieplnej przez Joule’a. Gdy te terminy są dostępne, odkrywanie nowych praw staje się (stosunkowo) łatwe. Najtrudniejsza część polega na uświadomieniu sobie, że jakiś nowy byt, mający specyficzny związek z istniejącymi bytami, pozwoli wyjaśnić cały zbiór obserwacji za pomocą znacznie prostszej i bardziej eleganckiej teorii niż istniała wcześniej. Jak dotąd systemy ILP nie dokonały odkryć na poziomie Galileusza czy Joule’a, ale ich odkrycia zostały uznane za możliwe do opublikowania w literaturze naukowej. Na przykład w Journal of Molecular Biology, Turcotte i inni opisują automatyczne odkrywanie reguł fałdowania białek za pomocą programu ILP PROGOL. Wiele reguł odkrytych przez PROGOL można było wyprowadzić ze znanych zasad, ale większość z nich nie została wcześniej opublikowana jako część standardowej bazy danych biologicznych. . W pracy pokrewnej Srinivasan  zajmował się problemem odkrywania opartych na strukturze molekularnej reguł mutagenności związków nitroaromatycznych. Związki te znajdują się w spalinach samochodowych. Dla 80% związków w standardowej bazie danych możliwe jest zidentyfikowanie czterech ważnych cech, a regresja liniowa tych cech przewyższa ILP. W przypadku pozostałych 20% same cechy nie są predyktywne, a ILP identyfikuje relacje, które pozwalają mu przewyższać regresję liniową, sieci neuronowe i drzewa decyzyjne. Co najbardziej imponujące, King i inni wyposażyli robota w możliwość przeprowadzania eksperymentów z biologii molekularnej i rozszerzyli techniki ILP o projektowanie eksperymentów, tworząc w ten sposób autonomicznego naukowca, który faktycznie odkrył nową wiedzę na temat funkcjonalnej genomiki drożdży. W przypadku wszystkich tych przykładów wydaje się, że zdolność zarówno do reprezentowania relacji, jak i korzystania z wiedzy podstawowej przyczynia się do wysokiej wydajności ILP. Fakt, że zasady znalezione przez ILP mogą być interpretowane przez ludzi, przyczynia się do akceptacji tych technik w czasopismach biologicznych, a nie tylko w czasopismach informatycznych. ILP wniosła wkład do innych nauk poza biologią. Jednym z najważniejszych jest przetwarzanie języka naturalnego, w którym ILP zostało wykorzystane do wyodrębnienia złożonych informacji relacyjnych z tekstu.

Uczenie indukcyjne z odwrotną dedukcją

https://aie24.pl/

Drugie główne podejście do ILP polega na odwróceniu normalnego procesu dedukcyjnego dowodu. Rozwiązanie odwrotne opiera się na spostrzeżeniu, że jeśli przykładowe Klasyfikacje wynikają z Tło Ʌ Hipoteza Ʌ Opisy, to trzeba być w stanie udowodnić ten fakt za pomocą rozwiązania (ponieważ rozwiązanie jest kompletne). Jeśli możemy „przeprowadzić dowód wstecz”, to możemy znaleźć Hipotezę taką, że dowód przejdzie. Kluczem jest zatem znalezienie sposobu na odwrócenie procesu restrukturyzacji i uporządkowanej likwidacji. Pokażemy proces weryfikacji wstecznej dla rozwiązania odwrotnego, który składa się z pojedynczych kroków wstecznych. Przypomnijmy, że zwykły krok rozwiązania obejmuje dwie klauzule C1 i C2 oraz rozwiązuje je, aby wytworzyć rezolucję C. Krok odwrotnej rezolucji bierze rezolucję C i tworzy dwie klauzule C1 i C2, takie, że C jest wynikiem rozwiązania C1 i C2. Alternatywnie, może wziąć rezolwentę C i klauzulę C1 i stworzyć klauzulę C2 taką, że C jest wynikiem rozwiązania C1 i C2.

Wczesne etapy procesu rozwiązywania odwrotnego są pokazane na rysunku 20.13, gdzie skupiamy się na pozytywnym przykładzie Dziadka(George;Anne). Proces rozpoczyna się na końcu dowodu (pokazanego na dole rysunku). Przyjmujemy rezolwentę C jako pustą klauzulę (tj. sprzeczność), a C2 jako ¬Grandparent(George;Anne), co jest negacją przykładu celu. Pierwszy odwrotny krok bierze C i C2 i generuje klauzulę Grandparent(George;Anne) dla C1. Następny krok przyjmuje tę klauzulę jako C, a klauzulę Parent(Elizabeth;Anne) jako C2 i generuje klauzulę ¬Parent(Elizabeth;y) V _Grandparent(George;y) jako C1. Ostatni krok traktuje tę klauzulę jako rezolucję. Z Parent(George; Elizabeth) jako C2, jedną z możliwych klauzul C1 jest hipoteza Parent(x,z)ɅParent(z;y) => Grandparent(x;y) . Teraz mamy dowód rozwiązania, że ​​hipoteza, opisy, i podstawowa wiedza pociąga za sobą klasyfikację Dziadkowie (George; Anne). Oczywiście odwrotna rozdzielczość obejmuje wyszukiwanie. Każdy krok rozwiązywania odwrotnego jest niedeterministyczny, ponieważ dla dowolnego C może istnieć wiele lub nawet nieskończona liczba klauzul C1 i C2, które rozstrzygają na C. Na przykład zamiast wybierać ¬Parent(Elizabeth;y) V Grandparent(George;y) dla C1 w ostatnim kroku na rysunku krok odwrotnego rozwiązywania mógł wybrać dowolne z następujących zdań

Ponadto, klauzule uczestniczące w każdym kroku mogą być wybrane z Wiedzy Podstawowej, z przykładowych Opisów, z zanegowanych Klasyfikacji lub z hipotetycznych klauzul, które zostały już wygenerowane w drzewie odwrotnej rozdzielczości. Duża liczba możliwości oznacza duży współczynnik rozgałęzienia (a tym samym nieefektywne wyszukiwanie) bez dodatkowych kontroli. We wdrożonych systemach ILP wypróbowano kilka podejść do oswajania poszukiwań:

  1. Zbędne wybory można wyeliminować – na przykład, generując tylko najbardziej szczegółowe hipotezy i wymagając, aby wszystkie hipotezy były spójne ze sobą i z obserwacjami. To ostatnie kryterium wykluczyłoby klauzulę ¬Parent(z;y) V Grandparent(George;y), wymienioną wcześniej.
  2. Strategia dowodowa może być ograniczona. Na przykład w rozdziale 9 widzieliśmy, że rozdzielczość liniowa jest kompletną, ograniczoną strategią. Rozdzielczość liniowa tworzy drzewa dowodów, które mają liniową strukturę rozgałęzień – całe drzewo podąża za jedną linią, z tylko pojedynczymi klauzulami odchodzącymi od tej linii.
  3. Język reprezentacji można ograniczyć, na przykład eliminując symbole funkcji lub dopuszczając tylko klauzule Horn. Na przykład PROGOL działa z klauzulami Horna, wykorzystując odwrotne wywoływanie. Chodzi o to, aby zmienić ograniczenie wynikania.

do formy równoważnej logicznie

Na tej podstawie można użyć procesu podobnego do normalnej dedukcji klauzuli Prologa Horna, z negacją jako niepowodzeniem w celu wyprowadzenia Hipotezy. Ponieważ jest ograniczona do klauzul Horn, jest to niekompletna metoda, ale może być bardziej wydajna niż pełna rozdzielczość. To jest również możliwe zastosowanie pełnego wnioskowania z odwrotnym wnioskowaniem.

  1. Wnioskowanie można przeprowadzić za pomocą sprawdzania modelu, a nie dowodzenia twierdzeń. System PROGOL wykorzystuje formę sprawdzania modelu w celu ograniczenia wyszukiwania. Oznacza to, że podobnie jak programowanie zestawu odpowiedzi, generuje możliwe wartości dla zmiennych logicznych i sprawdza spójność.
  2. Wnioskowanie można przeprowadzić za pomocą podstawowych zdań zdaniowych, a nie w logice pierwszego rzędu. System LINUS działa poprzez tłumaczenie teorii pierwszego rzędu na logikę zdań, rozwiązywanie ich za pomocą systemu uczenia się zdań, a następnie tłumaczenie z powrotem. Praca z formułami zdaniowymi może być bardziej wydajna w przypadku niektórych problemów, jak widzieliśmy w przypadku SATPLAN .