AI : Technologie, Aplikacje i Wyzwania : Wyzwania chirurgii robotycznej

https://aie24.pl/

Ryzyko związane z nowoczesnymi metodami jest podobne do metod tradycyjnych, ale czynnik ryzyka jest mniejszy. Jednym z ograniczeń minimalnie inwazyjnego podejścia chirurgicznego jest brak możliwości bezpośredniego kontaktu chirurga z operowaną tkanką. W przypadku chirurgii robotycznej chirurg polega wyłącznie na ruchu komputera. Szkolenie w chirurgii robotycznej pozostaje blokadą dla różnych chirurgów, a ulepszenia w modułach symulacyjnych i szkoleniowych miałyby znaczący wpływ . Integracja uczenia maszynowego (ML) z bazami danych może zapewnić chirurgom szczegółowe wskazówki. Poniżej wymieniono niektóre inne wyzwania:

  • Pacjenci od pewnego czasu mają krwawienia, co może prowadzić do tego, że operacja stanie się procedurą otwartą lub metodą tradycyjną.
  • Do szkolenia chirurgów wymagane jest dodatkowe szkolenie.
  • Koszt utrzymania i wdrożenia jest wysoki w porównaniu do tradycyjnej chirurgii.
  • Brak dotykowego sprzężenia zwrotnego dla operatora.

Analiza zależności

https://aie24.pl/

Istnieje szeroko stosowane alternatywne podejście syntaktyczne zwane gramatyka zależności, które zakłada, że ​​strukturę syntaktyczną tworzą relacje binarne między elementami leksykalnymi, bez potrzeby stosowania składników składniowych.  W pewnym sensie gramatyka zależności i gramatyka struktury fraz są tylko wariantami notacji. Jeśli drzewo struktury fraz jest opatrzone nagłówkiem każdej frazy, możesz odzyskać z niego drzewo zależności. W drugą stronę możemy przekonwertować drzewo zależności na drzewo struktury fraz, wprowadzając dowolne kategorie (chociaż nie zawsze otrzymamy w ten sposób naturalnie wyglądające drzewo). Dlatego nie wolelibyśmy jednej notacji od drugiej, ponieważ jedna jest silniejsza; raczej wolelibyśmy taki, ponieważ jest bardziej naturalny – albo bardziej znany dla ludzkich twórców systemu, albo bardziej naturalny dla systemu uczenia maszynowego, który będzie musiał nauczyć się struktur. Ogólnie rzecz biorąc, drzewa struktury fraz są naturalne dla języków (takich jak angielski) z przeważnie ustaloną kolejnością wyrazów; Drzewa zależności są naturalne dla języków (takich jak łacina) z przeważnie swobodnym szykiem wyrazów, gdzie szyk wyrazów jest określany bardziej przez pragmatykę niż przez kategorie składniowe. Obecna popularność gramatyki zależności wywodzi się w dużej mierze z projektu Universal Dependencies , projektu banku drzew o otwartym kodzie źródłowym, który definiuje zestaw relacji i dostarcza miliony przeanalizowanych zdań w ponad 70 językach.

AI : Technologie, Aplikacje i Wyzwania : Zalety chirurgii robotycznej

https://aie24.pl/

Ta operacja oferuje pacjentom kilka korzyści w porównaniu z tradycyjną lub konwencjonalną lub otwartą operacją. Niektóre z ważnych zalet to:

  • Podczas tej operacji chirurdzy mogą lepiej zrozumieć obecną sytuację.
  • Ta operacja powoduje mniejsze uszkodzenie tkanek.
  • Ta operacja wiąże się z minimalną utratą krwi, a zatem zapewnia pacjentom szybki powrót do zdrowia.
  • Ten system jest korzystniejszy, ponieważ pacjenci mogą wrócić do swoich codziennych zajęć w znacznie krótszym czasie.
  • Szanse na infekcje są również znacznie mniejsze w porównaniu z operacją otwartą.
  • Szanse na uszkodzenia nerwowo-naczyniowe są mniejsze, a cięcie tkanek jest łatwiejsze dzięki temu systemowi. Nacięcie jest małe, a rekonwalescencja szybsza.
  • Minimalna utrata krwi w chirurgii robotycznej, co skutkuje mniejszą potrzebą transfuzji krwi.
  • Precyzyjna operacja; chirurdzy mogą uzyskać dostęp do obszaru, w którym ma być wykonana skrupulatna operacja, dzięki stosunkowi pikseli o wysokiej rozdzielczości.
  • Skomplikowaną operację można przeprowadzić w efektywny sposób za pomocą robotyki, co nie jest możliwe w przypadku tradycyjnej procedury.
  • Szanse na infekcję rany są również mniejsze.
  • Chirurdzy mają większą elastyczność operacyjną w porównaniu z metodami konwencjonalnymi.
  • Operacja ta jest bardziej precyzyjna ze względu na instrumentarium i precyzję robota w porównaniu do metod tradycyjnych.

Parsowanie

https://aie24.pl/

Parsowanie to proces analizowania ciągu słów w celu odkrycia jego struktury frazowej, zgodnie z zasadami gramatyki. Możemy myśleć o tym jako o poszukiwaniu prawidłowego drzewa parsowania, którego liście są słowami ciągu. Rysunek 24.4 pokazuje, że możemy zacząć od symbolu S i wyszukiwać z góry na dół lub możemy zacząć od słów i szukać od dołu do góry. Strategie analizy odgórnej lub oddolnej mogą być jednak nieefektywne, ponieważ mogą skończyć się powtarzaniem wysiłku w obszarach przestrzeni wyszukiwania, które prowadzą do ślepych zaułków. Rozważ następujące dwa zdania: Niech uczniowie z sekcji 2 Informatyki 101 przystąpią do egzaminu. Czy uczniowie z sekcji 2 Informatyki 101 przystąpili do egzaminu? Mimo że dzielą one pierwsze 10 słów, zdania te mają bardzo różne parsy, ponieważ pierwsze jest poleceniem, a drugie pytaniem. Algorytm analizujący od lewej do prawej musiałby odgadnąć, czy pierwsze słowo jest częścią polecenia, czy pytania, i nie będzie w stanie stwierdzić, czy odgadnięcie jest poprawne, aż do co najmniej jedenastego słowa, weź lub wzięcie. Jeśli algorytm odgadnie źle, będzie musiał cofnąć się do pierwszego słowa i ponownie przeanalizować całe zdanie pod inną interpretacją. Aby uniknąć tego źródła nieefektywności, możemy użyć programowania dynamicznego: za każdym razem, gdy analizujemy podciąg, przechowuj wyniki, abyśmy nie musieli ich później ponownie analizować. Na przykład, gdy odkryjemy, że „uczniowie z sekcji 2 Informatyki 101” to NP, możemy to zapisać w strukturze danych znanej jako wykres. Algorytm, który to robi, nazywa się parserem wykresu. Ponieważ mamy do czynienia z gramatykami bezkontekstowymi, każda fraza znaleziona w kontekście jednej gałęzi drzewa wyszukiwania może działać równie dobrze w każdej innej gałęzi drzewa wyszukiwania. Istnieje wiele rodzajów parserów wykresów; opisujemy probabilistyczną wersję algorytmu analizowania wykresów bottom-up, zwanego algorytmem CYK, na cześć jego wynalazców Ali Cocke, Daniela Youngera i Tadeo Kasami.

Algorytm CYK  

Algorytm CYK wykorzystuje przestrzeń O(n2m) dla tablic P i T, gdzie n to liczba słów w zdaniu, a m to liczba nieterminalnych symboli w gramatyce i zajmuje czas O(n3m). Jeśli chcemy algorytmu, który gwarantuje działanie dla wszystkich możliwych gramatyk bezkontekstowych, nie możemy zrobić nic lepszego. Ale tak naprawdę chcemy parsować tylko języki naturalne, a nie wszystkie możliwe gramatyki. Języki naturalne ewoluowały, by być łatwym do zrozumienia w czasie rzeczywistym, aby nie być tak trudnym, jak to możliwe, więc wydaje się, że powinni być podatni na szybszy algorytm parsowania. Aby spróbować dostać się do O(n), możemy zastosować wyszukiwanie A w dość prosty sposób: każdy stan jest listą elementów (słów lub kategorii). Stan początkowy to lista słów, a stan docelowy to pojedyncza pozycja S. Koszt stanu jest odwrotnością jego prawdopodobieństwa, zgodnie z definicją dotychczas stosowanych reguł. Istnieją różne heurystyki pozwalające oszacować pozostałą odległość do cel; najlepsze obecnie stosowane heurystyki pochodzą z uczenia maszynowego zastosowanego do korpusu zdań. Dzięki algorytmowi A nie musimy przeszukiwać całej przestrzeni stanów i mamy gwarancję, że pierwsza znaleziona parsowanie będzie najbardziej prawdopodobna (przy założeniu dopuszczalnej heurystyki). Zwykle będzie to szybsze niż CYK, ale (w zależności od szczegółów gramatyki) nadal wolniejsze niż O(n).  Podobnie jak w przypadku tagowania części mowy, możemy użyć wyszukiwania wiązki do parsowania, gdzie w dowolnym momencie bierzemy pod uwagę tylko b najbardziej prawdopodobnych parsów alternatywnych. Oznacza to, że nie mamy gwarancji, że znajdziemy parsowanie z najwyższym prawdopodobieństwem, ale (przy ostrożnej implementacji) parser może działać w czasie O(n) i nadal znajduje najlepszą parsowanie przez większość czasu. Parser przeszukiwania wiązki z b=1 nazywany jest parserem deterministycznym. Jednym z popularnych podejść deterministycznych jest parsowanie shift-reduce, w którym przechodzimy przez zdanie słowo po słowie, wybierając w każdym punkcie, czy przenieść słowo na stos składników, czy zredukować górny(e) składnik(i) na stosie zgodnie z regułą gramatyczną. Każdy styl parsowania ma swoich zwolenników w społeczności NLP. Nawet jeśli możliwe jest przekształcenie systemu redukcji zmian w PCFG (i odwrotnie), to po zastosowaniu uczenia maszynowego do problemu wprowadzenia gramatyki, indukcyjne nastawienie, a tym samym uogólnienia, które zrobi każdy system, będą inne.

AI : Technologie, Aplikacje i Wyzwania : Kliniczne zastosowania chirurgii robotycznej

https://aie24.pl/

Robotyczna chirurgia prostaty

Operacja ta wykorzystuje mniejsze nacięcia, co skutkuje mniejszym uszkodzeniem naczyń krwionośnych i nerwów, a co za tym idzie mniejszą liczbą powikłań i krótszym czasem rekonwalescencji pacjentów w porównaniu z konwencjonalną operacją.

Robotyczna chirurgia nerek

Ta operacja może być konieczna w przypadkach, gdy konieczne jest usunięcie jednej nerki (nefrektomia robotem) lub części nerki (nefrektomia częściowa robota). W konwencjonalnych procedurach chirurgicznych do zabiegu wymagane jest duże nacięcie o długości do 8 cali [29, 30]. W przypadku zrobotyzowanej operacji nerek rozmiar nacięcia jest niewielki, co czyni ją zabiegiem małoinwazyjnym. Ta operacja ma szybki czas rekonwalescencji dla pacjentów, którzy mogą wrócić do codziennych zajęć stosunkowo krótko po operacji.

Zrobotyzowana chirurgia ginekologiczna

Ten system chirurgiczny powoduje mniejszą utratę krwi podczas operacji i mniejszy ból pooperacyjny dla pacjenta. Dzięki tej operacji rozmiar nacięcia jest mały, co prowadzi do mniejszej utraty krwi, mniejszego bólu i krótszego czasu rekonwalescencji pacjenta. Z kolei operacja konwencjonalna skutkuje wydłużonym okresem rekonwalescencji oraz powikłaniami fizycznymi i emocjonalnymi pacjenta.

Robotyczna chirurgia pęcherzyka żółciowego

Polega na cholecystektomii (usunięcie pęcherzyka żółciowego). Za pomocą tych systemów operację można wykonać za pomocą jednego nacięcia. Dla pacjenta oznacza to mniejszą utratę krwi, mniejsze blizny i krótszy czas rekonwalescencji, a co za tym idzie, szybszy powrót do codziennych czynności w porównaniu do tego samego po operacji konwencjonalnej.

Robotyczna chirurgia jelita grubego

Ten system chirurgiczny jest korzystny w przypadkach, gdy pacjent wymaga kolektomii (z powodu raka jelita grubego) lub w okolicznościach takich jak łagodny guz. Zastosowanie tego systemu chirurgicznego pozwala skutecznie operować mniejszymi nacięciami chirurgicznymi, co zmniejsza ryzyko uszkodzenia nerwów i powikłań z tym związanych. Ułatwia również cięcie tkanek i zapewnia pracownikom służby zdrowia inne środki przeprowadzania operacji okrężnicy niedostępne w przypadku konwencjonalnych operacji. Wreszcie, rekonwalescencja pooperacyjna jest również znacznie skrócona.

Leksykon E0

https://aie24.pl/

Leksykon, czyli lista dopuszczalnych słów, jest zdefiniowany na rysunku.

Każda z kategorii leksykalnych kończy się na …, aby wskazać, że w kategorii znajdują się inne słowa. W przypadku rzeczowników, imion, czasowników, przymiotników i przysłówków nawet w zasadzie niemożliwe jest wymienienie wszystkich słów. W każdej klasie są nie tylko dziesiątki tysięcy członków, ale ciągle dodajemy nowych — takich jak humblebrag czy microbiom. Te pięć kategorii nazywa się klasami otwartymi. Zaimki, zaimki względne, rodzajniki, przyimki i spójniki nazywane są klasami zamkniętymi; mają niewielką liczbę słów (kilkanaście) i zmieniają się na przestrzeni wieków, a nie miesięcy. Na przykład „ty” i „ty” były powszechnie używanymi zaimkami w XVII wieku, podupadały w XIX wieku i są dziś widywane tylko w poezji i niektórych dialektach regionalnych.

AI : Technologie, Aplikacje i Wyzwania : Roboty chirurgiczne

https://aie24.pl/

Operacje laparoskopowe poprawiają jakość życia pacjentów, jak pokazano na rycinie 17.3. W przypadku chirurgii laparoskopowej roboty chirurgiczne są zasadniczo podzielone na dwa typy, które wymieniono w poniższych podsekcjach.

Typ Master-Slave

Tego rodzaju roboty mają sześć stopni swobody (DOF) ruchu. Ma ramię z czterema stopniami swobody na zewnątrz jamy brzusznej i staw nadgarstkowy z dwoma stopniami swobody na końcu. W czasie operacji chirurgicznej, za pomocą konsoli głównej, chirurg może z łatwością sterować zdalnym urządzeniem podrzędnym ze stawem nadgarstkowym. Robot umożliwia intuicyjną obsługę, ponieważ podrzędne ramiona w jamie brzusznej odtwarzają sześć DOF ruchów ręki chirurga na konsoli. Roboty umożliwiają również telechirurgię za pośrednictwem sieci i mikrochirurgię, dostosowując zakres ruchu między urządzeniem nadrzędnym a podrzędnym. System Da Vinci jest najczęściej stosowanym systemem, który w 2000 roku został zatwierdzony przez Food and Drug Administration (FDA) jako pierwszy system chirurgiczny w Stanach Zjednoczonych do ogólnej chirurgii laparoskopowej [28, 29, 31]. Roboty master-slave mają pewne wady, takie jak brak haptyki, duże rozmiary i wysoki koszt operacji.

Ręczne szczypce robotyczne

Robot nadrzędny-podrzędny nie jest uważany za najlepszy do wszystkich operacji chirurgicznych, ponieważ wymaga dużej przestrzeni na konsolę główną i ma kilka innych wad omówionych w poprzednim podrozdziale. W przeciwieństwie do ręcznych szczypiec robotów, na końcu znajduje się przegub nadgarstkowy, którym można sterować za pomocą interfejsu zainstalowanego na szczypcach. Jego działanie translacyjne jest takie samo jak tradycyjne. W tym przypadku system jest mały w porównaniu do master-slave ze względu na brak konsoli master, a czas konfiguracji jest również krótszy. System ten można podzielić na sterowany za pomocą siłowników lub napędzany mechanicznie.

Gramatyka

https://aie24.pl/

Wcześniej użyliśmy formy Backusa–Naura (BNF) do napisania gramatyki dla języka logiki pierwszego rzędu. Gramatyka to zbiór reguł, które definiują strukturę drzewa dozwolonych fraz, a język to zbiór zdań zgodnych z tymi regułami. Języki naturalne nie działają dokładnie tak, jak język formalny logiki pierwszego rzędu — nie mają sztywnej granicy między zdaniami dopuszczalnymi i niedozwolonymi, ani nie mają pojedynczej, definitywnej struktury drzewiastej dla każdego zdania. Jednak w języku naturalnym ważna jest struktura hierarchiczna. Słowo „Zapasy” w „Zapasy zgromadzone w poniedziałek” nie jest tylko słowem ani rzeczownikiem; w tym zdaniu zawiera również frazę rzeczownikową, która jest przedmiotem następującej frazy czasownikowej. Kategorie składniowe, takie jak fraza rzeczownikowa lub fraza czasownikowa, pomagają ograniczyć prawdopodobne słowa w każdym punkcie zdania, a struktura frazy zapewnia ramy znaczenia lub semantyki zdania. Istnieje wiele konkurencyjnych modeli językowych opartych na idei hierarchicznej struktury składniowej; w tej części opiszemy popularny model zwany probabilistyczną gramatyka bezkontekstową lub PCFG. Gramatyka probabilistyczna przypisuje każdemu ciągowi prawdopodobieństwo, a „bezkontekstowa” oznacza, że ​​dowolna reguła może być użyta w dowolnym kontekście: reguły dla frazy rzeczownikowej na początku zdania są takie same, jak dla innej frazy rzeczownikowej w dalszej części zdania. zdanie, a jeśli ta sama fraza występuje w dwóch miejscach, to za każdym razem musi mieć to samo prawdopodobieństwo. Zdefiniujemy gramatykę PCFG dla małego fragmentu języka angielskiego, który jest odpowiedni do komunikacji między agentami eksplorującymi świat wumpusa. Nazywamy ten język E0 . Reguła gramatyczna, taka jak

oznacza, że kategoria składniowa Adjs może składać się z pojedynczego Adjective z prawdopodobieństwem 0,80 lub z Adjective, po którym następuje ciąg tworzący Adjs, z prawdopodobieństwem 0,20.

Niestety gramatyka nadmiernie się generuje: to znaczy generuje zdania, które nie są gramatyczne, takie jak „Me go I”. Nie generuje też zbyt wiele: jest wiele zdań w języku angielskim, które odrzuca, na przykład „Myślę, że wumpus jest śmierdzący”. Zobaczymy, jak nauczyć się lepszej gramatyki później; na razie skupiamy się na tym, co możemy zrobić z tą bardzo prostą gramatyką.

AI : Technologie, Aplikacje i Wyzwania : Wykorzystanie robotyki w chirurgii: aktualne trendy, wyzwania i przyszłość

https://aie24.pl/

Era operacji robotycznych rozpoczęła się w latach 80. XX wieku: w 1985 r. do chirurgii stereotaktycznej zastosowano pierwszy system Robotic Surgical, znany jako PUMA 560. Później, w 1988 r., PROBOT został użyty do operacji prostaty. Następnie, w 1992 roku, opracowano ROBODOC do preparacji „ubytku kości udowej”. W 1990 roku nastąpiła rewolucja, znana jako rewolucja laparoskopowa, kiedy to kilka operacji otwartych przystosowano do chirurgii minimalnego dostępu (MAS), co skutkuje krótszym pobytem w szpitalu, mniejszym bólem pooperacyjnym, minimalnym ryzykiem zakażenia rany i lepszą wyniki, które sprawiły, że operacje, takie jak cholecystektomia laparoskopowa, stały się standardem postępowania w przypadku kamicy żółciowej. Ze względu na ich korzystne wyniki wielu chirurgów stosowało techniki małoinwazyjne do swoich operacji chirurgicznych. W tej technice istnieją otwarte wyzwania, takie jak niestabilna pozycja kamery podczas wykonywania operacji i zapewnienie wizji 2D domeny. Główny chirurg był związany z trudnymi pozycjami do operowania prostymi instrumentami laparoskopowymi. Na początku XXI wieku rozwój nowej techniki lub technologii prowadzi do dalszych postępów w MAS. Zarówno chirurgia robotyczna, jak i teleobecność skutecznie usuwają wady operacji laparoskopowych i torakoskopowych. Chirurgia robotyczna ma pozostać rosnącą częścią chirurgii . Zakłada się również, że w przyszłości większość operacji będzie wykonywana przez roboty. Chirurgia robotyczna obejmuje zrobotyzowany system chirurgiczny do przeprowadzania operacji na pacjentach. Podobnie jak na przykład MAS, system Da Vinci jest najczęściej używanym systemem i składa się z trzech podstawowych elementów: (1) konsoli chirurga, (2) wózka pacjenta i (3) wózka wizyjnego. Połączenie wszystkich tych elementów sprawia, że ​​chirurg rozumie aktualny scenariusz, a następnie naśladuje minuty, aby poprowadzić instrument. Ponieważ chirurgia robotyczna nie wymaga specjalnego szkolenia, z pewnością może zmienić dotychczasowy model szkolenia chirurgicznego i przemodelować paradygmat uczenia się ludzi, dostarczając nowych możliwych rozwiązań, takich jak robotyczne telementoring i robotyczne symulatory chirurgiczne. Te operacje okazały się bardzo skuteczne w przypadku złożonych warunków, które wymagają ekstremalnej precyzji. W niektórych warunkach skomplikowane operacje nie są możliwe w konwencjonalny sposób. Ta technika jest jedyną opcją pozostawioną chirurgom, ponieważ zapewnia elastyczność umożliwiającą dogłębne zbadanie operowanej części ciała. Zapewnia to również jaśniejszy pogląd, że ogólnie skutkuje to płynniejszymi procedurami. Chirurgia robotyczna zapewnia również większą kontrolę nad wykonywanymi czynnościami.

Porównanie modeli językowych

https://aie24.pl/

Aby zorientować się, jak wyglądają różne modele n-gramowe, zbudowaliśmy modele unigramowe (tj. bag-ofwords), bigramowe, trygramowe i 4-gramowe na słowach, a następnie losowo pobrane sekwencje słów z każdego z cztery modele:

  • n = 1: logiczne są tak samo jak zamieszanie może dobrze próbuje agent cel był
  • n = 2: systemy są bardzo podobne, będzie reprezentowane podejście obliczeniowe
  • n = 3: planowanie i harmonogramowanie są zintegrowane, sukces naiwnego modelu Bayesa to
  • n=4: wykorzystanie struktury sieci bayesowskich i opracowanie różnych języków do pisania „szablonów” ze zmiennymi logicznymi, z których duże sieci mogą być konstruowane automatycznie dla każdej instancji problemu

Z tej małej próbki powinno jasno wynikać, że model unigramowy jest bardzo słabym przybliżeniem albo ogólnie języka angielskiego, albo podręcznika AI w szczególności, a model 4-gramowy jest niedoskonały, ale znacznie lepszy. Następnie, aby zademonstrować, w jaki sposób próbki przełączają się między źródłami uczącymi (i zdecydowanie nie tylko dla zabawy), dodaliśmy tekst Biblii Króla Jakuba do 4-gramowego modelu, uzyskując te losowe próbki:

  • Udowodnij, że każdy problem 3-SAT można zredukować do prostszych, używając praw twojego Boga.
  • Mistrzowie, dajcie swoim sługom to, co jest prawdziwe, jeśli zarówno P, jak i Q w dowolnym modelu m poprzez prosty eksperyment: połóżcie rękę na sobie i waszych domach, bo to jest przyjemne.
  • Wielu będzie błagać Pana, Boga twego, mówiąc: Nie; ale na razie zignorujemy tę kwestię;
  • I stało się tak, jakby nie miał następców.
  • Bezpośrednie oszacowanie użyteczności jest tylko przykładem ogólnego lub algorytmu, w którym nowe symbole funkcyjne są konstruowane „w locie”. Na przykład pierwsze dziecko Ducha Świętego.

Istnieje ograniczenie modeli n-gramowych – wraz ze wzrostem n będą one tworzyć język płynniejszy, ale mają tendencję do dosłownego powielania długich fragmentów danych treningowych, zamiast generowania nowego tekstu. Modele językowe z bardziej złożonymi reprezentacjami słów i kontekstu mogą działać lepiej. Pozostała część pokazuje, w jaki sposób gramatyka może ulepszyć model językowy i w jaki sposób metody głębokiego uczenia się stworzyły ostatnio imponujące modele językowe. Jeden z takich modeli głębokiego uczenia, GPT-2, może generować płynne próbki języka angielskiego po otrzymaniu monitu. Daliśmy GPT-2 pierwsze dwa zdania tego akapitu jako podpowiedź; wyprodukował następujące dwie próbki:

  • Liczne badania wykazały, że najlepszymi modelami językowymi, które mogą generować język, są te, które wykorzystują sieci neuronowe, aw szczególności wykorzystują głębokie uczenie do modelowania mowy. Użyłem jednego z tych modeli do wygenerowania setek zdań w wielu językach i ma on możliwość generowania prawie doskonałych tłumaczeń moich zdań szkoleniowych. To świetny model i pozwoli Ci zaoszczędzić dużo czasu w przyszłości, gdy będziesz musiał tłumaczyć między wieloma językami.
  • Modele te mogą również działać lepiej, jeśli ich próbki zostaną wybrane losowo, a nie przez eksperta w danej dziedzinie. Jednak z reguły modele n-gramowe i językowe, które zawierają dużą liczbę funkcji, mają tendencję do lepszego tworzenia tekstu, ponieważ te cechy najbardziej przyczyniają się do nauki języka. Aby zmierzyć wydajność modelu, przygotowałem kilka przykładowych zdań które chciałbym szkolić, aby lepiej rozumieć modele mowy i języka. Możesz je przeczytać, aby dowiedzieć się, jak prognozuje model.

Widzimy, że te fragmenty są różnorodne i płynne gramatycznie; ponadto trzymają się tematów, które są istotne dla zdań podpowiedzi. Ale zdania nie budują na sobie nawzajem, by postawić spójną tezę. Model językowy GPT-2 jest znany jako model transformatorowy. Innym modelem transformatora jest język transformatora warunkowego CTRL. Można nim sterować w bardziej elastyczny sposób; w poniższych próbkach CTRL został poproszony o wygenerowanie tekstu w kategorii recenzje produktów, z oceną 1 i 4 (z 5): określona ocena (z 5):

  • 1.0: Kupiłem to dla mojego syna, który jest wielkim fanem serialu. Był tak podekscytowany, że go dostał, a kiedy go otworzył, wszyscy byliśmy bardzo rozczarowani. Jakość produktu jest okropna. Wygląda na coś, co można kupić w sklepie za dolara.

• 4.0: kupiłam to mojemu mężowi i on to uwielbia. Ma mały nadgarstek, więc trudno znaleźć zegarki, które by do niego pasowały. Ten pasuje idealnie