Rozpoznawanie nazwanych podmiotów (NER) to zadanie wyodrębniania informacji, które ma na celu zlokalizowanie i sklasyfikowanie nazwanych podmiotów wymienionych w nieustrukturyzowanym tekście według predefiniowanych kategorii, takich jak nazwiska osób, organizacje, lokalizacje, wyrażenia czasu, ilości, wartości pieniężne, wartości procentowe itp. NER pomaga aby odpowiedzi były bardziej spersonalizowane i trafne, ale obecne, najnowocześniejsze podejścia wymagają ogromnych ilości danych do szkolenia, zanim w ogóle zacznie się prognozować. Z drugiej strony GPT-3 może od razu rozpoznać ogólne byty, takie jak ludzie, miejsca i organizacje, bez konieczności podawania przez człowieka choćby jednego przykładu szkoleniowego. W poniższym przykładzie używamy wersji modelu z serii davinci-instruct, która w momencie pisania tej książki była w fazie beta, a model gromadzi podpowiedzi umożliwiające uczenie i ulepszanie przyszłych modeli API OpenAI. Dajemy mu proste zadanie: wydobyć dane kontaktowe z przykładowego maila. Pomyślnie wykonuje zadanie za pierwszym podejściem .
Oto nasz wkład:
Wyodrębnij imię i nazwisko oraz adres pocztowy z tego e-maila:
Shubham,
Wspaniale było z tobą porozmawiać pewnego dnia!
Nie mogę się doczekać rozpoczęcia pracy nad naszą książką.
Oto mój adres: 1307 Roosevelt Street, San Francisco, CA 94107
To, co najlepsze,
Sandra Kubik
Imię i nazwisko oraz adres korespondencyjny:
I wynik:
Sandra Kubik
1307 Roosevelt Street, San Francisco, CA 94107