https://aie24.pl/
Jedną z najbardziej ekscytujących możliwości GPT-3 jest opowiadanie historii. Możesz nadać modelowi temat i poprosić go o napisanie historii w ustawieniu zero-shot. Możliwości dają pisarzom możliwość poszerzenia swojej wyobraźni i stworzenia niezwykłych dzieł. Na przykład sztuka AI wyreżyserowana przez Jennifer Tang i opracowana wspólnie z Chinonyerem Odimbą i Niną Segal przedstawia wyjątkową współpracę między umysłami ludzkimi i komputerowymi za pomocą GPT-3. Autor K Allado-McDowell potraktował GPT-3 jako współautora podczas pisania książki Pharmako-AI (Ignota Books), która według Allado-McDowella „na nowo wyobraża sobie cybernetykę dla świata stojącego w obliczu wielu kryzysów, z głębokimi konsekwencjami dla tego, jak postrzegamy siebie, przyrodę i technologia XXI wieku.” Spotkaliśmy się z Edwardem Saatchi, współzałożycielem i dyrektorem generalnym Fable Studio oraz Frankiem Careyem, dyrektorem technicznym Fable Studio, aby dowiedzieć się o ich podróży podczas tworzenia nowego gatunku interaktywnych historii przy użyciu GPT-3. Bajka zaadaptowana przez Neila Gaimana oraz książkę dla dzieci Dave’a McKeana „Wilki w ścianach” w nagrodzony nagrodą Emmy film w wirtualnej rzeczywistości (VR). Lucy, bohaterka filmu, może prowadzić naturalne rozmowy z ludźmi dzięki dialogom generowanym przez GPT-3. Lucy pojawiła się nawet jako gość na Festiwalu Filmowym w Sundance w 2021 roku. Saatchi i Carey zauważyli, że wśród widzów nawiązała się emocjonalna więź z Lucy. To skłoniło ich do skupienia się na wykorzystaniu sztucznej inteligencji do tworzenia wirtualnych istot, a wraz z nimi nowej kategorii opowiadania historii i rozrywki, która splata sztuczną inteligencję i opowiadanie historii. Jak to ujął YouTuber Bakz Awan: „Będziemy mieli zupełnie nowe rodzaje filmów i gatunków: będziemy mieć interaktywne, zintegrowane doświadczenia.” Carey wyjaśnia, że widzowie zwykle myślą o sztucznej inteligencji przejmującej rolę postaci, tak jak zrobiłby to aktor: jedna sztuczna inteligencja odpowiada jednej postaci. Zamiast tego sztuczna inteligencja Fable jest narratorem, mającym w swoim repertuarze najróżniejsze postacie. Carey wierzy, że możliwe jest stworzenie gawędziarza opartego na sztucznej inteligencji, równie utalentowanego i kreatywnego, jak najlepsi pisarze. Podczas gdy rozmowy Lucy toczą się głównie za pośrednictwem czatów tekstowych i wideo, Fable eksperymentuje również z GPT-3 w symulowanych światach 3-D, aby zapewnić wciągające wrażenia VR. Zespół wykorzystuje sztuczną inteligencję do generowania dźwięku i gestów oraz synchronizowania ruchów warg. Używają GPT-3 do generowania znacznej ilości treści na potrzeby interakcji bohaterów z publicznością. Niektóre z tych treści mogą być wstępnie opracowane, ale większość z nich musi być tworzona na bieżąco. Współpracownicy Lucy intensywnie korzystali z GPT-3, zarówno improwizując podczas jej występu w Sundance, jak i podczas tworzenia filmu. Lucy pojawiła się także na interaktywnej platformie Twitch, gdzie transmituje gry lub opowiada historie). Carey twierdzi, że w obu przypadkach „ponad 80% treści zostało wygenerowanych przy użyciu GPT-3.” Jest to uderzająca zmiana w porównaniu z wcześniejszymi eksperymentami zespołu obejmującymi wyłącznie tekst, które były w większym stopniu autorskie i miały bardziej liniową narrację. Zespół Fable Studio zasadniczo nie korzystał z GPT-3 na żywo, aby poradzić sobie z nieprzewidywalnymi reakcjami widzów; ich techniki były starsze niż GPT-3. Czasami jednak używali GPT-3 jako partnera do pisania lub zastępowania publiczności, gdy rozważali potencjalne odpowiedzi, jakie mogliby udzielić członkowie publiczności. Carey wyjaśnia, że GPT-3 jest także użytecznym narzędziem dla autorów będących ludźmi: „W przypadku improwizowanych treści używamy GPT-3 do rozgrywania testów, więc możesz traktować GPT jak człowieka i w pewnym sensie odgrywać tę postać . Przechodzenie tam i z powrotem za pomocą GPT-3 pomaga wymyślić, na przykład, o co ktoś by zapytał w tej sytuacji? Jakie będą dalsze działania?” Pomaga to autorom uwzględnić jak najwięcej wyników rozmów. “Czasami był to partner w pisaniu, czasem coś, co mogło wypełnić luki w tym, co się dzieje” – mówi Saatchi. „Możemy więc pomyśleć: to właśnie stanie się z tą postacią w tym tygodniu. Co stanie się z bohaterem w przyszłym tygodniu? A GPT-3 [wypełnia] niektóre z tych luk.” Zespół Fable w pełnym zakresie wykorzystał GPT-3 w eksperymencie przeprowadzonym na Festiwalu Filmowym w Sundance w 2021 r., gdzie Lucy współpracowała na żywo z uczestnikami festiwalu, aby stworzyć własny film krótkometrażowy Dracula: Blood Gazpacho, podczas gdy Fable Studio i uczestnicy byli kuratorami jej pomysłów wygenerowane, odrzucając je od uczestników i wprowadzając pomysły publiczności z powrotem do GPT-3. Zasilanie jednej spójnej postaci za pomocą GPT-3 było szczególnym wyzwaniem. GPT-3 jest bardzo dobry w przypadkach użycia, które przekierowują postać do uczestnika, jak sesje terapeutyczne, a także w przypadku postaci, które mają „bardzo dużą bazę wiedzy na swój temat, jak gwiazda lub postać archetypowa jak Jezus , Święty Mikołaj lub Dracula. Ale oczywiście to ogranicza wszystkie informacje, które zostały już zapisane” – wyjaśnia Saatchi, zauważając, że każdy, kto intensywnie wchodzi w interakcję z postacią zasilaną GPT-3, dość szybko osiągnie limity GPT-3.
„Próbuje znaleźć dobrą odpowiedź na historię, którą proponujesz. Ale jeśli w podpowiedziach opowiesz fantastyczną historię, ona również otrzyma fantastyczne odpowiedzi. Prawidłowy? Nie jest więc osobą mówiącą prawdę. Powiedziałbym, że jest z natury gawędziarzem; po prostu próbuje znaleźć wzorce w języku.” Wiele osób nie zdaje sobie sprawy z GPT-3, że jego podstawowym zadaniem jest opowiadanie historii, a nie „prawdy” – mówi Carey. „Wygenerowanie kilku losowych scenariuszy przy użyciu GPT-3 to jedno, ale upewnienie się, że jest to głos tej postaci, to zupełnie inna sprawa”
Carey dodaje. „Mamy więc techniki, których używamy do ich tworzenia wyświetla monit, aby znak był dobrze zdefiniowany dla GPT-3.” Przyznaje, że zespół wkłada wiele wysiłku w to, aby GPT-3 rozumiał głos postaci i pozostawał w zakresie możliwych reakcji postaci. Musieli także unikać pozwalania uczestnikom na wpływanie na postać, ponieważ GPT-3 może wychwytywać subtelne sygnały. Carey wyjaśnia, że jeśli Lucy wchodzi w interakcję z osobą dorosłą, „będzie to po prostu współgrało z atmosferą, ale [jeśli] Lucy jest ośmiolatką, może wyczuć bardziej dorosłą atmosferę od uczestnika i przekazać ją z powrotem do nich. Ale tak naprawdę chcemy, żeby [Lucy] mówiła głosem ośmioletniego dziecka”. Przekonanie OpenAI, aby pozwoliło Fable na tworzenie wirtualnych istot za pomocą GPT-3, wymagało trochę wysiłku. „Byliśmy bardzo zainteresowani tym, aby nasi bohaterowie rozmawiali z ludźmi jak postacie” – mówi Carey. „Możesz sobie wyobrazić, że może to być jeden z ich problematycznych obszarów, prawda? [To] z pewnością może potencjalnie zostać nikczemnie wykorzystane przez kogoś udającego człowieka”. Zespoły Fable Studio i OpenAI spędziły trochę czasu na opracowywaniu różnic między tworzeniem realistycznych postaci a podszywanie się pod ludzi, zanim OpenAI zatwierdziło przypadek użycia Fable. OpenAI miało jeszcze jeden wymóg: zespół Fable musiał na bieżąco informować człowieka o wszelkich eksperymentach narracyjnych, podczas których wirtualna istota udawała „prawdziwą” przed publicznością. Zdaniem Careya, zapewnienie działania GPT-3 w środowisku przeznaczonym dla tysięcy ludzi było wyzwaniem. Mimo to nadal uważa, że duże modele językowe będą dobrodziejstwem, „nawet jeśli będą przeznaczone do wstępnego tworzenia treści lub, w bardziej wyrozumiałych obszarach, jeśli będą używane „na żywo” i bez ograniczeń”. Carey wierzy, że tworzenie GPT-3 najlepiej sprawdza się jako narzędzie współpracy w rękach osoby, która zna sztukę opowiadania historii i chciałaby uzyskać lepsze wyniki, zamiast oczekiwać, że GPT-3 wykona całą pracę. Jeśli chodzi o koszty, wyzwaniem, jakie widzi w przypadku użycia opowiadania historii, jest to, że przy każdym żądaniu API, aby zachować spójność GPT-3 z rozwijającą się historią, należy „podać wszystkie szczegóły i wygenerować coś, co do tego doda. Zatem za wygenerowanie kilku linii pobierana jest opłata za cały zestaw tokenów. To może być wyzwanie.” Jak Fable Studio rozwiązało kwestię cen? Studiu udało się tego w dużej mierze uniknąć, głównie dzięki eksperymentom z pregeneracją, podczas której „wstępnie generujesz kilka opcji, a następnie możesz skorzystać z wyszukiwania, aby znaleźć odpowiednią opcję, aby odpowiedzieć” – mówi Carey. Znaleźli także sposób na zmniejszenie liczby użytkowników API: zamiast zapewniać dużą publiczność wchodzącą w interakcję z Lucy za pośrednictwem sztucznej inteligencji, „w pewnym sensie przeszliśmy do modelu, w którym Lucy faktycznie prowadzi rozmowę jeden na jeden, ale w strumień na Twitchu.” Widzowie oglądają za pośrednictwem Twitcha, zamiast wykonywać połączenia API, co łagodzi problemy z przepustowością, ogranicza liczbę osób, z którymi Lucy wchodzi w interakcję w danym momencie, i poszerza grono odbiorców. Saatchi wspomina plotkę, że GPT-4 bada przestrzenne rozumienie przestrzeni wirtualnych, które jego zdaniem mają większy potencjał niż chatboty wyłącznie językowe. Radzi osobom badającym ten przypadek użycia, aby skupiły się na tworzeniu postaci w wirtualnych światach. Saatchi zauważa, że Replika, firma, która stworzyła postać wirtualnego przyjaciela AI, obecnie bada możliwość rozszerzenia się na metaświat, w którym wirtualne istoty będą miały własne mieszkania i będą mogły spotykać się i wchodzić w interakcje ze sobą, a także ostatecznie z ludźmi. „Chodzi o to, aby postać sprawiała wrażenie żywej, a GPT-3 jest jednym z wielu narzędzi. Potencjalnie umożliwienie wirtualnym istotom prawdziwego zrozumienia przestrzeni, po których się poruszają, mogłoby odblokować możliwość uczenia się tych postaci”. Co nas czeka? Carey widzi miejsce dla przyszłych iteracji GPT-3 w budowaniu metaświata, równoległej rzeczywistości cyfrowej, w której ludzie mogą wchodzić w interakcje i wykonywać czynności tak swobodnie, jak w prawdziwym świecie. Wyobraża sobie, że będzie to generować pomysły i mieć na oku człowieka, który będzie ich kuratorem. Saatchi uważa, że zmniejszenie nacisku na język jako jedyny sposób interakcji może potencjalnie stworzyć bardziej interesujące i wyrafinowane interakcje ze sztuczną inteligencją. „Naprawdę uważam, że przestrzenie 3D dają nam możliwość zrozumienia przestrzeni przestrzennej przez sztuczną inteligencję” – kontynuuje. Metawersum, które Saatchi przewiduje, daje AI możliwość poruszania się i eksploracji, a ludziom daje możliwość stania się częścią pętli i pomagania w szkoleniu wirtualnych istot. Dochodzi do wniosku, że potrzebujemy radykalnie nowego myślenia i że metaświat oferuje znaczne możliwości umieszczania postaci AI w przestrzeniach 3D i „pozwalania im na symulowane życie z ludźmi, pomagającymi postaciom się rozwijać”.