https://aie24.pl/
Aby rozpocząć dostosowywanie GPT-3, wystarczy uruchomić jedno polecenie w narzędziu wiersza poleceń OpenAI z dostarczonym plikiem. Twoja niestandardowa wersja rozpocznie szkolenie i będzie natychmiast dostępna w interfejsie API OpenAI. Na bardzo wysokim poziomie dostosowywanie GPT-3 do Twojej aplikacji obejmuje następujące trzy kroki:
* Przygotuj nowe dane treningowe i prześlij je na serwer OpenAI
* Dostosuj istniejące modele za pomocą nowych danych szkoleniowych
* Użyj dopracowanego modelu
Przygotuj i prześlij dane szkoleniowe
Dane szkoleniowe są tym, co model przyjmuje jako dane wejściowe do dostrajania. Twoje dane szkoleniowe muszą być dokumentem JSONL, gdzie każda linia jest parą podpowiedzi odpowiadającą przykładowi szkoleniowemu. W celu doprecyzowania modelu możesz podać dowolną liczbę przykładów. Zdecydowanie zaleca się utworzenie zbioru danych ukierunkowanego na wartości (który zdefiniujemy i omówimy w rozdziale 6), aby zapewnić modelowi dane wysokiej jakości i szeroką reprezentację. Dostrajanie poprawia wydajność dzięki większej liczbie przykładów, więc im więcej przykładów podasz, tym lepszy wynik. Twój dokument JSONL powinien wyglądać mniej więcej tak:
{“prompt”: “prompt text”, “completion”: “ideal generated text”}
{“prompt”: “prompt text”, “completion”: “ideal generated text”}
{“prompt”: “prompt text”, “completion”: “ideal generated text”}
…
Gdzie tekst podpowiedzi powinien zawierać dokładny tekst podpowiedzi, który chcesz wypełnić, a idealnie wygenerowany tekst powinien zawierać przykład żądanego tekstu uzupełnienia, który ma zostać wygenerowany przez GPT-3. Możesz użyć narzędzia do przygotowywania danych CLI OpenAI, aby łatwo przekonwertować dane do tego formatu pliku. Narzędzie do przygotowywania danych CLI akceptuje pliki w różnych formatach; jedynym wymaganiem jest to, aby zawierały zachętę i kolumnę/klucz zakończenia. Możesz przekazać plik CSV, TSV, XLSX, JSON lub JSONL, a narzędzie zapisze dane wyjściowe w pliku JSONL gotowym do dostrojenia. Aby to zrobić, użyj następującego polecenia:
openai tools fine_tunes.prepare_data -f LOCAL_FILE
Gdzie LOCAL_FILE to plik przygotowany do konwersji.