GPT-3 jest wysoce zaawansowanym i wyrafinowanym następcą dziedziny NLP, zbudowanym i trenowanym przy użyciu podstawowych podejść NLP i głębokich sieci neuronowych. W przypadku każdego podejścia do modelowania opartego na sztucznej inteligencji wydajność modelu ocenia się w następujący sposób: najpierw trenujesz model pod kątem określonego zadania (takiego jak klasyfikacja, pytanie i odpowiedź, generowanie tekstu itp.) na danych szkoleniowych; następnie weryfikujesz wydajność modelu, korzystając z danych testowych (nowych, wcześniej niewidzianych danych). W podobny sposób istnieje standardowy zestaw testów porównawczych NLP służących do oceny wydajności modeli NLP i tworzenia względnego rankingu lub porównania modeli. To porównanie lub ranking względny pozwala wybrać najlepszy model dla konkretnego zadania NLP (problemu biznesowego). W tej sekcji omówimy wydajność GPT-3 w niektórych standardowych zadaniach NLP, jak pokazano na rysunku , i porównamy ją z wydajnością podobnych modeli w odpowiednich zadaniach NLP.