AI : Technologie, Aplikacje i Wyzwania : Wyniki i dyskusja

Zoptymalizowany klasyfikator RF został przeanalizowany zarówno przy użyciu oryginalnego zestawu danych testu treningowego (TF), jak i testu treningowego o zmniejszonej wymiarowości zbioru danych (TS). W każdym wykonaniu model RF może wybrać najlepsze cechy predykcyjne poprzez losowy wybór cech podczas każdego podziału węzła. Model RF został skalibrowany z optymalnym podzbiorem cech o wielkości m, dla którego jest on najwyższy w stosunku do najniższej wartości błędu worka przy minimalnym R w danym teście. Zaobserwowano, że wydajność zoptymalizowanego klasyfikatora RF znacznie się poprawiła w zestawie danych TS w porównaniu z oryginalnym zestawem danych TF , mimo że model został skalibrowany z obydwoma zestawami danych. Osiągnął ogólną dokładność OA = 9,45% przy P = 0,96, i ROC = 0,98, gdy model został przeszkolony przy użyciu zestawu danych TS. Wydajność obliczeniowa klasyfikatora RF została również zwiększona dzięki optymalnemu podzbiorowi cech m = 8 niż oryginalna pierwotna liczba cech m = 147. Zbudowanie modelu uczącego zajęło tylko 6,09 s. Dla zbioru danych TF model został skalibrowany z m = 11, co również poprawia wydajność klasyfikatora RF z oryginalnymi danymi z pełnym zestawem funkcji. Wydajność zoptymalizowanego klasyfikatora RF jest porównywana z trzema innymi potężnymi klasyfikatorami; perceptron wielowarstwowy (MLP), maszyna wektorów pomocniczych (SVM) i las rotacji.. Zaobserwowano, że ogólna wydajność wszystkich klasyfikatorów jest zwiększona, gdy zostały one przeszkolone za pomocą zestawu danych TS. Zoptymalizowany klasyfikator RF przewyższał wszystkie inne klasyfikatory zarówno dla zestawów danych TF, jak i TS. Dla porównania zarówno klasyfikatory lasu rotacji, jak i klasyfikatory SVM również wykazały zadowalający wynik niż MLP. Mocną stroną zoptymalizowanego klasyfikatora RF jest to, że obniża on koszty obliczeniowe, ponieważ wyszukuje losowo najlepszą cechę z już wybranego optymalnego podzbioru cech, a nie z całego zestawu cech. Umożliwia to również osiągnięcie wyższej wydajności w przypadkach, w których zestawy danych są powiązane z szumem lub dodatkowymi funkcjami. Wybór odpowiedniego rozmiaru klasyfikatora RF jest ważny, ponieważ decyduje o wydajności zarówno dokładności, jak i kosztów obliczeniowych. Studium przypadku zademonstrowane na hiperspektralnym zestawie danych ROSIS-3 przy użyciu zoptymalizowanego klasyfikatora RF zostało uznane za charakterystycznie lepsze i skuteczne pod względem dokładności predykcyjnej i czasu wykonania

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *