OCR jest wykonywany na obszarze tablicy rejestracyjnej wykrytym w poprzednim kroku. Odbywa się to poprzez zdefiniowanie opcji Tesseract ANPR, w tym białej listy znaków OCR i trybu segmentacji strony. Za pomocą operacji morfologicznych OpenCV i przetwarzania konturów do tablicy rejestracyjnej jest identyfikowany i generowany jest czysty obraz, który jest przesyłany jako dane wejściowe do następnego modułu, aby przesłać go przez silnik Tesseract OCR. Metoda segmentacji strony jest realizowana poprzez ustawienie trybu działania tak, aby obraz traktował jako pojedynczą linię tekstu. Jest to ustawienie, które wskazuje na analizę układu obrazów i dokumentów. Biała lista to lista postaci branych pod uwagę przez Tesseract. Metoda OCR zajmuje trzy kanały kolorowego obrazu z tabliczką rejestracyjną, tryb pracy PSM i zmienną flagową weryfikującą konieczność oczyszczenia konturów stykających się z granicami tablicy rejestracyjnej. Ustawiając opcje PyTesseract wykonuje się OCR . Podsumowując, wdrożenie systemu ANPR można przeprowadzić w następujących krokach:
- Załaduj obraz wejściowy z dysku
- Znajdź tablicę rejestracyjną na obrazie wejściowym
- OCR tablicę rejestracyjną
- Wyświetl wynik ANPR na naszym ekranie i przechowuj go w bazie danych w czasie rzeczywistym w celu dalszego przetwarzania
Wyniki systemu ANPR są poprawiane poprzez wyczyszczenie granicy (wyczyszczenie pikseli pierwszego planu, które dotykają granic tablicy rejestracyjnej). Wyniki są uzyskiwane z systemu ANPR przy użyciu OpenCV. Obraz na rysunku przedstawia kilka pomyślnych wyników uzyskanych z algorytmu ANPR do wykrywania liczb przy użyciu Python, OpenCV i Tesseract OCR do implementacji każdego modułu. Jednak system jest bardzo wrażliwy na niektóre warunki i ma wiele błędnych prognoz – w tym przypadku pozwolenie postaci na dotykanie krawędzi obrazu powoduje zaszumienie danych wejściowych do Tesseract OCR, co prowadzi do mniejszej dokładności. Wynika to głównie z ilości założeń przyjętych podczas budowy systemu.