AI : Technologie, Aplikacje i Wyzwania : Technologie i ich definicje

https://aie24.pl/

Intencją proponowanego systemu jest wykorzystanie niektórych wbudowanych pakietów do wdrożenia niektórych tradycyjnych technik przetwarzania obrazu z naciskiem na operacje morfologiczne w celu identyfikacji konturu z tablicą rejestracyjną. Ta sekcja jest przeznaczona dla czytelników, którzy nie mają jasnego pojęcia o definicjach/celach niektórych bibliotek i technologii.

(a) Optyczne rozpoznawanie znaków: OCR to elektroniczna lub mechaniczna konwersja obrazów tekstu pisanego na maszynie, odręcznie lub drukowanego na tekst zakodowany maszynowo, z zeskanowanego dokumentu, zdjęcia dokumentu, zdjęcia sceny (na przykład tekst na znakach i billboardach na zdjęciu poziomym) lub z tekstu napisów nałożonych na obraz. Jest to powszechna metoda digitalizacji tekstów drukowanych, dzięki czemu można je elektronicznie edytować, przeszukiwać, przechowywać w bardziej zwarty sposób, wyświetlać online i wykorzystywać w procesach maszynowych, takich jak przetwarzanie kognitywne, tłumaczenie maszynowe, (wyodrębnione) zamiana tekstu na mowę i kluczowanie. eksploracja danych i tekstu. OCR to dziedzina badań nad rozpoznawaniem wzorców, sztuczną inteligencją i widzeniem komputerowym.

(b) OpenCV: OpenCV to biblioteka Pythona zaprojektowana do rozwiązywania problemów z widzeniem komputerowym. Jest to biblioteka funkcji programistycznych ukierunkowanych głównie na widzenie komputerowe w czasie rzeczywistym. Obsługuje wysoce ulepszone moduły głębokiego uczenia. Obsługuje również kilka platform uczenia głębokiego, w tym Caffe, TensorFlow i Torch/PyTorch. Obsługuje interfejsy API do używania wstępnie wytrenowanych modeli uczenia głębokiego, które są zgodne z wieloma językami, takimi jak C++, API i Python.

(c) Tesseract: Tesseract to mechanizm optycznego rozpoznawania znaków typu open source i program wiersza poleceń. Jest wydany na licencji Apache. W najnowszej wersji Tesseract większy nacisk położono na rozpoznawanie linii; jednak nadal obsługuje starszy silnik Tesseract OCR, który rozpoznaje wzorce znaków. Może być używany bezpośrednio lub (dla programistów) za pomocą interfejsu API do wyodrębniania drukowanego tekstu z obrazów. Obsługuje szeroką gamę języków. Tesseract nie ma wbudowanego GUI, ale jest kilka dostępnych od zewnętrznych dostawców.

(d) Sieci neuronowe: Sieci neuronowe wykorzystują neurony do przesyłania danych w postaci wartości wejściowych i wyjściowych poprzez połączenia. Są one luźno modelowane na ścieżkach neuronalnych w ludzkim mózgu, aby poznać przydatne funkcje.

(e) Splotowa sieć neuronowa: Jest to architektura warstwowa, w której każdy węzeł sieci (punkt połączenia) ma możliwość przetwarzania danych wejściowych i przekazywania danych wyjściowych do innych węzłów w sieci.

Post Views: 49

Dodaj komentarz Anuluj pisanie odpowiedzi