Rozpoznawanie mowy

https://aie24.pl/

Rozpoznawanie mowy to interdyscyplinarna dziedzina wchodząca w zakres lingwistyki obliczeniowej, która zostanie wykorzystana w opracowywaniu metodologii i technik, które pomogą maszynom rozpoznawać i tłumaczyć język mówiony na tekst. Nazywa się to również komputerowym rozpoznawaniem mowy, zamianą mowy na tekst (STT) lub automatycznym rozpoznawaniem mowy (ASR). Rozpoznawanie mowy obejmie wiedzę i badania potrzebne w informatyce, językoznawstwie i elektrotechnice. Niektóre systemy będą wymagały odbycia szkolenia, podczas którego osoba mówiąca będzie czytać słownictwo lub tekst w systemie. Głos danej osoby zostanie następnie przeanalizowany przez system i wykorzystany do dostrojenia rozpoznawania mowy tej osoby, co pomoże zwiększyć dokładność. System zależny od mówcy wykorzystuje szkolenie, podczas gdy system niezależny od mówcy nie wymaga szkolenia. Zastosowania do rozpoznawania mowy będą obejmować wybieranie głosowe, przekierowywanie połączeń, proste wprowadzanie danych, określanie cech mówiącego, samolot, przetwarzanie mowy na tekst, przygotowywanie dokumentów strukturalnych i wyszukiwanie sterowania urządzeniami domotycznymi. Termin rozpoznawanie głosu odnosi się do identyfikacji mówiącego, a nie do tego, co mówi. Dzięki rozpoznaniu mówcy zadanie tłumaczenia w systemach zostanie uproszczone. Jeśli spojrzeć na rozpoznawanie mowy z technologicznego punktu widzenia, ma ono długą historię z wieloma falami innowacji. Jedną z najnowszych fal jest wykorzystanie dużych zbiorów danych i głębokiego uczenia się. Postęp ten można dostrzec nie tylko w związku z dużą liczbą opublikowanych artykułów akademickich, ale także w przyjęciu przez światowy przemysł różnych metod głębokiego uczenia się, które są stosowane przy projektowaniu i wdrażaniu systemów rozpoznawania mowy. Tę innowację można zobaczyć w firmach takich jak SoundHound, Microsoft, IBM, Amazon i Apple.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *