Rozpoznawanie wzorców

Rozpoznawanie wzorców ( Rozpoznawanie wzorców ) to zdolność rozpoznawania zestawu prawidłowości danych, powtórzeń, podobieństw lub prawidłowości. Ta cecha wyższych systemów poznawczych jest badana pod kątem ludzkiej percepcji przez nauki kognitywne, takie jak psychologia percepcyjna , podczas gdy w przypadku maszyn jest badana przez informatykę .

Typowe przykłady niezliczonych obszarów zastosowań są rozpoznawanie mowy , rozpoznawanie tekstu i rozpoznawania twarzy , zadania, że ludzka percepcja robi stale i oczywiście bez wysiłku. Jednak elementarna umiejętność klasyfikacji jest również kamieniem węgielnym tworzenia pojęć , abstrakcji i (indukcyjnego) myślenia, a tym samym ostatecznie inteligencji , tak więc rozpoznawanie wzorców ma również kluczowe znaczenie w bardziej ogólnych obszarach, takich jak sztuczna inteligencja lub eksploracja danych .

Rozpoznawanie wzorców u ludzi

Ta umiejętność porządkuje początkowo chaotyczny przepływ percepcji zmysłowej . Zdecydowanie najlepiej zbadano rozpoznawanie wzorców w percepcji wzrokowej . Ich najważniejszym zadaniem jest identyfikacja (i późniejsza klasyfikacja) obiektów w świecie zewnętrznym (patrz rozpoznawanie obiektów ).

W psychologii percepcyjnej rozróżnia się dwa główne podejścia do wyjaśniania rozpoznawania wzorców: „ teorie szablonów ” i „ teorie cech ”. Teorie szablonowe zakładają, że postrzegane obiekty są porównywane z obiektami już przechowywanymi w pamięci długotrwałej , podczas gdy teorie cech opierają się na założeniu, że postrzegane obiekty są analizowane i identyfikowane za pomocą ich „komponentów”. Dwie najbardziej rozbudowane teorie cech to „Teoria obliczeniowa” Davida Marra i teoria elementów geometrycznych („Geony”) Irvinga Biedermana .

Rozpoznawanie wzorców w informatyce

Informatyka bada procesy, które automatycznie klasyfikują mierzone sygnały w kategorie. Centralnym punktem jest rozpoznanie wzorców , cech wspólnych wszystkim rzeczom w kategorii i odróżniających je od treści innych kategorii. Procesy rozpoznawania wzorców umożliwiają komputerom, robotom i innym maszynom przetwarzanie mniej precyzyjnych sygnałów ze środowiska naturalnego zamiast precyzyjnych danych wejściowych.

Pierwsze systematyczne podejście badawcze do rozpoznawania wzorców pojawiło się w połowie lat pięćdziesiątych XX wieku z chęcią sortowania przesyłek pocztowych według maszyn, a nie ręcznie. Z biegiem czasu wyłoniły się trzy obecne grupy procesów rozpoznawania wzorców, obejmujące syntaktyczne , statystyczne i strukturalne rozpoznawanie wzorców. Eksploatacja maszyn wektorów nośnych i sztucznych sieci neuronowych była postrzegana jako przełom pod koniec lat 80. Chociaż wiele dzisiejszych standardowych procedur zostało odkrytych bardzo wcześnie, nadawały się one do codziennego użytku dopiero po znacznych udoskonaleniach metodologicznych i ogólnym wzroście wydajności komputerów dostępnych na rynku.

podejścia

Obecnie rozróżnia się trzy podstawowe podejścia do rozpoznawania wzorców: rozpoznawanie wzorców syntaktycznych, statystycznych i strukturalnych. Chociaż opierają się na różnych pomysłach, po bliższym przyjrzeniu się dostrzeżemy podobieństwa, które idą tak daleko, że metoda jednej grupy może zostać przeniesiona do metody innej grupy bez większego wysiłku. Spośród trzech podejść rozpoznawanie wzorców składniowych jest najstarsze, statystyczne - najpowszechniej używane, a strukturalne - najbardziej obiecujące na przyszłość.

Składniowo

Celem rozpoznawania wzorców składniowych jest opisanie rzeczy za pomocą symboli w taki sposób, aby obiekty należące do tej samej kategorii miały takie same opisy. Jeśli chcesz oddzielić jabłka od bananów, możesz wprowadzić symbole dla czerwonego (R) i żółtego (G), a także wydłużonego (L) i kulistego (K); wszystkie jabłka byłyby wtedy opisane sekwencją symboli RK, a wszystkie banany słowem GL. W tym przypadku problem rozpoznawania wzorców jawi się jako poszukiwanie gramatyki formalnej , czyli zbioru symboli i reguł ich łączenia. Ponieważ zwykle nie jest możliwe łatwe przypisanie cechy do symbolu, stosowane są tutaj metody obliczania prawdopodobieństwa . Na przykład kolory występują w niezliczonych odcieniach, ale musisz dokładnie rozróżnić czerwony i żółty. W przypadku złożonych problemów rzeczywisty problem jest tylko opóźniony, a nie rozwiązany, dlatego podejście to poświęca się mało uwagi i jest stosowane tylko do bardzo jasnych zadań.

Statystycznie

Większość dzisiejszych standardowych metod należy do tego obszaru, w szczególności wspomniane powyżej maszyny wektorów nośnych i sztuczne sieci neuronowe. Celem jest tutaj określenie prawdopodobieństwa, że ​​obiekt należy do jednej lub drugiej kategorii i ostatecznie posortowanie go do kategorii o najwyższym prawdopodobieństwie. Zamiast oceniać cechy według gotowych reguł, są one tutaj po prostu mierzone jako wartości liczbowe i podsumowywane w tak zwanym wektorze cech . Następnie funkcja matematyczna jednoznacznie przypisuje kategorię do każdego możliwego wektora cech. Ogromną zaletą tych metod jest to, że można je zastosować w prawie wszystkich obszarach tematycznych i nie jest wymagana głębsza wiedza o wzajemnych powiązaniach.

Formalnie

Rozpoznawanie wzorców strukturalnych łączy różne procesy składniowe i / lub statystyczne w jeden nowy proces. Typowym przykładem jest rozpoznawanie twarzy, w którym różne metody klasyfikacji są stosowane dla różnych części twarzy, takich jak oczy i nos, z których każda określa tylko, czy poszukiwana część ciała jest obecna, czy nie. Nadrzędne procedury strukturalne, takie jak sieci bayesowskie, łączą te indywidualne wyniki i wykorzystują je do obliczenia wyniku ogólnego, przynależności do kategorii. Rozpoznawanie podstawowych cech pozostawia się ogólnym procesom statystycznym, podczas gdy procesy wnioskowania wyższego poziomu przynoszą szczególną wiedzę na ten temat. Procedury strukturalne są stosowane szczególnie w przypadku bardzo złożonych problemów, takich jak wykrywanie wspomagane komputerowo, diagnostyka medyczna wspomagana komputerowo.

Podetapy rozpoznawania wzorców

Proces rozpoznawania wzorców można podzielić na kilka podetapów, które rozpoczynają się od pozyskania, a na końcu określają klasyfikację. Podczas akwizycji dane lub sygnały są rejestrowane i digitalizowane za pomocą czujników . Wzorce uzyskuje się z przeważnie sygnałów analogowych , które można przedstawić matematycznie w wektorach , tzw. Wektorach cech i macierzach . Wstępne przetwarzanie ma na celu zmniejszenie ilości danych i poprawę jakości . Poprzez wyodrębnianie cech wzorce są w ekstrakcji cech, a następnie przekształcane w przestrzeń cech. Wymiar przestrzeni cech, w której wzory są teraz reprezentowane jako punkty, jest ograniczony do podstawowych cech podczas redukcji cech . Ostatnim kluczowym krokiem jest klasyfikacja przez klasyfikator , który przypisuje cechy do różnych klas . Metoda klasyfikacji może opierać się na procesie uczenia się na podstawie próby .

Schemat budowy systemu rozpoznawania wzorców

Zdobyć

Zobacz także : przetwarzanie sygnałów , pomiary , digitalizacja i technika pomiarowa

Przetwarzanie wstępne

Aby móc lepiej rozpoznawać wzorce, zwykle ma miejsce przetwarzanie wstępne. Usunięcie lub redukcja niechcianych lub nieistotnych składowych sygnału nie prowadzi do zmniejszenia ilości przetwarzanych danych; dzieje się tak tylko wtedy, gdy funkcja jest wyodrębniona. Możliwe metody przetwarzania wstępnego obejmują uśrednianie sygnału , zastosowanie wartości progowej i normalizację. Pożądanymi rezultatami wstępnego przetwarzania są redukcja szumów i mapowanie do jednolitego zakresu wartości.

Ekstrakcja cech

Po poprawieniu wzorca przez przetwarzanie wstępne, z jego sygnału można uzyskać różne cechy. Z reguły odbywa się to empirycznie zgodnie z procedurami zdobytymi dzięki intuicji i doświadczeniu, ponieważ istnieje niewiele procedur czysto analitycznych (np. Automatyczna synteza cech). To, które funkcje są istotne, zależy od danej aplikacji. Funkcje mogą składać się z symboli lub łańcuchów symboli lub można je uzyskać z różnych poziomów skali przy użyciu metod statystycznych . W metodach numerycznych rozróżnia się metody z zakresu pierwotnego i metody z zakresu widmowego . Możliwe funkcje to na przykład

Wykorzystując transformacje, takie jak dyskretna transformacja Fouriera (DFT) i dyskretna transformacja kosinusowa (DCT), oryginalne wartości sygnału można przenieść do łatwiejszej w zarządzaniu przestrzeni cech. Granice między metodami ekstrakcji cech i ich redukcji są płynne. Ponieważ pożądane jest uzyskanie jak najmniejszej liczby cech, ale tym bardziej znaczących, można wziąć pod uwagę takie związki, jak kowariancja i współczynnik korelacji między kilkoma cechami. Cechy mogą być dekorelowane z transformacją Karhunena-Loève'a ( transformacja osi głównej).

Redukcja funkcji

W celu zredukowania charakterystyk do tych, które są istotne dla klasyfikacji, sprawdza się, które właściwości są istotne dla podziału klas, a które można pominąć. Metodami redukcji cech są analiza wariancji , w której sprawdza się, czy jedna lub więcej cech ma separowalność, oraz analiza dyskryminacyjna , w której poprzez łączenie cech elementarnych powstaje najmniejsza możliwa liczba dających się oddzielić cech nieelementarnych.

Klasyfikacja

Ostatnim i niezbędnym krokiem rozpoznawania wzorców jest klasyfikacja cech na klasy. W tym celu stosuje się różne metody klasyfikacji .

Żywe istoty najczęściej używają sieci neuronowych do rozpoznawania wzorców w sygnałach naszych zmysłów . To podejście jest analizowane i naśladowane w bionice . Informatyka neuro wykazały, że sztuczne sieci neuronowe są możliwe uczenia i rozpoznawania skomplikowanych wzorów, również odbywa się w sposób pokazany powyżej bez pierwszej abstrakcji reguły.

Po klasyfikacji wzoru można podjąć próbę jego interpretacji. To jest przedmiotem analizy wzorców . W przetwarzaniu obrazu po klasyfikacji obrazów może następować tak zwane rozpoznawanie obrazu , czyli samo rozpoznanie obiektów na obrazie bez interpretowania lub analizowania relacji między tymi obiektami.

Zobacz też

literatura

  • Richard O. Duda, Peter E. Hart, David G. Stork: Klasyfikacja wzorców . Wiley, Nowy Jork 2001, ISBN 0-471-05669-3 .
  • J. Schuermann: Klasyfikacja wzorców - ujednolicony pogląd na podejście statystyczne i neuronowe . Wiley, Nowy Jork 1996, ISBN 0-471-13534-8 .
  • K. Fukunaga: Statystyczne rozpoznawanie wzorców . Academic Press, Nowy Jork 1991, ISBN 0-12-269851-7 .
  • M. Eysenck , M. Keane: Psychologia poznawcza . Psychology Press, Hove, 2000.
  • H. Niemann: Klasyfikacja wzorców . Springer, Berlin 1983, ISBN 3-540-12642-2 . ( online ).
  • Christopher M. Bishop: Rozpoznawanie wzorców i uczenie maszynowe . Springer, Berlin 2006, ISBN 0-387-31073-8 . ( online ).
  • Monique Pavel: Podstawy rozpoznawania wzorców . Wydanie 2. Dekker, Nowy Jork 1993, ISBN 0-824-78883-4 .

linki internetowe

Indywidualne dowody

  1. ^ E. Bruce Goldstein: Psychologia percepcyjna . Spektrum Akademischer Verlag, Heidelberg 2002, ISBN 3-8274-1083-5