Rozpoznawanie obrazu

Rozpoznawanie obrazów ( angielska analiza obrazu ) to gałąź rozpoznawania wzorców i przetwarzania obrazu . W rozpoznawaniu obrazu próbuje się segmentować obiekty na obrazie . Jest im przypisany symboliczny opis, ale połączenia między obiektami nie są wyszukiwane, jak to zwykle ma miejsce w analizie wzorców .

definicja

Rozpoznawanie obrazu w kontekście przetwarzania obrazu to zdolność oprogramowania do identyfikowania obiektów, miejsc, ludzi, pism i działań na obrazach. Komputery mogą wykorzystywać technologie przetwarzania obrazu w połączeniu z kamerą i oprogramowaniem sztucznej inteligencji w celu uzyskania obiektów na obrazach.

Podczas gdy mózgi ludzi i zwierząt z łatwością rozpoznają przedmioty, komputery nadal mają trudności z takimi zadaniami. Oprogramowanie do rozpoznawania obrazów wymaga dogłębnego uczenia maszynowego . Procesory splotów sztucznych sieci neuronowych działają najlepiej, ponieważ określone zadanie w innym przypadku wymaga ogromnych zasobów sprzętowych ze względu na jego intensywny obliczeniowo charakter . Algorytmy rozpoznawania obrazu mogą działać za pomocą porównawczych modeli 3D , wyglądów pod różnymi kątami za pomocą rozpoznawania krawędzi lub poprzez komponenty. Takie algorytmy są często uczone maszynowo na milionach wstępnie oznakowanych obrazów .

Aplikacje

Istnieje niezliczona liczba obszarów zastosowań cyfrowego rozpoznawania obrazu:

  • Automatyczne oznaczanie i oznaczanie obiektów na obrazach w dużych bazach danych obrazów, np . B. na flickr.com lub Cloud Vision API od Google.
  • Rozpoznaj obrazy lub sekcje obrazów produktów multimedialnych i przypisz je do odpowiedniego produktu. Następnie można uzyskać informacje o produktach, na przykład informacje o zawartości, gatunek, przydział, krytyka, recenzje lub porównania cen.
  • rozpoznawanie twarzy
  • Sterowanie autonomicznymi robotami , autonomicznymi samochodami i systemami zapobiegania wypadkom.
  • Rozpoznawanie znaków rejestracyjnych w przemyśle. Elementy elektroniczne i znaki rejestracyjne są mierzone w celu uzyskania możliwie najdokładniejszego montażu.
  • Sortowanie i wykrywanie błędów, np. B. towarów masowych, obwodów drukowanych, druk zdjęć.
  • Obiektowa analiza obrazu OBIA jako metoda geografii
  • Automatyczne wykrywanie „nienormalnego zachowania” ludzi w strumieniach danych wideo z kamer monitoringu publicznego w celu zapobiegania przestępczości, zobacz kontrowersyjny projekt UE INDECT
  • Dzięki aplikacji TapTapSee osoby niewidome mogą robić zdjęcia swojego otoczenia. Następnie głos mówi to, co widać na obrazku. Na przykład osoby niewidome mogą poznać kolor części garderoby. Aplikacja jest bezpłatna, więc możesz samodzielnie przetestować tę technologię.

literatura

  • H. Niemann: Analiza i zrozumienie wzorców. Springer Series in Information Sciences, Berlin 1990
  • A. Pinz: Zrozumienie obrazów. Podręczniki informatyki, Springer-Verlag

linki internetowe

Indywidualne dowody

  1. TechTarget: rozpoznawanie obrazu
  2. Darmowa aplikacja pokazuje niewidomym świat chip.de.