Klasyfikacja

Klasyfikacja (z łac. classis „klasa” i facere „zrobić”) nazywana jest grupowaniem przedmiotów w klasy (grupy, zbiory , kategorie), które razem tworzą klasyfikację .

Klasyfikacja wymaga albo abstrakcji, albo utworzenia struktury wielowarstwowej: kompleksu (patrz złożoność ). - W semiotyce te dwie metody nazywa się „budowaniem klas” i „ superacją budowania złożonych ”.

Klasyfikacja zachodzi we wszystkich dziedzinach myśli ; jednak w filozofii , psychologii , etnologii i innych naukach antropologicznych zamiast tego używa się terminu „ kategoryzacja ”. Oznacza to elementarną zdolność do intuicyjnego sortowania różnych bytów (obiektów, istot żywych, procesów, abstraktów) i podporządkowywania ich odpowiednim terminom zbiorowym (kategorie).

„Klasyfikacja” natomiast oznacza celowo zaplanowany porządek wiedzy w kontekście konkretnego rozważania według obiektywnych, jednolitych kryteriów (często matematycznych , przyrodniczych i technicznych ).

Ponieważ tylko klasyfikacja rzeczywistym informacji umożliwia prawidłowe przetwarzanie, klasyfikacja jest również centralnym składnikiem wielu informatycznych aplikacji, na przykład B. w rozpoznawaniu wzorców .

W klasyfikacji, może to przez błędy w podejściu i / lub właściwości tych obiektów powinny być klasyfikowane do błędnych decyzji, tzw. Wadliwy lub fałszywe klasyfikacje przyjść. Aby wskazać, jak bardzo jesteś pewny swojego zadania, zaleca się, aby przy każdej decyzji dołączać informacje o jego rzetelności.

Określenie warunków

Ta sekcja zawiera przegląd między-artykułowy najważniejszych terminów związanych z klasyfikacją.

Terminy klasyfikacyjne są często używane nieprecyzyjnie lub nawet niepoprawnie, chociaż większość ma jasno określone znaczenie. Zamieszanie językowe potęguje fakt, że niektóre pojęcia mają wiele nazw:

  • Klasyfikacja: proces tworzenia granic klas
  • Klasa lub kategoria: Klasa to grupa rzeczy, które spełniają szereg warunków. Klasa składa się na ogół z rzeczy, które są takie same lub podobne pod względem ich cech .
  • Granice klas, granice decyzyjne: Aby zdecydować, do której klasy należy obiekt, granice klas - rzadziej nazywane również granicami decyzyjnymi - są rysowane między klasami. Obiekt należy do klasy, jeśli mieści się w jej granicach.
  • Klasyfikacja, system klas, systematyka: Całość wszystkich klas tworzy klasyfikację , zwaną także systemem klas lub systematyką. Często używane klasyfikacje specjalne często mają swoje własne nazwy: tezaurus , ontologia , indeks , taksonomia , typologia . Klasyfikacja jest końcowym produktem klasyfikacji; najczęściej jednak nie dokonuje się rozróżnienia, a klasyfikacja i klasyfikacja są używane zamiennie.
  • Klasyfikacja: Podczas gdy granice klas są tworzone po raz pierwszy podczas klasyfikacji, klasyfikacja przypisuje obiekty do istniejącego systemu klas. Rozróżnienie między klasyfikacją a klasyfikacją jest raczej teoretyczne; Potoczny niemiecki i inne języki łączą oba podejścia pod pojęciem klasyfikacji.
  • Kategoryzacja: Klasyfikacja i kategoryzacja są zasadniczo takie same, ale „klasyfikacja” obejmuje matematykę i technologię, a „kategoryzacja” obejmuje psychologię i znaczenie. Kategoryzacja może również obejmować definiowanie klas.
  • Klasyfikator, klasyfikator: Klasyfikator to nazwa podmiotu, który przeprowadza klasyfikację lub klasyfikację.
  • Procedura klasyfikacyjna: Procedura klasyfikacyjna określa procedurę klasyfikatora. Często nie dokonuje się rozróżnienia między klasyfikatorem a procedurą klasyfikacji.
  • Ocena klasyfikatora : jakość klasyfikacji przez klasyfikatora lub metodę klasyfikacji można ocenić za pomocą środków statystycznych.

oznaczający

Klasyfikacja jest podstawowym i uniwersalnym procesem, na którym zbudowane są niezliczone, bardziej złożone procesy. Nawet najprostsze organizmy potrafią podzielić bodźce ze świata zewnętrznego na klasy takie jak „niebezpieczne” i „nieszkodliwe” czy „jadalne” i „niejadalne” oraz odróżnić ważne od nieważnego . W żywych istotach z układem nerwowym wstępną klasyfikację wykonuje neuron, który „ decyduje ”, czy bodziec jest podprogowy i ignorowany, czy też jest podprogowy i jest dalej przetwarzany.

Ludzie dzielą dźwięki, które słyszą, na słowa i kształty, które widzą, na litery i symbole; Klasyfikacja jest podstawą wszelkiego zrozumienia. Umiejętność klasyfikowania jest warunkiem wstępnym tworzenia pojęć, a tym samym ostatecznie inteligencji. Artykuł Kategoryzacja (nauka kognitywna) przygląda się bliżej temu kompleksowi znaczeń klasyfikacji.

Klasyfikację automatyczną stosuje się w wielu technikach. Na przykład klasyfikatorzy oceniają produkty na liniach montażowych jako „dopuszczalne” lub „niezadowalające” lub obrazy tomografii komputerowej jako „guz” lub „nieszkodliwe”. Klasyfikacja ma również kluczowe znaczenie dla sztucznej inteligencji.

Podstawowym filozoficznym przeciwstawieniem logiki klasyfikacji lub logiki subsumpcji jest procedura logiki dialektycznej .

metoda

Rozróżnia się podejście odgórne i oddolne.

Z góry na dół

W podejściu odgórnym proces klasyfikacji składa się z trzech pojedynczych kroków:

  1. Określ klasy
  2. Wybierz funkcje
  3. Narysuj granice klas

Charakterystyczne dla klasyfikacji jest to, że określona jest stała liczba klas celów, a jedyne, co ma znaczenie, to określenie ich granic. Formacja kategorii odpowiada za określenie ilości i rodzaju zajęć .

Wybór znaczących cech jest niezbędny dla powodzenia klasyfikacji, ponieważ liczba wymaganych obserwacji rośnie wykładniczo wraz ze wzrostem liczby cech. W praktyce jednak liczba obserwacji jest stała, w wyniku czego od pewnego momentu jakość klasyfikatora ponownie spada wraz z dodatkowymi cechami (patrz też overfitting ).

W przypadku klasyfikacji ważne jest zatem określenie decydujących cech. Stosuje się do tego różne metody:

Procesy różnią się stopniem skomplikowania i w zależności od zastosowania dają zadowalające wyniki, a wybór cech może być konieczny, jeśli wybór nie został dokonany prawidłowo. Mniej ważne cechy mogą również odgrywać decydującą rolę w klasyfikacji w połączeniu z niektórymi innymi cechami, tak że nie można wybrać zbyt małej ilości cech.

Równie ważny jest wybór odpowiedniej metody klasyfikacji i wydajnego klasyfikatora.

Od dołu do góry

Proces ten często odbywa się nieświadomie, na przykład wraz z przyswajaniem pierwszego języka z jego konceptualnym formowaniem. Wilhelm Kamlah formułuje:

„Z jednej strony język stara się dostosować do świata i jego imponującej struktury, z drugiej zaś najpierw nadaje światu strukturę… Ale że istnieje świat, który jest już nam znajomy, w którym zawsze -nowa jednostka to w większości przypadek tego, co już znane Spotkanie w ogóle nie tłumaczy się językiem, ale faktem, że w samym świecie powtarza się to samo...”

- Propedeutyka logiczna. Przedszkole Rozsądnego Mowy

kłopot

Podczas klasyfikacji mogą pojawić się następujące trudności:

Nieczyste kryteria

Jeżeli warunki, kiedy przedmiot należy do klasy, a kiedy nie, nie są jasno określone, zaklasyfikowanie przedmiotu staje się trudne lub wręcz niemożliwe. Zdarza się to dość często w codziennym posługiwaniu się klasyfikacją: Jakie kryteria odróżniają dobro od zła? Jakie są warunki, które odróżniają muzykę rockową od jazzu? Jednoznaczna klasyfikacja wymaga jasno sformułowanych i obiektywnie mierzalnych kryteriów. Aby uzyskać jasne sformułowanie, zwykle używa się matematyki.

Zła charakterystyka

Klasyfikowanie obiektów w klasach jest możliwe tylko wtedy, gdy rozważane cechy rzeczywiście umożliwiają rozróżnienie klas. Na przykład nie jest możliwe zaklasyfikowanie żywych istot do klasy ludzi i małp na podstawie ich koloru włosów; kolor włosów generalnie nie wskazuje na klasę żywej istoty.

Płynne przejścia

Płynne przejścia między klasami są sprzeczne z ideą ostrych granic klas. Na przykład bardzo trudno jest zdefiniować granice klas klasy czerwonej w spektrum kolorów. Aby umożliwić klasyfikację, można sztucznie wprowadzić ostrą linię podziału. Zamiast tego, również za pomocą logiki rozmytej operuje na tych zbiorach rozmytych i podejmuje się ostrą decyzję przez defuzzification. Aby uzyskać płynne przejścia w obszarze języka, zobacz Rozmycie (język) .

Nierozdzielność

Nierozłączność występuje głównie wtedy, gdy bierze się pod uwagę zbyt mało lub bezsensowne cechy. Z tego punktu widzenia obiekty wydają się pomieszane, a wyraźne rozdzielenie wydaje się niemożliwe. Jeśli chcesz odróżnić jabłka od pomarańczy na podstawie koloru, wielkości i wagi, wiele jabłek i pomarańczy może być tak podobnych pod względem tych cech, że wyraźne oddzielenie jest prawie niemożliwe. Chociaż cechy są znaczące, pozostaje szara strefa, w której decyzja jest niepewna.

Uciec

Nieprzewidywalne błędy pomiarowe lub wyjątkowo wyraźne pojedyncze próbki mogą prowadzić do nieprawidłowej klasyfikacji obiektu.

Pozostałe obiekty

Na końcu klasyfikacji może pozostać grupa obiektów szczątkowych, które nie mieszczą się w żadnej z istniejących klas i dla których nie można łatwo stworzyć nowej klasy, która nie spowodowałaby niespójności całego systemu klasyfikacji. Następnie dla tych obiektów należy ustawić niezadowalającą kategorię rezydualną .

Wiarygodność decyzji (zaufanie)

Nawet jeśli znane są wszystkie cechy przedmiotu, w pewnych okolicznościach może on zostać błędnie sklasyfikowany (chyba że za cechę uważa się samą klasę). Na przykład orzech laskowy byłby zwykle klasyfikowany jako nieszkodliwy, chociaż może zabić alergików, a po wystrzeleniu z procy staje się niebezpiecznym pociskiem. Z drugiej strony nie każde zdjęcie rentgenowskie jest prawidłowo klasyfikowane jako chore lub nie, ponieważ treść obrazu może nie pozwalać na wyciągnięcie jakichkolwiek wniosków na temat klasy. Jeśli decyzja jest wymuszona – a tak jest zwykle w przypadku klasyfikacji – klasyfikacja może stać się dyskusyjna lub nawet błędna w wyniku takich skutków.

Z tego powodu nowoczesne klasyfikatory wypisują wartość dodatkowo do każdej decyzji, która wskazuje na wiarygodność (pewność) podjętej decyzji. Miara ta jest powszechnie nazywana informacją o niezawodności. Duży, czerwony pomidor zostałby sklasyfikowany jako „dojrzały” z wysoką niezawodnością, średniej wielkości czerwony pomidor z kilkoma zielonymi obszarami zostałby również sklasyfikowany jako „dojrzały”, ale z niższą niezawodnością. Wskazanie wiarygodności decyzji daje korzyści w przetwarzaniu następującym po klasyfikacji. Grzyb uznany za „niebezpieczny” jako jadalny nie zostanie zjedzony, podczas gdy „pewny” uznany za jadalny będzie.

W scenariuszach, w których nieprawidłowa klasyfikacja ma poważniejsze wady niż brak, sensowne może być również wprowadzenie dodatkowej klasy „niemożliwy do zaklasyfikowania”.

Reprezentacje klasyfikacyjne

Zobacz też

linki internetowe

Wikisłownik: Klasyfikacja  - wyjaśnienia znaczeń, pochodzenie słów, synonimy, tłumaczenia
Wikisłownik: klasyfikacja  - wyjaśnienia znaczeń, pochodzenie słów, synonimy, tłumaczenia

Indywidualne dowody

  1. ^ Hans Uszkoreit i Brigitte Jörg: Informatyka i systemy informacyjne. Notatki z wykładów, specjalizacja językoznawstwo ogólne, Saarland University.
  2. Hardwin Jungclaussen: Informatyka przyczynowa: Wprowadzenie do nauczania aktywnego modelowania językowego przez ludzi i komputery , Springer Fachmedien Wiesbaden , 2001, ISBN 978-3-322-81220-9 , s. 57 [1]