Die Mustererkennung wird im Allgemeinen nach der Art des Lernverfahrens kategorisiert, das zum Generieren des Ausgabewerts verwendet wird. Überwachtes Lernen setzt voraus, dass eine Reihe von Trainingsdaten (der Schulungssatz) bereitgestellt wurde, die aus einer Reihe von Instanzen bestehen, die von Hand mit der richtigen Ausgabe ordnungsgemäß beschriftet wurden. Ein Lernverfahren generiert dann ein Modell, das versucht, zwei manchmal widersprüchliche Ziele zu erreichen: Führen Sie so gut wie möglich auf die Trainingsdaten, und verallgemeinern Sie so gut wie möglich auf neue Daten (in der Regel bedeutet dies, so einfach wie möglich zu sein, für eine technische Definition von “einfach”, in Übereinstimmung mit Occam Razor, unten besprochen). Unbeaufsichtigtes Lernen hingegen setzt Trainingsdaten voraus, die nicht von Hand beschriftet wurden, und versucht, inhärente Muster in den Daten zu finden, die dann verwendet werden können, um den richtigen Ausgabewert für neue Dateninstanzen zu bestimmen. [5] Eine Kombination aus beidem, das kürzlich untersucht wurde, ist halbüberwachtes Lernen, das eine Kombination aus beschrifteten und nicht beschrifteten Daten verwendet (in der Regel ein kleiner Satz beschrifteter Daten in Kombination mit einer großen Menge nicht beschrifteter Daten). Beachten Sie, dass es bei unbeaufsichtigtem Lernen möglicherweise überhaupt keine Schulungsdaten gibt, von denen die Rede ist; mit anderen Worten, und die zu kennzeichnenden Daten sind die Schulungsdaten. In der Medizinischen Wissenschaft ist die Mustererkennung die Grundlage für COMPUTERgestützte Diagnosesysteme (CAD). CAD beschreibt ein Verfahren, das die Interpretationen und Befunde des Arztes unterstützt. Weitere typische Anwendungen von Mustererkennungstechniken sind die automatische Spracherkennung, die Einteilung von Text in mehrere Kategorien (z.
B. Spam/Non-Spam-E-Mail-Nachrichten), die automatische Erkennung von Handschrift auf Briefumschlägen, die automatische Erkennung von Bildern menschlicher Gesichter oder die Handschriftbildextraktion aus medizinischen Formularen. [10] Die letzten beiden Beispiele bilden die subtopische Bildanalyse der Mustererkennung, die sich mit digitalen Bildern als Eingabe in Mustererkennungssysteme befasst. [11] [12] Im maschinellen Lernen ist die Mustererkennung die Zuordnung einer Beschriftung zu einem bestimmten Eingabewert. In der Statistik wurde 1936 zu diesem Zweck eine diskriminierende Analyse eingeführt. Ein Beispiel für die Mustererkennung ist die Klassifizierung, bei der versucht wird, jeden Eingabewert einer bestimmten Gruppe von Klassen zuzuweisen (z. B. bestimmen, ob eine bestimmte E-Mail “Spam” oder “Nicht-Spam” ist). Die Mustererkennung ist jedoch ein allgemeineres Problem, das auch andere Arten von Ausgaben umfasst. Andere Beispiele sind die Regression, die jeder Eingabe eine realwertige Ausgabe zuweist. [2] Sequenzbeschriftung, die jedem Element einer Sequenz von Werten [3] eine Klasse zuweist (z.
B. Teil der Sprachmarkierung, die jedem Wort in einem Eingabesatz einen Teil der Sprache zuweist); und Parsing, das einem Eingabesatz einen Analysebaum zuweist und die syntaktische Struktur des Satzes beschreibt. [4] Probabilistische Musterklassifikatoren können nach einem Vieltisten- oder Einem Bayesschen Ansatz verwendet werden. Die Beispiele komplexer Mikrostrukturmuster, die in optischen Mikroskopiebildern von zwei A-Stählen mit gleicher Zusammensetzung beobachtet wurden, aber mit unterschiedlichen Kühlraten von 1 °C/s (a) und 3 °C/s (b) ab 1400 °C und mit unterschiedlichen mechanischen Eigenschaften erhalten wurden. Die manuelle Identifizierung verschiedener Mikrostrukturen wird mit Pfeilen dargestellt. Mustererkennung ist die automatisierte Erkennung von Mustern und Regelmäßigkeiten in Daten. Es hat Anwendungen in der statistischen Datenanalyse, Signalverarbeitung, Bildanalyse, Informationsabruf, Bioinformatik, Datenkomprimierung, Computergrafik und maschinelles Lernen.