Maschinelles Lernen - Begriff und Abgrenzung

Eine kurze Einführung in den Begriff des maschinellen Lernens, eine Abgrenzung zu verwandten Disziplinen und die Unterschiede solcher Verfahren zur herkömmlichen Erstellung von Computerprogrammen.

Veröffentlicht am 01.02.2022. Zuletzt aktualisiert am 01.02.2022. 557 Wörter.

Maschinelles Lernen (ML) bezeichnet ein Anwendungs- und Forschungsgebiet der Informatik, welches sich mit Verfahren (Algorithmen) befasst, die Daten zur Vorhersage oder Entscheidungsfindung selbstständig auswerten können. Solche Algorithmen erstellen meist ein Modell auf der Grundlage von Beispieldaten (Trainingsdaten) um neue, unbekannte Daten bewerten zu können. Damit gehen sie implizit davon aus, dass Strategien, die in der Vergangenheit gut funktioniert haben, wahrscheinlich auch in Zukunft gut funktionieren werden. Üblicherweise ist es aufgrund der Datenmenge, der Datenkomplexität oder der Tatsache der kontinuierlichen Änderung der Bewertungskriterien zu aufwendig, explizierte Verfahrensanweisungen zur Erfüllung der erforderlichen Aufgaben zu programmieren. Verfahren dieser Art werden in einer Vielzahl von Anwendungen eingesetzt, z. B. beim Filtern von E-Mails (Spam-Filter), bei der Spracherkennung (digitale Assistenten) und in der Medizin (Bildauswertung).

Der Begriff des maschinellen Lernens

Der Bereich maschinelles Lernen wird oft als Teil der künstlichen Intelligenz (KI) betrachtet, die in den 1950er Jahren ihren Siegeszug begann. In den 1990er Jahren entwickelte er sich eigenständig weiter mit dem Ziel lösbare Probleme praktischer Natur anzugehen, statt eine künstliche Intelligenz erschaffen zu wollen. Im Unterschied zur künstlichen Intelligenz basiert maschinelles Lernen auf passiven Beobachtungen. Eine künstliche Intelligenz hingegen kann durch Interaktion mit der Umwelt das Lernen selbstständig optimieren. Verfahren mit einer solchen aktiven komponente werden im maschinellen Lernen dem Reinforcement Learning zugeordnet.

Dies gilt ebenfalls für das Verhältnis von den Begriffen maschinelles Lernen und Data Mining. Beide Bereiche verwenden nahezu dieselben Methoden und überschneiden sich erheblich. Während sich das maschinelle Lernen jedoch auf Vorhersagen konzentriert, die auf bekannten, aus den Trainingsdaten erlernten Eigenschaften beruhen, liegt der Schwerpunkt beim Data Mining auf der Entdeckung von unbekannten Eigenschaften in den Daten. Im Folgenden werden beide Begriffe jedoch synonym verwendet.

Unterschied zu traditioneller Programmierung

Das traditionelle Vorgehen zur Erstellung eines Computerprogramms umfasst die Erstellung einer Reihe von wohldefinierten Anweisungen, die ein Computer Schritt für Schritt ausführt, um eine Eingabe in eine gewünschte Ausgabe zu transformieren. Ein Beispiel hierfür wäre die Umwandlung einer Bilddatei in Schwarz/Weiß. Die Anweisungen basieren meist auf einer Wenn-Dann-Struktur: Wenn bestimmte Bedingungen erfüllt sind, führt das Programm eine bestimmte Aktion aus.

Das maschinelle Lernen hingegen ist ein automatisierter Prozess, der es Maschinen ermöglicht, Probleme zu lösen und Aktionen auf der Grundlage früherer Beobachtungen durchzuführen ohne auf die spezifischen Merkmale der Eingabe programmiert worden zu sein. Beispielsweise können maschinelle Lernverfahren zu Klassifizierung von E-Mails in Spam/Kein-Spam auch dazu genutzt werden, Texte in beliebige andere Kategorien einzuteilen (z.B. die Rubriken Sport/Politik/Gesellschaft). Ein solches Verfahren lernt auf Basis von vorgegebenen Beispielen (Daten und Ergebnis, d.h. E-Mail-Texte zusammen mit den Kategorien Spam/Kein-Spam) die Zusammenhänge von Eingabe und Ausgabe. Dazu werden die Eingabedaten zunächst in eine mathematische Repräsentation überführt, d.h. eine Anordnung von Zahlen, die die Merkmale des Eingabedatensatzes repräsentieren. Die Verfahren lernen dann, diese Repräsentationen mit der vorgegebene Ausgabe zu verknüpfen. Auf Basis dieses Modells kann das Verfahren dann auch Aussagen über unbekannten Daten konfrontiert treffen (z.B. neue E-Mails).

Im Gegensatz zu Programmen mit expliziter Verfahrensanweisungen lernen maschinelle Lernverfahren diese Anweisung selbstständig anhand von vorgegebenen Beispielen. Dies ermöglicht es, auch sehr komplizierte Zusammenhänge oder Zusammenhänge in sehr großen Datenmengen zu erfassen und auf unbekannte Daten anzuwenden.