Auswahl geeigneter Trainingsdaten
Die Auswahl der Trainingsdaten ist beim Maschinellen Lernen entscheidend: Ein Algorithmus soll lernen, Hunde von Katzen zu unterscheiden, doch zum Trainieren wurden nur Bilder einer Hunderasse verwendet. Was könnte dann passieren?
In einem Trainingsdatensatz werden Bilder von
durch Bilder von
ersetzt, behalten aber das Label
. Das Modell lernt dadurch die falschen
. In der Anwendung wird es demnach Bilder von
wahrscheinlich
.
