Entnommen von GeeksforGeeksClustering ist eine unbeaufsichtigte Technik, bei der Datenpunkte gruppiert oder gruppiert werden. Es wird häufig zur Kundensegmentierung, Betrugserkennung und Dokumentenklassifizierung verwendet.Zu den gängigen Clustertechniken gehören k-Means-Clustering, hierarchisches Clustering, Mean Shift-Clustering und dichtebasiertes Clustering. Während jede Technik eine andere Methode zum Finden von Clustern hat, zielen alle darauf ab, dasselbe zu erreichen.
Dimensionalitätsreduktion
Dimensionalitätsreduktion ist der Prozess der Verringerung der Anzahl der betrachteten Zufallsvariablen durch Erhalten eines Satzes von Hauptvariablen . In einfacheren Worten, es ist der Prozess der Verringerung der Dimension Ihres Feature-Set (in noch einfacheren Worten, die Verringerung der Anzahl der Features). Die meisten Techniken zur Reduzierung der Dimensionalität können entweder als Merkmaleliminierung oder Merkmalsextraktion kategorisiert werden.
Eine beliebte Methode zur Reduzierung der Dimensionalität wird als Hauptkomponentenanalyse bezeichnet.
Principal Component Analysis (PCA)
Im einfachsten Sinne beinhaltet PCA Projekt höherdimensionale Daten (zB. 3 dimensionen) auf einen kleineren Raum (z.B. 2 abmessungen). Dies führt zu einer geringeren Datendimension (2 Dimensionen anstelle von 3 Dimensionen), während alle ursprünglichen Variablen im Modell beibehalten werden.
Es ist ziemlich viel Mathematik damit verbunden. Wenn Sie mehr darüber erfahren möchten …
Lesen Sie diesen fantastischen Artikel über PCA hier.
Wenn Sie lieber ein Video ansehen möchten, erklärt StatQuest PCA in 5 Minuten hier.
Fazit
Natürlich gibt es eine Menge Komplexität, wenn Sie in ein bestimmtes Modell eintauchen, aber dies sollte Ihnen ein grundlegendes Verständnis dafür vermitteln, wie jeder Algorithmus für maschinelles Lernen funktioniert!
Weitere Artikel wie diesen finden Sie unter https://blog.datatron.com/
Stuart J. Russell, Peter Norvig, Künstliche Intelligenz: Ein moderner Ansatz (2010), Prentice Hall
Roweis, S. T. , Saul, L. K., Nichtlineare Dimensionsreduktion durch lokal lineare Einbettung (2000), Wissenschaft
Danke fürs Lesen!