Machine Learning non supervisionato
Il Machine Learning non supervisionato ( unsupervised ML ) è un sistema di apprendimento automatico basato su una serie di esempi non etichettati.
Si fornisce alla macchina un database di dati. L'algoritmo ML unsupervised analizza i dati ed eventualmente trova un criterio di classificazione. E' la macchina a trovare le etichette (classi) da assegnare agli esempi.
Come funziona
Nel sistema viene inserito in input un dataset di esempi di training set. Ciascun esempio è descritto nelle caratteristiche principali ma non è classificato dal progettista.
Pertanto, nel ML unsupervised il sistema non ha esempi di riferimento ( golden data ) che lo aiutano nel processo di addestramento, né conosce le classi o le categorie in cui dovrà classificare gli esempi.
Esempio. Il sistema riceve in input un dataset di addestramento ( training set ) con le caratteristiche di quattro specie di fiori ( lunghezza, larghezza del petalo ). Tuttavia, in ciascun esempio non è indicata la specie del fiore.
L'algoritmo genera autonomamente un modello di classificazione in base alle caratteristiche in comune, dati simili, schemi o regolarità che eventualmente rileva negli esempi del training set.
Le principali tipologie di machine learning unsupervised sono
- Clustering
- DBSCAN
- K-means
- Hidden Markov Model
- Agglomerative
- Fuzzy C-Means
- Mean shift
- Anomaly detection
- k-Nearest-Neighbours
- Bayesian belief network
- Decision tree
- Support Vector Machine
- Association
- Bayesian belief network
- Decision tree
- Neural networks
Altri algoritmi di pattern search (Apriori, Eclat, FP-Growth) e algoritmi generici (T-Sne, PCA, LSA, SVD, LDA).