Eage

Machine Learning non supervisionato

Il Machine Learning non supervisionato ( unsupervised ML ) è un sistema di apprendimento automatico basato su una serie di esempi non etichettati.

Si fornisce alla macchina un database di dati. L'algoritmo ML unsupervised analizza i dati ed eventualmente trova un criterio di classificazione. E' la macchina a trovare le etichette (classi) da assegnare agli esempi.

    Come funziona

    Nel sistema viene inserito in input un dataset di esempi di training set. Ciascun esempio è descritto nelle caratteristiche principali ma non è classificato dal progettista.

    Pertanto, nel ML unsupervised il sistema non ha esempi di riferimento ( golden data ) che lo aiutano nel processo di addestramento, né conosce le classi o le categorie in cui dovrà classificare gli esempi.

    Esempio. Il sistema riceve in input un dataset di addestramento ( training set ) con le caratteristiche di quattro specie di fiori ( lunghezza, larghezza del petalo ). Tuttavia, in ciascun esempio non è indicata la specie del fiore.

    L'algoritmo genera autonomamente un modello di classificazione in base alle caratteristiche in comune, dati simili, schemi o regolarità che eventualmente rileva negli esempi del training set.

    Le principali tipologie di machine learning unsupervised sono

    • Clustering
      • DBSCAN
      • K-means
      • Hidden Markov Model
      • Agglomerative
      • Fuzzy C-Means
      • Mean shift
    • Anomaly detection
      • k-Nearest-Neighbours
      • Bayesian belief network
      • Decision tree
      • Support Vector Machine
    • Association
      • Bayesian belief network
      • Decision tree
      • Neural networks

    Altri algoritmi di pattern search (Apriori, Eclat, FP-Growth) e algoritmi generici (T-Sne, PCA, LSA, SVD, LDA).