Appunti tratti dal webinar Tecniche di Machine Learning con Matlab - Francesca Perino http://it.mathworks.com/videos/machine-learning-with-matlab-98517.html

Il Machine Learning permette di costruire un modello predittivo partendo dall'utilizzo di un dataset di training. E' utile quando abbiamo molti dati, molte variabili, sistemi complessi che non possono essere descritti tramite semplici equazioni.

Si utilizza, ad esempio, per la sequenziazione del DNA, per identificare frodi in ambito finanziario, in sistemi di pattern recognition.

Gli algoritmi di Machine Learning hanno un approccio del tipo seguente:fig1

  • un dataset di training viene "passato" all'algoritmo
  • l'algoritmo "mappa" una funzione di induzione "f"
  • sulla funzione "f" vengono passati i dati di test
  • Se l'algoritmo ha "imparato" correttamente, allora è in grado di generalizzare. I dati di test permettono di valutare la bontà dell'algoritmo.

Ottimo corso su EdX: https://courses.edx.org/courses/BerkeleyX/CS188x_1/1T2013/info

Ottimo libro: http://aima.cs.berkeley.edu/

Ottimo prof: http://www.cs.ubc.ca/~nando/

Tipi di algoritmi di Machine learning in MATLAB

tipiML

Algoritmi non supervisionati: i dati sono raggruppati in base ad alcune caratteristiche e similarità che li rendono coerenti fra loro (algoritmi di clustering)

Algoritmi supervisionati: abbinano i dati di ingresso ai dati di output. Possono essere suddivisi in algoritmi di classificazione (informazioni di tipo classificativo/categorico) e algoritmi di regressione (numerici)

Dati esercizio matlab http://www.mathworks.com/matlabcentral/fileexchange/42744-machine-learning-with-matlab/content//Machine%20Learning/Clustering/html/Example_Clustering.html

Algoritmo di clustering (tipo unsupervised)

I gruppi possono essere separati o parzialmente sovrapposti (un dato può appartenere a più classi). Il processo è iterativo e si avvale del concetto di trial and error. Tipici algoritmi di clustering:

Posterior: è una funzione che va a calcolare a posteriori la probabilità che appartenga a una o all'altra classe http://it.mathworks.com/help/stats/gmdistribution.posterior.html

(riprendere da 27 min il webinar)