2010-11
2010-11
Sei collegato come utente non registrato
Riepilogo dell'insegnamento: Metodi Informatici per l'Analisi dei dati
Informazioni generali
Corso di Laurea Scienze dell'Informazione Percorso Scienze dell'Informazione
CFU 12 Università PALERMO
Ore di didattica frontale per CFU 12 Settore Scientifico Disciplinare INF/01
   

12 cfu così ripartiti nelle aree:

  • 3 CFU nell'area B - Algoritmi
  • 9 CFU nell'area M - Rappresentazione della conoscenza

Sillabo dell'insegnamento

  • B - Algoritmi
    • SDA - Strutture di Dati Avanzate
      Clustering. Matrice delle caratteristiche e scattering e loro proprieà, Classi linearmente separabili e non, indici di prossimità, misure statistiche, simboliche e di similarità, indici probabilistici, Jaccard Coefficient. Standardizzazione delle variabili.
    • * A - Algoritmi fondamentali
      Algoritmi Gerarchici e loro Rappresentazione, single linkage Algorithm, Dendrogramma, Grafi di prossimità, Algoritmo di Johnson, Algoritmi Partizionali, Criteri globali e locali, Soluzione Teorica, Algoritmi basati su partizione, Soluzione euristiche, K-means, ISODATA.
    • * A - Algoritmi fondamentali
      Sfera di Bennet e Algoritmo, approccio globale e locale, criteri basati sull'errore quadratico, problema di programmazione non-lineare, ulteriori criteri di clusterizzazione, metodo ISODATA.
  • M - Rappresentazione della conoscenza
    • AASC - Apprendimento Automatico e Scoperta di Conoscenza
      Classificazione ed Apprendimento: classificatore Bayesiano, Linear Discriminant Analysis, classificatore K-vicini. Test di Ipotesi e Curve ROC, uso delle curve ROC come valutatori di un sistema di classificazione.
    • * SBC - Sistemi Basati su Conoscenza
      Reti neurali artificiali, percettrone, reti neurali multistrato, reti neurali Radial Basis Function, reti probabilistiche, reti competitive, reti LVQ, reti SOM, schemi auto associativi.
    • AASC - Apprendimento Automatico e Scoperta di Conoscenza
      Funzioni Kernel, proprietà e loro caratterizzazione, riduzione nella dimensionalità dei dati: SVD, PCA, NMF, Random Projections. Canonical Correlation Analysis, Fisher Discriminant Analysis.
    • AASC - Apprendimento Automatico e Scoperta di Conoscenza
      La dimensione VC, versione duale dell'algoritmo del percettrone, iperpiano di separazione ottimale e sua formulazione lagrangiana.
    • * SBC - Sistemi Basati su Conoscenza
      Support Vector Machines (SVM) per classificazione e regressione nel caso di separabilità lineare e non lineare.
    • AASC - Apprendimento Automatico e Scoperta di Conoscenza
      SVM e One class classifiers, funzioni Kernel per dati strutturati (stringhe, alberi) e per testi.
    • * RP - Risoluzione di Problemi
      Classificatori, curve ROC, stima dell'errore sperimentale, metodi di validazione, matrice di confusione e perdita, parametri di valutazione.
    • ARC - Acquisizione e Rappresentazione della Conoscenza
      Metodi integrati ed applicazioni, tecniche combinate, ottimizzazione, Learning algorithm, combinazione di classificatori, Metodi di Ensemble, Bagging, Boosting, Boosted Combination of Classifiers, AdaBoost, esempi ed applicazioni, Single link (MST Cluster), Hierarchical Single Link (HSL), Two Phases Clustering (TPC).
    • * RP - Risoluzione di Problemi
      Ricampionamento, cross-validation, bootstrapping, Tecniche di boostrap, Simulated Annealing Algorithm, Fuzzy sets, Caratteristiche, Algoritmo Fuzzy C-Means.

(*) Le sottoaree con asterisco sono quelle che il GRIN ritiene essenziali