Il data mining è il processo di estrazione di conoscenza dai dati, tramite l'applicazione di algoritmi che individuano le informazioni "nascoste" e le rendono visibili. In altre parole, col nome data mining si intende l'applicazione di una o più tecniche che consentono l'esplorazione di dati, con l'obiettivo di individuare le informazioni più significative e di renderle disponibili e direttamente utilizzabili nell'ambito del decision making. Per molti versi, il data mining è simile all'analisi statistica. Si differenzia, tuttavia, da questa per la sua origine, avvenuta prevalentemente nell'ambito delle scienze informatiche. Il diverso ambiente in cui si sono sviluppati i due approcci spiega il diverso uso che essi fanno degli strumenti informatici: mentre un'analisi statistica può essere sviluppata anche senza l'uso di un computer, l'attività di data mining è strettamente legata all'uso del computer. Nell'ambito del data mining, le sempre maggiori risorse informatiche e i set di dati sempre più ampi hanno consentito lo sviluppo di metodi, raggruppati sotto il termine di machine learning , basati prevalentemente sul calcolo numerico, in grado di sostituire, in parte o del tutto, le capacità di analisi di un ricercatore. Questi metodi stanno avendo particolare successo nel campo predittivo, non solo lungo la dimensione temporale, ma anche lungo le altre dimensioni che possono caratterizzare i dati analizzati. Ad esempio, possono valutare, sulla base di un set di dati, se la carta di credito usata è vera o falsa.
Obiettivo del corso “Python e R per Data Mining” è quello di insegnare l'uso delle tecniche di estrazione di informazioni da set ampi di dati. Nello specifico dopo aver appreso gli elementi di base dei linguaggi python e R, essi verranno utilizzati per sviluppare analisi di tipo clustering, time series e panel data.
2 lezioni teoriche + workshop
€125/partecipante
6 settimane
€400/partecipante