L'attività di “Strutturazione dei dati” è cruciale in un qualunque
progetto di Data Analysis. Molto spesso, infatti, l'attività più
strettamente di analisi dei dati consiste nell'applicare, su strutture
dati predefinite, algoritmi già disponibili (sviluppati in R ad, esempio,
oppure contenuti nei moduli python statsmodels, linearmodels o
scikit-learn). L'attività di strutturazione dei dati serve proprio a
costruire le specifiche strutture richieste dagli algoritmi di analisi che
si vogliono usare.
Il modulo Pandas di python è uno tra gli strumenti informatici più
efficienti ed efficaci di gestione di ampie e complesse strutture dati.
Esso mette a disposizione strumenti specifici per:
Una volta strutturati i dati, questi sono pronti per essere elaborati con stumenti di statistical learning. Nella parte finale del corso verranno presentati due moduli python (statsmodel e scikit-learn) contenenti gli strumenti python per lo sviluppo di:
L'obiettivo del corso “Python e Statistical learning” è quello di consentire ad un aspirante data scientist:
Si terranno il lunedì e il giovedì dalle ore 18.30-20.00 in modalità online.
2 lezioni teoriche + workshop
€100/partecipante
5 settimane
€300/partecipante