ForDataScientist

Le attività tipiche di un data scientist possono essere divise nelle seguenti aree:

Conoscenza fonti e raccolta dati;
Strutturazione dei dati;
Utilizzo di tecniche statistiche;
Presentazione dei risultati.

L'attività di “Strutturazione dei dati” è cruciale in un qualunque progetto di Data Analysis. Molto spesso, infatti, l'attività più strettamente di analisi dei dati consiste nell'applicare, su strutture dati predefinite, algoritmi già disponibili (sviluppati in R ad, esempio, oppure contenuti nei moduli python statsmodels, linearmodels o scikit-learn). L'attività di strutturazione dei dati serve proprio a costruire le specifiche strutture richieste dagli algoritmi di analisi che si vogliono usare.
Il modulo Pandas di python è uno tra gli strumenti informatici più efficienti ed efficaci di gestione di ampie e complesse strutture dati. Esso mette a disposizione strumenti specifici per:

unire due o più strutture dati;
estrarre parti di strutture dati sulla base di specifiche condizioni;
elaborare dati, organizzandoli per gruppi e sottogruppi;
modificare una struttura dati ridefinendo righe e colonne.

Una volta strutturati i dati, questi sono pronti per essere elaborati con stumenti di statistical learning. Nella parte finale del corso verranno presentati due moduli python (statsmodel e scikit-learn) contenenti gli strumenti python per lo sviluppo di:

modelli con specificazioni dinamiche;
modelli panel data;
tecniche di classificazione;
tecniche di clusterizzazione;

L'obiettivo del corso “Python e Statistical learning” è quello di consentire ad un aspirante data scientist:

di apprendere i concetti base e gli strumenti python per poter costruire in autonomia le specifiche strutture dati richieste dagli algoritmi di analisi.
di conoscere i moduli python per poter estrarre informazioni dai dati tramite tecniche di statistical learning.

Calendario Maggio 2021

Presentazione gratuita del corso:

Le lezioni

Si terranno il lunedì e il giovedì dalle ore 18.30-20.00 in modalità online.

I workshop

Si terranno il sabato ore 10.00-13.00 in via Santo Stefano 57, Bologna.

Prima settimana
Lunedì 17 maggio: Python base – Variabili, stringhe e numeri
Giovedì 20 maggio: Python base – Istruzioni condizionali e ricorsione; funzioni built-in
Sabato 22 maggio: workshop- esercitazioni sui temi della settimana1

Seconda settimana
Lunedì 24 maggio: Python base – Strutture dati built-in
Giovedì 27 maggio: Python base – Funzioni e classi
Sabato 29 maggio: workshop- esercitazioni sui temi della settimana1

Terza settimana
Lunedì 31 maggio: Moduli numpy e pandas
Giovedì 3 giugno: Metodi pandas
Sabato 5 giugno: workshop- esercitazioni sui temi della settimana1

Quarta settimana
Lunedì 7 giugno: Multindex
Giovedì 10 giugno: Reshape di strutture dati
Sabato 13 giugno: workshop- esercitazioni sui temi della settimana

Quinta settimana
Lunedì 14 giugno: Modulo statsmodels
Giovedì 17 giugno: Modulo sklearn
Sabato 19 giugno: workshop- esercitazioni sui temi della settimana

Pacchetto settimanale

2 lezioni teoriche + workshop

€100/partecipante

Corso completo

5 settimane

€300/partecipante

Python e Statistical learning
Corso accelerato di python per l'utilizzo di tecniche di statistical learning

Le attività tipiche di un data scientist possono essere divise nelle seguenti aree:

Calendario Maggio 2021

Presentazione gratuita del corso:

Le lezioni

I workshop

PROMOZIONE

Sei uno studente o hai meno di 25 anni? Tutti i corsi ti costano la metà!

Python e Statistical learning Corso accelerato di python per l'utilizzo di tecniche di statistical learning

Le attività tipiche di un data scientist possono essere divise nelle seguenti aree:

Calendario Maggio 2021

Presentazione gratuita del corso:

Le lezioni

I workshop

PROMOZIONE

Sei uno studente o hai meno di 25 anni? Tutti i corsi ti costano la metà!

Python e Statistical learning
Corso accelerato di python per l'utilizzo di tecniche di statistical learning