MODULO 1: FONDAMENTI DI ANALISI DATI E PROGRAMMAZIONE
Introduzione alla Data Analysis
- Panoramica sul ruolo del Data Analyst
- Differenze tra Data Analyst e Data Scientist
- Esempi di applicazioni reali della Data Analysis
Fondamenti di Programmazione con Python
- Introduzione a Python
- Strutture dati fondamentali: liste, dizionari, set
- Controllo di flusso e funzioni di base
Manipolazione dei Dati con Pandas
- Introduzione ai DataFrame e alle Serie
- Importazione di dati da CSV, Excel e SQL
- Pulizia e trasformazione dei dati
Analisi Esplorativa dei Dati
- Visualizzazione dei dati con Matplotlib e Seaborn
- Descrizione statistica di base
- Identificazione di pattern e trend
Introduzione a SQL per l’Analisi Dati
- Creazione e gestione di database relazionali
- Scrittura di query SQL per l’estrazione di dati
- Operazioni avanzate in SQL (join, subquery, aggregazioni)
MODULO 2: STATISTICA APPLICATA PER DATA ANALYST
Statistica Descrittiva
- Misure di centralità e dispersione
- Visualizzazione delle distribuzioni
- Tecniche per il riassunto dei dati
Statistica Inferenziale
- Principi di inferenza statistica
- Test di ipotesi
- Intervalli di confidenza
Analisi delle Correlazioni e Regressione Lineare
- Calcolo e interpretazione della correlazione
- Regressione lineare semplice
- Valutazione dei modelli di regressione
Analisi delle Serie Temporali
- Introduzione alle serie temporali
- Tecniche di smoothing e forecasting
- Analisi delle stagionalità e trend
MODULO 3: STRUMENTI AVANZATI DI DATA ANALYSIS
Strumenti di Visualizzazione Avanzata
- Creazione di grafici avanzati con Seaborn e Plotly
- Dashboard interattivi con Dash e Streamlit
- Principi di Data Storytelling
Excel per l’Analisi Dati
- Tecniche avanzate di manipolazione dati in Excel
- Utilizzo di funzioni avanzate (VLOOKUP, PIVOT, etc.)
- Automazione con Macro e VBA
Tableau e Power BI per la Business Intelligence
- Creazione di dashboard interattive con Tableau
- Analisi dei dati aziendali con Power BI
- Integrazione con fonti dati multiple
Introduzione a Google Analytics e Web Analytics
- Panoramica di Google Analytics
- Analisi del traffico web e delle performance
- Creazione di report personalizzati
Introduzione a Big Data e Hadoop
- Fondamenti di Big Data
- Panoramica di Hadoop e MapReduce
- Utilizzo di strumenti Big Data per l’analisi
MODULO 4: BUSINESS ANALYSIS E COMUNICAZIONE DEI DATI
Business Analysis e KPI
- Identificazione e definizione dei KPI aziendali
- Tecniche di analisi per il supporto decisionale
- Utilizzo di strumenti per il monitoraggio dei KPI
Data Cleaning e Preparazione dei Dati
- Tecniche di data cleaning avanzato
- Gestione dei dati mancanti e outlier
- Trasformazione dei dati per l’analisi
Reporting e Automazione
- Creazione di report automatizzati
- Introduzione a strumenti di automazione come Python e Excel
- Reporting dinamico con Power BI e Tableau
Comunicazione Efficace dei Risultati
- Principi di comunicazione visiva
- Presentazione dei risultati a stakeholder non tecnici
- Data storytelling per il business
MODULO 5: PROGETTO FINALE
Progetto Finale Progetto di Analisi Dati Completo
- Definizione di un problema di analisi reale
- Raccolta, pulizia e analisi dei dati
- Sviluppo di dashboard, report e presentazione dei risultati
Primo Progetto Finale: Analisi del Costo dell’Alimentazione Sana
FASE 1 – Acquisizione Dati
Verranno raccolte informazioni da diverse fonti:
- Dati nutrizionali e prezzi mediante web scraping di portali di supermercati online
- Database di ricette forniti in formato CSV e JSON contenenti ingredienti, quantità e preparazioni
- Validazione delle informazioni nutrizionali attraverso API pubbliche specializzate
- Parametri di riferimento per fabbisogni nutrizionali per diverse fasce demografiche
FASE 2 – Pulizia e Strutturazione
I dati grezzi verranno processati e organizzati in un database relazionale. Le attività includeranno:
- Normalizzazione di formati diversi tramite codice python (unità di misura, prezzi, porzioni)
- Gestione di valori mancanti e inconsistenze tra fonti
- Creazione di relazioni logiche tra alimenti, ricette e valori nutrizionali
- Analisi degli abbinamenti di ingredienti più frequenti nelle ricette
FASE 3 – Analisi
Applicazione di tecniche statistiche per identificare pattern e correlazioni nei dati:
- Calcolo del costo medio di diete bilanciate per diversi profili demografici
- Analisi della correlazione tra prezzo e qualità nutrizionale degli alimenti
- Confronto dei costi tra diverse tipologie di dieta
- Identificazione degli alimenti con migliore rapporto qualità-prezzo
FASE 4 – Visualizzazione e Reporting
Creazione di report e dashboard che presentano i risultati attraverso grafici e tabelle interpretabili, con possibilità di personalizzazione in base a parametri come età, preferenze alimentari e budget.
Secondo Progetto Finale: Analisi di Dati Sanitari in Epidemiologia e Neuroscienze
Introduzione e setup
Obiettivo: studenti orientati su dataset, obiettivi e strumenti.
- Presentazione del project work, illustrazione dataset (COVID-19 e neuroscienze), overview strumenti, aspetti etici e privacy dati sanitari.
Pulizia dati epidemiologici (COVID-19)
Obiettivo: Excel dataset epidemiologico pulito e prime tabelle.
- Import dataset COVID in Excel, gestione duplicati e valori mancanti, creazione variabili derivate (tasso/100.000), prime pivot.
Analisi demografica COVID
Obiettivo: prime visualizzazioni COVID in Excel e setup Power BI.
- Analisi distribuzione casi per età e sesso, analisi ricoveri/decessi, grafici in Excel, introduzione a Power BI.
Indicatori epidemiologici COVID
Obiettivo: dashboard epidemiologica con KPI principali.
- Calcolo CFR (Case Fatality Rate), Rt semplificato, KPI dinamici e dashboard interattiva in Power BI.
Analisi geografica COVID
Obiettivo: cruscotto geografico epidemiologico.
- Import dati regionali in QGIS, creazione heatmap, integrazione mappe in Power BI, dashboard finale COVID.
Pulizia dati neuroscienze
Obiettivo: dataset neuroscientifico pulito e coerente.
- Import dataset clinico in Excel, gestione mancanti nei test cognitivi (MMSE, MoCA), normalizzazione punteggi, variabili derivate (stadio malattia).
Analisi descrittiva neuroscienze
Obiettivo: overview clinica dei dati neuroscientifici.
- Distribuzione pazienti per patologia, età e sesso, analisi outcome clinici, grafici comparativi in Excel, introduzione a Tableau.
Analisi avanzata neuroscienze
Obiettivo: dashboard clinico-analitica neuroscientifica.
- Tableau: boxplot età vs punteggi cognitivi, analisi correlazioni (terapie vs outcome), costruzione dashboard interattiva.