Musa Formazione

Programma Didattico Corso Data Analyst

 

MODULO 1: FONDAMENTI DI ANALISI DATI E PROGRAMMAZIONE

Introduzione alla Data Analysis

  • Panoramica sul ruolo del Data Analyst
  • Differenze tra Data Analyst e Data Scientist
  • Esempi di applicazioni reali della Data Analysis

Fondamenti di Programmazione con Python

  • Introduzione a Python
  • Strutture dati fondamentali: liste, dizionari, set
  • Controllo di flusso e funzioni di base

Manipolazione dei Dati con Pandas

  • Introduzione ai DataFrame e alle Serie
  • Importazione di dati da CSV, Excel e SQL
  • Pulizia e trasformazione dei dati

Analisi Esplorativa dei Dati

  • Visualizzazione dei dati con Matplotlib e Seaborn
  • Descrizione statistica di base
  • Identificazione di pattern e trend

Introduzione a SQL per l’Analisi Dati

  • Creazione e gestione di database relazionali
  • Scrittura di query SQL per l’estrazione di dati
  • Operazioni avanzate in SQL (join, subquery, aggregazioni)

MODULO 2: STATISTICA APPLICATA PER DATA ANALYST

Statistica Descrittiva

  • Misure di centralità e dispersione
  • Visualizzazione delle distribuzioni
  • Tecniche per il riassunto dei dati

Statistica Inferenziale

  • Principi di inferenza statistica
  • Test di ipotesi
  • Intervalli di confidenza

Analisi delle Correlazioni e Regressione Lineare

  • Calcolo e interpretazione della correlazione
  • Regressione lineare semplice
  • Valutazione dei modelli di regressione

Analisi delle Serie Temporali

  • Introduzione alle serie temporali
  • Tecniche di smoothing e forecasting
  • Analisi delle stagionalità e trend

MODULO 3: STRUMENTI AVANZATI DI DATA ANALYSIS

Strumenti di Visualizzazione Avanzata

  • Creazione di grafici avanzati con Seaborn e Plotly
  • Dashboard interattivi con Dash e Streamlit
  • Principi di Data Storytelling

Excel per l’Analisi Dati

  • Tecniche avanzate di manipolazione dati in Excel
  • Utilizzo di funzioni avanzate (VLOOKUP, PIVOT, etc.)
  • Automazione con Macro e VBA

Tableau e Power BI per la Business Intelligence

  • Creazione di dashboard interattive con Tableau
  • Analisi dei dati aziendali con Power BI
  • Integrazione con fonti dati multiple

Introduzione a Google Analytics e Web Analytics

  • Panoramica di Google Analytics
  • Analisi del traffico web e delle performance
  • Creazione di report personalizzati

Introduzione a Big Data e Hadoop

  • Fondamenti di Big Data
  • Panoramica di Hadoop e MapReduce
  • Utilizzo di strumenti Big Data per l’analisi

MODULO 4: BUSINESS ANALYSIS E COMUNICAZIONE DEI DATI

Business Analysis e KPI

  • Identificazione e definizione dei KPI aziendali
  • Tecniche di analisi per il supporto decisionale
  • Utilizzo di strumenti per il monitoraggio dei KPI

Data Cleaning e Preparazione dei Dati

  • Tecniche di data cleaning avanzato
  • Gestione dei dati mancanti e outlier
  • Trasformazione dei dati per l’analisi

Reporting e Automazione

  • Creazione di report automatizzati
  • Introduzione a strumenti di automazione come Python e Excel
  • Reporting dinamico con Power BI e Tableau

Comunicazione Efficace dei Risultati

  • Principi di comunicazione visiva
  • Presentazione dei risultati a stakeholder non tecnici
  • Data storytelling per il business

MODULO 5: PROGETTO FINALE

Progetto Finale Progetto di Analisi Dati Completo

  • Definizione di un problema di analisi reale
  • Raccolta, pulizia e analisi dei dati
  • Sviluppo di dashboard, report e presentazione dei risultati

Primo Progetto Finale: Analisi del Costo dell’Alimentazione Sana

FASE 1 – Acquisizione Dati

Verranno raccolte informazioni da diverse fonti:

  • Dati nutrizionali e prezzi mediante web scraping di portali di supermercati online
  • Database di ricette forniti in formato CSV e JSON contenenti ingredienti, quantità e preparazioni
  • Validazione delle informazioni nutrizionali attraverso API pubbliche specializzate
  • Parametri di riferimento per fabbisogni nutrizionali per diverse fasce demografiche

FASE 2 – Pulizia e Strutturazione

I dati grezzi verranno processati e organizzati in un database relazionale. Le attività includeranno:

  • Normalizzazione di formati diversi tramite codice python (unità di misura, prezzi, porzioni)
  • Gestione di valori mancanti e inconsistenze tra fonti
  • Creazione di relazioni logiche tra alimenti, ricette e valori nutrizionali
  • Analisi degli abbinamenti di ingredienti più frequenti nelle ricette

FASE 3 – Analisi

Applicazione di tecniche statistiche per identificare pattern e correlazioni nei dati:

  • Calcolo del costo medio di diete bilanciate per diversi profili demografici
  • Analisi della correlazione tra prezzo e qualità nutrizionale degli alimenti
  • Confronto dei costi tra diverse tipologie di dieta
  • Identificazione degli alimenti con migliore rapporto qualità-prezzo


FASE 4 – Visualizzazione e Reporting

Creazione di report e dashboard che presentano i risultati attraverso grafici e tabelle interpretabili, con possibilità di personalizzazione in base a parametri come età, preferenze alimentari e budget.

 

Secondo Progetto Finale: Analisi di Dati Sanitari in Epidemiologia e Neuroscienze

Introduzione e setup
Obiettivo: studenti orientati su dataset, obiettivi e strumenti.

  • Presentazione del project work, illustrazione dataset (COVID-19 e neuroscienze), overview strumenti, aspetti etici e privacy dati sanitari.

Pulizia dati epidemiologici (COVID-19)
Obiettivo: Excel dataset epidemiologico pulito e prime tabelle.

  • Import dataset COVID in Excel, gestione duplicati e valori mancanti, creazione variabili derivate (tasso/100.000), prime pivot.

Analisi demografica COVID
Obiettivo: prime visualizzazioni COVID in Excel e setup Power BI.

  • Analisi distribuzione casi per età e sesso, analisi ricoveri/decessi, grafici in Excel, introduzione a Power BI.

Indicatori epidemiologici COVID
Obiettivo: dashboard epidemiologica con KPI principali.

  • Calcolo CFR (Case Fatality Rate), Rt semplificato, KPI dinamici e dashboard interattiva in Power BI.

Analisi geografica COVID
Obiettivo: cruscotto geografico epidemiologico.

  • Import dati regionali in QGIS, creazione heatmap, integrazione mappe in Power BI, dashboard finale COVID.

Pulizia dati neuroscienze
Obiettivo: dataset neuroscientifico pulito e coerente.

  • Import dataset clinico in Excel, gestione mancanti nei test cognitivi (MMSE, MoCA), normalizzazione punteggi, variabili derivate (stadio malattia).

Analisi descrittiva neuroscienze
Obiettivo: overview clinica dei dati neuroscientifici.

  • Distribuzione pazienti per patologia, età e sesso, analisi outcome clinici, grafici comparativi in Excel, introduzione a Tableau.

Analisi avanzata neuroscienze
Obiettivo: dashboard clinico-analitica neuroscientifica.

  • Tableau: boxplot età vs punteggi cognitivi, analisi correlazioni (terapie vs outcome), costruzione dashboard interattiva.

 


Ti Aiutiamo Noi!

Compila il form e scopri tutti i vantaggi riservati a TE!
Copyright 2021 © IN-Formazione s.r.l.. Tutti i diritti riservati. P. IVA 07252070722