DATA GOVERNANCE, DATA QUALITY E DATA SCIENCE
Come gestire i Dati in chiave di business: Modelli di riferimento e casi pratici
CERTIFICAZIONE:
-ENTE CERTIFICANTE:
-CORSO EROGATO DA:
ENIA ACADEMYC’è una crescente esigenza di ordine, qualità, conoscenza e controllo dei dati aziendali, soggetti ad una situazione di crescente caos dovuta non solo a nuove esigenze di compliance e nuovi adempimenti normativi, ma anche e soprattutto di valorizzare il patrimonio informativo aziendale e di estrarne valore, attraverso l’introduzione di tecnologie innovative (Machine Learning, Big Data, Artificial Intelligence, …)
E’ necessario un governo dei dati, una Data Governance, che affronti e armonizzi questi aspetti:
- in modo trasversale tra ambiti tecnologici, organizzativi, normativi e umani,
- favorendo controllo, trasparenza e reattività aziendale in un quadro di business basato sul valore e sul rischio ma non sulla burocrazia.
Questo corso, grazie al ricorso a numerosi esempi e casi pratici, nonchè tramite sperimentazione su tool di Data Exploration, esamina questi argomenti anche alla luce degli standard internazionali e definisce gli Stakeholder, le architetture, le soluzioni tecnologiche ed organizzative necessarie:
- alla formulazione di un corretto ed efficace Programma di Data Governance,
- e all’elaborazione di un sistema di metriche, KPI e KQI di controllo e di reporting per il management.
E’ necessario un governo dei dati, una Data Governance, che affronti e armonizzi questi aspetti:
- in modo trasversale tra ambiti tecnologici, organizzativi, normativi e umani,
- favorendo controllo, trasparenza e reattività aziendale in un quadro di business basato sul valore e sul rischio ma non sulla burocrazia.
Questo corso, grazie al ricorso a numerosi esempi e casi pratici, nonchè tramite sperimentazione su tool di Data Exploration, esamina questi argomenti anche alla luce degli standard internazionali e definisce gli Stakeholder, le architetture, le soluzioni tecnologiche ed organizzative necessarie:
- alla formulazione di un corretto ed efficace Programma di Data Governance,
- e all’elaborazione di un sistema di metriche, KPI e KQI di controllo e di reporting per il management.
OBIETTIVI DEL CORSO:
- Capacità di comprendere in azienda quali siano i segnali deboli e quelli forti che esprimono una necessità di una strategia di Data Governance, anche parziale
- Capacità di eseguire un Data Quality assessment per fissare i dati più critici per il business e per la compliance e gli obiettivi strategici – tattici di Data Governance per la propria organizzazione;
- Capacità di definire uno schema organizzativo realistico e sostenibile di Data Governance coinvolgendo le aree maggiormente sensibili e con esse fare un piano strategico ed operativo;
- Capacità di definire un sistema di metriche, KQI e KPI, adattando gli obiettivi generici della Data Governance alle esigenze della propria azienda secondo criteri di necessità e sostenibilità;
- Comprendere le nuove professionalità aziendali necessarie, il loro ruolo e il modello organizzativo nonché gli stakeholder interni ed esterni necessari al setup iniziale ed all’evoluzione futura di un sistema di Data Governance.
- Capacità di eseguire un Data Quality assessment per fissare i dati più critici per il business e per la compliance e gli obiettivi strategici – tattici di Data Governance per la propria organizzazione;
- Capacità di definire uno schema organizzativo realistico e sostenibile di Data Governance coinvolgendo le aree maggiormente sensibili e con esse fare un piano strategico ed operativo;
- Capacità di definire un sistema di metriche, KQI e KPI, adattando gli obiettivi generici della Data Governance alle esigenze della propria azienda secondo criteri di necessità e sostenibilità;
- Comprendere le nuove professionalità aziendali necessarie, il loro ruolo e il modello organizzativo nonché gli stakeholder interni ed esterni necessari al setup iniziale ed all’evoluzione futura di un sistema di Data Governance.
DESTINATARI:
Il corso è indirizzato a Data Scientist, IT Auditor, IT Manager, Data Quality & Compliance Manager and Administrators, Data base administrator, Analisti e Progettisti funzionali, SW Architects
DOCENTE:
I docenti sono manager professionisti con esperienza senior di progettazione ed implementazione di soluzioni e tecnologie multi-settore per la Data Governance, il Data Quality Management e per le applicazioni di Data Science e Machine Learning
CONTENUTI:
GIORNO 1: DATA GOVERNANCE: da mero obbligo normativo a fattore abilitante per l’attuazione delle strategie di business
Negli ultimi anni, abbiamo assistito alla sempre più frequente emanazione, da parte dei Regolatori, di normative aventi ad oggetto il governo dei dati aziendali. Tuttavia, nel corso del tempo, molte aziende hanno acquisito consapevolezza del valore che i dati rappresentano per il proprio business, in quanto risorsa strategica determinante per i processi decision-making. Ma da dove partire? Governare i dati di un’azienda presuppone la conoscenza analitica delle informazioni che compongono l’Organizzazione, sotto forma di entità, relativi attributi, mutue relazioni.
Topics:
1) INTRODUZIONE ALLA DATA GOVERNANCE:
- La Data Governance tra normative di settore e leggi (i.e. Direttiva EU BCBS 239, Circolare 285 Banca d’Italia, Reg. 38/2018 IVASS, Regolamento EU 679/2016, etc)
- Modelli e standard di riferimento per la Data Governance (DAMA DMBoK, Data Maturity Model, Data Governance Institute)
- Relazioni con altri Framework e Best Practice (ISO, COBIT, etc)
- I trend della Data Governance (Artificial Intelligence, Machine Learning, Internet of Things)
2) MODELLI ORGANIZZATIVI PER IL GOVERNO DEI DATI
- Ruoli e responsabilità per governare i dati
- La Data Governance tra IT e Business
- Il Chief Data Officer
- Principali modelli adottati dalle Organizzazioni moderne
- Data Governance as a Service
3) CONOSCERE E GESTIRE I METADATI AZIENDALI
- Cosa sono i metadati: tipologie di metadati e standard per la loro definizione
- Ontologia e semantica
- Quali sono i principali strumenti per la gestione dei metadati aziendali: Data Catalog, Business Glossary e Data Dictionary
- Il valore del Metadata Management
4) CONOSCERE IL CICLO DI VITA DEI DATI E LE RELAZIONI TRA ESSI ALL'INTERNO DEI PROCESSI AZIENDALI
- Cos’è il Data Lineage e a cosa serve
- Dimensioni del Data Lineage
- Realizzare il Data Lineage per una Data Governance efficace: tecniche e principali ostacoli
- Data Lineage e Metadata Management: un approccio innovativo
5) LABORATORIO E CASI PRATICI
GIORNO 2: DATA QUALITY e adeguata rappresentazione dei dati a supporto dei processi aziendali
Un dato è considerato di qualità solo se ha delle caratteristiche valide ed è in grado di soddisfare l'uso cui è destinato. Per questo motivo, i dati devono essere accurati, aggiornati, rilevanti, completi, comprensibili e affidabili. La qualità dei dati rappresenta anche lo stato di completezza, coerenza, tempestività e accuratezza che li rende appropriati ad un uso specifico. La Data Quality è l’ambito della Data Governance che comprende una serie di processi ripetibili, finalizzati al monitoraggio continuo dei dati aziendali e al miglioramento della loro significatività (es. attraverso l’arricchimento). Anche saper rappresentare nel modo giusto, collocando i dati in un contesto visivo corretto, aiuta manager e decision-maker a identificare rapidamente modelli, tendenze e prendere decisioni migliori per il proprio business. La Data Visualization è la disciplina che si occupa d’individuare i migliori modi per rappresentare i dati in modo grafico, utilizzando tutti gli strumenti che possano aiutare a rendere il dato analizzato il più fruibile e accessibile possibile.
Topics:
1) INTRODUZIONE AL DATA QUALITY MANAGEMENT
- Data Quality impact: principio del garbage in-garbage out e costo dei “bad data”
- Il Data Quality Assessment: valutare la qualità delle informazioni su 7 dimensioni
2) PREPARAZIONE DEI DATI E TECNICHE PER MIGLIORARNE LA QUALITA': "THE HIDDEN DATA FACTORY"
- Data Discovery: identificare le fonti-dati e “scoprire” le relazioni tra i dativ
- Data Profiling: statistiche descrittive e presentazione di alcuni strumenti a supporto (i.e. Bot)
- Data Cleansing checklist: come incrementare la qualità della base dati
- Tecniche di Data Transformation: normalizzazione, discretizzazione e imputazione di valori
- Normalizzazione dei dati e deduplica
- Manual cleanup
- Esempio applicativo: workflow di Data Cleaning
- Data Quality Firewalls: golden rules per la Data Entry
3) DATA DESIGN: PROGETTARE LA MODALITA' CORRETTA PER VISUALIZZARE DATI E INFORMAZIONI
- Exploratory vs explanatory Analysis: principali differenze
- Come rendere la visualizzazione dei dati esplicativa (Data Storytelling)
- Piattaforme Open source per la Data Visualization: Google Data Studio, Power BI e Raw Graphs
4) LABORATORIO - ESEMPI e CASI APPLICATI
GIORNO 3: DATA SCIENCE e MACHINE LEARNING, alla base di modelli di Data Governance evoluti
L’esplosione del volume dei dati digitali, il cosiddetto fenomeno Big Data, costituisce una grande opportunità per le imprese di qualsiasi settore produttivo, che proprio a partire dall’analisi sistematica dei dati raccolti e dalla loro organizzazione possono trovare delle correlazioni utili per le proprie scelte e per le strategie di business. In questo contesto, la data science si configura quindi come l’insieme di metodi, processi, algoritmi e tecnologie che consentono di estrarre la conoscenza utile dalla moltitudine di dati strutturati (database) e soprattutto non strutturati (testi, immagini, video ecc.), che l’azienda ha a disposizione. I metodi statistici e analitici più avanzati, assieme all’intelligenza artificiale e al machine learning, sono le risorse di base della moderna data science per il business.
Topics:
1) LA CENTRALITA' DEI DATI COME FATTORE STRATEGICO PER LO SVILUPPO DEL BUSINESS
- Perché i dati rappresentano un asset aziendale strategico
- Opportunità di valorizzazione del patrimonio informativo aziendale (Data Valorization e Data Monetization)
- Case study: l’utilizzo dei dati per abilitare il decision-making
- Le principali sfide nell’utilizzo dei dati: utilizzare i big data analytics per prendere decisioni di business
2) INTRODUZIONE AL MACHINE LEARNING APPLICATO
- L’Hype Cycle dei Big Data: il livello di maturità delle tecnologie emergenti
- Modelli predittivi: metodi di apprendimento (Supervised vs Unsupervised) e principali tipologie di algoritmi
- Il framework CRISP-DM: pipeline per l’implementazione di un processo di ML
- Piattaforme open source per il ML: linguaggi di programmazione e low-coding tool
- Overfitting e underfitting: le principali causa di fallimento dei modelli di ML
- Model performance assessment: criteri di valutazione dell’efficacia dei modelli
- Etica e Machine Learning: spunti di riflessione sui bias degli algoritmi
3) USE CASE DI MACHINE LEARNING
- Alcuni esempi applicativi
4) LABORATORIO - ESEMPI E CASI APPLICATI
Negli ultimi anni, abbiamo assistito alla sempre più frequente emanazione, da parte dei Regolatori, di normative aventi ad oggetto il governo dei dati aziendali. Tuttavia, nel corso del tempo, molte aziende hanno acquisito consapevolezza del valore che i dati rappresentano per il proprio business, in quanto risorsa strategica determinante per i processi decision-making. Ma da dove partire? Governare i dati di un’azienda presuppone la conoscenza analitica delle informazioni che compongono l’Organizzazione, sotto forma di entità, relativi attributi, mutue relazioni.
Topics:
1) INTRODUZIONE ALLA DATA GOVERNANCE:
- La Data Governance tra normative di settore e leggi (i.e. Direttiva EU BCBS 239, Circolare 285 Banca d’Italia, Reg. 38/2018 IVASS, Regolamento EU 679/2016, etc)
- Modelli e standard di riferimento per la Data Governance (DAMA DMBoK, Data Maturity Model, Data Governance Institute)
- Relazioni con altri Framework e Best Practice (ISO, COBIT, etc)
- I trend della Data Governance (Artificial Intelligence, Machine Learning, Internet of Things)
2) MODELLI ORGANIZZATIVI PER IL GOVERNO DEI DATI
- Ruoli e responsabilità per governare i dati
- La Data Governance tra IT e Business
- Il Chief Data Officer
- Principali modelli adottati dalle Organizzazioni moderne
- Data Governance as a Service
3) CONOSCERE E GESTIRE I METADATI AZIENDALI
- Cosa sono i metadati: tipologie di metadati e standard per la loro definizione
- Ontologia e semantica
- Quali sono i principali strumenti per la gestione dei metadati aziendali: Data Catalog, Business Glossary e Data Dictionary
- Il valore del Metadata Management
4) CONOSCERE IL CICLO DI VITA DEI DATI E LE RELAZIONI TRA ESSI ALL'INTERNO DEI PROCESSI AZIENDALI
- Cos’è il Data Lineage e a cosa serve
- Dimensioni del Data Lineage
- Realizzare il Data Lineage per una Data Governance efficace: tecniche e principali ostacoli
- Data Lineage e Metadata Management: un approccio innovativo
5) LABORATORIO E CASI PRATICI
GIORNO 2: DATA QUALITY e adeguata rappresentazione dei dati a supporto dei processi aziendali
Un dato è considerato di qualità solo se ha delle caratteristiche valide ed è in grado di soddisfare l'uso cui è destinato. Per questo motivo, i dati devono essere accurati, aggiornati, rilevanti, completi, comprensibili e affidabili. La qualità dei dati rappresenta anche lo stato di completezza, coerenza, tempestività e accuratezza che li rende appropriati ad un uso specifico. La Data Quality è l’ambito della Data Governance che comprende una serie di processi ripetibili, finalizzati al monitoraggio continuo dei dati aziendali e al miglioramento della loro significatività (es. attraverso l’arricchimento). Anche saper rappresentare nel modo giusto, collocando i dati in un contesto visivo corretto, aiuta manager e decision-maker a identificare rapidamente modelli, tendenze e prendere decisioni migliori per il proprio business. La Data Visualization è la disciplina che si occupa d’individuare i migliori modi per rappresentare i dati in modo grafico, utilizzando tutti gli strumenti che possano aiutare a rendere il dato analizzato il più fruibile e accessibile possibile.
Topics:
1) INTRODUZIONE AL DATA QUALITY MANAGEMENT
- Data Quality impact: principio del garbage in-garbage out e costo dei “bad data”
- Il Data Quality Assessment: valutare la qualità delle informazioni su 7 dimensioni
2) PREPARAZIONE DEI DATI E TECNICHE PER MIGLIORARNE LA QUALITA': "THE HIDDEN DATA FACTORY"
- Data Discovery: identificare le fonti-dati e “scoprire” le relazioni tra i dativ
- Data Profiling: statistiche descrittive e presentazione di alcuni strumenti a supporto (i.e. Bot)
- Data Cleansing checklist: come incrementare la qualità della base dati
- Tecniche di Data Transformation: normalizzazione, discretizzazione e imputazione di valori
- Normalizzazione dei dati e deduplica
- Manual cleanup
- Esempio applicativo: workflow di Data Cleaning
- Data Quality Firewalls: golden rules per la Data Entry
3) DATA DESIGN: PROGETTARE LA MODALITA' CORRETTA PER VISUALIZZARE DATI E INFORMAZIONI
- Exploratory vs explanatory Analysis: principali differenze
- Come rendere la visualizzazione dei dati esplicativa (Data Storytelling)
- Piattaforme Open source per la Data Visualization: Google Data Studio, Power BI e Raw Graphs
4) LABORATORIO - ESEMPI e CASI APPLICATI
GIORNO 3: DATA SCIENCE e MACHINE LEARNING, alla base di modelli di Data Governance evoluti
L’esplosione del volume dei dati digitali, il cosiddetto fenomeno Big Data, costituisce una grande opportunità per le imprese di qualsiasi settore produttivo, che proprio a partire dall’analisi sistematica dei dati raccolti e dalla loro organizzazione possono trovare delle correlazioni utili per le proprie scelte e per le strategie di business. In questo contesto, la data science si configura quindi come l’insieme di metodi, processi, algoritmi e tecnologie che consentono di estrarre la conoscenza utile dalla moltitudine di dati strutturati (database) e soprattutto non strutturati (testi, immagini, video ecc.), che l’azienda ha a disposizione. I metodi statistici e analitici più avanzati, assieme all’intelligenza artificiale e al machine learning, sono le risorse di base della moderna data science per il business.
Topics:
1) LA CENTRALITA' DEI DATI COME FATTORE STRATEGICO PER LO SVILUPPO DEL BUSINESS
- Perché i dati rappresentano un asset aziendale strategico
- Opportunità di valorizzazione del patrimonio informativo aziendale (Data Valorization e Data Monetization)
- Case study: l’utilizzo dei dati per abilitare il decision-making
- Le principali sfide nell’utilizzo dei dati: utilizzare i big data analytics per prendere decisioni di business
2) INTRODUZIONE AL MACHINE LEARNING APPLICATO
- L’Hype Cycle dei Big Data: il livello di maturità delle tecnologie emergenti
- Modelli predittivi: metodi di apprendimento (Supervised vs Unsupervised) e principali tipologie di algoritmi
- Il framework CRISP-DM: pipeline per l’implementazione di un processo di ML
- Piattaforme open source per il ML: linguaggi di programmazione e low-coding tool
- Overfitting e underfitting: le principali causa di fallimento dei modelli di ML
- Model performance assessment: criteri di valutazione dell’efficacia dei modelli
- Etica e Machine Learning: spunti di riflessione sui bias degli algoritmi
3) USE CASE DI MACHINE LEARNING
- Alcuni esempi applicativi
4) LABORATORIO - ESEMPI E CASI APPLICATI
PREREQUISITI:
Suggerita, ma non obbligatoria, la conoscenza delle principali problematiche legate alla gestione dei dati
E' richiesto da parte dei partecipanti l'utilizzo del proprio PC per i laboratori e le esercitazioni interattive
E' richiesto da parte dei partecipanti l'utilizzo del proprio PC per i laboratori e le esercitazioni interattive
DURATA: 24 ORE
PREZZO:
1.200,00 € + IVA
PREZZO PER I SOCI ENIA:
1.040,00 € + IVA