Curriculum Vitae

Istruzione e formazione Titoli di Studio Date 2000 - 2004 Titolo della qualifica Dottorato di ricerca in Ingegneria Informatica rilasciata Principali L'attività di ricerca condotta nell’ambito del dottorato si colloca tematiche/competenze principalmente nell'area delle basi di dati, ed è, in particolare, incentrata professionali possedute sulla qualità dei dati. Il titolo della tesi di dottorato è: “ DaQuinCIS: Exchanging and Improving Data Quality in Cooperative Information Systems”. Relatore della tesi: Prof. Carlo Batini. Il contributo fornito riguarda (i) modelli per la rappresentazione e l'interrogazione della qualità dei dati e (ii) tecniche per il miglioramento della qualità dei dati in sistemi informativi cooperativi. I risultati conseguiti sono tra i primi relativi alla gestione della qualità dei dati in sistemi informativi cooperativi. Ulteriori tematiche oggetto di ricerca nell’ambito del dottorato includono: modelli e linguaggi di interrogazione basati su XML, composizione di metriche di qualità dei dati, qualità dei dati nei Web Information Systems , interoperabilità nei sistemi informativi in rete e trade-off tra privatezza dell’informazione e qualità dei dati.

Nome e tipo Dipartimento di Informatica e Sistemistica, Università degli Studi di Roma d'organizzazione erogatrice “La Sapienza” dell'istruzione e formazione

Date Febbraio 2001 Titolo della qualifica Abilitazione alla Professione di Ingegnere rilasciata Nome e tipo Università degli Studi di Roma “La Sapienza” d'organizzazione erogatrice dell'istruzione e formazione

Date Febbraio 2000 Titolo della qualifica Laurea in Ingegneria Informatica rilasciata Principali La tesi di laurea si colloca nell’ambito dei sistemi informativi ed ha per tematiche/competenze titolo: “Progettazione a Componenti Distribuiti. Proposta, Sperimentazione professionali possedute e Confronto di Paradigmi d i Sviluppo in ambito Rete Unitaria della Pubblica Amministrazione (RUPA)” . Ne è stato relatore il Prof. Carlo Batini. La tesi ha avuto carattere sperimentale, con oggetto la progettazione ed implementazione di soluzioni software basate su middleware a

1 / 45 comp onenti distribuiti nel contesto di una pubblica amministrazione italiana (INPS). Votazione riportata: 110/110 e lode Nome e tipo Dipartimento di Informatica e Sistemistica, Università degli Studi di Roma d'organizzazione erogatrice “La Sapienza” dell'istruzione e formazione

Date: 1993 Titolo della qualifica Diploma di Maturità Scientifica rilasciata Principali La sottoscritta ha conseguito il diploma di maturità scientifica con la tematiche/competenze votazione di 60/60 professionali possedute Nome e tipo Liceo Scientifico Statale “B. Mangino”, Pagani (SA) d'organizzazione erogatrice dell'istruzione e formazione

Corsi di Formazione Date 23-24-30-31/1/2012 e 1/2/2012 Nome del Corso IT Governance e Project Management Nome e tipo SAPIENZA – Università di Roma d'organizzazione erogatrice dell'istruzione e formazione

Date 27/06/2011 Nome del Corso Evolution and merging of real-life ontologies Nome e tipo Tutorial al 19 th Italian Symposium on Advanced Database Systems, d'organizzazione erogatrice Maratea, Italia dell'istruzione e formazione

Date 28/06/2011 Nome del Corso Querying and Reasoning about Massive Social Networks Nome e tipo Tutorial al 19 th Italian Symposium on Advanced Database Systems, d'organizzazione erogatrice Maratea, Italia dell'istruzione e formazione

Date Dal 4/6/2008 al 6/6/2008 Nome del Corso Statistical Machine learning Nome e tipo Università di Roma “La Sapienza” d'organizzazione erogatrice dell'istruzione e formazione

Date 23/6/2008 Nome del Corso Secure Logistic Regression: shared computation across databases Nome e tipo Istat, Roma

2 / 45 d'organizzazione erogatrice dell'istruzione e formazione

Date 25/9/2007 Nome del Corso Adaptive Query Processing Nome e tipo Tutorial alla 33 rd VLDB Conference, Vienna, Austria d'organizzazione erogatrice dell'istruzione e formazione

Date Dal 22/06/2007 al 24/06/2007 Nome del Corso Algoritmi genetici e altre tecniche di calcolo evoluzionistico Nome e tipo Corso di dottorato, Politecnico di Milano, Italia d'organizzazione erogatrice dell'istruzione e formazione

Date 12/06/2007 Nome del Corso Provenance in Databases Nome e tipo Tutorial alla 27 th SIGMOD Conference, Pechino, Cina d'organizzazione erogatrice dell'istruzione e formazione

Date 28/6/2006 Nome del Corso Record Linkage: Similarity Measures and Algorithms Nome e tipo Tutorial alla 26 th SIGMOD Conference Chicago, USA d'organizzazione erogatrice dell'istruzione e formazione

Date Dal 3/5/2006 al 5/5/2006 Nome del Corso Fondamenti di Linux Nome e tipo Istat, Roma d'organizzazione erogatrice dell'istruzione e formazione

Date 17/06/2004 Nome del Corso Tools for Design of Composite Web Services Nome e tipo Tutorial alla 24 th SIGMOD Conference Parigi, Francia d'organizzazione erogatrice dell'istruzione e formazione

Date 20/08/2002 Nome del Corso Automation in Information Extraction and Data integration Nome e tipo Tutorial alla 28 th VLDB Conference, Hong Kong, Cina d'organizzazione erogatrice

3 / 45 dell'istruzione e formazione

Date Dal 14/05/2001 al 18/05/2001 Nome del Corso Scuola di Dottorato ERSADS – European Research Seminar on Advances in Distributed Systems Nome e tipo Bertinoro, Forlì, Italia d'organizzazione erogatrice dell'istruzione e formazione

Date Dicembre 2000 (20 ore) Nome del Corso Data integration Nome e tipo Università di Roma “La Sapienza” d'organizzazione erogatrice dell'istruzione e formazione

Esperienza professionale Date Dal 1 Marzo 2006 ad oggi Lavoro o posizione Tecnologo Terzo Livello Professionale ricoperti Nome e indirizzo del Istat datore di lavoro Tipo di attività o settore Ente di Ricerca Pubblico Principali attività e Appartenenza a strutture Istat e incarichi di responsabilità di strutture responsabilità Istat

• Da Marzo 2006 a Giugno 2006 la struttura di afferenza è stata DCMT/U ( Direzione Centrale per le tecnologie ed il supporto metodologico - Ufficio del Direttore). • Da Giugno 2006 a Giugno 2009 la struttura di afferenza è stata DCMT/1 (Direzione Centrale per le tecnologie ed il supporto metodologico - Progetto Internalizzazione dello Sviluppo Software). • Dal Novembre 2006 a Giugno 2009 ha avuto un incarico per il coordinamento gestionale di tre persone (si veda Allegato A1 nel fascicolo personale) della struttura di progetto DCMT/1 (Direzione Centrale per le tecnologie ed il supporto metodologico - Progetto Internalizzazione dello Sviluppo Software). • Da Giugno 2009 a Novembre 2011 è stata assegnata al servizio DCMT/SVS (Direzione Centrale per le tecnologie ed il supporto metodologico - Servizio Sviluppo Software) ed ha rivestito il ruolo di Dirigente Unità Operativa SVS/C (Sviluppo Software per i processi di produzione statistica) composta da nove persone . • Da Dicembre 2011 ad oggi è stata assegnata al servizio DCIT/RST (Direzione centrale per le tecnologie dell'informazione e della comunicazione – Servizio Regolazione e sviluppo delle tecnologie ICT) ed ha rivestito il ruolo di Dirigente Unità Operativa RST/B

4 / 45 (Sviluppo Sistemi informatici per la statistica) composta da dieci persone .

Partecipazione a Gruppi di Lavoro, Comitati e Commissioni Istat

Il dettaglio dei contributi ai gruppi di lavoro è riportato nei progetti successivamente elencati (e richiamati per comodità di lettura tra parentesi a valle della denominazione del gruppo). [GDL1] Gruppo di Lavoro “Metodologie e software per l'abbinamento di dati da fonti diverse" Riferimento: D08 – 122- DPTS-Ottobre 2008, Durata: Ottobre 2008 – Marzo 2010, Ruolo: Coordinatore Attività (Progetto RELAIS) [GDL2] Gruppo di lavoro “RELAIS: Metodi e Strumenti per il Record Linkage”, riferimento: D08-205 – DPTS 10, Durata: dicembre 2010 - novembre 2013, Ruolo: Membro (Progetto RELAIS) [GDL3] Gruppo di Lavoro per lo “Studio ed applicazione di tecniche di Record Linkage per la costruzione di archivi longitudinali sulla popolazione straniera”, riferimento: D08-54-DPTS 11, Durata: marzo 2011- giugno 2012, Ruolo: Membro (Progetto RELAIS) [GDL4] Gruppo di Lavoro avente il compito di definire le procedure per la gestione operativa, presso tutte le strutture organizzative coinvolte, delle attività inerenti l’applicazione delle sanzioni: D08-92-DPTS-maggio 2011, Ruolo: Membro (Progetto Sanzioni) [GDL5] Gruppo di Lavoro per la “Realizzazione degli idonei sviluppi metodologici e l’estensione degli ambiti applicativi del sistema SMART”, riferimento D08 64 DPTS 10, Durata: Aprile 2010 –Ottobre 2011, Ruolo: Membro (Progetto SMART - Fase 2) [GDL6] Gruppo di lavoro per il Progetto Interdirezionale “Sistema Informativo Statistico delle Pubbliche Amministrazioni – Portale Statistico della PA”, D08 172 DPTS 10, Durata: Ottobre 2010 – Ottobre 2013 , Ruolo: Membro (Progetto Portale PA) [GDL7] Progetto per lo sviluppo e la gestione dei dati censuari – DIDAC, riferimento: D08-5-DIQR-28/10/2011, Durata: Novembre 2011-Dicembre 2014, Ruolo: Vice responsabile (Progetto DIDAC) [GDL8] Gruppo di Lavoro ISTAT-CISIS avente il compito di definire la fattibilità della produzione delle stime sul mercato del lavoro. Riferimento: D08-14-DPTS, Durata: Inizio: marzo 2006 - Fine: settembre 2008, Ruolo: Membro. (Progetto SMART – Fase 1) [GDL9] Gruppo di lavoro per la gestione degli interventi di sviluppo applicativo e/o di manutenzione evolutiva. Riferimento: D08 165 DPTS 09. Durata: Novembre 2009 –, Ruolo: membro [GDL10] Membro del Circolo di Qualità “Metodologie e Strumenti Generalizzati”, D01-UDC-08, 2008 [GDL11] Membro del Circolo di Qualità “Metodologie e Strumenti Generalizzati”, D01-UDC-SCS-07, 2007 [GDL12] Gruppo di lavoro che gestisce la raccolta e la diffusione dei software generalizzati, le relative informazioni e gli aspetti informatici connessi alla applicazione web alla base dell'OTS. Riferimento: 100/DPTS – 13/05/2011, Durata: maggio 2011 – Novembre 2012, Ruolo: membro. (Progetto OTS) [GDL13] Gruppo di lavoro incaricato di procedere alla valutazione di metodi di tutela della riservatezza di tipo perturbativo per la pubblicazione di aggregati delle

5 / 45 statistiche strutturali sulle imprese. Riferimento: 83/06/DPTS. Durata: Maggio 2006 –, Ruolo: membro (Progetto Tutela della Riservatezza)

[Comm1] Funzione di segretario di commissione esaminatrice del concorso pubblico nazionale per titoli ed esami per il profilo di primo ricercatore di secondo livello professionale dell’Istat nell’area statistico informatica (si veda allegato A2 – fascicolo personale). [Comm2] Funzione di segretario di commissione esaminatrice del concorso pubblico nazionale per titoli per il profilo di dirigente di ricerca dell’Istat nell’area statistico informatica (si veda allegato A3– fascicolo personale) [Comm3] Membro della commissione esaminatrice del concorso pubblico nazionale per titoli ed esami a 25 posti per il profilo di collaboratore tecnico enti di ricerca VI livello professionale dell’Istat, area informatica (Allegato A5). [Comm4] Membro del corrente comitato metodologie , con il compito di provvedere all’avvio e al corretto funzionamento della rete per l’innovazione metodologica nella produzione statistica dell’Istat. Riferimento D08 110 DPTS 10. [Comm5] Membro supplente della Commissione Tecnica incaricata di aggiudicare le procedure di gara per la fornitura di beni e servizi informatici. (Allegato A6)

Nel seguito si riporta una sintetica descrizione dei progetti cui la sottoscritta ha partecipato. I richiami a pubblicazioni e lavori fanno riferimento alla successiva lista di pubblicazioni e lavori opportunamente numerata. Progetto RELAIS (Record Linkage At Istat) Data inizio: Marzo 2006 Data fine: In corso

Obiettivo Generale

RELAIS (REcord Linkage At IStat) è un toolkit che rende disponibile un insieme di tecniche atte a realizzare un processo di record linkage tra due sorgenti dati. Il record linkage ha l’obiettivo di identificare la stessa entità del mondo reale, a partire d a diverse rappresentazioni, tipicamente record, che questa può avere in fonti di dati diverse. RELAIS nasce da un’idea della sottoscritta che ha seguito il progetto di realizzazione del sistema fin dall’inizio. La versione 1.0 del software RELAIS è stata r ilasciata sul sito Istat a Febbraio 2008, ed è stato il primo sistema software rilasciato dall’Istat con la EUPL (European Union Public License), aderendo alle iniziative indirizzate all’adozione ed alla promozione di software a sorgente aperto. Il sistema, attualmente alla versione 2.2, è disponibile per il download alle seguenti fonti: 1. Sito Istat intranet: http://10.18.103.29/doutdes/SW_statistico_1/repositary/index.html 2. Sito Istat internet: http://www.istat.it/it/strumenti/metodi-e- software/software/relais 3. Repository europeo joinup: https://joinup.ec.europa.eu/software/relais/description Ruoli e Responsabilità

6 / 45

La sottoscritta ha svolto le seguenti funzioni: • Coordinamento di un gruppo di informatici di sviluppo composto da due persone, nello specifico Luca Valentino e Laura Tosco. Si vedano in merito, o Allegato A1 (fascicolo personale) , che sancisce il coordinamento generale del progetto RELAIS in relazione agli aspetti informatici. o Le schede intervento (disponibili presso il sistema www- spm.istat.it): ° ID_Intervento IT120101(1/1/2009 – 31/12/2009), che che individua la sottoscritta come responsabile dell’intervento relativo allo sviluppo delle funzionalità della versione 2.0 di RELAIS. ° ID_Intervento: IT1201.02 (1/1/2010 – 31/12/2010) ), che individua la sottoscritta come responsabile dell’intervento relativo allo sviluppo delle funzionalità delle versioni 2.1 e 2.2 di RELAIS. ° ID_Intervento: IS0903.01 (30/12/2011 - 30/12/ 2011), che individua la sottoscritta come responsabile dell’intervento relativo all’utilizzo di RELAIS per il censimento della popolazione 2011. o Il gruppo di lavoro relativo a “Metodologie e software per l'abbinamento di dati da fonti diverse” [GDL1], in cui la sottoscritta ha la funzione di coordinamento delle attività informatiche. • Attività di progettazione, sviluppo, test e disseminazione (si vedano i gruppi di lavoro [GDL1], [GDL2] e [GDL3]), illustrate nel dettaglio nella seguente sezione relativa alle attività specifiche. • Responsabile della linea di attività OB1076 del PAA 2012 (Piano delle attività annuali dell’Istat) e dell’ azione di “Progettazione e realizzazione sistemi generalizzati” in cui il progetto si colloca.

Attività Specifiche

La sottoscritta ha partecipato alla progettazione ed allo sviluppo delle seguenti funzionalità disponibili nelle versione 1.0 del software RELAIS: • Lettura di insiemi di dati da file in formato testuale. • Creazione dello spazio di ricerca del processo di li nkage come prodotto cartesiano dei record degli insiemi di dati in input. • Metodo di riduzione dello spazio di ricerca (dato dal prodotto cartesiano dei record di ciascun file coinvolto nel processo di linkage) denominato “blocking” mediante specifica di un ’opportuna variabile di bloccaggio. • Metodo di riduzione dello spazio di ricerca denominato “sorted neighborhood method” con la definizione di un’opportuna variabile di ordinamento e della dimensione della finestra dei confronti. • Specifica delle variabili d i matching da utilizzare nelle fasi successive del processo di linkage. • Calcolo della distribuzione di frequenza osservata del vettore dei confronti generato dalle variabili di matching specificate (tabella di

7 / 45 contingenza). • Stima dei parametri del modello di Fellegi e Sunter mediante l’algoritmo EM (Expectation-Maximization), sotto l’ipotesi di indipendenza condizionata delle variabili di matching. • Scrittura di coppie di match, nonmatch, possible match nel caso di matching N:M. • Riduzione da matching N:M a matching 1:1. • Scrittura di coppie di match e possible match nel caso di matching 1:1. Con riferimento alla versione del software 2.0, la sottoscritta ha partecipato alla progettazione ed ha coordinato lo sviluppo delle seguenti attività: • Passaggio ad una a rchitettura basata su una base di dati relazionale (MySQL) che consente di ottimizzare la gestione di grosse moli di dati in tutto il processo (input, fasi intermedie e output); • Introduzione di diverse funzioni di distanza numerica e tra stringhe, in aggiu nta alla sola funzione di uguaglianza presente nella versione 1.0; • Introduzione dei modelli decisionali esatto e deterministico da affiancare al metodo probabilistico; • Introduzione di una fase di “data profiling” che fornisce all’utente un insieme di meta dati per supportarlo nelle fasi di scelta delle variabili di bloccaggio e delle variabili di matching; • Esecuzione contemporanea (“one-shot”) di tutti i blocchi al fine di semplificare la gestione di un numero elevato di blocchi. Con riferimento alla vers ione del software 2.1, la sottoscritta ha partecipato alla progettazione ed ha seguito lo sviluppo delle seguenti attività: • Input dei dati da database Oracle e MySQL. • Miglioramento del metodo sorted neighborhood per la riduzione dello spazio di ricerca. Con riferimento alla versione del software 2.2, la sottoscritta ha partecipato alla progettazione ed ha coordinato lo sviluppo delle seguenti attività: • Deduplicazione • Nuovo metodo di riduzione dello spazio di ricerca denominato Nested Blocking • Visualizzazione delle probabilità marginali stimate da modello probabilistico • Input delle probabilità marginali da file esterno • Esecuzione batch Per ciascuna versione del sistema è stato prodotto un manuale, ed in particolare: • RELAIS 1.0 Guida Utente, in lingua italiana [RT7]. • RELAIS 2.0, 2.1 e 2.2 User Guide, in lingua inglese [RT8], [RT9] e [RT10]. Con riferimento alle attività di test del sistema RELAIS, esse sono state progettate e seguite dalla sottoscritta. In particolare, oltre ai normali test funzionali e non funzionali atti a verificare la correttezza e le prestazioni del sistema, sono state effettuate le seguenti attività: • Collaborazione con INE – Istituto Nazionale di Statistica Spagnolo avente lo scopo di testare il software sui dati dell’I ndagine sulle Condizioni di Vita (LCS) e del Registro Centrale della Popolazione (CPR). 8 / 45 • Collaborazione con DCIS/DEM/C con riferimento a rilevazioni Istat sulle nascite per analizzare fenomeni come le aspettative di fecondità, la medicalizzazione del percorso gravidanza – parto - nascita e i suoi effetti. • Attività nell’ambito del [GDL3] (Studio ed applicazione di tecniche di Record Linkage per la costruzione di archivi longitudinali sulla popolazione straniera). Con riferimento alle attività di diffusione e disseminazione del software, la sottoscritta oltre a pubblicazioni sia in forum nazionali che internazionali (riportate nella sezione pubblicazioni), ha organizzato/partecipato ai seguenti eventi: • CENEX Meeting (26 Gennaio 2007) o Relazione: RELAIS: an Open Source Toolkit for Building Record Linkage Processes • Giornata di Studio sull’Ambiente “R”: Prime Esperienze di Utilizzo di R all’Interno dell’Istat (20 Febbraio 2007) o Relazione: Utilizzo di R embedded in JAVA nel progetto RELAIS • Organizzazione del seminari o “RELAIS: Un Software Open Source per il Record Linkage” (22 Febbraio 2008) durante il quale e’ stato presentato il software sia con riferimento ai suoi aspetti metodologici che implementativi. o Relazione: Generalità Architetturali di RELAIS • Nona Conferenza nazionale di statistica (15-16 dicembre 2008) o Poster “RELAIS: Record Linkage At Istat” • ESSnet Data Integration o Training on the Job di RELAIS, Istituto di Statistica Lettonia, 5/7/2011-7/7/2011 o Corso di formazione su Record Linkage e Statistical

Progetto DIDAC Data inizio: Novembre 2011 Data fine: Dicembre 2014

Obiettivo Generale

Il progetto DIDAC (Diffusione Dati Censuari) ha come obiettivo lo sviluppo e la gestione del sistema di diffusione dei dati dei censimenti generali, ovvero censimento dell’agricoltura, censimento della popolazione e delle abitazioni, censimento dell’industria e dei servizi. Il progetto ha una notevole complessità che si manifesta nell’elevato numero di workpackage costitutivi pari a 22 e nell’elevato numero di risorse c oinvolte (circa 80, naturalmente in diversi periodi temporali e con diverse percentuali di utilizzo).

Ruoli e Responsabilità

La sottoscritta è membro dello staff di coordinamento tecnico del

9 / 45 progetto con ruolo di vice -responsabile dell’intero progetto ([GDL7]) . Inoltre riveste il ruolo di responsabile di team tecnico , in quanto responsabile del WP6 – Data Warehouse Primario – Infrastruttura tecnologica ed Impianto DW( [GDL7]) . Inoltre, è responsabile della linea di attività OB1839 del PAA 2012 e delle r elative azioni di (i) “Progettazione dell’architettura di diffusione dei censimenti generali” e (ii) “Supporto alla realizzazione dell’architettura di diffusione”.

Attività Specifiche

La sottoscritta ha partecipato alla stesura del progetto di massima ( 7 allegati tecnici, un executive summary, un primo work plan, un gantt “top level”) in collaborazione con Stefano De Francisci, Fabio Crescenzi e Franco Lorenzini. Ha inoltre contribuito alla redazione della delibera [GDL7]. Le attività di gestione svolte ad oggi comprendono: • Attività preliminari necessarie all’organizzazione del kick-off meeting, ed in particolare incontri dello staff di coordinamento tecnico. • Partecipazione all’organizzazione della riunione di kick-off. • Gestione delle schede di dettaglio dei singoli WP, da compilare a cura dei responsabili dei team tecnici. • Gestione del Gantt di progetto relativo ai primi 18 mesi. • Redazione di note di sintesi e quadri riepilogativi sulle risorse ad utilizzo del top management. In quanto responsabile del WP6, la sottoscritta ha redatto la scheda di dettaglio contenent e la pianificazione delle attività del WP e la relativa allocazione delle risorse. Inoltre, un’attività specifica del WP è ad oggi in corso e riguarda la scelta dell’infrastruttura tecnologica del data warehouse primario. In merito a tale attività: (i) è stato predisposto un ambiente di benchmark; (ii) sono stati invitati alcuni vendor ad effettuare un POC (proof-of-concept) su tale ambiente; (iii) è in corso una valutazione comparata dei POC a l fine di effettuare la scelta relativa all’infrastruttura tecnologica del data warehouse primario. Progetto Sanzioni Data inizio: Gennaio 2011 Data fine: In corso

Obiettivo Generale

Il progetto ha l’obiettivo di realizzare un sistema che gestisce l’iter sanzionatorio a carico dei soggetti inadempienti per le indagini sanzionabili, ovvero quelle che rientrano in un apposito DPR. La gestione dell’iter sanzionatorio è in parte a carico delle direzioni di produzioni dell’Istat ed in parte a carico della Direzione Generale.

Ruoli e Responsabilità

La sottoscritta ha il ruolo di responsabile intervento fornitore e di consulente/ progettista come da Scheda Intervento IT1605.01 (disponibile presso il sistema www.spm.istat.it).

10 / 45 Nello specifico, la sottoscritta coordina una risorsa , Paolo Piergentili, nelle attività di progettazione e di sviluppo del sistema. L’attività inquadrata dalla scheda intervento riguarda le sole funzionalità del sistema relative alla gestione della parte dell’iter sanzionatorio a carico della Direzione Generale. La completa definizione della gestione dell’iter sanzionatorio è a carico di un gruppo di lavoro GDL, di cui la sottoscritta è membro [GDL4]. Inoltre, è responsabile della linea di attività OB1076 del PAA 2012 ed in partico lare delle azioni di (i) “Manutenzione sistemi area sociale” e (ii) “Progettazione e sviluppo sistemi area sociale”, in cui il progetto si colloca.

Attività Specifiche

Le attività specifiche effettuate dalla sottoscritta riguardano: (i) coordinamento ne lle attività di progettazione e di sviluppo del sistema, (ii) gestione dei rapporti con i referenti delle direzioni committenti. E’ in fase di rilascio la versione beta del sistema che copre le funzionalità relative all’iter sanzionatorio di interesse del la direzione generale, mentre è in atto la pianificazione dello sviluppo delle restanti funzionalità.

Progetto CORE Data inizio:Gennaio 2010 Data fine: Febbraio 2012

Obiettivo Generale

CORE (COmmon Reference Environment) è una ESSnet finanziata da Eurostat nell’ambito dello Statistical Programme 2010. L’Istat ha coordinato il progetto, con partner gli istituti di statistica di Olanda, Norvegia, Francia, Portogallo e Svezia. L’ obiettivo generale del progetto ha riguardato la progettazione e l’implementazione di un’architettura a supporto della definizione ed esecuzione automatica dei processi statistici. Il progetto CORE è ritenuto strategico in ambito europeo nell’ambito delle iniziativ e di industrializzazione e standardizzazione dei processi statistici promosse dall’HLG-BAS (High-level Group for Strategic Developments in Business Architecture in Statistics).

Ruoli e Responsabilità

La sottoscritta ha rivestito per il progetto CORE il ruolo di Technical Manager di tutto il progetto, con responsabilità sulla gestione organizzativa e sulla qualità tecnica dei risultati del progetto, come riportato nel contratto con la Commissione Europea:

Each work-package has a WP leader, taking responsibility for the production of the deliverables of individual work-packages. The Technical Committee will consist of the WP leaders and will be chaired by a Technical Manager. Monica Scannapieco from Istat will be the CORE technical Manager. The Technical Committee will be responsible for overseeing the overall agenda of the project, as well as for project policy, liaison and external activities of the project, and technical quality management

11 / 45

In aggiunta, la sottoscritta ha rivestito il ruolo di workpackage (WP) leader per: • WP1 “Project Management”, a partecipazione di tutti i partner. • WP3 “Generic interface design for interconnecting GSBPM sub- processes”, a partecipazione oltre Istat di INSEE (Francia), CBS(Olanda) e SSB (Norvegia). Il WP3 è il workpackage di progetto dell’intera architettura CORE. Infine, si sottolinea come l’attività è di carattere aggiuntivo rispetto all’attività ordinaria .

Attività Specifiche

La sottoscritta ha redatto la proposta di progetto CORE [RT18] curandone sia gli aspetti organizzativi che tecnici.

In relazione al WP1 “Project Management”, ha condotto attività di monitoraggio e revisione dei lavori dell’intera Essnet. Ha organizzato e partecipato ai meeting di progetto: • kick-off meeting - Luxembourg, 17-18 January 2011; • meeting – Lisbon 28-29 March 2011; • Intermediate meeting – Paris 20-21 June 2011; • Rome meeting – Rome 3-4 October 2011; • Final meeting – Luxembourg, 10-11 January 2012.

Ha redatto, in collaborazione paritaria con Laura Tosco, i seguenti deliverable: • D.1.1 Preliminary Report • D.1.2 Intermediate Report • D.1.3 Final Report Ha infine coordinato l’attività di rendicontazione dell’intero progetto.

In relazione al WP3 “Generic interface design for interconnecting GSBPM sub-processes”, la sottoscritta ha coor dinato e partecipato alla redazione del deliverable: • D.3.1 Technical Specification vs1

In relazione al WP6 “Implementation library for generic interface and production chain for Java”, coordinato da Antonino Virgillito, ha condotto le seguenti attività: (i) progettazione ed implementazione del CORE repository, (ii) progettazione ed implementazione dello scenario statistico di riferimento, in collaborazione con Diego Zardetto. In relazione alle attività di disseminazione dei risultati la sottoscritta, oltr e ai lavori riportati nella sezione pubblicazioni, ha svolto le seguenti attività: • Partecipazione al meeting SISAI , maggio 2011, Lussemburgo. Illustrazione di due presentazioni: 1. “COmmon Reference environment – CORE: Architecture and Information Model” ; 2. “CORE & SDMX: Integration Issues” • Meeting ITDG, ottobre 2011, Lussemburgo. Red azione di una nota descrittiva di CORE e preparazione della relativa presentazione “CORE ESSnet – Progess Status”.

12 / 45 • Meeting HLG-BAS, Novembre 2011, Ginevra. Partecipazione a gruppi di lavoro con l’obiettivo di discutere il ruolo di CORE nella visione strategic dell’HLG-BAS.

Progetto CORA Data inizio:Gennaio 2010 Data fine: Febbraio 2012

Obiettivo Generale

Il progetto CORA (COmmon Reference Architecture) è una ESSnet finanziata da Eurostat nell’ambito dello Statistical Programme 2009. L’Istat ha coordinato il progetto, con partner gli Istituti di Statistica di Olanda, Norvegia, Svizzera, Lettonia e Svezia. L’ obiettivo generale del progetto ha riguardato un’analisi della fattibilità di una architettura comune ai vari Istituti di Statistica Europei, secondo le dimensioni di business, technology e organization . I principali risultati di CORE sono relativi a: (i) un information model, che è stato un input importante per il successivo progetto CORE, (ii) un repository di software open source utilizzati da Istituti di Statistica Europei, attualmente mantenuto dall’UNECE (http://www1.unece.org/stat/platform/display/msis/Software+Inventory ). Il progetto CORA si è concluso con successo, e l’esito positivo ha determinato il finanziamento per il successivo progetto CORE.

Ruoli e Responsabilità

La sottoscritta ha rivestito per il progetto CORA il ruolo di Technical Manager di tutto il progetto, con responsabilità sulla gestione organizzativa e sulla qualità tecnica dei risultati del progetto, come riportato nel contratto con la Commissione Europea:

Each work-package has a WP leader, taking responsibility for the production of the deliverables of individual work-packages. The Technical Committee will consist of the WP leaders and will be chaired by a Technical Manager. Monica Scannapieco from Istat will be the CORE technical Manager. The Technical Committee will be responsible for overseeing the overall agenda of the project, as well as for project policy, liaison and external activities of the project, and technical quality management

In aggiunta, la sottoscritta ha rivestito il ruolo di workpackage (WP) leader per: • WP1 “Project Management”, a partecipazione di tutti i partner. • WP5 “Project Dissemination”, a partecipazione di tutti i partner.

Infine, si sottolinea come l’attività è di carattere aggiuntivo rispetto all’attività ordinaria . Attività Specifiche

La sottoscritta ha redatto la proposta di progetto CORA [RT12] curandone sia gli aspetti organizzativi che tecnici.

13 / 45 In relazione al WP1 “Project Management”, ha condotto attività di monitoraggio e revisione dei lavori dell’intera ESSnet. Ha organizzato e partecipato ai meeting di progetto:

• Kick-off meeting - Luxembourg, 19-20 October 2009: • WPs Leader Meeting – The Hague, 26-27 January 2010: • Intermediate Meeting – Rome, 23-25 March 2010: • Final Meeting – Luxembourg 18 October 2010:

Ha redatto, in collaborazione paritaria con Laura Tosco, i seguenti deliverable: • D.1.1 Preliminary Report • D.1.2 Intermediate Report • D.1.3 Final Report Ha infine coordinato l’attività di rendicontazione dell’intero progetto.

In relazione al WP5 “Project Dissemination”, la sottoscritta ha coordinato e partecipato alla redazione dei deliverable: • D.5.1 Final Report • D.5.2 Report on Dissemination Activities Ha inoltre coordinato la realizzazione di un sito web del progetto (https://joinup.ec.europa.eu/software/cora/description ) ed il set-up di una sezione wiki CORA utilizzata sia in fase di proposta che di lavoro.

Progetto ReGe Data inizio: Gennaio 2011 Data fine: In corso

Obiettivo Generale

Il progetto REGE (REgistro GEnerale) è relativo allo sviluppo di un sistema di acquisizione e correzione dei dati relativi ai procedimenti giudiziari, gestiti dalla Direzione centrale delle statistiche socio- demografiche e ambientali (DCSA) . Il sistema acquisisce i dati inviati ogni trimestre dalle circa 200 procure italiane ed assiste una prima fase di controllo e correzione.

Ruoli e Responsabilità

La sottoscritta ha il ruolo di responsabile intervento fornitore e di consulente/ progettista come da Schede Intervento IS0204.02 e IS0204.03 (disponibile presso il sistema www.spm.istat.it). Nello specifico, la sottoscritta coordina due risorse , Pasquale Testa e Paolo Pizzo, nelle attività di progettazione e di sviluppo del sistema. Inoltre, è responsabile della linea di attività OB1076 del PAA 2012 ed in particolare delle azioni di (i) “Manutenzione sistemi area sociale” e (ii) “Progettazione e sviluppo sistemi area sociale”, in cui il progetto si colloca Attività Specifiche

Le attività specifiche effettuate dalla sottoscritta riguardano: (i) coordinamento nelle attività di progettazione e di sviluppo del sistema, (ii)

14 / 45 gestione dei rapporti con i referenti delle direzioni committenti. Ad Aprile 2011 sono state rilasciate in versione beta le funzionalità che relative alla acquisizione. E’ in corso la progettazione e lo sviluppo della fase di correzione.

Progetto I.stat Data inizio:Settembre 2009 Data fine: Marzo 2010

Obiettivo Generale

Il progetto I.stat ha avuto come obie ttivo principale l’introduzione di un corporate data warehouse in Istat. Infatti, la pubblicazione dei dati da parte dell’Istat avveniva in modo non coordinato e si avvertiva la necessità di una centralizzazione dell’informazione diffusa dall’Istituto. Per tanto, nel 2009, sono partite diverse attività che hanno poi portato, alla fine del 2010 alla piena pubblicazione su un sistema di web warehousing, I.stat appunto, di gran parte dei dati Istat.

Ruoli e Responsabilità

La sottoscritta ha avuto il ruolo di coordinatore del progetto per la Direzione Centrale per le tecnologie ed il supporto metodologico (DCMT) come da allegato, in cui si evidenzia il carattere di incarico aggiuntivo rispetto all’attività ordinaria (allegato A4). Ha inoltre partecipato alle attività di valutazione del sistema utilizzato (OECD.stat) e di messa in esercizio di I.stat, come dettagliato in seguito.

Attività Specifiche

Da Settembre 2009 a Dicembre 2010, la sottoscritta ha partecipato ad una attività di valutazione della piattafo rma OECD.stat, contribuendo nello specifico alla redazione di una griglia comparativa tra la soluzione OECD.stat ed una soluzione open source basata su piattaforma Penthao. Da dicembre 2010, la sottoscritta ha effettuato quattro principali tipi di attività: (i) attività di coordinamento dell’intero progetto, in collaborazione paritaria con Stefania Bergamasco, incaricata del coordinamento per la direzione di diffusione (DCET) ; (ii) attività di coordinamento di due risorse sistemistiche, Luigi Malatesta e Luca Gramigni, per l’installazione di OECD.stat; (iii) attività di interfacciamento con l’OECD , al fine di discutere tematiche connesse alla installazione e profilazione del p rodotto; (iv) attività di interfacciamento con le direzioni di produzione per guidarle nella predisposizione dei file di input al sistema. Nell’ambito delle attività di coordinamento del progetto (tipo (i)): • E’ stata effettuata una pianificazione di dett aglio del progetto, ritenuto ad elevata criticità per l’Istituto. • E’ stato prodotto un gantt generale per il rilascio di I.stat, progressivamente aggiornato e discusso con il top management in riunione dedicate. • Sono stati redatti un insieme di SAL (stato avanzamento lavori) per il monitoraggio continuo del progetto.

15 / 45 • Sono stati effettuati una serie di incontri con le risorse coinvolte nel progetto per l’attivazione ed il monitoraggio delle singole attività. • Si è partecipato alla predisposizione del MOU (M emorandum of Understanding) con l’OECD per l’utilizzo del prodotto. Nell’ambito delle attività connesse all’installazione di OECD.stat (tipo (ii)): • Sono state coordinate due risorse. • Si è attivamente partecipato alla predisposizione degli ambienti di test e di produzione del sistema. Nell’ambito delle attività di interfacciamento con l’OECD (tipo (iii)): • Sono state effettuate diverse web conference, al fine di sopperire alle deficienze della manualistica utente e di installazione e definire i termini della profilazione del prodotto in lingua italiana. Nell’ambito delle attività di tipo (iv) connesse ai rapporti con le direzioni di produzione: • Si sono organizzati ed effettuati una serie di incontri mirati ad illustrare le modalità di interfacciamento con I.stat. • Si è partecipato alla predisposizione di un documento “Il piano di spoglio e i file di input” (riferimento [RT23]), inviato alle direzione di produzione. La sottoscritta si è in particolare occupata del formato dei file di input.

Progetto EMS (Event Management System) Data Inizio: Ottobre 2010 Data Fine: Novembre 2010

Obiettivo Generale

L’obiettivo generale del progetto è stata la valutazione del sistema dell’ OCSE Event Management System (EMS) al fine di comprenderne la potenziale utilità ai fini di un utilizzo interno da parte dell’Istat.

Ruoli e Responsabilità

La sottoscritta è stata incaricata di coordinare l’attività, e si è avvalsa di una risorsa Paolo Pizzo.

Attività Specifiche

Le attività specifiche connesse al progetto sono: • La sottoscritta ha curato i contatti con l’OCSE al fine di poter valutare il prodotto. • Ha organizzato un web conference in cui i rappresentanti dell’OCSE hanno presentato il prodotto ai rappresentanti Istat delle possibili aree di utilizzo (presidenza, SI STAN, direzione della comunicazione, servizio sviluppo risorse umane, direzione centrale per le metodologie ed il supporto metodologico). • Ha effettuato, insieme a Paolo Pizzo, una valutazione delle funzionalità del sistema. • Ha redatto, insieme a Paolo Pizz o, un documento riassuntivo dei risultati ([RT24]).

16 / 45 Progetto Migrazione da SAS ad R: Sperimentazione sull’Indagine Forze di Lavoro Data inizio: Maggio 2006 Data fine: Febbraio 2008

Obiettivo Generale

La sperimentazione ha riguardato l’utilizzo del package R “Survey” per implementare le fasi di calibrazione dei dati e di calcolo delle stime e degli errori nel caso dell’indagine Forze di Lavoro. Tale sperimentazione ha avuto l’obiettivo di testare la fattibilità della migrazione SAS−>R in una specifica fase del processo di produzione. In particolare, sono stati confrontati i risultati ottenuti con tale package con quelli prodotti dal software GENESEES (GENEralized Sampling Estimates and Errors in Surveys) attualmente usato in Istat e sviluppato in SAS.

Ruoli e Responsabilità

La sottoscritta ha avuto il compito di coordinare il progetto per la DCMT/1 (si veda incarico allegato A1 nel fascicolo personale). Si è inoltre occupata delle attività di studio e di test effettuate in collaborazione con Diego Zardetto.

Attività Specifiche

Le attività condotte nell’ambito del presente progetto sono state: • Attività 1: Studio del package Survey ed individuazione delle funzioni di interesse. Questa fase ha sostanzia lmente previsto lo studio della documentazione relativa al package Survey. • Attività 2: Test delle funzioni individuate nella fase 1 su data set “controllati”. Questa fase è stata condotta con l’obiettivo di comprendere pienamente il comportamento delle funzioni individuate, posponendo ogni considerazione relativa alla loro efficienza su data set realistici. Nello specifico, le funzioni sono state testate su data set di prova, prendendo in esame diverse configurazioni dei parametri di input. E’ stato, inf ine, effettuato un primo confronto tra i risultati di GENESEES ed i risultati delle funzioni testate, con lo scopo principale di orientare la sperimentazione effettiva che è stata successivamente realizzata. • Attività 3: Identificazione delle analogie e del le differenze tra GENESEES e le funzioni testate. Lo studio è stato utile anche per progettare nella maniera più opportuna la sperimentazione successivamente condotta. Ad esempio, a causa della diversa gestione dei vincoli di range, si è resa necessaria l’ implementazione di un modulo R che “replicasse” il metodo di calcolo dei bounds di GENESEES: solo in questo modo è stato, infatti, possibile dare senso al test di efficacia cui i due software sono stati sottoposti. • Attività 4: Test di efficacia ed efficienza di GENESEES e la funzione calibrate sull’indagine Forze di Lavoro. Questa fase è stata la più onerosa del processo di sperimentazione ed ha previsto test sia in ambiente PC che in ambiente server. I risultati conseguiti

17 / 45 sull’indagine sulle Forze di Lavoro – una rilevazione in certo senso “critica” sia in termini di dimensioni, sia per la complessità del disegno di campionamento e del problema di calibrazione – oltre a dimostrare la possibilità concreta di usare il package Survey nella pratica Istat, hann o permesso l’individuazione di criticità e punti di forza generali del linguaggio R. Infine è stata effettuata una attività di disseminazione dei risultati ottenuti, che oltre alle partecipazioni a forum nazionali ed internazionali (riportate nella sezione pubblicazioni), ha previsto: • Giornata di Studio sull’Ambiente “R”:Prime Esperienze di Utilizzo di R all’Interno dell’Istat (20 Febbraio 2007) o Relazione: Esperienze nella Migrazione da GENESEES- SAS a Survey-R • Seminario “Il Software per la Statistica Uffi ciale: dai Sistemi Proprietari a quelli Open Source”(4 Marzo 2008) o Relazione: “L’Uso di R per il Calcolo delle Stime e degli Errori: Risultati Ottenuti e Lavori in Corso” Progetto SMART: stime sul mercato del lavoro a livello sub- provinciale (FASE 2) Data Inizio: Aprile 2010 Data Fine: Settembre 2011

Obiettivo Generale

Il progetto, è il seguito del progetto SMART Fase 1, di seguito riportato. Si focalizza su ulteriori sviluppi metodologici e degli applicativi software realizzati nella prima fase.

Ruoli e responsabilità La sottoscritta è membro del gruppo di lavoro [GDL5].

Attività specifiche

Ha partecipato alla fase di progettazione delle funzionalità di interfaccia del sistema SMART, insieme ad Antonino Virgillito

Progetto SMART: stime sul mercato del lavoro a livello sub- provinciale (FASE 1) Data Inizio: Marzo 2007 Data Fine: Dicembre 2008

Obiettivo Generale

Il progetto, inserito nel Programma Statistico Nazionale (PSN) del 2005, ha previsto la collaborazione tra ISTAT e CISIS per valutare la possibilità di produrre stime sul mercato del lavoro a livello sub-provinciale. Nell’ambito di tale collaborazione era previsto lo sviluppo di un sistema software che mettesse in grado gli uffici di statistica delle Regioni di produrre, sempre nel ri spetto della metodologia statistica, stime su domini specifici con maggiore autonomia.

18 / 45 Ruoli e responsabilità

Le attività che hanno coinvolto la sottoscritta (si veda incarico Allegato 1 nel fascicolo personale, e gruppo di lavoro [GDL8]) riguardano lo sviluppo del sistema software SMART ed in particolare si dettagliano nel: • Coordinamento di un gruppo di informatici di sviluppo composto da due persone. • Partecipazione alla progettazione e allo sviluppo del sistema. • Disseminazione.

Attività Specifiche

La fase di progettazione e sviluppo ha in particolare previsto le seguenti attività: • Studio di un middleware specifico per l’invocazione remota di procedure SAS che implementano il calcolo delle stime desiderate. Il middleware selezionato è ACTIVE-MQ, mid dleware basato sui messaggi caratterizzato dalla possibilità di realizzare una comunicazione asincrona tra i soggetti richiedenti (le regioni) ed il soggetto fornitore (Istat). • Progetto e sviluppo di un’applicazione JAVA che consentisse l’invocazione delle procedure SAS di stima. • Progetto di un s istema complessivo, denominato SMART, comprendente, oltre al middleware ACTIVE MQ e all’applicazione JAVA, anche un’interfaccia per l’accesso via Web. La fase di disseminazione ha previsto: • Incontro seminariale Istat-Regioni: Progetto studio di fattibilità per la produzione di stime sul mercato del lavoro a livello sub- provinciale (21 febbraio 2008) o Relazione: “Sistema Informatico Accessibile via Web per la Produzione di Stime per Piccole Aree a partire dall’Ind agine Forze di Lavoro” • Presentazione del sistema web SMART – SMall ARea estimation Tool: Soluzioni metodologico-informatiche e suoi possibili utilizzi da parte degli utenti (26 Novembre 2008) o Relazione: “Il sistema SMART” • Pubblicazione in un contesto internazionale [C35].

Progetto Portale PA Data inizio: Ottobre 2010 Data fine: Ottobre 2013

Obiettivo generale

L’obiettivo generale del progetto è la raccolta dei requisiti nonché la realizzazione e la manutenzione di un portale che renda disponibili, in modo dedicato, i dati relativi alle statistiche sulle pubbliche amministrazioni e sulle società pubbliche (o con trollate da soggetti pubblici), in accordo alla legge finanziaria del 2008.

Ruoli e Responsabilità

19 / 45

La sottoscritta è membro di un gruppo di lavoro dedicato alla realizzazione del progetto [GDL6], con attività specifica relativa alla predisposizione di un sito Web di accesso diretto al portale, con funzione di front-end di un web warehouse contente i dati da diffondere.

La sottoscritta ha condotto le seguenti attività per il progetto: • Partecipazione al disegno dell’architettura complessiva del sistema, sia lato internet che intranet. • Risoluzione delle problematiche di sicurezza connesse all’accesso via Internet mediante autenticazione. • Ha condotto, con funzioni sia di coordinamento che operative, insieme a Leonardo Tininini, le attività di progettazione e realizzazione del sito web.

Progetto OTS Data inizio: Maggio 2011 Data fine: Novembre 2012

Obiettivo generale

Il progetto ha l’obiettivo di riprogettare il sito Istat dell’Osservatorio Tecnologico dei Software generalizzati (OTS). L’OTS ha i compiti principali di (i) centralizzare le informazioni riguardanti i software generalizzati usati in Istat; (ii) rendere disponibile il download dei sistemi stessi. La riprogettazione prevede l’utilizzo di piattaforme collaborative al fine di migliorare la gestio ne da parte dei responsabili dei sistemi software e di coinvolgere maggiormente l’utenza dei sistemi stessi.

Ruoli e Responsabilità

La sottoscritta riveste il ruolo di membro del gruppo di lavoro [GDL12].

Attività Specifiche

La sottoscritta ha partecipato alla stesura dei requisiti per la realizzazione della nuova versione dell’Osservatorio Tecnologico sia su Intranet che su Internet. Inoltre, è stata individuata, insieme a Luca Valentino, come responsabile dell’area Record Linkage dell’Osservatorio Tecnologico.

Progetto ESSnet on Data Integration Data inizio: Dicembre 2009 Data fine: Dicembre 2011

Obiettivo generale

Il progetto “ESSnet on Data Integration” (ESSnet DI) è stato condotto dall’Istat, con partecipazione degli istituti di statistica di Olanda, Norvegia, Polonia, Spagna e Svizzera. Il progetto si è occupato della diffusione e del trasferimento di conoscenza di metodi statistici per l’integrazione di fonti dati esistenti nella produzione della statistica ufficiale.

20 / 45 Ruoli e Responsabilità

La sottoscritta ha partecipato al progetto in qualità di membro . In particolare ha partecipato alle attività relative al workpackage 3 “Methodological Developments”, Task 3.1 Record Linkage. A tal fine, ha coordinato una risorsa , Luca Valentino, per la realizzazione delle attività di sviluppo. Infine, si sottolinea come l’attività è di carattere aggiuntivo rispetto all’attività ordinaria .

Attività Specifiche

Nello specifico, le attività condotte per il task 3.1, sono sintetizzabili come segue: • Gennaio/Fe bbraio 2011, proposta di un questionario ai membri della Essnet per censire le esigenze di pre-processing in un processo di record linkage. • Analisi dei risultati e attribuzione delle priorità di realizzazione alle diverse funzionalità. • Partecipazione al progetto e coordinamento nello sviluppo di tali funzionalità nel sistema RELAIS (Relais 2.3 beta). • Rilascio della versione realizzata ai partner e scrittura di un manuale utente di accompagnamento [RT11] (realizzato in collaborazione con Luca Valentino).

Progetto CENEX – Centro di Eccellenza sull’Integrazione Dati Data Inizio: Dicembre 2006 Data Fine: Giugno 2008

Obiettivo generale

Nel 2005 Eurostat ha promosso dei centri di eccellenza nel campo della statistica, denominati European Centres and Networks of Excellence (CENEX), con l’obiettivo di rafforzare la cooperazione tra gli istituti nazionali di statistica (questi cen tri si sono poi “evoluti” nelle ESSnet). Questo CENEX coordinato dall’Istat riguarda l’area “Integration of Survey and Administrative Data” e ha previsto come istituti nazionali di statistica partecipanti, oltre all’Istat, l’istituto spagnolo (INE), quello olandese (CBS), quello austriaco (AT) e quello ceco (CSO).

Ruoli e Responsabilità

Il ruolo della sottoscritta nel progetto (si veda incarico allegato A1 nel fascicolo personale) è stato quello di coordinare il lavoro di un workpackage relativo all’analisi dei sistemi software esistenti per effettuare record linkage probabilistico. Infine, si sottolinea come l’attività è di carattere aggiuntivo rispetto all’attività ordinaria .

Attività Specifiche

21 / 45 Nello specifico, l’attività svolta ha previsto: • Proposta di una metodologia di analisi dei software esistenti secondo determinate caratteristiche, di modo tale da renderli confrontabili. • Applicazione della metodologia di cui sopra ad u n sottoinsieme selezionato dei software esistenti e stesura del deliverable [RT5]. La disseminazione dei risultati conseguiti ha riguardato: • Presentazione del workpackage “Software Tools for Integration Methodologies”, Madrid (SPAGNA), Ottobre 2007

Progetto Adozione di Tecnologie Open Source Data Inizio: Gennaio 2007 Data Fine: In corso

Obiettivo generale

Il progetto riguarda l’adozione di tecnologie open source a supporto del processo statistico (si veda incarico allegato A1 nel fascicolo personale).

Attività Specifiche

Un’importante attività del progetto è relativa alla diffusione dell’ambiente statistico “R” all’interno dell’Istat. Con riferimento a tale attività, la sottoscritta ha: • Partecipato a diverse riunioni di un gruppo di studio che si occupa di aggiornare le proprie conoscenze rispetto alle continue novità offerte dalla comunità R. Iniziative di studio specifiche condotte dalla sottoscritta hanno riguardato, ad esempio, lo studio del package “R.oo”, “ delle modalità di invocazio ne di codice compilato da programmi R, etc. • Effettuato un’attività di formazione interna all’Istat erogando, come nel seguito dettagliato, svariate edizioni del corso “Elementi di Programmazione in R”. • Partecipato alla organizzazione, pianificazione e ges tione delle erogazioni dei corsi R all’interno dell’Istat. Una seconda attività è relativa all’analisi del software statistico “AdamSoft” sviluppato da un gruppo di persone afferenti al Caspur (Consorzio Interuniversitario per le Applicazioni si Supercalco lo per Università e Ricerca). Con riferimento a tale attività, la sottoscritta ha: • Partecipato all’analisi delle potenzialità del software AdamSoft. • Contribuito alla progettazione di una sperimentazione avente l’obiettivo di confrontare R con AdamSoft.

Progetto Tutela della Riservatezza Data inizio: Maggio 2006 Data fine: Dicembre 2007

Obiettivo generale

L’obiettivo del progetto è stata la valutazione di metodi di tutela della riservatezza di tipo perturbativo per la pubblicazione di aggregati delle

22 / 45 statistiche strutturali sulle imprese, con particolare riferimento al metodo random rounding.

Ruoli e Responsabilità

La sottoscritta ha rivestito il ruolo di membro del gruppo di lavoro [GDL13].

Attività Specifiche

La sottoscritta ha condotto un’attività di studio e sperimentazione relativa alle tematica di record linkage privacy-preserving . Parte dei risul tati conseguiti sono riportati nei lavori [C30], [C31].

Attività di Docenza Istat

Nel seguito si riporta il dettaglio dell’attività di docenza erogata dalla sottoscritta nel ruolo di dipendente Istat. L’attività è di due tipi: (i) docenza interna (indica ta con DI) e (ii) docenza nell’ambito di iniziative internazionali (indicata con DE e con dettaglio dell’iniziativa stessa).

Titolo Corso: L’ambiente R elementi di programmazione e librerie per la produzione statistica Numero di ore :11,5 Periodo: 6-10 Novembre 2006 Tipologia: DI

Titolo Corso: L’ambiente R elementi di programmazione e librerie per la produzione statistica Numero di ore :13,5 Periodo: 4 Dicembre 2006 -12 Gennaio 2007 Tipologia: DI

Titolo Corso: L’ambiente R elementi di programmazione e librerie per la produzione statistica Numero di ore :10 Periodo: 6-15 Febbraio 2007 Tipologia: DI

Titolo Corso: The R software for statistical computing Numero di ore :11 Periodo: 19-23 Marzo 2007 Tipologia: DE – Cooperazione Internazionale

Titolo Corso: L’ambiente R elementi di programmazione e librerie per la produzione statistica Numero di ore :13,5 Periodo: 21-29 Maggio 2007 Tipologia: DI

Titolo Corso: Web services: Progetto e Programmazione in Java Numero di ore :13,5 Periodo: 28-30 Marzo 2007

23 / 45 Tipologia: DI

Titolo Corso: Programmazione avanzata con R Numero di ore :11 Periodo: 19-21 Marzo 2008 Tipologia: DI

Titolo Corso: Programmazione avanzata con R Numero di ore :11 Periodo: 28-30 Maggio 2008 Tipologia: DI

Titolo Corso: Developpement du Systeme d’ Informations Statistiques sur les Entreprises (SISE) à L’Institut National de la Statistique Tunisia Relais- un instrument pour le lien probabilistique Numero di ore :2 Periodo: 19-21 Gennaio 2009 Tipologia: DE – Cooperazione Internazionale

Titolo Corso: Introduzione all'integrazione: principi, metodi e strumenti Numero di ore :1,5 Periodo: 17 Febbraio 2009 Tipologia: DI

Titolo Corso: Advanced Course on R Programming Numero di ore : 25 Periodo: 15-18 Dicembre 2009 Tipologia: DE

Titolo Corso: Record Linkage Numero di ore :3,5 Periodo: 16-19 Marzo 2009 Tipologia: DI

Titolo Corso: Training on the Job RELAIS Numero di ore : 11 Periodo: 5-8 Luglio 2011 Tipologia: DE, Essnet Data Integration

Titolo Corso: Corso di formazione su Record Linkage e Statistical Matching Numero di ore : 3,25 Periodo: 28-29 Settembre 2011 Tipologia: DE, Essnet Data Integration

Date Aprile 2011-Marzo 2012 Lavoro o posizione Contratto di collaborazione coordinata e continuativa per attività di ricerca ricoperti Nome e indirizzo del Dipartimento di Informatica e Sistemistica Università di Roma “La datore di lavoro Sapienza” 24 / 45 Principali attività e La collaborazione ha per oggetto lo svolgimento di attività di ricerca, responsabilità responsabile scientifico Prof. Tiziana Catarci. In particolare, ha svolto attività di studio e sperimentazione relativa all’utilizzo di tecniche di record linkage per il mining di processi a partire da dati semi-strutturati (e.g. email). Parte dei risultati conseguiti sono stati pubblicati in [J15], [C43]. Tipo di attività o settore Ricerca

Date Luglio 2009 – Giugno 2010 Lavoro o posizione Contratto di collaborazione coordinata e continuativa per attività di ricerca ricoperti Nome e indirizzo del Dipartimento di Informatica e Sistemistica Università di Roma “La datore di lavoro Sapienza” Principali attività e La collaborazione ha avuto per oggetto lo svolgimento di attività di responsabilità ricerca, responsabile scientifico Prof. Tiziana Catarci. In particolare, ha svolto attività di studio e sperimentazione relativa alla tematica dell’Object Matching applicata al contesto Web (Web Object Identification). Parte dei risultati conseguiti sono stati pubblicati in [J12], [J16].

Tipo di attività o settore Ricerca

Date Aprile 2008 – Dicembre 2008 Lavoro o posizione Contratto di collaborazione coordinata e continuativa per attività di ricerca ricoperti Nome e indirizzo del Dipartimento di Informatica e Sistemistica Università di Roma “La datore di lavoro Sapienza” Principali attività e La collaborazione ha avuto per oggetto lo svolgimento di attività di ricerca, responsabilità responsabile scientifico Prof. Tiziana Catarci. In particolare, ha svolto attività di studio e sperimentazione relativa al problem a del record linkage affrontato con un approccio basato su algoritmi evolutivi. I risultati di tale ricerca sono presentati in [C33],[C34],[C39],[C42],[C44],[C45]. Tipo di attività o settore Ricerca

Date Giugno 2007 – Dicembre 2007 Lavoro o posizione Contratto di collaborazione coordinata e continuativa per attività di ricerca ricoperti Nome e indirizzo del Dipartimento di Informatica e Sistemistica Università di Roma “La datore di lavoro Sapienza” Principali attività e La collaborazione ha avuto per oggetto lo svolgimento di attività di responsabilità ricerca, responsabile scientifico Prof. Tiziana Catarci. Il titolo della ricerca è “Studio di meccanismi per l'integrazione dei dati in modalità Privacy Preserving e studio di algoritmi per il processamento delle interrogazioni in sistemi Peer to Peer con attenzione alla qualità dei dati e alla privatezza. In particolare sono stati studiati protocolli di record linkage che permettano a due (o più) organizzazioni di conoscere l'insieme “intersezione" dei propri record rispettando i requisiti di privatezza

25 / 45 definiti. I risultati di tale ricerca sono presentati in [C30]. Tipo di attività o settore Ricerca

Date Giugno 2006 – Maggio 2007 Lavoro o posizione Contratto di collaborazione coordinata e continuativa per attività di ricerca ricoperti Nome e indirizzo del Dipartimento di Informatica e Sistemistica Università di Roma “La datore di lavoro Sapienza” Principali attività e La collaborazione ha avuto per oggetto lo svolgimento di attività di responsabilità ricerca, responsabile scientifico Prof. Tiziana Catarci. Il titolo della ricerca è “Record Linkage Dinamico mediante Combinazione di Tecniche Empiriche e Probabilistiche”. In particolare si è investigato il problema del record linkage di dati XML. I risultati di tale ricerca sono presentati in [J9,C24]. Tipo di attività o settore Ricerca

Date Giugno 2004 – Febbraio 2006 Lavoro o posizione Titolare di Assegno di Ricerca ricoperti Nome e indirizzo del Dipartimento di Informatica e Sistemistica Università di Roma “La datore di lavoro Sapienza” Principali attività e La ricerca in oggetto ha per titolo “Qualità dei Dati nei Sistemi Informativi responsabilità Cooperativi”, responsabile scientifico prof. Roberto Baldoni. Si è proseguita l’attività di ricerca intrapresa durante il dottorato, che ha riguardato la qualità dei dati nei sistemi informativi cooperativi. Tipo di attività o settore Ricerca

Date Agosto 2005 – Dicembre 2005 Lavoro o posizione Incarico professionale per attività di ricerca ricoperti Nome e indirizzo del Department of Computer Science e il CERIAS (Center for Education and datore di lavoro Research in Information Assurance and Security) della University of Purdue (West Lafayette, Indiana, USA) Principali attività e La collaborazione ha avuto per oggetto lo studio di un framework per la responsabilità valutazione del rischio di violazione della privacy e si è svolta presso l’università di Purdue. I risultati di tale ricerca sono presentati in [C26] e [J11]. Tipo di attività o settore Ricerca

Date Maggio 2004 – Giugno 2004 Lavoro o posizione Contratto di collaborazione coordinata e continuativa per attività di ricerca ricoperti

26 / 45 Nome e indirizzo del Dipartimento di Informatica e Sistemistica Università di Roma “La datore di lavoro Sapienza” Principali attività e La collaborazione ha avuto per oggetto lo svolgimento di attività di responsabilità ricerca, responsabile scientifico Prof. Tiziana Catarci. In particolare, sono stati investigati problemi di qualità dei dati nei sistemi adattivi multicanale. Tipo di attività o settore Ricerca

Date Aprile 2004 Lavoro o posizione Contratto di collaborazione coordinata e continuativa per attività di ricerca ricoperti Nome e indirizzo del Dipartimento di Informatica e Sistemistica Università di Roma “La datore di lavoro Sapienza” Principali attività e La collaborazione ha avuto per oggetto la classificazione ed il confronto di responsabilità dimensioni della qualità dei dati nel contesto e-Government, responsabile scientifico prof. Tiziana Catarci.

Tipo di attività o settore Ricerca

Date Gennaio 2004 – Marzo 2004 Lavoro o posizione Collaborazione coordinata e continuativa ricoperti Nome e indirizzo del Istat, Via Balbo 16, Roma datore di lavoro Principali attività e La collaborazione ha avuto per oggetto lo studio della problematica della responsabilità qualità dei dati toponomastici in grandi basi di dati amministrative. I risultati conseguiti sono riportati in [IS4]. Tipo di attività o settore Ente Pubblico di Ricerca

Date Novembre 2003 - Marzo 2004 Lavoro o posizione Contratto di collaborazione coordinata e continuativa per attività di ricerca ricoperti Nome e indirizzo del Dipartimento di Informatica e Sistemistica Università di Roma “La datore di lavoro Sapienza” Principali attività e La collaborazione ha avuto per oggetto lo studio di problematiche responsabilità connesse all'usabilità ed alla accessibilità di contenuti di e-Learning, responsabile scientifico prof. Tiziana Catarci.

Tipo di attività o settore Ricerca

Date Giugno 2003 – Novembre 2003 Lavoro o posizione Collaborazione coordinata e continuativa ricoperti Nome e indirizzo del Istat, Via Balbo 16, Roma

27 / 45 datore di lavoro Principali attività e La collaborazione ha avuto per oggetto lo studio della problematica della responsabilità qualità dei dati toponomastici in grandi basi di dati amministrative. I risultati conseguiti sono riportati in [IS1], [IS2], [IS3]. Tipo di attività o settore Ente Pubblico di Ricerca

Date Ottobre 2000 – Dicembre 2000 Lavoro o posizione Incarico Professionale ricoperti Nome e indirizzo del AT&T Laboratories, Indirizzo: Florham Park, New Jersey, USA datore di lavoro Principali attività e La collaborazione ha avuto per oggetto lo studio di nuovi modelli per la responsabilità rappresentazione di dati tramite XML e si è svolta presso gli AT&T Research Lab. I risultati conseguiti sono riportati in [C20]. Tipo di attività o settore Ricerca

Date Ottobre 2000 – Febbraio 2000 Lavoro o posizione Dottorato di Ricerca ricoperti Nome e indirizzo del Dipartimento di Informatica e Sistemistica Università di Roma “La datore di lavoro Sapienza” Principali attività e L’attività di ricerca svolta nell’ambito del dottorato ha riguardato la responsabilità qualità dei dati nei sistemi informativi cooperativi, ed in particolare la proposta di un sistema completo per lo scambio ed il miglioramento della qualità dei dati, chiamato DaQuinCIS (Data Quality in Cooperative Information Systems). I principali risultati conseguiti sono riportati in [J3], [J4], [B1]. Tipo di attività o settore Ricerca

Date Dicembre 2000 – Maggio 2001 Lavoro o posizione Incarico professionale ricoperti Nome e indirizzo del Scuola Superiore della Pubblica Amministrazione, Presidenza del datore di lavoro consiglio dei Ministri Principali attività e Organizzazione di corsi sui metodi e le tecnologie della società responsabilità dell'informazione. In particolare: • Organizzazione del materiale didattico da utilizzare in aula • Predisposizione on-line del materiale informativo sui corsi • Strutturazione di casi di studio Tipo di attività o settore Ente Pubblico

Date Aprile 2000 – Ottobre 2000 Lavoro o posizione Contratto a tempo indeterminato ricoperti

28 / 45 Nome e indirizzo del Centro di Ricerca in Matematica Pura ed Applicata (CRMPA), Via Ponte datore di lavoro Don Melillo, Salerno Principali attività e • Docenza in corsi di formazione sulle piattaforme a componenti e responsabilità sulle tecnologie middleware. • Analisi per la customizzazione di un prodotto (Sistemi Informativi, Caserta) per l’automazione del protocollo, su piattaforma Lotus/Domino. La customizzazione ha come obiettivo l’applicazione del prodotto al protocollo dell’Università di Salerno. • Collaborazione con il gruppo di ricerca del prof. Gerardo Canfora (Ingegneria Informatica, Università del Sannio, Benevento) su tematiche riguardanti la reingegnerizzazione (BPR) dei processi aziendali e l’applicabilità di WfMS (Workflow Management System). Attraverso lo studio di alcuni processi di sviluppo del software utilizzati dalla società EDS di Caserta, sono stati individuati dei suggerimenti metodologici e pattern di processo per la reingegnerizzazione di tali processi. • Ideazione e stesura della proposta di progetto MURST (Ministero Università e Ricerca Scientifica e Tecnologica) “GAP-Grid Application Provision”. Il progetto ha previsto la realizzazione di un ASP (Application Service Provider) in architettura Grid per la fornitura di servizi applicativi a piccoli comuni ed aziende sanitarie. Tipo di attività o settore Ricerca

Date Dal 2002 ad oggi Lavoro o posizione Docenza a Contratto ricoperti Nome e indirizzo del Università degli Studi di Roma “La Sapienza” datore di lavoro Principali attività e Nell’anno accademico 2010/2011 è stata incaricata della docenza a responsabilità contratto del corso di Basi di Dati (3 crediti), Corso di Laurea in Ingegneria Gestionale, dell' Università degli Studi di Roma “La Sapienza”.

Nell'anno accademico 2008/2009 è stata incaricata della docenza a contratto del corso di Basi di Dati (6 crediti), Corso di Laurea in Ingegneria Gestionale, dell' Università degli Studi di Roma “La Sapienza”.

Nell'anno accademico 2007/2008 è stata incaricata della docenza a contratto del corso di Progettazione del Software (5 crediti), Corso di Laurea in Ingegneria Gestionale, dell' Università degli Studi di Roma “La Sapienza”.

Nell'anno accademico 2006/2007 è stata docente a contratto del corso di Progettazione del Software (5 crediti), Corso di Laurea in Ingegneria Gestionale, dell' Università degli Studi di Roma “La Sapienza”.

Nell'anno accademico 2005/2006 è stata docente a contratto del corso di Progettaz ione del Software (5 crediti), Corso di Laurea in Ingegneria Gestionale, dell' Università degli Studi di Roma “La Sapienza”.

29 / 45 Nell'anno accademico 2004/2005 è stata docente a contratto del corso di Progettazione del Software (5 crediti), Corso di Laurea in Ingegneria Gestionale, dell' Università degli Studi di Roma “La Sapienza”.

Nell'anno accademico 2003/2004 è stata docente a contratto del corso di Progettazione del Software (5 crediti), Corso di Laurea in Ingegneria Gestionale, dell' Università degli Studi di Roma “La Sapienza”.

Nell'anno accademico 2002/2003 è stata tutor del corso di Progettazione del Software, Corso di Laurea in Ingegneria Gestionale, dell' Università degli Studi di Roma “La Sapienza”, docente prof. Giuseppe De Giacomo.

Tipo di attività o settore Ricerca

Altre titoli scientifici e Partecipazioni a progetti di ricerca professionali Nell’ambito delle attività svolte presso l’Istat, come precedentemente dettagliato, la sottoscritta ha partecipato ad iniziative di ricerca a livello europeo : progetti CORE, CORA, ESSnet Data Integration e CENEX CENEX Statistical Methodology Project - Area Integration of survey and administrative data. Inoltre, n ell'ambito del Dottorato di Ricerca in Ingegneria Informatica, e successivamente come assegnista di ricerca e collaboratore scientifico, da Novembre 2000 ha collaborato con il Dipartimento di Informatica e Sistemistica dell'Università di Roma “La Sapienza” ai seguenti progetti di ricerca nazionali ed internazionali, in cui spesso ha ri vestito il ruolo di coordinatore di attività e risorse.

In particolare: 1. 2011-2012: MailOfMine project, ricerca cofinanziata dall’Unione Europea all’interno del Settimo Programma Quadro 2007-2013 attraverso il progetto “Smart Vortex – management and analysis of massive data streams to support large-scale collaborative engineering projects”, responsabile del progetto prof. Tiziana Catarci, Dipartimento di Informatica e Sistemistica A. Ruberti, “Sapienza” Università di Roma. 2. 2009-2010: Progetto di Ateneo Federato dal titolo “Web Object Matching”, C26F09BY73, ricerca finanziata per 24 mesi, ricerca finanziata per 24 mesi, responsabile della ricerca prof. Tiziana Catarci, Dipartimento di Informatica e Sistemistica A. Ruberti, “Sapienza” Università di Roma. 3. 2007-2008: Progetto di Ricerca di Università (ex Progetto di Ateneo) C26A074R53, “Metodi per migliorare l’accuratezza e la consistenza dei dati basati su algoritmi evolutivi”, ricerca finanziata per 24 mesi, responsabile della ricerca prof. Tiziana Catarci, Dipartimento di Informatica e Sistemistica A. Ruberti, “Sapienza” Università di Roma. 4. 2006-2007: progetto ESTEEM (Emergent Semantics and cooperaTion in multi-knowledgE EnvironMents) (PRIN 2005)(durata biennale da Gennaio 2006 a Dicembre 2007), responsabile scientifico prof. Tiziana Catarci. Le attività svolte riguardano il coordinamento della linea di ricerca connessa al processamento trust- and quality-

30 / 45 aware di dati in contesti P2P. Il suo ruolo è stato di indirizzo scientifico e di coordinamento organizzativo del gruppo di lavoro del Dipartimento di Informatica e Sistemistica (2 persone), nonchè di supporto al coordinatore del progetto. 5. 2005-2008: progetto eG4M (eGovernment for Mediterranean Countries) (FIRB 2003)(durata triennale da Novembre 2005 a Ottobre 2008), responsabile scientifico prof. Tiziana Catarci. Le attività svolte riguardano il coordinamento della linea di ricerca connessa alla qualità dei documenti elettronici ed in particolare alle tecniche di misurazione, controllo e miglioramento di tale qualità. Il suo ruolo è stato di indirizzo scientifico e di coordinamento organizzativo del sottogruppo di lavoro sulla qualità del Dipartimento di Informatica e Sistemistica (2 persone). 6. 2003-2006: rete di eccellenza europea “INTEROP” (durata triennale da Novembre 2003 a Ottobre 2006), finanziato dalla Commissione Europea nell'ambito del programma quadro IST FP 6, responsabile scientifico prof. Tiziana Catarci; nell'ambito della rete di eccellenza la tematica di interesse è quella di modellazione dei dati tramite ontologie. Il suo ruolo è stato di indirizzo scientifico e di coordinamento organizzativo del gruppo di lavoro del Dipartimento di Informatica e Sistemistica (composto da 2 persone). 7. 2003-2005: Progetto nazionale “Le nuove tecniche di governo e l'innovazione tecnologica nella formazione e attuazione delle politiche pubbliche - Metodologia di analisi della problematica di accesso ai dati pubblici" (Progetti Attivi di Amministrazione dello Stato – Legge FISR)(durata biennale da Settembre 2003 a Settembre 2005), responsabile scientifico prof. Tiziana Catarci. In particolare, in tale contesto, ha il compito di studiare le problematiche di accesso ai dati pubblici e di caratterizzarli rispetto al relativo livello di qualità. Il suo ruolo è stato di indirizzo scientifico e di coordinamento organizzativo del gruppo di lavoro del Dipartimento di Informatica e Sistemistica (composto da 2 persone). 8. 2002-2005: progetto MAIS (Multichannel Adaptive Information Systems) (FIRB 2001) (durata triennale da Novembre 2002 a Ottobre 2005, poi esteso a Giugno 2006), responsabile scientifico prof. Tiziana Catarci). L'ambito di competenza ha riguardato la progettazione di un repository di qualità del servizio. Il suo ruolo è stato di membro del gruppo di lavoro del Dipartimento di Informatica e Sistemistica (composto da 5 persone). 9. 2002-2003: progetto nazionale “DaQuinCIS - Data Quality in Cooperative Information Systems" (durata biennale dal Gennaio 2002 a Dicembre 2003), finanziato dal MIUR (COFIN 2001), responsabile scientifico prof. Tiziana Catarci. Le competenze scientifiche hanno riguardato: la definizione di un modello di cooperazione specificatamente orientato alla qualità dei dati, e la progettazione di un'architettura cooperativa per il supporto alla gestione ed al miglioramento della qualità dei dati. Inoltre, ha avuto il ruolo di (i) di indirizzo scientifico e di coordinamento organizzativo del gruppo di lavoro del Dipartimento di Informatica e Sistemistica (composto da 3 persone), e (ii) di assistente del responsabile scientifico prof. Tiziana Catarci su tutte le tematiche organizzative ed amministrative del progetto, di cui il Dipartimento di Informatica e Sistemistica è stato

31 / 45 coordinatore nazionale. Partecipazione a Gruppi di Lavoro Internazionali, Comitati di Programma, Comitati Editoriali di Riviste

Membro del gruppo EUROSTAT SISAI (Statistical Information Systems Architecture and Integration ), coordinatore Adam Wronski, ref: http://www1.unece.org/stat/platform/display/msis/SISAI, dal 2011.

Membro dell' Editorial Board e Associate Editor dell'International Journal on Information Quality (ISSN (Online): 1751-0465 & ISSN (Print): 1751-0457).

Program Chair della 17th International Conference on Information Quality (ICIQ 2012).

Program Chair del 1st INTEROP Dissemination Workshop tenutosi in cooperazione con OnTheMove (OTM 2004) Federated Conferences a Cipro, Grecia, il 27 Ottobre 2004.

Program Chair dell'International Workshop on Information Quality in Information Systems, tenutosi in cooperazione con 23 rd ACM SIGMOD International Conference on Management of Data a Parigi, Francia, il 18 Giugno 2004.

Guest editor dell’IEEE Special Issue Data Quality in the Internet Area, 2011 [Ed3].

Membro del gruppo IFIP 2.6 su “Data Semantics" dal 2004 e ne è stata segretario dal 2004 al 2007.

Guest editor dello Special Issue di Information Systems (Elsevier) “Interoperability in Open Information Systems through Data and Service Integration" (Data di pubblicazione: Ottobre 2008).

Program Chair dell' International Workshop on Semantic Data and Service Integration (SDSI 2007) tenutosi in cooperazione con VLDB 2007 a Vienna, Austria, il 23 Settembre 2007.

Program Chair del INTEROP-MIOS Workshop tenutosi in cooperazione con On-TheMove (OTM 2005) Federated Conferences a Cipro, Grecia, il 31 Ottobre 2005.

Local Chair della 4th International Conference on Web Information Systems Engineering (WISE 2003), tenutasi a Roma il 10-13 Dicembre 2003.

Local Chair dell' International Workshop on Data Quality in Cooperative Information Systems, tenutosi a Siena il 10-11 Gennaio 2003.

E’ stata membro del Program Committee di: 7th Mediterranean Conference on Information Systems (MCIS 2012), International VLDB

32 / 45 Workshop on Quality of Databases (QDB 2011), International Conference on Information Quality (ICIQ 2011), Third International Conference on Emerging Databases (EDB 2011), European Conference on Information Systems (ECIS 2010), International Conference on Database Systems for Advanced Applicatins (DASFAA 2010), International Asia Pacific Web Conference (APWEB 2010), International VLDB Workshop on Quality of Databases (QDB 2010),International Conference on Information Quality (ICIQ 2010), International Conference on Information Quality (ICIQ 2009), International Conference on Database Systems for Advanced Applicatins (DASFAA 2009), International VLDB Workshop on Quality of Databases (QDB 2009), International Conference on Data Warehousing and Knowledge Discovery (DaWaK 2009),International Conference on Information and Knowledge Management (CIKM 2008), International Conference on Conceptual Modeling (ER 2008), , International Conference on Data Warehousing and Knowledge Discovery (DaWaK 2008), International Asia Pacific Web Conference (APWEB 2008) IEEE International Conference on Computer Systems and Applications (AICCSA-08), Latin American Web Congress (LA-Web 2008), International Conference on Data Warehousing and Knowledge Discovery (DaWaK 2008), VLDB Workshop on Quality of Databases (QDB 2008), International Conference on Very Large Data Bases(VLDB 2007), International Conference on Information Quality (ICIQ 2007), Asia- Pacific Web Conference and International Conference on Web-Age Information Management (APWeb/WAIM 2007), International Conference on Data Warehousing and Knowledge Discovery (DaWaK 2007), International Asia Pacific Web Conference (APWEB 2007), Latin American Web Congress (LA-Web 2007), International Conference on Web Information Systems Engineering (WISE 2007), Australasian Workshop on Information Quality (AusIQ 2007), VLDB International Workshop on Clean Databases (CleanDB 2006), SIGMOD International Workshop on Information Quality in Information Systems (IQIS 2006), International Workshop on Interoperability Solutions to Trust, Security, Policies and QoS for Enhanced Enterprise Systems (IS-TSPQ 2006), International Workshop on XML Schema and DataManagement (XSDM 2006), International Asia Pacific Web Conference (APWEB 2006), Latin American Web Congress (LA-Web 2006), International Conference on Web Information Systems Engineering (WISE 2006), Australasian Workshop on Information Quality (AusIQ 2006), International Conference on Information Quality (ICIQ 2006), International Workshop on XML Schema and Data Management (XSDM 2006), International Workshop on Data Integration in Life Sciences (DILS 2006), International Conference on Data Warehousing and Knowledge Discovery (DaWaK 2006), International XML Database Symposium (XSym 2005), Latin American Web Congress (LA-Web 2005), International Workshop on Data and Knowledge Quality (DKQ 2005), International Conference on Cooperative Information Systems (CoopIS 2005) , International Conference on Ontologies, Databases and Applications of SEmantics (ODBASE 2005), International Conference on Information Quality (ICIQ'05), International Symposium on Applications and the Internet (SAINT-2005), International Conference on Web Information Systems Engineering (WISE 2005), International Conference on Artificial Intelligence: Methodology, Systems, Applications (AIMSA 2004), CAiSE

33 / 45 2004 Workshop on Data and Information Quality (DIQ 2004), International Conference on Cooperative Information Systems (CoopIS 2004), International Asia Pacific Web Conference (APWEB 2004), International Conference on Web Information Systems Engineering (WISE 2004), International Conference on Information Quality (ICIQ 2003), International Conference on Web Information Systems Engineering (WISE 2003).

Ha svolto attività di revisore per le seguenti riviste internazionali : IEEE Transactions on Data and Knowledge Engineering, ACM Transactions on Database Systems, Information Systems, International Journal of Cooperative Information Systems,World Wide Web Journal, International Journal of Enterprise Information Systems, Journa on System Architecture, ACM Journal of Data and Information Quality, VLDB Journal.

Seminari Invitati e Tutorial

E’ stata invitata ad esporre relazioni ai seguenti eventi: • Seminario invitato “ RELAIS: Un sistema per il record linkage”, Università di Bologna, Prof. Claudio Sartori, (Maggio 2012). • Seminario invitato “CORE and GSIM” in Web Conference nell’ambito dello GSIM Sprint, Slovenia, (Febbraio 2012). • Seminario invitato dal titolo “Record Linkage and Data Integration: Can You Have One Without the Other?”, Workshop sulla Qualità dei Dati nella Pubblica Ammistrazione, SAS (Aprile 2007). • Keynote Speech dal titolo “The Object Identification Problem: New Trends in Record Linkage”, 2nd French Workshop on Data and Knowledge Quality, ENIC, Villeneuve d'Ascq, (Gennaio 2006). • Seminario invitato dal titolo “Dealing with Data Quality in Distributed and Heterogeneous Information Systems", CS Colloquium, Purdue University, West Lafayette, Indiana, USA (Novembre 2005). • Seminario invitato dal titolo “Data Integration and Trust in Data Quality Frameworks”, Università di Milano Bicocca, Italia (Giugno 2005). • Seminario invitato dal titolo “Dealing with Data Inconsistencies in Cooperative Information Systems” all'IRISA, Rennes, Francia (Giugno 2004). • Seminario invitato dal titolo “eGovernment e Governo Economie Locali”, Università di Bergamo, Italia (Maggio 2004). • International Conference and Research Center for Computer Science Dagstuhl Schloss - Seminar on “Data Quality on the Web”, Dagsthul, Germania (Settembre 2003). • Panel su “Data Quality & Data Integrity Research Issues” alla 6th IFIP TC-11 WG 11.5 Working Conference on Integrity and Internal Control in Information Systems, EPFL, Losanna, Svizzera (Novembre 2003). • E’ autore, insieme a Tiziana Catarci e Carlo Batini, del seguente tutorial: “Data Quality in Cooperative Information Systems",

34 / 45 presentato alla International Con ference on Entity Relationships (ER 2004), Shanghai, Cina, 2004.

Capacità e competenze La sottoscritta ha una spiccata attitudine all’innovazione , testimoniata personali da: • Più di 80 pubblicazioni in ambito nazionale ed internazionale con un h-index pari a 18 (fonte Publish or Perish / Google Scholar, febbraio 2012 con query = “m scannapieco” su “Engineering, Computer Science, Mathematics” AND “Business, Administration, Finance, Economics”). • Partecipazione a 13 progetti di ricerca. • Principal investigator di 6 dei 13 progetti con ruolo di redazione delle proposte e coordinamento delle attività principali: CORE, CORA, Progetto “Metodi per migliorare l'accuratezza e la consistenza dei dati basati su algoritmi evolutivi”, “Web Object Matching”, ESTEEM, DaQuinCIS. • Visibilità da parte della comunità di ricerca internazionale, testimoniata dalle numerose chairship e partecipazioni a comitati di programma di conferenze internazionali. Si sottolinea la chairship corrente della 17th International Conference on Information Quality (ICIQ 2012), promossa dal MIT (Massachusetts Institute of Technology) http://mitiq.mit.edu/ICIQ/2012/.

La sottoscritta ha capacità di gestione di progetti e di coordinamento di risorse , come testimoniato dalla responsabilità di progetti e dai ruoli di coordinamento rivestiti, che oltre a quelli elencati, includono principalmente: • Dal novembre 2006 ad oggi ha rivestito in Istat il ruolo di responsabile di risorse, prima con un incarico specifico e poi come responsabile di unità operative. Oggi è responsabile di 10 risorse di sviluppo. • Vice-Responsabile del progetto DIDAC (Diffusione Dati Censuari) che ha come obiettivo lo sviluppo e la gestione del sistema di diffusione dei dati di tutti i censimenti general (censimento dell’agricoltura, censimento della popolazione e delle abitazioni, censimento dell’industria e dei servizi). • Technical Manager di due progetti di ricerca a partnership europea (CORE e CORA).

La sottoscritta ha capacità didattiche , testimoniate da docenze universitarie continuative a partire dall’anno accademico 2002-2003 e dalle numerose docenze istituzionali Istat. Inoltre la sottoscritta è stata relatore di 15 tesi di laurea.

La sottoscritta ha inoltre capacità di sistematizzazione e di analisi , testimoniate dalla pubblicazione del libro “C. Batini and M. Scannapieco, Data Quality: Concepts, Methodologies, and Techniques,

35 / 45 Springer, 2006” , che ha venduto ad oggi oltre 1500 copie.

Infine si rileva che l’attività di ricerca della sottoscritta ha avuto impatto su due brevetti industriali : • Methods and Systems for Managing Data Quality, Patent number: 7676523, Filing date: Apr 20, 2007 by SAP, Issue date: Mar 9, 2010, Application number: 11/785,929, articolo: M. Scannapieco and C. Batini, Completeness in the Relational Model: A Comprehensive Framework, Proceedings of the International Conference on Information Quality(ICIQ 2004), Boston, MA, USA, 2004. • Method and system for including data quality in data stream. Patent number: 7676522, Filing date: Apr 20, 2007 by SAP, Issue date: Mar 9, 2010, Application number: 11/785,928, articolo: M. Scannapieco and C. Batini, Completeness in the Relational Model: A Comprehensive Framework, Proceedings of the International Conference on Information Quality(ICIQ 2004), Boston, MA, USA, 2004.

Madrelingua(e) Italiano Altra(e) lingua(e) Inglese Autovalutazione Comprensione Parlato Scritto Livello europeo Ascolto Lettura Interazione Produzione orale orale Inglese C Utente C Utente C Utente C Utente C Utente 1 Avanzato 1 Avanzato 1 Avanzato 1 Avanzato 1 Avanzato

Pubblicazioni Articoli su Riviste Nazionali ed Internazionali e Monografie

Autori, Titolo, Data [J17] C. Vaccari, M. Scannapieco, T. Virgillito, D. Zardetto: “CORE: Supporting pubblicazione Statistical Processes Standardization through a COmmon Reference Environment”, in corso di revisione per la pubblicazione nel volume: “IJEG – International Journal of Electronic Governance”, special issue on “MeTTeG 2011, the 5th International Conference on Methodologies, Technologies and Tools Enabling e-Government”, Inderscience Publishers, 2012.

[J16] D. Zardetto, M. Scannapieco: “Optimal Decision Rules for Constrained Record Linkage: an Evolutionary Approach”, versione estesa per i post-conference proceedings di CLADAG 2011, in corso di revisione per la pubblicazione nel volume: Springer Series “Studies in Classification, Data Analysis, and Knowledge Organization”, Springer-Verlag, Heidelberg, , 2012.

[J15] C. Di Ciccio, M. Mecella, M. Scannapieco, D. Zardetto, T. Catarci: “MailOfMine – Analyzing Mail Messages for Mining Artful Collaborative Processes”, versione estesa per i post-conference proceedings di SIMPDA 2011, in corso di pubblicazione nel volume: Springer Series “Lecture Notes in Business Information Processing”, Springer-Verlag, Heidelberg, Germany, 2012. [J14] S. Montanelli, D. Bianchini, C. Aiello, R. Baldoni,C. Bolchini,S. Bonomi, S. Castano, T. Catarci, V. De Antonellis, A. Ferrara, M. Melchiori, E. Quintarelli, M. Scannapieco, F. Schreiber, and L.Tanca, The ESTEEM platform: enabling P2P semantic collaboration through emerging collective knowledge, Journal of Intelligent Information Systems, volume 26, no. 2 , 2011. [J13] D. Bianchini, C. Aiello, R. Baldoni,C. Bolchini,S. Bonomi, S. Castano, T.

36 / 45 Catarci, V. De Antonellis, A. Ferrara, M. Melchiori, S.Montanelli, E. Quintarelli, M. Scannapieco, F. Schreiber, and L.Tanca, Emergent Semantics and Cooperation in Multi-knowledge Communities: the ESTEEM Approach, World Wide Web, volume 10, n0. 1-2, 2010.

[J12] D. Zardetto, M. Scannapieco: “A Novel Suite of Methods for Mixture Based Record Linkage”, in “Rivista di Statistica Ufficiale”, n. 2-3/2010, Istat, pagg. 31- 58, ISSN 1828-1982, 2010.

[J11] G. Lebanon, M. Scannapieco, Mohamed R. Fouad, E. Bertino: Beyond k- Anonymity: A Decision Theoretic Framework for Assessing Privacy Risk. Transactions on Data Privacy 2(3): 153-183, 2009.

[J10] D. Milano, M. Scannapieco, and T. Catarci, Measuring and Diffusing Data Quality in a Peer-to-Peer Architecture , International Journal of Enterprise Information Systems (ISSN 1548-1115), 3 (2007), no. 1. [J9] D. Milano, M. Scannapieco, and T. Catarci, Structure Aware XML Object Identification , Data Engineering Bullettin - Special Issue on Data Quality 29 (2006). [J8] D. Milano, M. Scannapieco, and T. Catarci, P2P Data Quality Improvement in the DaQuinCIS System , Journal of Digital Information Management (ISSN 0972-7272) 3 (2005), no. 3.

[J7] M. Scannapieco, P. Missier, and C. Batini, Data Quality At A Glance, German Database Journal - Datenbank-Spektrum, vol. 14, 2005. [J6] M. Bertoletti, P. Missier, M. Scannapieco, P. Aimetti, and C. Batini, Improving Government-to-Business Relationships through Data Reconciliation and Process Re-engineering, Advances in Management Information Systems- Information Quality Monograph (AMIS-IQ) Monograph (R.Y. Wang, E.M. Pierce, S.E. Madnick, and Fisher C.W., eds.), Sharpe, M.E., April 2005. [J5] M. Scannapieco, B. Pernici, and E.M. Pierce, IP-UML: A Methodology for Quality Improvement based on IP-MAP and UML, Advances in Management Information Systems-Information Quality Monograph (AMIS-IQ) Monograph (R.Y. Wang, E.M. Pierce, S.E. Madnick, and Fisher C.W., eds.), Sharpe, M.E., April 2005. [J4] M. Scannapieco, A. Virgillito, M. Marchetti, M. Mecella, and R. Baldoni, The DaQuinCIS Architecture: a Platform for Exchanging and Improving Data Quality in Cooperative Information Systems , Information Systems 29 (2004), no. 7. [J3] M. Mecella, M. Scannapieco, A. Virgillito, R. Baldoni, T. Catarci, and C. Batini, The DaQuinCIS Broker: Querying Data and their Quality in Cooperative Information Systems , Journal on Data Semantics 1 (2003)

[J2] B. Pernici and M. Scannapieco, Data Quality in Web Information Systems , Journal on Data Semantics 1 (2003).

[J1] T. Catarci and M. Scannapieco, Data Quality under the Computer Science Perspective, Archivi & Computer 2 (2002).

[J0] Nicoletta Cibella, Marco Fortini, Monica Scannapieco, Rosalba Spina, Laura Tosco, Tiziana Tuoto, RELAIS: an open Source toolkit for record linkage, in “Rivista di Statistica Ufficiale”, n. 2-3/2007, Istat, 2007. Libri, Capitoli In Libri e Libri Editi

[B2] C. Batini and M. Scannapieco, Qualità dei dati: Concetti, Metodi e Tecniche, Springer,2008.

37 / 45

[B1] C. Batini and M. Scannapieco, Data Quality: Concepts, Methodologies, and Techniques, Springer, 2006.

[Ch4] M. Scannapieco, Data Quality Models. In L. Liu and M. Tamer Ozsu (Ed.) Encyclopedia of Database Systems, Springer, 2009. [Ch3] C. Aiello, T. Catarci, P. Ceravolo, E. Damiani, M. Scannapieco, and M. Viviani, Emergent Semantics in Distributed Knowledge Management. In L. Jain (Ed.) Evolution of WEB in an Artificial Intelligence Environment, Springer- Verlag, 2008.

[Ch2] D. Milano, M. Scannapieco, and T. Catarci, Quality of XML Data: Measurement and Diffusion in a Peer-to-Peer Architecture. In A. Gunasekaran (Ed.), Global Implications of Modern Enterprise Information Systems: Technologies and Applications, IGI Publishing, 2008.

[Ch1] C. Marchetti, M. Mecella, M. Scannapieco, and A. Virgillito, Data Quality in Cooperative Information Systems, Encyclopedia of Data Warehousing and Mining (ISBN 1-59140-557-2) (J. Wang, ed.), Idea Group Reference, June 2005.

[Ed3] E. Bertino, A. Maurino, M. Scannapieco: Guest Editors' Introduction: Data Quality in the Internet Era. IEEE Internet Computing 14(4): 11-13 (2010).

[Ed2] T. Catarci, H.Panetto, M. Scannapieco: Editorial. Inf. Syst. 33(7-8): 595-596 (2008).

[Ed1] F. Naumann and M.Scannapieco (eds.), IQIS 2004, International Workshop on Information Quality in Information Systems, 18 june 2004, Paris, France (SIGMOD 2004 workshop), ACM, 2004. Conferenze e Workshop Internazionali

[C45] D. Zardetto, M. Scannapieco: “Optimal Decision Rules for Constrained Record Linkage: an Evolutionary Approach”, in: “Book of Abstracts – CLADAG 2011, the 8th Scientific Meeting of the Classification and Data Analysis Group of the Italian Statistical Society”, Pavia University Press, series “Editoria Scientifica”, pagg. 55-56, Pavia, 7-9 Settembre 2011, ISBN 978-88-96764-22-0, 2011.

[C44] D. Zardetto, M. Scannapieco: “Optimal Decision Rules for Constrained Record Linkage: an Evolutionary Approach”, in: “Book of Short Papers – CLADAG 2011, the 8th Scientific Meeting of the Classification and Data Analysis Group of the Italian Statistical Society”, Pavia University Press, series “Editoria Scientifica”, pagg. 1-6, Pavia, 7-9 Settembre 2011, usb pen ISBN 978-88-906639, 2011.

[C43] Di Ciccio, M. Mecella, M. Scannapieco, D. Zardetto, T. Catarci:“MailOfMine – Analyzing Mail Messages for Mining Artful Collaborative Processes”, in: “Proceedings of the 1st International Symposium on Data-Driven Process Discovery and Analysis (SIMPDA 2011)”, pagg. 45-59, Campione d’Italia, 29 Giugno - 1 Luglio 2011, ISBN 978-88-903120-2-1,2011.

[C42] D. Zardetto, L. Valentino, M. Scannapieco: “MAERLIN: New Record Linkage Methods At Work”, in: “Proceedings of the 6th International Conference on New Techniques and Technologies for Statistics (NTTS 2011)”, pagg. 1-10, Brussels, 22-24 Febbraio 2011, DOI 10.2901/Eurostat.C2011.001, 2011

[C41] M. Scannapieco, C. Vaccari. Standardizing European Statistical Processes: CORA and CORE Projects, 5th International Conference on Methodologies, Technologies and Tools enabling e-Government, Camerino, Italy, 2011

38 / 45

[C40] N.Cibella, M.Scannapieco, T. Tuoto: Open source software: a way to enrich local solutions, supporting paper at the International Meeting on the Management of statistical information systems (MSIS 2011), Luxembourg, 2011.

[C39] D. Zardetto, M. Scannapieco, T. Catarci (2010) “Effective Automated Object Matching” , nel volume: “Proceedings of the 26th IEEE International Conference on Data Engineering (ICDE 2010)”, pagg. 757-768, Long Beach, California, USA, 1-6 Marzo 2010, ISBN 978-1-4244-5444-0. Full Research Paper, Acceptance Rate = 69/570 ~ 12%

[C38] M. Di Gioia, D. Beneventano, M. Scannapieco: Multi-Source Object Identification With Constraints. International Conference on Information Quality (ICIQ 2009): 266-267, 2009.

[C37] Cibella N., Fernandez G. L., Fortini M., Guigo M., Hernandez F., Scannapieco M., Tosco L. and Tuoto T., Sharing Solutions for Record Linkage: the RELAIS Software and the Italian and Spanish Experiences. Proc. of the 31st New Techniques and Technologies for Statistics (NTTS 2009), Brussels, B, 2009.

[C36] Cibella N., Fortini M., Scannapieco M., Tosco L., Tuoto T., Vaccari C. and Valentino L.,. Open Source nella Pubblica Amministrazione (OSPA 2009), Rome, 2009.

[C35] Saccoccio M. T., Scannapieco M., Vaccari C. and Virgillito A., SMART: a Web Architecture for Long Running Applications. Proc. of Int. Conf. on Methodologies, Technologies and Tools enabling e-Government, (Metteg 2009), Vigo, 2009.

[C34] F. Cusmai , C. Aiello, M. Scannapieco, T. Catarci: EARL: an Evolutionary Algorithm for Record Linkage, Proc. of the 6th International Workshop on Quality in Databases (QDB 2008), in conjuction with VLDB 2008, August 25th, Auckland, New Zealand, 2008.

[C33] F. Cusmai , C. Aiello, M. Scannapieco, T. Catarci: Record Linkage as a Multiobjective Optimization Problem solved by Evolutionary Computation, in Proc of the First International Workshop on Emergent Semantics and cooperaTion in opEn systems (ESTEEM 2008), In cooperation with the 2nd International Conference on Distributed Event-Based Systems (DEBS 2008) Rome, Italy, 2008

[C32] N. Cibella, M. Fortini, M. Scannapieco,T. Tosco,T. Tuoto, Theory and Practice in Developing a Record Linkage Software, in Proc. of the International Workshop on Integration Methodologies, Vienna, Austria, 2008.

[C31] A. Inan, M. Kantarcioglu, E. Bertino, M. Scannapieco, A Hybrid Approach to Private Record Linkage , Proc. of the 24th International Conference on Data Engineering (ICDE 2008), April 7-12, Cancun, Mexico, 2008.

[C30] M. Scannapieco, I. Figotin, E. Bertino and A.K. Elmagarmid, Privacy Preserving Schema and Data Matching, Proc. of the 27th ACM SIGMOD Conference (SIGMOD 2007), Pechino, Cina, 2007.

[C29] G. Barcaroli, M. Scannapieco, C. Vaccari, and D. Zardetto, Migrating a Critical Application Towards Open Source: the Istat Experience, Proc. of the 1st International Conference on Methodologies, Technologies and Tools Enabling eGovernment (METTEG 2007), Camerino, Italy, 2007

[C28] T. Tuoto, N. Cibella, M. Fortini, M. Scannapieco, and T. Tosco, RELAIS: Don't Get Lost in a Record Linkage Project, Proc. of the Federal Committee on

39 / 45 Statistical Methodologies (FCSM 2007) Research Conference, Arlington, VA, USA, 2007.

[C27] The ESTEEM Team, Emergent Semantics and Cooperation in MultiKnowledge Environments: the ESTEEM Architecture, Proc. of the VLDB International Workshop on Semantic Data and Service Integration (SDSI 2007), Vienna, Austria, 2007.

[C26] G. Lebanon, M. Scannapieco, M. Fouad, and E. Bertino, Beyond K- Anonimity: Towards a Framework for Assessing Privacy Risk, Proc. International Conference on Privacy in Statistical Databases (PSD 2006), Roma, Italy, 2006.

[C25] M. Fortini, M. Scannapieco, T. Tosco, and T. Tuoto, Towards an Open Source Toolkit for Building Record Linkage Workflows, Proc. SIGMOD 2006 Workshop on Information Quality in Information Systems (IQIS'06), Chicago, USA, 2006.

[C24] D. Milano, M. Scannapieco, and T. Catarci, Structure Aware XML Object Identification, Proc. VLDB 2006 Workshop on Clean Databases (CleanDB'06), Seoul, Korea,2006.

[C23] V. Katifori, A. Poggi, M. Scannapieco, T. Catarci, and Y. Ioannidis, OntoPIM: How to Rely on a Personal Ontology for Personal Information Management, Proc. ICSW'05 Workshop on The Semantic Desktop - Next Generation Personal Information Management and Collaboration Infrastructure, Edinburgh, Scotland, 2005.

[C22] D. Milano, M. Scannapieco, and T. Catarci, Using Ontologies for XML Data Cleaning., Proc. OTM Workshop on Inter-organizational Systems and Interoperability of Enterprise Software and Applications (MIOS+INTEROP), Larnaca, Cyprus, 2005.

[C21] D. Milano, M. Scannapieco, and T. Catarci, Design and Implementation of a P2P Data Quality Broker, Proceedings of the International Conference on Interoperability of Enterprise Software and Applications (INTEROP 2005), Geneve, Switzerland, 2005.

[C20] H.V. Jagadish, L.V.S. Lakshmanan, M. Scannapieco, D. Srivastava, and N. Wiwatwattana, Colorful XML: One Hierarchy Isn't Enough, Proceedings of the 2004 ACM SIGMOD Conference (SIGMOD 2004), Paris, France, 2004

[C19] D. Milano, M. Scannapieco, and T. Catarci, Quality-driven Query Processing of XQuery Queries, Proceedings of the International Workshop on Data and Information Quality (DIQ 2004), Riga, Latvia, 2004.

[C18] M. Scannapieco and C. Batini, Completeness in the Relational Model: A Comprehensive Framework, Proceedings of the International Conference on Information Quality(ICIQ 2004), Boston, MA, USA, 2004

[C17] D. Milano, M. Scannapieco, and T. Catarci, A Peer-to-Peer Service Supporting Data Quality: Design and Implementation Issues (Poster), Proceedings of the InternationalConference on Semantics of a Networked World (SNW 2004), Paris, France, 2004.

[C16] K. Aberer, P. Cudrè-Mauroux, A.M. Ouksel, T. Catarci, M. Hacid, A. Illarramendi, V. Kashyap, M. Mecella, M. Mena, E.J. Neuhold, O. De Troyer, T. Risse, M. Scannapieco, F. Saltor, L. De Santis, S. Spaccapietra, S. Staab, and R. Studer, Emergent Semantics Principles and Issues, Proceedings of the 9th International Conference on Database Systems for Advances Applications

40 / 45 (DASFAA 2004), Jeju Island, Korea,2004. [C15] H. Panetto, M. Scannapieco, and M. Zelm, INTEROP NoE: Interoperability Research for Networked Enterprises Applications and Software, Proceedings of the On the Move to Meaningful Internet Systems 2004, Cyprus, Greece, 2004. [C14] Karl Aberer, Tiziana Catarci, Philippe Cudre-Mauroux, Tharam S. Dillon, Stephan Grimm, Mohand-Said Hacid, Arantza Illarramendi, Mustafa Jarrar, Vipul Kashyap, Massimo Mecella, Eduardo Mena, Erich J. Neuhold, Aris M. Ouksel, Thomas Risse, Monica Scannapieco, Fèlix Saltor, Luca de Santis, Stefano Spaccapietra, Steffen Staab,Rudi Studer, and Olga De Troyer, Emergent Semantics Systems., Proceedings of the International Conference on Semantics of a Networked World (SNW 2004), Paris, France, 2004. [C13] L. De Santis, M. Scannapieco, and T. Catarci, Trusting Data Quality in Cooperative Information Systems, Proceedings of the 11th International Conference on Cooperative Information Systems (CoopIS'03), , Italy, 2003. [C12] C. Marchetti, M. Mecella, M. Scannapieco, and A. Virgillito, Enabling Data Quality Notification in Cooperative Information Systems through a Web- service based Architecture (short paper), Proceedings of the 4th International Conference on Web Information Systems Engineering (WISE'03), Roma, Italy, 2003. [C11] P. Bertolazzi, L. De Santis, and M. Scannapieco, Automatic Record Matching in Cooperative Information Systems, Proceedings of the ICDT'03 International Workshop on Data Quality in Cooperative Information Systems (DQCIS'03), Siena, Italy, 2003. [C10] C. Cappiello, C. Francalanci, B. Pernici, P. Plebani, and M. Scannapieco, Data Quality Assurance in Cooperative Information Systems: a Multi-dimension Quality Certificate, Proceedings of the ICDT'03 International Workshop on Data Quality in Cooperative Information Systems (DQCIS'03), Siena, Italy, 2003. [C9] C. Marchetti, M. Mecella, M. Scannapieco, A. Virgillito, and R. Baldoni, Data Quality Notification in Cooperative Information Systems, Proceedings of the ICDT'03 International Workshop on Data Quality in Cooperative Information Systems (DQCIS'03),Siena, Italy, 2003. [C8] P.D. Falorsi, S. Pallara, A. Pavone, A. Alessandroni, E. Massella, and M. Scannapieco, Improving the Quality of Toponymic Data in the Italian Public Administration, Proceedings of the ICDT '03 Workshop on Data Quality in Cooperative Information Systems (DQCIS '03), Siena, Italy, 2003. [C7] M. Bertoletti, P. Missier, M. Scannapieco, P. Aimetti, and C. Batini, The Services To Businesses Project: Improving Government-to-Business Relationships in Italy, Proceedings of the 2nd EGOV Conference (EGOV'03), Prague, Czech Republic, 2003. [C6] M. Scannapieco, B. Pernici, and E.M. Pierce, IP-UML: Towards a Methodology for Quality Improvement based on the IP-MAP Framework, Proceedings of the 7th International Conference on Information Quality (ICIQ'02), Boston, MA, USA, 2002. [C5] M. Mecella, M. Scannapieco, A. Virgillito, R. Baldoni, T. Catarci, and C. Batini, Managing Data Quality in Cooperative Information Systems, Proceedings of the 10th International Conference on Cooperative Information Systems (CoopIS 2002), Irvine, CA, 2002. [C4] P. Aimetti, C. Batini, C. Gagliardi, and M. Scannapieco, The “Services To Enterprises” Project: an Experience of Data Quality Improvement in the Italian Public Administration, Experience Paper at the 7th International Conference on Informa tion Quality (ICIQ'02), Boston, MA, USA, 2002.

41 / 45 [C3] B. Pernici and M. Scannapieco, Data Quality in Web Information Systems, Best rated paper in Proceedings of the 21th International Conference on Conceptual Modeling (ER 2002), Tampere, Finland, 2002. [C2] M. Scannapieco, V. Mirabella, M. Mecella, and C. Batini, Data Quality in e-Business, Proceedings of the Workshop on Web Services, e-Business, and the Semantic Web: Foundations, Models, Architecture, Engineering and Applications (WES 2002), in conjunction with CAiSE 2002, Toronto, Ontario, Canada, 2002. [C1] P. Bertolazzi and M. Scannapieco, Introducing Data Quality in a Cooperative Context, Proceedings of the 6th International Conference on Information Quality (ICIQ'01), Boston, MA, USA, 2001. Pubblicazioni in Collane Istat [IS5] M. Scannapieco, D. Zardetto and G. Barcaroli, La Calibrazione dei Dati con R: una Sperimentazione nell'Indagine Forze di Lavoro ed un Confronto con GENESEES/SAS, ISTAT (serie Contributi), no.4, 2007. [IS4] A. Boggia, A. Pavone, L. Pizzicannella, and M. Scannapieco, Tecniche e Metodi Sperimentali per la Misurazione dell'Accuratezza dei Dati Toponomastici, L'Integrazione di Dati di Fonti Diverse: Tecniche e Applicazioni del Record Linkage e Metodi di Stima Basati sull'Uso Congiunto di Fonti Statistiche e Amministrative (P.D. Falorsi, A. Pallara, and A. Russo, eds.), Franco Angeli, 2006. [IS3] A. Boggia, F. Crescenzi, O. Gargano and M. Scannapieco, Miglioramento della Qualità dei Dati Interno alle Amministrazioni, in Principi Guida per la Qualità dei Dati Toponomastici nella Pubblica Amministrazione (P.D. Falorsi and M. Scannapieco, eds.), cap. 4, ISTAT (serie Contributi, vol. 12 - http://www.istat.it/dati/pubbsci/contributi/Contr anno2005.htm), 2005. [IS2] P.D. Falorsi and M. Scannapieco, Miglioramento della Qualità dei Dati basato sulla Cooperazione, in Principi Guida per la Qualità dei Dati Toponomastici nella Pubblica Amministrazione (P.D. Falorsi and M. Scannapieco, eds.), cap. 5, ISTAT (serie Contributi, vol. 12 - http://www.istat.it/dati/pubbsci/contributi/Contr anno2005.htm), 2005. [IS1] P.D. Falorsi and M. Scannapieco (eds.), Principi Guida per la Qualità dei Dati Toponomastici nella Pubblica Amministrazione, ISTAT (serie Contributi, vol. 12 - http://www.istat.it/dati/pubbsci/contributi/Contr anno2005.htm), 2005.

Conferenze e Workshop Italiani [IT9] D. Zardetto, M. Scannapieco, L. Valentino, T. Catarci: “On Probabilistic Record Linkage: New Methods Compared to the Fellegi-Sunter Approach”, in: “Proceedings of the 19th Italian Symposium on Advanced Database Systems (SEBD 2011)”, pagg. 21-32, Maratea, 26-29 Giugno 2011.

[IT8] M. Di Gioia, M. Scannapieco, D. Beneventano: Object Identification across Multiple Sources. SEBD 2010: 414-425, 2010.

[IT7] N.Cibella, M. Fortini, M.Scannapieco, T. Tuoto: From theory to practice: the software RELAIS as a solution for record linkage. SIS (Società Italiana di Statistica) 2010.

[IT6] N.Cibella, M. Fortini, M. Scannapieco, L. Tosco, T.Tuoto; L.Valentino: RELAIS: Record Linkage At Istat (Poster), Nona Conferenza Nazionale di Statistica, Roma, 2008.

42 / 45 [IT5] D. Milano, M. Scannapieco, and T. Catarci, Data Quality Improvement in the DaQuinCIS System, Proceedings of the National Conference Sistemi Evoluti per Basi di Dati (SEBD 2004), S. Margherita di Pula, Italy, 2004.

[IT4] L. De Santis, M. Scannapieco, and T. Catarci,A Trust Model for Tightly Coupled P2P Systems, Proceedings of the National Conference Sistemi Evoluti per Basi di Dati (SEBD 2003), Cetraro (CS), Italy, 2003.

[IT3] M. Mecella, M. Scannapieco, A. Virgillito, R. Baldoni, T. Catarci, and C. Batini, Managing Data Quality in Cooperative Information Systems (Extended Abstract), Proceedings of the National Conference Sistemi Evoluti per Basi di Dati (SEBD 2002), Isola d'Elba, Italy, 2002.

[IT2] B. Pernici and M. Scannapieco, A Model for Data Quality in Web Information Systems, Proceedings of the National Conference Sistemi Evoluti per Basi di Dati (SEBD 2002), Isola d'Elba, Italy, 2002.

[IT1] D. Natale, M. Scannapieco, Angeletti P., T. Catarci, and G. Raiss, Qualità dei Dati e Standard ISO/IEC 9126: Analisi Critica ed Esperienze nella Pubblica Amministrazione Italiana, Proceedings of the National Workshop on Sistemi in Rete nella Pubblica Amministrazione, Roma, Italy, 2001.

Lavori (note e relazioni tecniche) Autori, Titolo, Data [RT24] EMS: Sintesi 2010 [RT23] I.stat: Piano di diffusione file di input 2009 [RT22] CORE Deliverable 3.1, Technical Specification vs1, 2011 [RT21] CORE Deliverable 1.3, Management Final Report, 2011 [RT20] CORE Deliverable 1.2, Management Intermediate Report, 2011 [RT19] CORE Deliverable 1.1, Management Preliminary Report, 2011 [RT18] CORE Proposal, 2010 [RT17] CORA Deliverable 5.2, Report on Dissemination Activities, 2010 [RT16] CORA Deliverable 5.1, Final Report, 2010 [RT15] CORA Deliverable 1.3, Management Final Report, 2010 [RT14] CORA Deliverable 1.2, Management Intermediate Report, 2010 [RT13] CORA Deliverable 1.1, Management Preliminary Report, 2010 [RT12] CORA Proposal, 2009 [RT11] RELAIS 2.3 –User Guide, preprocessing, 2011 [RT10] “RELAIS 2.2 – User Guide, 2011. [RT9] “RELAIS 2.1 – User Guide, 2010. [RT8] “RELAIS 2.0 – User Guide, 2009. [RT7] “RELAIS”- Guida Utente All’Utilizzo – Versione 1.0, 2008. [RT6] M. Scannapieco, and C. Vaccari, Open Source e Statistica nella Pubblica Amministrazione, Rivista del Sistema Statistico Nazionale (Sistan), 2007. [RT5] Deliverable CENEX - Integration of Survey and Administrative Data – WP3 – Software Tools for Integration Methodologies [RT4] M. Scannapieco, DaQuinCIS: Exchanging and Improving Data Quality in

43 / 45 CooperativeInformation Systems, Ph.D. Thesis in Computer Engineering, Università di Roma “La Sapienza", Dipartimento di Informatica e Sistemistica, 2004. [RT3] M. Scannapieco, Data Quality in Cooperative Information Systems, Doctoral Poster at the 28th Very Large Databases Conference (VLDB 2002), Hong Kong, 2002. [RT2] P. Bertolazzi, M.G. Fugini, M. Mecella, B. Pernici, G. Plebani, and M. Scannapieco,Supporting Trusted Data Exchanges in Cooperative Information Systems, Technical Report 30-2001, Dipartimento di Informatica e Sistemistica, Università di Roma “La Sapienza", Roma, Italy, 2001. [RT1] P. Missier, M. Scannapieco, and C. Batini, Cooperative Architectures: Introducing Data Quality, Technical Report 14-2001, Dipartimento di Informatica e Sistemistica, Università di Roma “La Sapienza”, Roma, Italy, 2001.

Conoscenze informatiche Pacchetti di Office Automation: Microsoft Office, Open Office Sistemi Operativi: Microsoft Windows, Linux Tecnologie e linguaggi per il Web: V XML e linguaggi correlati o derivati (XML-Schema, XSLT, XQuery, XPath e WSDL per i Web Service); V Linguaggi/tecnologie server-side: XHTML, PHP, JSP V Linguaggi/tecnologie client-side: CSS, Javascript; V HTML Strumenti di editing di testi: LaTeX Linguaggi di Programmazione: Java, sia Standard Edition che Enterprise Edition, e framework correlati (EJB, JPA, JAX-WS per i Web Service), R, C, C++, Pascal, Prolog, LISP. Strumenti e linguaggi di Progettazione: Entity-Relationship (ER), UML 2.0, IBM Rational Rose, MicrosoftVisio, Visual Paradigm, ERWin, Eclipse, NetBeans Gestione dei dati: SQL, MySQL, SQLite, ORACLE Middleware, application e Web server: CORBA, Enterprise Java Beans, Web service, ActiveMQ, Tomcat, JBoss

Referenze La sottoscritta ha direttamente collaborato e collabora con i seguenti ricercatori di chiara fama internazionale:

• Prof. Carlo Batini, professore ordinario, Università degli Studi di Milano - Bicocca • Prof. Elisa Bertino, full professor, Purdue University • Prof. Tiziana Catarci, professore ordinario, SAPIENZA – Università di Roma • Dott. Divesh Srivastava, AT&T-Labs Inc. Research

Il sottoscritto è a conoscenza che, ai sensi dell’art. 76, del D.P.R. n. 445 del 28 dicembre 2000, le dichiarazioni di cui al presente curriculum sono da considerare come rese a pubblico ufficiale e che le

44 / 45 dichiarazioni mendaci, la falsità negli atti e l’uso di atti falsi sono puniti ai sensi del codice penale e delle leggi speciali in materia

Dichiara, altresì, di essere informato che, ai sensi e per gli effetti di cui all’art. 13 del D. Lgs. n. 196/2003, i dati personali raccolti saranno trattati, anche con strumenti informatici, esclusivamente nell’ambito del procedimento per il quale la presente dichiarazione viene resa.

.

Roma, 14/03/2014

Monica Scannapieco

______

45 / 45