Perché i dati pubblicati dal governo sul Pnrr non vanno bene Trasparenza

Sul sito italiadomani.gov.it sono stati pubblicati 2 file non coerenti tra loro e sprovvisti di metadati. Questo ci porta a pensare che le informazioni messe a disposizione dei cittadini non siano le stesse su cui sta lavorando il governo.

|

Uno dei principi fondamentali per la definizione dei progetti contenuti nel piano nazionale di ripresa e resilienza (Pnrr) era la sua apertura al mondo della società civile. Non a caso il governo negli scorsi mesi ha tenuto una serie di incontri sia con i rappresentanti degli enti locali che del mondo del lavoro.

A ciò si aggiunge un secondo elemento. Il regolamento istitutivo del Next generation Eu (Ngeu) prevede un “freno di emergenza” che può bloccare l’erogazione dei fondi nel caso di gravi scostamenti dal raggiungimento dei target intermedi e finali. Per questo motivo un monitoraggio attento e puntuale sullo stato di avanzamento di riforme e investimenti risulta indispensabile. Anche da questo punto di vista quindi sarebbe auspicabile un coinvolgimento della società civile che possa contribuire a segnalare criticità e ritardi.

Affinché ciò sia possibile però è fondamentale il più ampio accesso alle informazioni possibile. Sotto questo aspetto però abbiamo riscontrato le prime difficoltà. Nella sezione “open data” dell’apposito portale che il governo ha creato per la diffusione delle informazioni sul Pnrr infatti sono stati recentemente pubblicati 2 file.

I dati pubblicati su Italiadomani non rispettano le più comuni pratiche in tema di open data.

Tali documenti presentano alcune criticità e incongruenze. In primo luogo non sono stati realizzati seguendo le più comuni buone pratiche in tema di open data. Ad esempio, tali documenti non sono accompagnati da un file “meta dati”, esplicativo di quanto contenuto nel database principale. Come vedremo inoltre questi file sono stati compilati in maniera disomogenea e contengono diversi errori.

Tali problemi fanno presumere che il governo e le altre istituzioni coinvolte lavorino su altri database con dati corretti e aggiornati. Informazioni che però non sembrano accessibili a tutti. Questa disparità informativa però anziché garantire la trasparenza non fa altro che generare ulteriore confusione su un tema particolarmente delicato. Per questo chiediamo che i soggetti coinvolti rendano pubblici tutti i dati in loro possesso.

Cosa prevede il Pnrr in tema di monitoraggio e trasparenza

Per quanto riguarda il monitoraggio sull’attuazione di investimenti e riforme il Pnrr italiano – riprendendo le indicazioni contenute nel regolamento Ue 2021/241 – prevede una serie di indicazioni molto stringenti. Tali indicazioni sono mirate a tutelare gli investimenti fatti nel nostro paese dall’Unione europea. Per questo motivo nel Pnrr è prevista la creazione di una specifica infrastruttura informatica a cui hanno accesso tutte le istituzioni nazionali (inclusa la corte dei conti) ed europee.

€ 24,9 mld gli importi già stanziati dall’Unione europea a favore dell’Italia nell’ambito del Next generation Eu.

Il sistema di controllo è simile a quello già utilizzato per gli altri fondi strutturali europei. Ma in aggiunta sono previsti ulteriori controlli volti a verificare la correttezza delle procedure per contrastare fenomeni di corruzione e infiltrazioni della criminalità organizzata.

Sul fronte della trasparenza invece non si trovano indicazioni altrettanto dettagliate. L’unica indicazione vincolante è quella relativa all’obbligo di inviare una relazione annuale al parlamento in cui sono riportati i prospetti sull’utilizzo delle risorse del Ngeu e sui risultati raggiunti.

Per ulteriori informazioni invece il documento rimanda al portale Italia domani. Tale portale tuttavia non ha una specifica finalità di trasparenza a beneficio dei cittadini quanto piuttosto di valorizzazione dei progetti e delle riforme che saranno realizzate grazie alle risorse europee.

[…] tali iniziative, destinate a dare piena diffusione del piano, garantiscono adeguata visibilità ai risultati degli investimenti e al ruolo dell’Unione europea nel sostegno offerto […]. L’esperienza offerta dal nuovo portale si basa su quattro principi guida: trasparenza, semplicità, immediatezza e personalizzazione.

Il fine di questo portale quindi può essere interpretato non tanto come un tentativo di favorire analisi sistematiche quanto come la necessità di tenere informati cittadini e addetti ai lavori su quanto sta avvenendo. Nel testo del Pnrr si fa riferimento anche alla condivisione dei dati. Tuttavia, come vedremo, anche questo aspetto può essere interpretato alla luce di un approccio divulgativo. Quindi non necessariamente completo.

Pnrr e dati, cosa non va

Prima di analizzare nel dettaglio le incongruenze che abbiamo riscontrato occorre fare una premessa sul formato utilizzato per la pubblicazione degli open data presenti sul portale del governo. Si tratta del cosiddetto comma separated values (meglio noto come csv).

I dati pubblicati sul portale del governo sono inutilizzabili per fini di analisi.

Tale formato è molto diffuso poiché compatibile con tutte le tecnologie attualmente disponibili. Tuttavia si presta più alla presentazione dei dati piuttosto che al loro riutilizzo a fini di analisi. In questo senso va segnalata anche l’assenza del cosiddetto file “metadati”. In questo specifico file sono solitamente illustrate le caratteristiche tecniche dei dati: dal formato utilizzato al carattere di separazione, all’eventuale intervallo di validità del dato. A ciò si aggiunge la spiegazione del significato delle colonne e di come queste siano correlate tra loro. In questo modo, sempre ai fini del riutilizzo dei dati, sarebbe anche possibile rimuovere la prima riga, solitamente utilizzata per descrivere i dati contenuti nelle colonne sottostanti durante le presentazioni.

Tale file però come detto non è presente sul portale del governo. Al contrario nei dati è presente la riga delle intestazioni. Se ne deduce che i documenti siano stati realizzati a scopo di presentazione e non di riutilizzo. Inoltre, come vedremo, i dati contenuti in questi file sembrano essere stati inseriti manualmente e non in maniera sistematica.

Incongruenze logiche nei dati

Come abbiamo detto, sul portale del governo sono stati pubblicati due file di open data. Uno contiene l’elenco delle misure (riforme e investimenti) aggiornato al 30 settembre. L’altro invece mostra le scadenze (traguardi e obiettivi) ed è aggiornato al 12 luglio.

Una prima incongruenza si registra nel file relativo alle scadenze. Ogni voce contenuta nel file è associata a una missione, una componente e una o più misure o sottomisure (riforme o investimenti). Tutte queste indicazioni sono poi ricollegate grazie a un unico codice identificativo. Tuttavia in alcuni casi i riferimenti dei codici identificativi e quelli descritti nella colonna “misura correlata” (da noi rinominata “titolo_misura”) non coincidono.

In questa immagine ad esempio possiamo vedere come nella colonna di sinistra si faccia riferimento alla riforma identificata con il codice 3.1. Mentre nella colonna adiacente le misure indicate sono la 1.4, 1.5, 1.6, 1.7, e 1.8.

I dati e le incongruenze con gli atti del governo

Queste incongruenze si riscontrano anche negli atti del governo. Ad esempio in uno schema di decreto del presidente del consiglio dei ministri (Dpcm) che è stato oggetto di un’intesa sancita nell’ambito della conferenza unificata dello scorso 7 ottobre. Tale atto delinea i criteri con cui saranno assunti mille esperti per fornire assistenza tecnica nelle procedure legate al Pnrr.

Le incongruenze nei codici identificativi si ritrovano anche negli atti del governo.

In questo schema di Dpcm si cita l’investimento I2.2.1. Tuttavia nel file con l’elenco delle scadenze non esiste questo codice identificativo. La scadenza a cui fa riferimento il Dpcm la si può ritrovare sotto il codice M1C1I2.1. Come se non bastasse peraltro il titolo della misura fa riferimento a un investimento ancora diverso (I1.9).

Ma al di là di ciò le incongruenze riscontrate indicano che molto probabilmente i dati messi a disposizione di cittadini e analisti e quelli su cui lavorano le istituzioni non coincidono.

L’anagrafica delle misure senza codici identificativi

Anche l’altro file presente sul portale, cioè quello relativo all’elenco delle misure, contiene delle criticità. In alcuni casi infatti manca il codice univoco con il quale le misure sono indicate nell’altro file. Ciò rende impossibile associare scadenze e misure.

I dati pubblici e quelli su cui lavorano le istituzioni non coincidono.

Questa informazione potrebbe essere “dedotta” dalle altre colonne presenti. Tuttavia ciò non sarebbe comunque sempre possibile. In primo luogo infatti sarebbe impossibile rintracciare le informazioni legate alle sub-misure. Inoltre, ed è forse la criticità più rilevante, in alcuni casi la colonna “Misura PNRR ufficiale (ITA)” non contiene il codice identificativo. Legata a questo elemento poi c’è un’ulteriore criticità. In alcuni casi infatti il codice identificativo è seguito dai due punti, mentre in altri casi no. Anche questo contribuisce a rendere impossibile un’operazione di ricollegamento analitico tra misure e scadenze.

È possibile che tutte queste criticità e incongruenze siano dovute al fatto che questi file sono stati compilati manualmente, con un fine non di analisi ma di divulgazione. Questo però rende i file poco affidabili e quindi inutilizzabili ai fini del monitoraggio sullo stato di implementazione del Pnrr.

Ancora un appello per la trasparenza

Alla fine di questa analisi infatti possiamo concludere che i dati disponibili provengono da un sistema di presentazione e non da un sistema gestionale (database). Questo significa che i dati disponibili potrebbero contenere errori. Tali errori hanno portato al disallineamento tra i dati presenti sul portale e quelli “reali”.

Con Italia domani il governo non sta facendo un’operazione di trasparenza ma solo di comunicazione.

Un ulteriore elemento che potrebbe aver contribuito al disallineamento riguarda la possibilità che i dati presenti sul portale non siano stati aggiornati parallelamente a quelli a disposizione di governo e altre istituzioni coinvolte. Ciò potrebbe creare in futuro ulteriori disallineamenti.

Per questo chiediamo che le strutture del governo destinate al monitoraggio delle misure pubblichino l’intera struttura dei dati legati al Pnrr in loro possesso. In modo da non alimentare ulteriore confusione su un tema già molto complesso e delicato. Chiediamo inoltre che ciò sia fatto utilizzando le buone pratiche legate agli open data che abbiamo visto e che sono già da tempo utilizzate comunemente in molti portali della pubblica amministrazione.

Il nostro osservatorio sul Pnrr

Scarica i dati in formato Csv o interroga le API

Questo articolo rientra nel progetto di monitoraggio civico “openpnrr” realizzato nell’ambito delle attività di analisi sul piano nazionale di ripresa e resilienza (Pnrr). Ogni lunedì pubblichiamo un nuovo approfondimento sulle misure previste dal piano e sullo stato di avanzamento dei lavori (vedi tutti gli articoli). Nei prossimi mesi pubblicheremo anche un’apposita piattaforma in cui sarà possibile consultare tutte le informazioni disponibili. I dati dei nostri open data possono essere riutilizzati liberamente per analisi, iniziative di data journalism o anche per semplice consultazione.

Foto credit: palazzo Chigilicenza

PROSSIMO POST