Informatica e diritto, XXXVII Annata, Vol. XX, 2011, n. 1-2, pp. 493-511

Giuseppe Rizzo, Federico Morando, Juan De Martin

Open Data: la piattaforma di dati aperti per il Linked Data

Open Data as a platform for Linked Data

Riassunto: La domanda e l'offerta di dati aperti attraverso il Web stanno assumendo una consistenza sempre più rilevante. L'informazione raw che tali dati veicolano ha il potenziale per aggiungere valore a contesti specifici tramite l'aggregazione con altre informazioni, arricchendo la conoscenza complessiva all'interno del sistema. Il Web, che è per sua natura un sistema che collega documenti e risorse all'interno della sua "nuvola", è lo strumento ideale per consentire questa aggregazione e diffondere contenuti verso una grande rete di (ri-)utilizzatori (ovvero fruitori, ma anche creatori di nuove informazioni e nuovi collegamenti). In questo scenario, occorrono strumenti che consentano una diffusione capillare e strutturata dell'informazione, al fine di garantire agli utenti spazi di consultazione e riuso liberi e non polarizzati (ovvero caratterizzati da informazioni quanto più possibile "oggettive", specie perché prive di livelli aggiuntivi di interpretazione/filtro). Cataloghi di dati aperti possono garantire l'interoperabilità dei contenuti, assumendo come modello di scambio l'approccio Linked Data. I formalismi e gli standard da esso introdotti, infatti, offrono un'infrastruttura comune per organizzare e combinare i dati aperti presenti sul web. Al contempo, i dati aperti diventano la piattaforma di cui il paradigma del Linked Data ha bisogno per raggiungere una massa critica di informazioni strutturate e collegate, così da fornire maggiori capacità di inferenza ai fruitori. Infine, la disponibilità di piattaforme collaborative online permette di far giocare un ruolo chiave alle community di utenti. Da un lato, perché le community stesse posso fornire contenuti "liberi" da strutturare (si pensi a Wikipedia, come base per DBPedia, o a Freebase, per esempio); dall'altro, perché la catalogazione dei dati (anche) tramite piattaforme con approccio wiki (es. CKAN.net) pare rappresentare un elemento imprescindibile per facilitare ed orientare la ricerca di coloro i quali necessitano di dati aperti per scopi di ricerca, di business o per interesse civico. La tesi dell'articolo, dunque, è che il modello del Linked Data possa offrire ai dati aperti una sovrastruttura che li renda più utili, in quanto aggregabili con altri dati sparsi per la rete, ed interoperabili, perché pubblicati secondo le stesse linee guida del modello. Inoltre, i dati aperti (sia pubblici che generati dalle community online) possono rappresentare la base concreta che permetta al Web di trasformarsi in un enorme spazio di informazione globale. Per dimostrare questa tesi, l'articolo adotta un approccio multidisciplinare, con particolare attenzione agli aspetti tecnologici (formalismi, standard emergenti, interoperabilità tecnica) e giuridici (proprietà intellettuale e "interoperabilità legale" tra licenze), ma senza tralasciare quelli economici (costi e prezzi) e sociologici (ruolo delle communities).

Abstract: A large amount of data is spread across the Internet and an increasingly large number of users is making advanced uses of them. These data transport raw information, which may be used to enrich existing data, creating new Knowledge about their context thanks to the aggregation with other data. Historically, the Web has been a system where many documents have been collected and linked together. Indeed, the Web has been considered a document aggregator. For this reason it is becoming the ideal system to enable aggregation among data and to deliver data to a large network of consumers, but also producers (or, better, people who consume data, linking and aggregating them, also becoming data producer). In this scenario, tools to share structured information become needed to guarantee to users a space where they may consume and re-use data. Key points are also data licenses and the nature of shared information. First, this kind of space requires free licenses, through which users may gather data in any way to create their preferred views; second, it is important to have a clean, or raw, information without any additional layers of interpretation or elaboration: we can consider this "raw" data or "objective" data. Open Data catalogues may enable data interoperability, taking the Linked Data model as sharing approach. Data models and data serialization standards which are introduced from Linked Data ensure a common infrastructure to organize and to aggregate data, enabling users to infer new knowledge. At the same time, Open Data become the platform that the Linked Data paradigm needs to reach a critical mass of structured and linkable data, allowing users to share and create data and to simply infer new information. Finally an important role is performed by online communities. On the one hand, they provide freely downloadable structured and linked data (e.g. FreeBase or DBpedia); on the other hand, they allow the cataloging of data by means of wiki systems (e.g Ckan.net). In addition, these systems represent an important Open Data source, where consumers (but also producer) may draw for research, business and so on.

vai al testo integrale / see full text