Informatica e diritto, XXXIX Annata, Vol. XXII, 2013, n. 1, pp. 243-261
Deborah De Felice, Giovanni Giuffrida, Giuseppe Giura, Vilhelm Verendel, Calogero G. Zarba
Information Extraction and Social Network Analysis of Criminal Sentences. A Sociological and Computational Approach
Estrazione di informazioni e social network analysis applicate a sentenze penali. Un approccio sociologico e computazionale
Administrative sources on crimes (statistics on felonies and crimes) have
in many cases shown to be unsatisfactory for the purpose of a
scientific description of the criminal phenomenon. Specifically in the
context of organized crime in Italy (and Mafia in particular) these
sources show significant limits in terms of reliability and quality of the
information due to specific recipients of data and to the difficulty in
collecting and comparing data, as consequence of the speed of legislative
changes and changes in criteria used to classify the data. This
paper reports a research project based on analyzing criminal sentences on
organized crime activities in Sicily, pronounced from 2000 through
2006. For this case study we split the analysis of a 1,147 document
textual corpus into three main stages. First, we collected criminal
sentences from the various courthouses. Since there is not yet a unified
digital archive of criminal sentences in Sicily, we collected them
in their paper format and stored into digital format, then into
plaintext, by means of computer technology. In the second stage, the text
was examined in order to extract the actors involved in the facts
and the relationships between them. The actors have been labelled with
the following roles: judge, members of the court, prosecutor,
defendants, lawyers. Actors not labelled have been purged from the
analysis. Relationships between actors were also extracted in terms
of close co-occurance in the text, and the network was investigated using
social network analysis, leading to a social network of typical
properties. In this paper, we report and discuss the sociological and
computational approaches to characterize the social structure of
criminal phenomena, using large-scale and automated computer tools.
Le fonti amministrative sulla criminalità (statistiche sui reati) hanno mostrato in molti casi di essere insoddisfacenti ai fini di una descrizione scientifica del fenomeno criminale. Specificamente, nel caso della criminalità organizzata in Italia (e in particolare della Mafia) queste fonti mostrano limiti significativi in termini di affidabilità e qualità delle informazioni a causa della particolare natura dei destinatari cui i dati raccolti vanno inviati e della difficoltà nel raccogliere e confrontare i dati in ragione del susseguirsi delle modifiche legislative e dei cambiamenti dei criteri di classificazione dei dati stessi. Questo articolo presenta un progetto di ricerca basato sull’analisi di sentenze penali relative ad attività della criminalità organizzata in Sicilia, pronunciate dal 2000 al 2006. Per questo studio l’analisi di un corpus di 1.147 documenti testuali è stata suddivisa in tre fasi principali. In primo luogo, sono state raccolte le sentenze penali dai diversi tribunali. Dal momento che non esiste ancora un archivio digitale unificato delle sentenze penali in Sicilia, queste sono state raccolte nel loro formato cartaceo e archiviate in formato digitale come file di testo. Nella seconda fase, il testo è stato esaminato per estrarre informazioni relative agli attori coinvolti nei fatti e alle relazioni esistenti tra loro. Gli attori sono stati etichettati con i seguenti ruoli: giudice, membri della corte, pubblico ministero, imputati, avvocati. Gli attori non etichettati sono stati eliminati dall’analisi. Sono state estratte anche informazioni sulle relazioni fra gli attori, sulla base della loro compresenza nel testo, e la rete è stata studiata utilizzando tecniche di social network analysis, che hanno condotto alla rappresentazione grafica di una rete sociale con caratteristiche peculiari. In questo articolo sono presentati e discussi gli approcci sociologici e computazionali che permettono di evidenziare le caratteristiche dei fenomeni criminali, utilizzando strumenti informatici che operano in maniera automatica su ampie quantità di documenti.