Informatica e diritto, XXXIX Annata, Vol. XXII, 2013, n. 1, pp. 243-261

Deborah De Felice, Giovanni Giuffrida, Giuseppe Giura, Vilhelm Verendel, Calogero G. Zarba

Information Extraction and Social Network Analysis of Criminal Sentences. A Sociological and Computational Approach

Estrazione di informazioni e social network analysis applicate a sentenze penali. Un approccio sociologico e computazionale

Administrative sources on crimes (statistics on felonies and crimes) have in many cases shown to be unsatisfactory for the purpose of a  scientific description of the criminal phenomenon. Specifically in the context of organized crime in Italy (and Mafia in particular) these  sources show significant limits in terms of reliability and quality of the information due to specific recipients of data and to the difficulty in collecting and comparing data, as consequence of the speed of legislative changes and changes in criteria used to classify the data. This  paper reports a research project based on analyzing criminal sentences on organized crime activities in Sicily, pronounced from 2000  through 2006. For this case study we split the analysis of a 1,147 document textual corpus into three main stages. First, we collected criminal  sentences from the various courthouses. Since there is not yet a unified digital archive of criminal sentences in Sicily, we collected them in  their paper format and stored into digital format, then into plaintext, by means of computer technology. In the second stage, the text was  examined in order to extract the actors involved in the facts and the relationships between them. The actors have been labelled with the  following roles: judge, members of the court, prosecutor, defendants, lawyers. Actors not labelled have been purged from the analysis.  Relationships between actors were also extracted in terms of close co-occurance in the text, and the network was investigated using social  network analysis, leading to a social network of typical properties. In this paper, we report and discuss the sociological and computational  approaches to characterize the social structure of criminal phenomena, using large-scale and automated computer tools.   

Le fonti amministrative sulla criminalità (statistiche sui reati) hanno mostrato in molti casi di essere insoddisfacenti ai fini di una descrizione scientifica del fenomeno criminale. Specificamente, nel caso della criminalità organizzata in Italia (e in particolare della Mafia) queste fonti  mostrano limiti significativi in termini di affidabilità e qualità delle informazioni a causa della particolare natura dei destinatari cui i dati raccolti vanno inviati e della difficoltà nel raccogliere e confrontare i dati in ragione del susseguirsi delle modifiche legislative e dei  cambiamenti dei criteri di classificazione dei dati stessi. Questo articolo presenta un progetto di ricerca basato sull’analisi di sentenze penali relative ad attività della criminalità organizzata in Sicilia, pronunciate dal 2000 al 2006. Per questo studio l’analisi di un corpus di 1.147  documenti testuali è stata suddivisa in tre fasi principali. In primo luogo, sono state raccolte le sentenze penali dai diversi tribunali. Dal momento che non esiste ancora un archivio digitale unificato delle sentenze penali in Sicilia, queste sono state raccolte nel loro formato cartaceo e archiviate in formato digitale come file di testo. Nella seconda fase, il testo è stato esaminato per estrarre informazioni relative  agli attori coinvolti nei fatti e alle relazioni esistenti tra loro. Gli attori sono stati etichettati con i seguenti ruoli: giudice, membri della corte, pubblico ministero, imputati, avvocati. Gli attori non etichettati sono stati eliminati dall’analisi. Sono state estratte anche informazioni sulle  relazioni fra gli attori, sulla base della loro compresenza nel testo, e la rete è stata studiata utilizzando tecniche di social network analysis, che hanno condotto alla rappresentazione grafica di una rete sociale con caratteristiche peculiari. In questo articolo sono presentati e discussi gli approcci sociologici e computazionali che permettono di evidenziare le caratteristiche dei fenomeni criminali, utilizzando strumenti informatici che operano in maniera automatica su ampie quantità di documenti.

vai al testo integrale / see full text