Informatica e diritto, XL Annata, Vol. XXIII, 2014, n. 1, pp. 41-64

Maria-Teresa Sagri, Tommaso Agnoloni, Lorenzo Bacci

Tecniche di estrazione terminologica e classificazione automatica di corpora giurisprudenziali

Legal keyword extraction and automatic categorization of Italian case law

L'articolo descrive lo sviluppo di una metodologia per l'estrazione automatica di metadati semantici descrittivi del contenuto della produzione giudiziaria in materia civile. Arricchire il dato testuale di queste meta-informazioni rappresenta il presupposto tecnico per implementare una catalogazione automatica per argomento e un'archiviazione dei provvedimenti nei database istituiti presso i singoli uffici giudiziari. In tal senso il progetto di ricerca promosso dalla Direzione Generale per i Sistemi Informativi Automatizzati (DGSIA) del Ministero della Giustizia e il Tribunale di Milano si pone in linea con i nuovi obiettivi disciplinati dal processo civile telematico.

The paper will show an approach to keyword extraction and automatic categorization of Italian case law of first instance on civil matters. The approach complements classic Natural Language Processing-based analysis of texts with legal and domain features extraction. The study originated from an experimental activity promoted by the Italian Ministry of Justice for automated semantic metadata attribution in case law deposit in the framework of the digitalization of civil trial in Italy.

vai al testo integrale / see full text