Informatica e diritto, XL Annata, Vol. XXIII, 2014, n. 1, pp. 41-64

Maria-Teresa Sagri, Tommaso Agnoloni, Lorenzo Bacci

Tecniche di estrazione terminologica e classificazione automatica di corpora giurisprudenziali

Legal keyword extraction and automatic categorization of Italian case law

L'articolo descrive lo sviluppo di una metodologia per l'estrazione automatica di metadati semantici descrittivi del contenuto della produzione giudiziaria in materia civile. Arricchire il dato testuale di queste meta-informazioni rappresenta il presupposto tecnico per implementare una catalogazione automatica per argomento e un'archiviazione dei provvedimenti nei database istituiti presso i singoli uffici giudiziari. In tal senso il progetto di ricerca promosso dalla Direzione Generale per i Sistemi Informativi Automatizzati (DGSIA) del Ministero della Giustizia e il Tribunale di Milano si pone in linea con i nuovi obiettivi disciplinati dal processo civile telematico.

Sommario: 1. Nuove opportunitą di condivisione del dato giudiziale. - 2. Tecniche di Natural Language Processing per lo sviluppo di una classificazione del merito civile. - 3. Text analysis delle sentenze ed estrazione automatica di informazioni. 3.1. Definizione degli obiettivi e individuazione delle caratteristiche del corpus. 3.2. Metodologia di analisi dei testi. 3.3. Definizione ed assegnazione di uno schema di classificazione. 3.4. Valutazione e verifica dei risultati. - 4. Influssi giuridici del software nella produzione e diffusione del prodotto giudiziario.

English Abstract: The paper will show an approach to keyword extraction and automatic categorization of Italian case law of first instance on civil matters. The approach complements classic Natural Language Processing-based analysis of texts with legal and domain features extraction. The study originated from an experimental activity promoted by the Italian Ministry of Justice for automated semantic metadata attribution in case law deposit in the framework of the digitalization of civil trial in Italy.

vai all'anteprima / see preview