Informatica e diritto, XL Annata, Vol. XXIII, 2014, n. 1, pp. 111-142

Dominique Brunato, Giulia Venturi

Le tecnologie linguistico-computazionali nella misura della leggibilità di testi giuridici

Natural Language Processing for automatic readability assessment of legal texts

Il contributo illustra una innovativa metodologia per il calcolo della leggibilità di un testo giuridico basata su strumenti di Trattamento Automatico del Linguaggio ed espressamente rivolta alla sua semplificazione. Inserendoci nel più ampio filone di ricerche che affronta il tema dell'accessibilità della lingua del diritto, discutiamo, con esempi tratti da testi reali, il caso specifico della prosa burocratico-amministrativa dal momento che l'accessibilità a tali documenti costituisce un elemento chiave della comunicazione istituzioni-cittadini. A nostra conoscenza, tale studio rappresenta il primo tentativo volto a mostrare come tecnologie linguistico-computazionali allo stato dell'arte per la lingua italiana incomincino ad essere mature per costituire non solo un ausilio per definire automaticamente la leggibilità di testi giuridici ma anche una guida per una loro stesura semplificata. Tali funzionalità saranno illustrate grazie a READ-IT, il primo e al momento unico strumento di valutazione della leggibilità oggi esistente per la lingua italiana basato su strumenti di Trattamento Automatico del Linguaggio.

Sommario: 1. Introduzione. - 2. La misura della leggibilità di testi giuridici. - 3. READ-IT: uno strumento automatico per l'analisi della leggibilità di un testo. 3.1. Gli strumenti di Trattamento Automatico del Linguaggio. 3.2. Il monitoraggio linguistico. 3.3. Un esempio: la Costituzione italiana. - 4. READ-IT e i testi della pubblica amministrazione: un esempio di applicazione. - 5. Conclusioni e sviluppi futuri.

English Abstract: This paper presents an innovative Natural Language Processing-based methodology for automatically assessing the readability of legal documents, with a view to their simplification. As part of a broader research field investigating the accessibility of the language of the law, we consider the specific domain of the bureaucratic language through an analysis of real texts; the accessibility to this typology of texts is indeed a crucial requisite of the communication between institutions and citizens. To the best of our knowledge, this is the first attempt aimed at showing that state-of-the-art language technologies are nowadays mature not only to enable the automatic readability evaluation of legal texts but also to support their simplification. For these purposes, we adopted READ-IT, the first advanced readability assessment tool for the Italian language.

vai all'anteprima / see preview