Informatica e diritto, XL Annata, Vol. XXIII, 2014, n. 1, pp. 13-39

Stefano Ondelli

Ordine delle parole nell'italiano delle sentenze:alcune misurazioni su corpora elettronici

Word Order in Italian Judgments: A Survey on Electronic Corpora

Lo studio riguarda alcuni aspetti relativi all'ordine delle parole che tradizionalmente sono fatti rientrare tra i tratti distintivi del linguaggio giuridico: l'inversione di soggetto e verbo; l'anteposizione dell'aggettivo al nome; l'anteposizione del participio passato e presente in funzione aggettivale al nome; l'anteposizione dell'avverbio al verbo. Due sono le novità introdotte: si utilizza l'analisi automatica di un corpus elettronico per mezzo di software, con vantaggi e limiti discussi di volta in volta, e si mettono a confronto subcorpora monolingui che però non comprendono testi prodotti nello stesso ordinamento. Nel confronto tra subcorpora, i testi prodotti dalla Cassazione Civile italiana risultano più ricchi di strutture marcate sia come quantità di forme coinvolte, sia come numero di occorrenze totali. La peculiarità delle sentenze della Corte di Giustizia dell'Unione europea è data dalla frequente ripetizione di un numero ridotto di forme, mentre i testi del Tribunale d'appello del Canton Ticino presentano una variazione più accentuata dei lemmi coinvolti. Ci si chiede se esistano giustificazioni funzionali che spieghino questa diversa distribuzione poiché i tratti analizzati, come altri nei testi giuridici, sono fatti di norma rientrare tra i fenomeni che contribuiscono alla difficoltà di lettura, e che quindi andrebbero considerati in eventuali proposte di semplificazione.

This article investigates with word-order patterns that are traditionally acknowledged as distinctive features of legal Italian: subject-predicate inversions, adjectives before nouns, past and present participle forms used as adjectives before nouns, adverbs before verbs. Two innovative approaches are adopted: the automatic analysis of an electronic corpus is conducted by means of dedicated software whose pros and cons are discussed for each application and monolingual subcorpora are compared comprising texts drafted in two different legal systems. The comparison shows that the judgments of the Italian Court of Cassation feature more distinctive word-order patterns in terms of both the linguistic types involved and the total number of tokens, whereas the texts of the Court of Justice of the European Union stand out for the high frequency of a limited number of types and the texts of the AppealCourt of Canton Ticino feature a wider variety of lemmas. Finding a functional explanation for those differences may be useful since the word-order patterns under investigation are among the traits that ought to be simplified in order to achieve plain language in legal texts.

vai al testo integrale / see full text