logo_ittig
Istituto di Teoria e Tecniche
dell'Informazione Giuridica

banner_top
attiva motore di ricerca
scrivici
ricerca

Progetto di ricerca: JurWordNet, lessico semantico per il diritto
Materiali

Disambiguazione dei polisensi: livello linguistico e livello ontologico

Una delle funzioni più interessanti della metodologia wordnet è la distinzione dei significati nei termini polisensi, sia all’interno del dominio che in relazione al linguaggio comune. Per es.: canone a livello giuridico significa sia una prestazione in denaro o in natura, corrispettivo di un contratto, sia, secondo il diritto canonico, una norma giuridica dal carattere universale; il termine mora è inteso sia come “il ritardo ingiustificato nell’adempimento di un’obbligazione” sia come “la stessa somma di denaro dovuta come sanzione per lo stesso”. Il lemma alimento cambia sostanzialmente il significato se considerato al singolare come “nutrimento” o al plurale come “prestazione obbligatoria in ambito divorziale”. Il lemma alienazione nel contesto giuridico è un atto giuridico mentre nell’italiano corrente ha svariate accezioni, tutte lontane (disgiunte) da quella tecnica. Rendendo esplicite le differenze di significato si consente all’utente di costruire le domande per la ricerca di informazioni in modo più preciso.

Spesso le distinzioni di senso non risiedono solo a livello di linguaggio, ma da assunzioni diverse sulla percezione della realtà: ad esempio per distinguere in un concetto il ruolo o la funzione rispetto alle componenti fisico-sostanziali: il lemma Presidente della Repubblica indica sia la persona fisica (riferita ad una precisa dimensione spazio-temporale), sia l’organo costituzionale, sia il titolare della funzione statale. Un altro esempio, molto comune nel diritto è la distinzione fra il contenuto normativo e la entità fisica: il contratto può essere contemporaneamente catalogato come un rapporto giuridico, come un entità fisica (il documento cartaceo), come un contenuto informativo; il lemma ricorso contiene al suo interno il senso dell’istanza rivolta al Giudice, e quello del documento scritto che contiene la stessa domanda. Il lemma ufficio indica la funzione ricoperta ed il luogo fisico in cui è svolta.

I criteri di organizzazione dei concetti risiedono perciò su assunzioni esterne al linguaggio, che devono essere parimenti esplicite, in modo che l’utente conosca la ‘prospettiva’ in base a cui a cui i concetti vengono differenziati: è questo il ruolo svolto dalle ontologie. Per spiegare la funzione delle ontologie, si consideri che nel lessico di JurWordNet sono stati inseriti termini utilizzati dalla manualistica giuridica con scopi sistematici, normalmente troppo generici per la ricerca del dato giuridico, che costituiscono categorie integrative appropriate per il dominio; per esempio, termini usati nella ricerca come fondazione, associazione, comitato, ecc. sono aggregati sotto la classe istituzione, che è un concetto creato dalla dottrina, ma che non compare tra i corpora lessicali.

Termini come istituzione, che raccolgono il livello più alto degli alberi tassonomici di JurWordNet, coincidono con le entità giuridiche fondamentali, che possono essere considerate comuni a tutti gli ordinamenti giuridici; per esse è possibile esprimere una serie minima di proprietà, condivise da tutte le accezioni specifiche di ogni ordinamento e/o linguaggio. Essi compongono una ontologia fondamentale (Core Ontology ) per il diritto, che ha la funzione di organizzare le tassonomie concettuali di JurWordNet in base a criteri esterni al linguaggio. Disporre di un nucleo di conoscenza giuridica condivisa rende possibile il confronto, l’integrazione, la comprensione della conoscenza giuridica elaborata e prodotta dai sistemi giuridici particolari, e garantisce che i criteri di organizzazione delle classi concettuali siano fondati giuridicamente e condivisibili. Essi sono inoltre consistenti con una ontologia sociale già definita.

Attraverso tale processo è possibile, fra l’altro, stabilire corrispondenze fra termini di linguaggi diversi. Tale approccio è particolarmente efficace nel dominio giuridico, ove la corrispondenza non è fra termini di lingue diverse, quanto fra concetti, o spesso fra istituti giuridici: in diritto è più appropriato parlare di versioni multilingue di un testo legislativo piuttosto che di traduzioni. Spostare l’attenzione dall’espressione linguistica al contenuto consente di confrontare i concetti attraverso le proprietà (e metaproprietà) e di verificare non solo se lo stesso concetto esista in differenti contesti ma anche come lo stesso sia stato elaborato in strutture normative diverse. Per fare un esempio, il lemma capacità giuridica, non ha un equivalente nella lingua inglese, in quanto, all’interno del common law non è stata elaborata una teoria generale della capacità giuridica che sia confrontabile con l’istituto del diritto italiano.

La Comissione Europea, sensibile alla necessità di strumenti per consentire l’accesso ad informazioni normative multilingue, ha recentemente finanziato nell’ambito del programma e-Content, il progetto LOIS (indirizzo nel sito) è l’oggetto), che produrrà un database multilingue costituito da wordnet giuridici in cinque lingue europee (inglese, tedesco, portoghese, ceco, italiano), linkate fra di loro attraverso l’inglese.

<<

ITTIG/Ricerca/Progetto JurWordNet/Disambiguazione dei polisensi: livello linguistico e livello ontologico