logo_ittig
Istituto di Teoria e Tecniche
dell'Informazione Giuridica

banner_top
attiva motore di ricerca
scrivici
ricerca

Progetto di ricerca: JurWordNet, lessico semantico per il diritto
Materiali

Dal livello del lessico al livello ontologico

Il rapporto fra lessici semantici ed ontologie è bidirezionale: un lessico strutturato con gerarchie semantiche può servire come base per una ontologia ben costruita, e l’ontologia è necessaria, come nel nostro caso, per dare un fondamento alle classificazioni del lessico.
D’altro canto, la distinzione fra lessici ed ontologie è dibattuta, e riconducibile alla questione circa la possibilità di una ontologia indipendente dal linguaggio.

I lessici Wordnet sono da alcuni considerati ontologie, in quanto i concetti della rete sono categorie di significati, classificati sulla base di punti di vista (percezioni della realtà), esplicitati linguisticamente dalle glosse.

In quanto ontologie dipendenti dal lessico o dal linguaggio, tale assimilazione implica affermare che ciascun linguaggio sia in grado di lessicalizzare la medesima percezione della realtà. Ciò è difficile da sostenere, soprattutto se si consideri che sono proprio i livelli più alti delle tassonomie , e quindi le categorie concettuali più astratte (entità, massa, materia, forma...) le più difficili da descrivere in termini linguistici; il linguaggio stesso applica distinzioni ontologiche alle categorie grammaticali, per cui di norma i sostantivi denotano oggetti ed eventi, ed i verbi denotano azioni, processi e stati, ma non sempre il comportamento linguistico è coerente con il criterio ontologico, né esistono corrispondenze complete fra i sistemi linguistici.

Nei domini tecnici, come in quello del diritto, la corrispondenza fra gli oggetti linguistici e le entità ontologiche è sicuramente più stretta, in quanto i termini tecnici sono descritti nei dizionari, nella manualistica, nelle elaborazioni sistematiche in modo preciso, tale da costituire un vocabolario parallelo che lessicalizza le intuizioni ontologiche. Lessici come JurWordNet possono perciò essere considerati ontologie leggere, estensioni linguistiche delle descrizioni di un modo di percezione della realtà: “It is possible that a lexicon with a semantic hierarchy might serve as the basis fo a useful ontology, and an ontology may serve as a grounding for a lexicon. This may be so in technical domains, in wich vocabulary and ontology are more closely tied than in more general domains.” (Hirst 2003, p.14).

La costruzione di ontologie a partire dai lessici può essere fatta in modo parzialmente automatico, estraendo dalle definizioni dei dizionari strutture sintattiche e stringhe linguistiche da cui ricavare relazioni ontologiche (di sussunzione o meronimia): è però difficile affermare in modo generalizzato la natura ontologica piuttosto che linguistica di tali strutture. In JurWordNet si è preferito utilizzare metodi parzialmente automatici per strutturare il lessico, ma effettuare manualmente il collegamento fra il lessico e le classi della Core Legal Ontology, stabilendo alcuni criteri per:

- stabilire cosa appartiene alla core ontology e cosa al lessico. Le entità della core ontology sono ricavate dai livelli più alti degli alberi lessicali, opportunamente integrati: esse coincidono, grosso modo, con le entità analizzate, definite, sistematizzate dalla dottrina giuridica, e, soprattutto dalla teoria generale del diritto (diritto, capacità, soggetto, nullità, reato, contratto, rappresentante, dolo, ecc. Può accadere che lo stesso ‘oggetto’, sia un concetto linguistico, ad esempio diritto, ed una entità dell’ontologia (Right): nel primo caso lessicalizza l’entità ontologica e, come iperonimo, raccoglie classi di concetti e sintagmi, nel secondo caso è correlato ad altre entità che popolano il dominio giuridico, ad es. sussume pretesa (Claim), e opposto a obbligo (Duty).

- differenziare le caratteristiche delle relazioni lessicali (fra synsets) da quelle ontologiche: le relazioni semantiche del lessico non hanno ereditarietà, in quanto relazioni orizzontali valide fra synsets, mentre le relazioni ontologiche esprimono proprietà ed attributi necessari a definire formalmente la classe, e sono perciò ereditate e specializzate dalle sottoclassi (ad es. se esiste una relazione di dipendenza degli oggetti mentali (mental description), dall’individuo (perdurant fisico) in quanto dotato di capacità cognitive, tutte le sottoclassi di oggetto mentale (volontà, dolo, ecc,) ereditano le stesse proprietà, più altre specifiche, necessarie a distinguerle dall’insieme generale. In genere le glosse utilizzate nei synsets forniscono la base per definire proprietà ontologiche). La relazione di disgiunzione fra classi valida a livello ontologico può non esserlo a livello lessicale: entità che condividono la stessa classe di appartenenza sono di norma disgiunte in una ontologia, mentre a livello di linguaggio sintagmi con il medesimo iperonimo possono essere sovrapponibili: contratto di locazione e contratto di compravendita sono sottoclassi (disgiunte) di contratto, ma contratto condizionato non è disgiunto da nessuno dei due precedenti. Le relazioni (primitive) fra le entità dell’ontologia sono mutuate dalla foundational-ontology (dipendenza, partecipazione, costituzione..), ed integrate da relazione mediate (cioè composte) specifiche del dominio giuridico, ad esempio le relazioni normative di obbligo, divieto, legittimazione, ecc.

L’ontologia CORE non interrompe il continuum degli alberi tassonomici verso l’alto; ma, nel passaggio dai synsets alle classi ontologiche, le relazioni vengono opportunamente sostituite, ad esempio l’iperonimia viene trasformata in una relazione di ISA (subClassOf ) o di istanza (instanceOf), la meronimia in relazione di costituzione, i requisiti, spesso contenuti nelle definizioni giuridiche ‘stipulative’, in relazioni di dipendenza.

<<

ITTIG/Ricerca/Progetto JurWordNet/Dal livello del lessico al livello ontologico