logo_ittig
Istituto di Teoria e Tecniche
dell'Informazione Giuridica

banner_top
attiva motore di ricerca
scrivici
ricerca

Progetto di ricerca: JurWordNet, lessico semantico per il diritto
Materiali

Utilizzo di JurWordNet

Le reti semantiche sono strumenti per il trattamento dei contenuti, che abbinate agli strumenti di Natural Language Processing, integrano l’analisi (parsing) degli aspetti morfo-sintattici con la comprensione dei significati e costituiscono perciò componenti importanti in molti settori di applicazione, fra cui:

- il supporto all’information retrieval: anche se il recente sviluppo della ricerca nel campo del Web semantico ha spostato l’accento dalla ricerca di informazioni in basi strutturate all’estrazione di informazioni da dati non strutturati, WordNet nasce come supporto ai sistemi di information retrieval per facilitare l’accesso a dati eterogenei e multilingue, attraverso l’estensione e la precisazione delle domande.

- come fonte di metadati per l’estrazione di informazioni, la classificazione automatica ed il tagging semantico dei documenti giuridici. In molti paesi europei sono stati varati progetti istituzionali per la definizione di standard di identificazione per le fonti giuridiche, in particolare per i testi legislativi: per l’Inghilterra il progetto sviluppato dal LAMS (Legal and Advice Sector Metadata), per l’Italia il progetto Norme in Rete, coordinato dal Ministero della Giustizia, per i Paesi Bassi il progetto Metalex, presso l’Università di Amsterdam; iniziative internazionali sono: il progetto Lexml e per gli Stati Uniti, Legalxml. In Italia, il progetto Norme in rete ha portato alla definizione di standard (DTD XML) per la descrizione della tipologia e della struttura testuale dei testi, in cui la descrizione dei contenuti è per ora assente, o veicolata attraverso le tradizionali risorse (schemi di classificazione, descrittori), che possono essere integrate con lessici semantici come JurWordNet, tagliati sui bisogni informativi dei cittadini piuttosto che dei professionisti del diritto.

- come modello di descrizione e linguaggio di rappresentazione della conoscenza giuridica; negli anni ’90 lo sviluppo di sistemi informatici ‘basati sulla conoscenza’ prometteva un utilizzo delle tecnologie nel diritto per l’elaborazione dei contenuti, sviluppo poi frenato non tanto dalla difficoltà di riprodurre schemi e processi di ragionamento propri del diritto, quanto dalla mancanza di un metodo di concettualizzazione della conoscenza. Oggi le ontologie core offrono una base per lo sviluppo di ‘ontologie di dominio’, basi di conoscenza che descrivono settori normativi specifici utilizzando elementi definiti e condivisi; questo rende possibile una ricca gamma di applicazioni avanzate nell’analisi e gestione della conoscenza, quali: il confronto e l’aggiornamento delle normative, la verifica del rispetto delle regole, la consulenza e la risoluzione on-line delle controversie.

Il data base di JurWordNet è accessibile singolarmente o integrato con il database dell’Italiano; la sezione giuridica sarà presto disponibile su questo sito, sia per il collegamento attraverso file Asp con motori di information retrieval, sia per la navigazione all’interno della rete lessicale e dell’ontologia.

<<

ITTIG/Ricerca/Progetto JurWordNet/Utilizzo di JurWordNet