Informatica e diritto, II Annata, Vol. II, 1976, n. 3, pp. 291-321

Gerard Salton, Anita Wong

Il ruolo delle parole e delle frasi nell' analisi automatica dei testi

Una delle operazioni più cruciali nel reperimento automatico delle informazioni consiste nell'assegnazione a testi scritti e documenti di appropriati identificatori, in grado di rappresentare il contenuto dell'informazione a scopo di ricerca e reperimento. Questa operazione, conosciuta come indicizzazione automatica, normalmente consiste nell'assegnazione ai documenti o di singoli termini, o di entità più specifiche come frasi, o di entità più generali come classi di termini. Un modello, indicato come modello di analisi del valore di discriminazione, assegna nelle operazioni d'indicizzazione un ruolo appropriato ai termini, alle frasi e alle classi di thesaurus; esso è impiegato al fine di determinare criteri di efficienza per gli identificatori del contenuto dei documenti e generare utili strategie d'indicizzazione. A convalidare la teoria sono fornite prove sperimentali.

vai al testo integrale / see full text