Questo lavoro si prefigge di costruire l’impianto lessicografico e gli strumenti informatici per un vocabolario elettronico, il Vocabolario del Siciliano Medievale (VSM) progetto già auspicato da Ruffino (1989: 337), Brincat (2011), Pagano (2011), e presentato, a grandi linee, da Pagano (2012). Dopo una rapida introduzione sulle digital humanities, vengono ripercorsi alcuni degli studi che hanno proposto classificazioni e modelli di valutazione per il vocabolario elettronico, seguiti da un’analisi storico-critica delle imprese più significative nel campo della lessicografia storica. Successivamente, gli elementi fondamentali dei vocabolari elettronici sono trattati singolarmente ed esaustivamente in un capitolo dedicato. La seconda parte si prefigge di applicare sistematicamente le teorie e le metodologie individuate al caso specifico del VSM. L’avvio dei lavori è naturalmente incentrato sulla raccolta dei dati lessicografici. A partire dall’analisi della rappresentatività del Corpus Artesia (Archivio Testuale del Siciliano Antico artesia.ovi.cnr.it) viene affrontato il problema del bilanciamento del sottocorpus dei testi d’archivio. La ricerca ha quindi curato la codifica di oltre 60 testi per l’indicizzazione in GATTO (Gestione degli Archivi Testuali del Tesoro delle Origini) e ha condotto alla realizzazione di una nuova versione della base di dati. Il lavoro è corredato dalla realizzazione dell’interfaccia di consultazione e installazione per la pubblicazione su CD-ROM. La sezione si conclude con alcuni sondaggi lessicali a campione per valutare il contributo dell’aggiornamento. Successivamente viene definita la microstruttura della voce, riadattando il prestigioso modello del Tesoro della Lingua Italiana delle Origini e operando una parallela riconversione della struttura logica della voce in XML/TEI. L’informatizzazione della redazione è stata completata attraverso la realizzazione di un sistema on-line di redazione collaborativa, che permette l inserimento guidato delle voci con strumenti di autocompletamento e di controllo dell’integrità referenziale.
ELEMENTI DI LESSICOGRAFIA COMPUTAZIONALE PER UN VOCABOLARIO DEL SICILIANO MEDIEVALE (VSM) / Arcidiacono, Salvatore. - (2015 Dec 10).
ELEMENTI DI LESSICOGRAFIA COMPUTAZIONALE PER UN VOCABOLARIO DEL SICILIANO MEDIEVALE (VSM)
ARCIDIACONO, SALVATORE
2015-12-10
Abstract
Questo lavoro si prefigge di costruire l’impianto lessicografico e gli strumenti informatici per un vocabolario elettronico, il Vocabolario del Siciliano Medievale (VSM) progetto già auspicato da Ruffino (1989: 337), Brincat (2011), Pagano (2011), e presentato, a grandi linee, da Pagano (2012). Dopo una rapida introduzione sulle digital humanities, vengono ripercorsi alcuni degli studi che hanno proposto classificazioni e modelli di valutazione per il vocabolario elettronico, seguiti da un’analisi storico-critica delle imprese più significative nel campo della lessicografia storica. Successivamente, gli elementi fondamentali dei vocabolari elettronici sono trattati singolarmente ed esaustivamente in un capitolo dedicato. La seconda parte si prefigge di applicare sistematicamente le teorie e le metodologie individuate al caso specifico del VSM. L’avvio dei lavori è naturalmente incentrato sulla raccolta dei dati lessicografici. A partire dall’analisi della rappresentatività del Corpus Artesia (Archivio Testuale del Siciliano Antico artesia.ovi.cnr.it) viene affrontato il problema del bilanciamento del sottocorpus dei testi d’archivio. La ricerca ha quindi curato la codifica di oltre 60 testi per l’indicizzazione in GATTO (Gestione degli Archivi Testuali del Tesoro delle Origini) e ha condotto alla realizzazione di una nuova versione della base di dati. Il lavoro è corredato dalla realizzazione dell’interfaccia di consultazione e installazione per la pubblicazione su CD-ROM. La sezione si conclude con alcuni sondaggi lessicali a campione per valutare il contributo dell’aggiornamento. Successivamente viene definita la microstruttura della voce, riadattando il prestigioso modello del Tesoro della Lingua Italiana delle Origini e operando una parallela riconversione della struttura logica della voce in XML/TEI. L’informatizzazione della redazione è stata completata attraverso la realizzazione di un sistema on-line di redazione collaborativa, che permette l inserimento guidato delle voci con strumenti di autocompletamento e di controllo dell’integrità referenziale.File | Dimensione | Formato | |
---|---|---|---|
D151210.pdf
accesso aperto
Tipologia:
Tesi di dottorato
Licenza:
PUBBLICO - Pubblico con Copyright
Dimensione
4.71 MB
Formato
Adobe PDF
|
4.71 MB | Adobe PDF | Visualizza/Apri |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.