Afficher la notice abrégée

dc.contributor.authorVaamonde Dos Santos, Gael 
dc.date.accessioned2024-05-22T06:44:12Z
dc.date.available2024-05-22T06:44:12Z
dc.date.issued2024-05-19
dc.identifier.citationVaamonde, G. (2024). Diseño y explotación de un corpus histórico de textos oralizantes para el estudio del español clásico y moderno. Revista de Humanidades Digitales, 9, 41–70. https://doi.org/10.5944/rhd.vol.9.2024.39834es_ES
dc.identifier.urihttps://hdl.handle.net/10481/91941
dc.description.abstractEn este artículo presentamos Oralia Diacrónica del Español (ODE), un corpus histórico de carácter especializado diseñado para investigar el léxico de la vida cotidiana y reconstruir la oralidad y la variación dialectal del español peninsular desde el siglo XVI hasta finales del siglo XIX. El corpus está compuesto por documentación inédita relativa a tres tipos textuales de inmediatez comunicativa: inventarios de bienes, declaraciones de testigos en juicios criminales y certificaciones periciales de cirujanos sobre personas heridas o fallecidas. ODE incluye las imágenes facsimilares de los manuscritos junto con la transcripción de los textos en lenguaje TEI-XML y cuenta, además, con lematización, etiquetación morfosintáctica y un sofisticado sistema de búsqueda en línea. En este trabajo explicamos el proceso de construcción de ODE y aportamos varios ejemplos que muestran las posibilidades de explotación de este recurso digital.es_ES
dc.description.abstractThis article presents Oralia Diacrónica del Español (ODE), a specialized historical corpus that has been designed to study the lexicon of everyday life and to reconstruct the orality and dialectology of Peninsular Spanish from the 16th century to the end of the 19th century. This dataset is made up of unpublished documents from three text types characterized by their communicative immediacy: inventories of goods, witnesses’ testimonies in criminal trials, and surgeons’ reports on the state of an injured or dead person. In this work, we detail the design process and methodology employed in creating this corpus: from digital edition in TEI-XML to the application of natural language processing tools on the TEITOK platform. We also explain, providing several examples, the possibilities for exploiting this digital resource via its query interface.es_ES
dc.language.isospaes_ES
dc.publisherRevista de Humanidades Digitaleses_ES
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectcorpus históricoes_ES
dc.subjecthistorical corpuses_ES
dc.subjectEdad Modernaes_ES
dc.subjectEarly Modernes_ES
dc.subjectedición digitales_ES
dc.subjectdigital editiones_ES
dc.subjecthumanidades digitaleses_ES
dc.subjectdigital humanitieses_ES
dc.subjectTEI-XMLes_ES
dc.titleDiseño y explotación de un corpus histórico de textos oralizantes para el estudio del español clásico y modernoes_ES
dc.typejournal articlees_ES
dc.rights.accessRightsopen accesses_ES
dc.identifier.doihttps://doi.org/10.5944/rhd.vol.9.2024.39834
dc.type.hasVersionVoRes_ES


Fichier(s) constituant ce document

[PDF]

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée

Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Excepté là où spécifié autrement, la license de ce document est décrite en tant que Attribution-NonCommercial-NoDerivatives 4.0 Internacional