Diseño y explotación de un corpus histórico de textos oralizantes para el estudio del español clásico y moderno

Vaamonde Dos Santos, Gael

doi:https://doi.org/10.5944/rhd.vol.9.2024.39834

dc.contributor.author	Vaamonde Dos Santos, Gael
dc.date.accessioned	2024-05-22T06:44:12Z
dc.date.available	2024-05-22T06:44:12Z
dc.date.issued	2024-05-19
dc.identifier.citation	Vaamonde, G. (2024). Diseño y explotación de un corpus histórico de textos oralizantes para el estudio del español clásico y moderno. Revista de Humanidades Digitales, 9, 41–70. https://doi.org/10.5944/rhd.vol.9.2024.39834	es_ES
dc.identifier.uri	https://hdl.handle.net/10481/91941
dc.description.abstract	En este artículo presentamos Oralia Diacrónica del Español (ODE), un corpus histórico de carácter especializado diseñado para investigar el léxico de la vida cotidiana y reconstruir la oralidad y la variación dialectal del español peninsular desde el siglo XVI hasta finales del siglo XIX. El corpus está compuesto por documentación inédita relativa a tres tipos textuales de inmediatez comunicativa: inventarios de bienes, declaraciones de testigos en juicios criminales y certificaciones periciales de cirujanos sobre personas heridas o fallecidas. ODE incluye las imágenes facsimilares de los manuscritos junto con la transcripción de los textos en lenguaje TEI-XML y cuenta, además, con lematización, etiquetación morfosintáctica y un sofisticado sistema de búsqueda en línea. En este trabajo explicamos el proceso de construcción de ODE y aportamos varios ejemplos que muestran las posibilidades de explotación de este recurso digital.	es_ES
dc.description.abstract	This article presents Oralia Diacrónica del Español (ODE), a specialized historical corpus that has been designed to study the lexicon of everyday life and to reconstruct the orality and dialectology of Peninsular Spanish from the 16th century to the end of the 19th century. This dataset is made up of unpublished documents from three text types characterized by their communicative immediacy: inventories of goods, witnesses’ testimonies in criminal trials, and surgeons’ reports on the state of an injured or dead person. In this work, we detail the design process and methodology employed in creating this corpus: from digital edition in TEI-XML to the application of natural language processing tools on the TEITOK platform. We also explain, providing several examples, the possibilities for exploiting this digital resource via its query interface.	es_ES
dc.language.iso	spa	es_ES
dc.publisher	Revista de Humanidades Digitales	es_ES
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 Internacional	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject	corpus histórico	es_ES
dc.subject	historical corpus	es_ES
dc.subject	Edad Moderna	es_ES
dc.subject	Early Modern	es_ES
dc.subject	edición digital	es_ES
dc.subject	digital edition	es_ES
dc.subject	humanidades digitales	es_ES
dc.subject	digital humanities	es_ES
dc.subject	TEI-XML	es_ES
dc.title	Diseño y explotación de un corpus histórico de textos oralizantes para el estudio del español clásico y moderno	es_ES
dc.type	journal article	es_ES
dc.rights.accessRights	open access	es_ES
dc.identifier.doi	https://doi.org/10.5944/rhd.vol.9.2024.39834
dc.type.hasVersion	VoR	es_ES

Fichier(s) constituant ce document

Nom:: vaamonde2024b.pdf
Taille:: 2.837Mo
Format:: PDF

Ce document figure dans la(les) collection(s) suivante(s)

DLE - Artículos

Afficher la notice abrégée

Excepté là où spécifié autrement, la license de ce document est décrite en tant que Attribution-NonCommercial-NoDerivatives 4.0 Internacional