Designing, compiling and interrogating corpora in L2 Spanish acquisition research

Lozano Pozo, Cristóbal Jesús; Fernández-Mira, Paloma

doi:10.1080/23247797.2022.2157086

Lozano and Fernández-Mira (2022) Lozano and Fernández-Mira_final_2.pdf (3.978Mb)

Identificadores

URI: https://hdl.handle.net/10481/97772

DOI: 10.1080/23247797.2022.2157086

Exportar

Editorial

Taylor and Francis

Materia

second language acquisition

learner corpora

Spanish second language acquisition

CEDEL2 corpus

COWS-L2H corpus

adquisición de segundas lenguas

español lengua extranjera (ELE)

Fecha

2022

Referencia bibliográfica

Published version: Lozano, C., & Fernández-Mira, P. (2022). Designing, compiling and interrogating corpora in L2 Spanish acquisition research. Journal of Spanish Language Teaching, 9(2), 190-206. https://doi.org/10.1080/23247797.2022.2157086

Patrocinador

Proyecto PID2020-113818GB-I00 financiado por MCIN (Ministerio de Ciencia e Innovación) / AEI (Agencia Estatal de Investigación), DOI: https://doi.org/10.13039/501100011033; MCIN / AEI PID2020-113818GB-I00

Resumen

Despite the burgeoning field of Spanish second language acquisition (SLA) research, large Spanish learner corpora (LC) are not common practice yet. We present a general yet practical introduction to the multiple decisions Spanish as a second language (L2) researchers should consider before creating their own LC. We focus on (i) two freely available Spanish LC (CEDEL2 and COWS-L2H), (ii) their general design principles, (iii) crucial variables to collect (learner and task variables), (iv) ways of collecting and compiling LC data, and (v) the final product (the corpus interface). We explore different ways of interrogating the two corpora, illustrating them with specific (morpho)syntactic and lexical examples from L2 Spanish, as well as potential curricular and teaching applications of LC. We conclude with a recommendation for the triangulation of LC data with experimental research and a summary of future directions that the field of LC research may take. Our ultimate aim is to equip researchers with the basic theoretical and methodological tools to build and collect their own, well-designed LC.

A pesar del reciente auge del campo de la investigación de la adquisición de español como segunda lengua (L2), el uso de corpus de aprendices (CA) sigue sin ser una práctica habitual. En este capítulo presentamos, de manera general a la vez que práctica, las múltiples decisiones a las que se enfrentan los investigadores de español L2 a la hora de crear su propio corpus. Nos centramos en (i) dos CA de español de acceso gratuito (CEDEL2 and COWS-L2H), (ii) sus principios de diseño, (iii) las variables relativas a los aprendices y a las tareas, (iv) maneras de recoger y compilar los datos y (v) el producto final (interfaces de búsqueda). Exploramos diferentes maneras de interrogar los corpus, ilustrándolas con ejemplos lingüísticos, y describimos posibles usos de esos datos tanto en la investigación como en la enseñanza. Concluimos con una recomendación de triangular datos de CA y experimentos y un resumen de los próximos pasos en el campo de la investigación de CA. Nuestra finalidad es equipar a los investigadores con herramientas básicas para compilar exitosamente su propio CA.

Colecciones

DFIA - Artículos

Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional