Designing, compiling and interrogating corpora in L2 Spanish acquisition research
Metadatos
Mostrar el registro completo del ítemEditorial
Taylor and Francis
Materia
second language acquisition learner corpora Spanish second language acquisition CEDEL2 corpus COWS-L2H corpus adquisición de segundas lenguas español lengua extranjera (ELE)
Fecha
2022Referencia bibliográfica
Published version: Lozano, C., & Fernández-Mira, P. (2022). Designing, compiling and interrogating corpora in L2 Spanish acquisition research. Journal of Spanish Language Teaching, 9(2), 190-206. https://doi.org/10.1080/23247797.2022.2157086
Patrocinador
Proyecto PID2020-113818GB-I00 financiado por MCIN (Ministerio de Ciencia e Innovación) / AEI (Agencia Estatal de Investigación), DOI: https://doi.org/10.13039/501100011033; MCIN / AEI PID2020-113818GB-I00Resumen
Despite the burgeoning field of Spanish second language acquisition (SLA) research, large Spanish learner corpora (LC) are not common practice yet. We present a general yet practical introduction to the multiple decisions Spanish as a second language (L2) researchers should consider before creating their own LC. We focus on (i) two freely available Spanish LC (CEDEL2 and COWS-L2H), (ii) their general design principles, (iii) crucial variables to collect (learner and task variables), (iv) ways of collecting and compiling LC data, and (v) the final product (the corpus interface). We explore different ways of interrogating the two corpora, illustrating them with specific (morpho)syntactic and lexical examples from L2 Spanish, as well as potential curricular and teaching applications of LC. We conclude with a recommendation for the triangulation of LC data with experimental research and a summary of future directions that the field of LC research may take. Our ultimate aim is to equip researchers with the basic theoretical and methodological tools to build and collect their own, well-designed LC. A pesar del reciente auge del campo de la investigación de la adquisición de español como segunda lengua (L2), el uso de corpus de aprendices (CA) sigue sin ser una práctica habitual. En este capítulo presentamos, de manera general a la vez que práctica, las múltiples decisiones a las que se enfrentan los investigadores de español L2 a la hora de crear su propio corpus. Nos centramos en (i) dos CA de español de acceso gratuito (CEDEL2 and COWS-L2H), (ii) sus principios de diseño, (iii) las variables relativas a los aprendices y a las tareas, (iv) maneras de recoger y compilar los datos y (v) el producto final (interfaces de búsqueda). Exploramos diferentes maneras de interrogar los corpus, ilustrándolas con ejemplos lingüísticos, y describimos posibles usos de esos datos tanto en la investigación como en la enseñanza. Concluimos con una recomendación de triangular datos de CA y experimentos y un resumen de los próximos pasos en el campo de la investigación de CA. Nuestra finalidad es equipar a los investigadores con herramientas básicas para compilar exitosamente su propio CA.