El Instituto Cervantes y la Universidad de Santiago presentan el Corpus de Aprendices de Español (CAES)

13 de febrero de 2015

  • Será una herramienta de gran utilidad para los profesionales de la enseñanza del español como segunda lengua

El Instituto Cervantes ha elaborado, en colaboración con la Universidad de Santiago de Compostela, un Corpus de aprendices de español como lengua extranjera (CAES) que será una herramienta de gran utilidad y de acceso libre para todos los profesionales de la enseñanza del Español como Lengua Extranjera (ELE), lo que contribuirá a mejorar la promoción y aprendizaje del español correcto en todo el mundo. 

Profesores, investigadores, evaluadores, autores de materiales didácticos y responsables de entidades lingüísticas, entre otros profesionales, encontrarán en el CAES información práctica sobre las dificultades que encuentran los estudiantes de español, los errores más comunes, el vocabulario que emplean en mayor o menor medida, etc. 

Toda esta información, obtenida a partir de datos sólidos y objetivos, facilitará el trabajo de los profesionales en las aulas, la investigación, la elaboración de textos u otros cometidos relacionados con la enseñanza del español para extranjeros. 

Un corpus es un conjunto de textos en formato electrónico que han sido reunidos en una aplicación informática para facilitar el estudio de la lengua o variedad lingüística de la que esos textos han sido extraídos. Un 'corpus de aprendices' –como este- contiene textos producidos por personas que están aprendiendo otra lengua, en este caso, el español. 

Desde octubre de 2011 hasta septiembre de 2013, el Instituto Cervantes llevó a cabo la recogida sistemática de muestras de lengua entre estudiantes de español en un total de 28 centros de la institución por todo el mundo, así como en cinco universidades de España (las de Alcalá, León, Salamanca, Santiago de Compostela y Vigo), de Estados Unidos (Universidad de Washington, Seattle) y de Portugal (Universidade do Minho). 

Los estudiantes procedían de seis lenguas de origen diferentes -árabe, chino mandarín, francés, inglés, portugués y ruso- y contaban con distintos grados de dominio lingüístico (niveles A1 a C1 del Marco común europeo de referencia). Los datos han sido recogidos, compilados y tratados con una herramienta informática creada para esta iniciativa. 

El Corpus contiene muestras producidas por 1.423 estudiantes, que escribieron dos o tres textos cada uno, lo cual arroja un total de 3.878 tareas integradas. 

Comprende casi 575.000 elementos lingüísticos, con una distribución que atiende a todos los niveles de español adquiridos y las seis lenguas iniciales (L1) incluidas en esta fase del proyecto. 

La información ya puede consultarse a través de una aplicación de fácil manejo que permite seleccionar los datos según los parámetros utilizados en la configuración del corpus: nivel adquirido de conocimiento de español, lengua familiar, país de residencia, edad y sexo. Las consultas pueden ser simples o combinadas con distintas variables. 

El proyecto, promovido y financiado por el Instituto Cervantes, ha sido diseñado y desarrollado íntegramente por un equipo de investigación de la Universidad de Santiago de Compostela bajo la dirección técnica de los profesores Guillermo Rojo e Ignacio Palacios. 

El CAES viene a cubrir un vacío importante en el área de corpus de aprendices de lenguas, en la línea de proyectos similares como el ICLE (International Corpus of Learner English) de la Universidad de Lovaina (Bélgica).


INFORMACIÓN
  • Editor:
  • Categoría:
  • Fecha:
  • Sede:
  • Type: notas prensa