CesCa:El Català Escolar Escrit a Catalunya
La finalidad del proyecto CesCa ha sido proporcionar a la comunidad educativa una herramienta fundamental para conocer los usos lingüísticos de su alumnado: un corpus de referencia del catalán escrito escolar en Cataluña con los datos derivados que se obtendrán a partir de su procesamiento.
Pudeden obtener más información en Llauradó, A. M. A. Martí y L. Tolchinsky (2012). "Corpus CesCa: Compiling a corpus of written Catalan produced by school children". International Journal of Corpus Linguistics [en prensa].
El corpus CesCa
Se han recogido y procesado los textos producidos por 2.426 niños y niñas, alumno del último curso de educación infantil (P5) hasta el último curso de educación obligatoria (4º de ESO) de 31 centros educativos de diferentes comarcas de Cataluña.
El corpus contiene:
- léxico producido correspondiente a cinco campos semánticos: nombres de alimentos, piezas de ropa, fenómenos de la naturaleza, actividades de ocio y rasgos de personalidad;
- textos de cuatro tipos diferentes: definiciones, narración de una película, recomendación argumentativa y explicación de un chiste.
En el apartado correspondiente al léxico encontrarán información organizada sobre:
- frecuencia de uso de palabras: formas y lemas;
- relaciones entre formas y lemas;
- distribución de lemas por nivel escolar; tiempo que hace que los informantes hablan catalán y lengua materna.
En el apartado correspondiente a textos podrán:
- acceder a los textos producidos seleccionándolos por edad de los participantes, por el tipo de texto o combinando ambas variables;
- consultar el texto tal y como lo escribió el participante y otra versión en que se han corregido los errores de separación de palabras;
- acceder a las definiciones bien seleccionando la edad de los participantes y el tipo de texto, bien seleccionando una de las palabras definidas;
- acceder a los textos de cualquier tipo que contienen una determinada palabra o un determinado lema;
- seleccionar las definiciones correspondientes a una determinada palabra en su conjunto o por una franja de edad.