CesCa: El Català Escolar Escrit a Catalunya
La finalitat del projecte CesCa ha estat proporcionar a la comunitat educativa una eina fonamental per conèixer els usos lingüístics del seu alumnat: un corpus de referència del català escrit escolar a Catalunya amb les dades derivades que s’obtindran a partir del seu processament.
Podeu obtenir més informació a Llauradó, A. M. A. Martí i L. Tolchinsky (2012). "Corpus CesCa: Compiling a corpus of written Catalan produced by school children". International Journal of Corpus Linguistics [en premsa].
El corpus CesCa
S'han recollit i processat els textos produïts per 2.426 nens i nenes, alumnes de l'últim curs d'educació infantil (P5) fins a l'últim curs d'educació obligatòria (4t d'ESO) de 31 centres educatius de diferents comarques de Catalunya.
El corpus conté:
- lèxic produït corresponent a cinc camps semàntics: noms d’aliments, peces de roba, fenòmens de la natura, activitats de lleure i trets de personalitat;
- textos de quatre tipus diferents: definicions, narració d’una pel·lícula, recomanació argumentativa i explicació d’un acudit.
En l’apartat corresponent al lèxic trobareu informació organitzada sobre:
- freqüència d'ús de paraules: formes i lemes;
- relacions entre formes i lemes;
- distribució de lemes per nivell escolar; temps que fa que els informants parlen català i llengua materna.
En l’apartat corresponent a textos podeu:
- accedir als textos produïts seleccionant-los per edat dels participants, pel tipus de text o combinant ambdues variables;
- consultar el text tal i com el va escriure el participant i a una altra versió en què s’han corregit els errors de separació de paraules;
- accedir a les definicions bé seleccionant l’edat dels participants i el tipus de text, bé seleccionant una de les paraules definides;
- accedir als textos de qualsevol tipus que contenen una determinada paraula o un determinat lema;
- seleccionar les definicions corresponents a una determinada paraula en el seu conjunt o per una franja d’edat.