Vés al contingut

CesCa

CesCa: El Català Escolar Escrit a Catalunya

La finalitat del projecte CesCa ha estat proporcionar a la comunitat educativa una eina fonamental per conèixer els usos lingüístics del seu alumnat: un corpus de referència del català escrit escolar a Catalunya amb les dades derivades que s’obtindran a partir del seu processament.

Podeu obtenir més informació a Llauradó, A. M. A. Martí i L. Tolchinsky (2012). "Corpus CesCa: Compiling a corpus of written Catalan produced by school children". International Journal of Corpus Linguistics [en premsa].

El corpus CesCa

S'han recollit i processat  els textos produïts per 2.426 nens i nenes, alumnes de l'últim curs d'educació infantil (P5) fins a l'últim curs d'educació obligatòria (4t d'ESO) de 31 centres educatius de diferents comarques de Catalunya.

El corpus conté:

  • lèxic produït corresponent a cinc camps semàntics: noms d’aliments, peces de roba, fenòmens de la natura, activitats de lleure i trets de personalitat;
  • textos de quatre tipus diferents: definicions, narració d’una pel·lícula, recomanació argumentativa i explicació d’un acudit.

En l’apartat corresponent al lèxic trobareu informació organitzada sobre:

  • freqüència d'ús de paraules: formes i lemes;
  • relacions entre formes i lemes;
  • distribució de lemes per  nivell escolar; temps que fa que els informants parlen català i llengua materna.

En l’apartat corresponent a textos podeu:

  • accedir als textos produïts seleccionant-los per edat dels participants, pel tipus de text o combinant ambdues variables;
  • consultar el text tal i com el va escriure el participant i a una altra versió en què s’han corregit els errors de separació de paraules;
  • accedir a les definicions bé seleccionant l’edat dels participants i el tipus de text, bé seleccionant una de les paraules definides;
  • accedir als textos de qualsevol tipus que contenen una determinada paraula o un determinat lema;
  • seleccionar les definicions corresponents a una determinada paraula en el seu conjunt o per una franja d’edat.
agaur
logotextmess