CESS-ECE (HUM2004-21127) és un projecte l’objectiu del qual ha estat la creació de tres corpus, un per l'espanyol (CESS-ESP), un pel català (CESS-CAT) i un per l'euskera (CESS-EUS), de 500.000 paraules els dos primers i de 350.000 l'últim, etiquetats sintàcticament (amb constituents i funcions els corpus CESS-ESP i CESS-CAT i amb dependències el corpus CESS-EUS) i semàntica, amb els synsets nominals de WordNet.
S’han utilitzat dues eines d'etiquetatge: l’AGTK (Universitat de Pennsylvania) que s’ha adaptat a les necessitats concretes d'anotació sintàctica dels corpus CESS-ECE i 3LB-SAT, una eina específica per a l’anotació semàntica amb sentits de WordNet.
Com a resultat del projete es disposa de la guia d’anotació sintàctica utilitzada per al català i l’espanyol.
Els corpus CESS-ECE són de lliure disposició. Cliqueu aquí per a obtenir-los.
Han participat en l’anotació dels corpus CESS-ECE:
Núria Bufí Cabrol
Montserrat Civit Torruella
Raquel Hernández Bitinas
Marina Lloberes Salvatella
Raquel Marcos
Borja Navarro
Bàrbara Soriano Bautista