Gran Via de les Corts Catalanes, 585  
Edifici Josep Carner, 5è pis  
08007 Barcelona  

AnCora

AnCora és un corpus del català i de l’espanyol amb diferents nivells d’anotació:

  • categoria morfològica
  • constituents i funcions sintàctiques
  • estructura argumental i papers temàtics
  • classe semàntica verbal
  • sentits de Wordnet nominals
  • entitats nombrades
  • coreferència

Com a resultat del procés d’anotació es disposa també de dos lèxics verbals
de 2.580 entrades per a l’espanyol i 2.142 entrades per al català amb
informació sobre la classe semàntica del verb i la subcategorització
sintàctica, l’estructura argumental i els papers temàtics per a  cada
un dels seus sentits.

El corpus de cada llengua conté 500.000 paraules.

El corpus AnCora està constituït majoritàriament per textos periodístics.

Accés al corpus AnCora.