Publications

2010

Outahajala, M.; Zenkouar, L.; Rosso, P.; Martí, M.A. (2010) 'Tagging Amazigh with AncoraPipe', Workshop on Semitic Languages, 7th International Conference on Language Resources and Evaluation (LREC-2010), pp. 52-56, Valleta, Malta.

Peris, A.; Taulé M.; Boleda, G.; Rodríguez, H. (2010) 'ADN-Classifier: Automatically assigning denotation types to nominalizations'. Proceedings of the 7th International Conference on Language Resources and Evaluation (LREC-2010), pp. 1422-1428, Valleta, Malta.

Recasens, M., Hovy, E. (2010). 'Coreference Resolution across Corpora: Languages, Coding Schemes, and Preprocessing Information'. Proceedings of ACL 2010, Uppsala, Sweden. 

Recasens, M.; Vila, M. (2010). 'On Paraphrase and Coreference'. To appear in Computational Linguistics.

Recasens, M.,  Màrquez, Ll., Sapena, E., Martí, M.A., Taulé, M., Hoste, V., Poesio M., Versley, Y. (2010). SemEval-2010 Task 1: Coreference Resolution in Multiple Languages. To appear in Proceedings of SemEval-2010, ACL 2010, Uppsala, Suècia. 

Recasens, M., Hovy, E., Martí, M.A. (2010) 'A Typology of Near-Identity Relations for Coreference (NIDENT).Proceedings of the 7th International Conference on Language Resources and Evaluation (LREC-2010), pp. 149-156, Valletta, Malta. 

Recasens, M., Martí, M.A. (2010) AnCora-CO: Coreferentially annotated corpora for Spanish and Catalan. Language Resources and Evaluation, Springer Science.

2009

Haji?c, J., Ciaramita, M., Johansson, R., Kawahara, D., Martí, M.A., Màrquez,Ll., Meyers, A., Nivre, J.,  Padó, S., Stepánek, J., Stra?nák, P., Surdeanu, M., Xue, N., Zhang, Y. (2009) 'The CoNLL-2009 Shared Task: Syntactic and Semantic Dependencies in Multiple Languages'.Proceedings of the Thirteenth Conference on Computational Natural Language Learning (CoNLL 2009).Boulder, Colorado, USA.

Peris, A., Taulé, M., Rodríguez, H. (2009) 'Hacia un sistema de clasificación automática de sustantivos deverbales'. Procesamiento del Lenguaje Natural, 43. pp. 23-31. San Sebastian (Spain).

Peris, A., M.Taulé (2009) 'Evaluación de los criterios lingüísticos para la distinción evento y resultado en los sustantivos deverbales'. Proceedings of the 1st International Conference on Corpus Linguistics(CILC-09), Murcia, Spain.

Recasens, M., Hovy, E. (2009) A Deeper Look into Features for Coreference Resolution. S. Lalitha Devi, A. Branco, and R. Mitkov (eds.), Anaphora Processing and Applications (DAARC 2009), LNAI 5847:29-42. Springer-Verlag Berlin Heidelberg. 

Recasens, M. (2009) A Chain-starting Classifier of Definite NPs in Spanish.Proceedings of the EACL 2009 Student Research Workshop, 46-53. Athens.

Recasens, M., M.A. Martí, M. Taulé (2009) 'First-mention Definites: More than Exceptional Cases', in S. Featherson and S. Winkler (eds), The Fruits of Empirical Linguistics. Berlin: de Gruyter.

Recasens, M., M.A. Martí, M. Taulé, Ll. Màrquez, E. Sapena (2009) SemEval-2010 Task 1: Coreference Resolution in Multiple Languages. Workshop on Semantic Evaluations: Recent Achievements and Future Directions (SEW 2009). NAACL 2009, Boulder, Colorado, USA.

2008

Aldezabal I., Aranzabe M.J., Diaz de Ilarraza A., Fernández K.  (2008) From Dependencies to Constituents in the Reference Corpus for the processing of Basque, SEPLN 2008, Madril

Aparicio, J., M. Taulé, M.A. Martí (2008) 'AnCora-Verb: Two large-scale lexicons for Catalan and Spanish'. Bernal, E. Decesaris, J. (eds.) Proceedings of the XIII Euralex International Congress 2008. Institut Universitari de Lingüística Aplicada, UPF: Barcelona (Spain).

Aparicio, J., M. Taulé, M.A. Martí (2008) 'AnCora-Verb: A Lexical Resource for the Semantic Annotation of Corpora'. Proceedings of 6th International Conference on Language Resources and Evaluation. Marrakesh (Morocco).

Bertran, M., O. Borrega, M. Recasens, B. Soriano. 'AnCoraPipe: A tool for multilevel annotation'. Procesamiento del Lenguaje Natural, 41. Madrid (Spain).

Martí, M. A., M.Taulé, L. Màrquez, M. Bertran. (2008). 'ANCora: A Multilingual and Multilevel Annotated Corpus'. (Pending to be published).

Morante, R. (2008) 'Semantic role labeling tools trained on the Cast3LB-CoNLL-SemRol corpus'.Proceedings of the Sixth International Language Resources and Evaluation (LREC'08). Marrakech, Morocco, 2008.

Morante, R. (2008) 'Etiquetat automàtic de rols semàntics amb un sistema basat en memòria'. Digithum, vol. 10.

Morante, R. (2008) 'Experiments with an ensemble of Spanish dependency parsers'. Procesamiento del Lenguaje Natural, vol. 40, pp. 59-66. Alicante (Spain).

Peris, A. (2008) La capacidad argumental de los sustantivos resultativos. Projecte de recerca. Universitat de Barcelona, Barcelona.

Recasens, M. (2008) Towards Coreference Resolution for Catalan and Spanish. Master Thesis. Universitat de Barcelona, Barcelona.

Surdeanu, M., R. Morante, Ll. Màrquez (2008). 'Analysis of Joint Inference Strategies for the Semantic Role Labeling of Spanish and Catalan', Computational Linguistics and Intelligent Text Processing 9th International Conference (CICLing-2008), pp. 206-218 Haifa, Israel.

Taulé, M., M.A. Martí, M. Recasens (2008) 'Ancora: Multilevel Annotated Corpora for Catalan and Spanish', Proceedings of 6th International Conference on Language Resources and Evaluation. Marrakesh (Morocco).

2007

Aldezabal I., Ceberio K., Esparza I., Estarrona A., Etxeberria J., Iruskieta M., Izagirre E., Uria L. (2007) EPEC (Euskararen Prozesamendurako Erreferentzia Corpusa) segmentazio-mailan etiketatzeko eskuliburuaUPV/EHU / LSI / TR 11-2007

Aparicio, J. (2007) Clasificación semántica de los predicados en español.Tesis de Master (programa Ciencia Cognitiva y Lenguaje), Universitat de Barcelona, septiembre de 2007.

Borrega, O., M. A. Martí, M. Taulé (2007) 'What do we mean when we talk about Named Entities?', Corpus Linguistics, Birmingham (UK).

Màrquez, Ll. L. Villarejo, M. A. Martí and M. Taulé (2007) 'SemEval-2007 Task 09: Multilevel Semantic Annotation of Catalan and Spanish', Proceedings of the 4th International Workshop on Semantic Evaluations (SemEval-2007), pages 42–47, Prague. Association for Computational Linguistics, ACL.

Martí, M.A., M. Taulé, Ll. Màrquez, M. Bertran (2007)'Anotación semiautomática con Papeles Temáticos de los corpus CESS-ECE'. Procesamiento del Lenguaje Natural-TIMM, Alicante (Spain).

Martí, M. A., M. Taulé (2007) 'CESS-ECE. Corpus anotados del español y catalán'. Arena Romanística, núm. 1. Monografía dedicada a Corpus and text linguistics in Romance languages. Bergen (Noruega).

Morante, R., B. Busser (2007) 'ILK2: Semantic Role Labelling for Catalan and Spanish using TiMBL', Proceedings of the 4th International Workshop on Semantic Evaluations (SemEval-2007), pp. 183-186, Prague, Czec Republic. Association for Computational Linguistics, ACL.

Morante, R., A. van den Bosch (2007) 'Memory-based semantic role labeling'. Proceedings of the International Conference Recent Advances in Natural Language Processing, pp. 388-394, Borovets, Bulgary.

Morante, R., B. Busser (2007) 'Semantic role labeling based on TiMBL'. Notes of the Workshop on Machine Learning for Natural Language Processing, pp. 21-22 Amsterdam, The Netherlands.

Recasens, M., M. Antònia Martí Mariona Taulé (2007) 'Text as Scene: Discourse Deixis and Bridging Relations'. Procesamiento del Lenguaje Natural, n. 39, Sevilla (Spain).

Recasens, M., M. A. Martí, M. Taulé (2007) 'Where Anaphora and Coreference Meet. Annotation in the CESS-ECE Corpus'. Recent Advances in Natural language Processing. Borovets (Bulgaria).

2006

Aduriz I., Aranzabe M., Arriola J., Atutxa A., Díaz de Ilarraza A., Ezeiza N., Gojenola K., Oronoz M., Soroa A., Urizar R. (2006) Methodology and steps towards the construction of EPEC, a corpus of written Basque tagged at morphological and syntactic levels for the automatic processing
Corpus Linguistics Around the World. Book series: Language and Computers. Vol 56 (pag 1- 15). ISBN 90-420-1836-4 Ed. Andrew Wilson, Paul Rayson, and Dawn Archer. Rodopi. Netherlands

Civit, M., M.A. Martí, N. Bufí (2006) 'Cat3LB and Cast3LB: from Constituents to dependencies'. Advances in Natural Language Processing (LNAI, 4139), pp. 141-153. Springer Verlag, Berlin. ISSN: 0302-9743.

Martí, M.A., M. Taulé, M. Arévalo (2006) 'MICE: un mòdul per al reconeixement i classificació d'entitats amb nom', a V. Salvador i L. Climent (eds). El discurs prefabricat II, Edicions Universitat Jaume I.(Spain).

Taulé, M.; Castellví, J.; Martí, M.A., Aparicio, J. (2006) 'Fundamentos teóricos y metodológicos para el etiquetado semántico de CESS-CAT y CESS-ESP', Procesamiento del Lenguaje Natural SEPLN 37, Zaragoza, ISSN: 1135-5948. pp. 75-82.

Taulé, M., Martí M.A., Castellví, J. (2006) ‘Semantic Classes in CESS-LEX: Semantic Annotation of CESS-ECE’, in J. Hajic and J. Nivre (eds.) Treebanks and Linguistic Theories, Praga. ISBN: 80-239-8009-2. pp. 139- 150.

2005

Civit, M. y M.A. Martí (2005) 'Building Cast3LB: A Spanish Treebank'. Research on Language and Computation , Springer Verlag, Vol: 2 Núm.: 4 pp. 549-574. Berlin, ISSN: 1570-7075 Dipòsit legal: 10.1007/s11168.

Civit, M. y M.A. Martí (2005) 'GramCat and Gramesp: two grammars for chunking'. Intelligent Information Processing and Web Mining, Springer-Verlag. pp. 159-169 Berlin, ISBN: 103-540-25056-5.

Civit M., M.A. Martí, R. Morante, B. Navarro, M. Taulé y I. Aldezabal (2005) 'Defining a framework for the analysis of predicates'. Verb Workshop 2005, Saarland University.

Civit, M. I. Aldezábal, E. Pociello, M. Taulé, J. Aparicio, L. Márquez, B. Navarro, J. Castellví y M.A. Martí (2005) '3LBLEX: léxico verbal con frames sintáctico-semànticos'. Procesamiento del Lenguaje Natural, pp. 367-374. ISSN: 1135-5948.

Civit, M., J. Castellví, R. Morante, A. Olivé y J. Aparicio (2005) '4LEX: A Multilingual Lexical Resource'. Cross-Language Knowledge Induction, Ed. A. I. Cuza (University Publishing House Iasi, Romania). pp. 39-45. Iasi (Rumania) ISBN: 973-703-139-9

Taulé, M., J. Aparicio, J. Castellví y M.A. Martí (2005) 'Mapping syntactic functions into semantic roles'. Treebanks and Linguistic Theories,pp. 185-196. Publicacions de la Universitat de Barcelona. Barcelona.

Valverde, M.P., P. Santalla del Río y M. Civit (2005) 'Constituent order in Spanish'. Treebanks and Linguistic Theories. Publicacions de la Universitat de Barcelona. Barcelona.

2004

Civit, M., N. Bufí y M.P. Valverde (2004) 'Building Cat3LB: a Treebank for Catalan'. Proceedings of the SALTMIL Workshop, LREC 2004 (First Steps for Language Documentation of Minority Languages: Computational Linguistic Tools for Morphology, Lexicon and Corpus Compilation) pp. 48-51. Lisboa.

Civit, M., N. Bufí, y M.P. Valverde (2004) 'CAT3LB: a Treebank for Catalan with Word Sense Annotation'. Proceedings of the 3th Treebanks and Linguistic Theories, Tuebingen, Germany.

Civit, M., N. Bufí y M.P. Valverde (2004) 'Guia per a l'anotació de les funcions sintàctiques de CAT3LB: un corpus del català amb anotació sintàctica, semàntica i pragmàtica'. Report Intern.

Palomar, M., M. Civit, A. Díaz, L. Moreno, E. Bisbal, M. Aranzabe, A. Ageno, M.A. Martí y B. Navarro (2004) '3LB: Construcción de una base de datos de árboles sintáctico-semánticos para el catalán, euskera y español'. Procesamiento del Lenguaje Natural (SEPLN), número 33, pp. 81-88. Barcelona, Julio de 2004. ISSN 1135-5948

Taulé, M., M. García, N. Artigas y M.A. Martí (2004) 'Evaluating Lexical Resources for WSD'. Euralex Proceedings, Francia.

2003

Aduriz, I. et al. (2003)'3LB:Construcción de una base de datos de árboles sintáctico-semánticos'. Procesamiento del Lenguaje Natural, n. 31, pp. 297-8, Septiembre 2003, Alcalá de Henares, ISSN 1135-5948.

Aduriz I., Aranzabe M., Arriola J., Atutxa A., Díaz de Ilarraza A., Garmendia A., Oronoz M. (2003) Construction of a Basque Dependency Treebank TLT 2003. Second Workshop on Treebanks and Linguistic Theories, J. Nivre and E. Hinrichs eds., pages 201-204, ISSN: 1651-0267, ISBN: 91-7636-394-5, Vaxjo, Sweden, November 14-15.

Aranzabe M., Arriola J., Atutxa A., Balza I., Uria L. Guía para la anotación sintáctica manual de Eus3LB (corpus del euskera anotado a nivel sintáctico, semántico y pragmático) UPV/EHU/LSI/TR 13-2003

Aduriz I., Aldezabal I., Aranzabe M., Arrieta B., Arriola J., Atutxa A., Díaz de Ilarraza A., Gojenola K., Maritxalar M., Oronoz M., Sarasola K. Corpusaren etiketatze sintaktikoa analizatzailea eraikitzeko UPV/EHU/LSI/TR 1-2003

Civit, M., A. Ageno, B. Navarro, N. Bufí, y M.A. Martí (2003) 'Qualitative and Quantitative Analysis of Annotators' Agreement in the Development of Cast3LB'. 2nd Workshop on Treebanks and Linguistic Theories (TLT03), Växjö, Sweden. ISSN 1651-0267 ISBN 91-7636-394-5.

Civit, M., A. Ageno, B. Navarro, N. Bufí, y M.A. Martí (2003) 'Análisis cualitativo y cuantitativo del acuerdo entre anotadores en el desarrollo de corpus interpretados lingüísticamente'. Procesamiento del Lenguaje Natural, n. 31, pp. 201-8, Septiembre 2002, Alcalá de Henares, ISSN 1135-5948.

Civit, M., M.A. Martí, B. Navarro, N. Bufí, B. Fernández y R. Marcos (2003) 'Issues in the Syntactic Annotation of Cast3LB'. 4th International Workshop on Linguistically Interpreted Corpora .

Navarro, B., M. Civit, M.A. Martí, R. Marcos y B. Fernández (2003) 'Syntactic, semantic and pragmatic annotation in Cast3LB'. Shallow Processing of Large Corpora (SProLaC) Workshop of Corpus Linguistics 2003, Lancaster, UK, ISBN 1-86220-131-5.