Marta Recasens
Research Scientist, Google Inc.
recasens <preposició locativa> google <punt> com
1600 Amphitheatre Pkwy
Mountain View, CA 94043
USA
Publicacions | Xerrades convidades | Comitès | Projectes I+D | Beques i premis | Formació | Idiomes | Coneixements informàtics | Materials |
|
Vaig arribar en aquest món amb els ulls ben oberts, la qual cosa era tal vegada un senyal d’allò que més tard seria la meva fascinació i curiositat constants pels secrets d’aquesta vida. La meva recerca se centra principalment en les aproximacions basades en corpus a la semàntica i la pragmàtica i, en concret, la integració del coneixement semàntic i del món. Valoro especialment els treballs interdisciplinaris entre la lingüística, la informàtica, la ciència cognitiva, l’estadística, la filosofia... El problema que em té fascinada des que vaig entrar al món de la lingüística computacional és la resolució de la coreferència, que segueix sent un dels grans reptes d'aquest camp. Des del 2013 sóc investigadora a Google. Anteriorment, vaig ser investigadora postdoctoral al Departament de Lingüística de la Universitat de Stanford i membre del grup de recerca Stanford NLP. Allà vaig treballar amb el Dr. Dan Jurafsky. Vaig obtenir el títol de doctora l'any 2010 a la Universitat de Barcelona, on era membre del grup de recerca CLiC, amb la tesi titulada Coreferència: Teoria, anotació, resolució i avaluació. Els meus directors van ser la Dra. M. Antònia Martí (UB) i el Dr. Eduard Hovy (USC). |
Publicacions
2017
Ingrid L. Falkum, Marta Recasens i Eve Clark. 2017. "The moustache sits down first": on the acquisition of metonymy. Journal of Child Language, 44(1):87-119. Disponible a CJO 2016 DOI:10.1017/S0305000915000720.
2016
Marta Recasens i Sameer Pradhan. 2016. Evaluation Campaigns. Dins M. Poesio, R. Stuckardt i Y. Versley (eds.), Anaphora Resolution: Algorithms, Resources, and Applications, pp. 165-208. Springer-Verlag Berlin Heidelberg.
Massimo Poesio, Sameer Pradhan, Marta Recasens, Kepa Rodríguez i Yannick Versley. 2016. Annotated Corpora and Annotation Tools. Dins M. Poesio, R. Stuckardt i Y. Versley (eds.), Anaphora Resolution: Algorithms, Resources, and Applications, pp. 97-140. Springer-Verlag Berlin Heidelberg.
Marta Recasens, Zhichao Hu i Olivia Rhinehart. 2016. Sense Anaphoric Pronouns: Am I One?. Dins Proceedings of CORBON 2016, pp. 1-6.
2015
Sujay Kumar Jauhar, Raul Guerra, Edgar Gonzàlez i Marta Recasens. 2015. Resolving Discourse-Deictic Pronouns: A Two-Stage Approach to Do It. Dins Proceedings of *SEM 2015, pp. 299-308, Denver, Colorado, USA.
Marie-Catherine de Marneffe, Marta Recasens i Christopher Potts. 2015. Modeling the Lifespan of Discourse Entities with Application to Coreference Resolution. Journal of Artificial Intelligence Research, 52(2015):445-475.
2014
Sameer Pradhan, Xiaoqiang Luo, Marta Recasens, Eduard Hovy, Vincent Ng i Michael Strube. 2014. Scoring Coreference Partitions of Predicted Mentions: A Reference Implementation. Dins Proceedings of ACL 2014, pp. 30-35, Baltimore, MD, USA.
Xiaoqiang Luo, Sameer Pradhan, Marta Recasens i Eduard Hovy. 2014. An Extension of BLANC to System Mentions. Dins Proceedings of ACL 2014, pp. 24-29, Baltimore, MD, USA.
Marta Recasens, Liliana Tolchinsky i M. Antònia Martí. 2014. Coreference is not always either/or: Psycholinguistic evidence for near-identity. Language, Cognition and Neuroscience, 29(7):844-855.
2013
Marta Recasens, Cristian Danescu-Niculescu-Mizil i Dan Jurafsky. 2013. Linguistic Models for Analyzing and Detecting Biased Language. Dins Proceedings of ACL 2013, pp. 1650-1659, Sofia, Bulgària.
Marta Recasens, Marie-Catherine de Marneffe i Christopher Potts. 2013. The Life and Death of Discourse Entities: Identifying Singleton Mentions. Dins Proceedings of NAACL-HLT 2013, pp. 627-633, Atlanta, Georgia. [video] Best Short Paper Award
Marta Recasens, Matthew Can i Dan Jurafsky. 2013. Same Referent, Different Words: Unsupervised Mining of Opaque Coreferent Mentions. Dins Proceedings of NAACL-HLT 2013, pp. 897-906, Atlanta, Georgia. [dades] [video]
2012
Heeyoung Lee, Marta Recasens, Angel Chang, Mihai Surdeanu i Dan Jurafsky. 2012. Joint Entity and Event Coreference Resolution across Documents. Dins Proceedings of EMNLP 2012, pp. 489-500, Jeju, Corea del Sud.
David McClosky, Wanxiang Che, Marta Recasens, Mengqiu Wang, Richard Socher i Christopher D. Manning. 2012. Stanford's System for Parsing the English Web. Dins Notes of the First Workshop on Syntactic Analysis of Non-Canonical Language (SANCL 2012), Mont-real, Canadà.
Marta Recasens, M. Antònia Martí i Constantin Orasan. 2012. Annotating Near-Identity from Coreference Disagreements. Dins Proceedings of LREC 2012, pp. 165-172, Istanbul, Turquia.
M. Antònia Martí, Raquel G. Alhama i Marta Recasens. 2012. Los avances tecnológicos y la ciencia del lenguaje. Dins T. Jiménez Juliá, B. López Meirama, V. Vázquez Rozas i Alexandre Veiga (eds.), Cum corde et in nova grammatica. Estudios ofrecidos a Guillermo Rojo. Santiago de Compostela: Universidade de Santiago de Compostela Publicaciones, pp. 543-553.
Lluís Màrquez, Marta Recasens i Emili Sapena. 2012. Coreference Resolution: An Empirical Study Based on SemEval-2010 Shared Task 1. Language Resources and Evaluation, 47(3):661-694.
2011
Marta Recasens, Eduard Hovy i M. Antònia Martí. 2011. Identity, non-identity, and near-identity: Addressing the complexity of coreference. Lingua, 121(6):1138-1152. Premi J. Manuel Blecua de la Universitat de Barcelona
Marta Recasens i Eduard Hovy. 2011. BLANC: Implementing the Rand Index for coreference evaluation. Natural Language Engineering, 17(4):485-510. © Cambridge University Press 2010
2010
Marta Recasens i Marta Vila. 2010. On Paraphrase and Coreference. Computational Linguistics, 36(4):639-647.
Marta Recasens i Eduard Hovy. 2010. Coreference Resolution across Corpora: Languages, Coding Schemes, and Preprocessing Information. Dins Proceedings of ACL 2010, pp. 1423-1432, Uppsala, Suècia.
Marta Recasens, Lluís Màrquez, Emili Sapena, M. Antònia Martí, Mariona Taulé, Véronique Hoste, Massimo Poesio i Yannick Versley. 2010. SemEval-2010 Task 1: Coreference Resolution in Multiple Languages. Dins Proceedings of the ACL International Workshop on Semantic Evaluation (SemEval-2010), pp. 1-8, Uppsala, Suècia.
Marta Recasens, Eduard Hovy i M. Antònia Martí. 2010. A Typology of Near-Identity Relations for Coreference (NIDENT). Dins Proceedings of LREC 2010, pp. 149-156, Valletta, Malta.
Marta Recasens i M. Antònia Martí. 2010. AnCora-CO: Coreferentially annotated corpora for Spanish and Catalan. Language Resources and Evaluation, 44(4):315-345.
2009
Marta Recasens i Eduard Hovy. 2009. A Deeper Look into Features for Coreference Resolution. Dins S. Lalitha Devi, A. Branco i R. Mitkov (eds.), Anaphora Processing and Applications (DAARC 2009), LNAI 5847:29-42. Springer-Verlag Berlin Heidelberg.
Marta Recasens. 2009. A Chain-starting Classifier of Definite NPs in Spanish. Dins Proceedings of the EACL Student Research Workshop, pp. 46-53, Atenes, Grècia.
Marta Recasens, M. Antònia Martí i Mariona Taulé. 2009. First-mention Definites: More than Exceptional Cases. Dins S. Featherston i S. Winkler (eds.), The Fruits of Empirical Linguistics. Volume 2: Product, pp. 217-237. Berlin: de Gruyter.
Marta Recasens, M. Antònia Martí, Mariona Taulé, Lluís Màrquez i Emili Sapena. 2009. SemEval-2010 Task 1: Coreference Resolution in Multiple Languages. Dins Proceedings of the NAACL HLT Workshop on Semantic Evaluations: Recent Achievements and Future Directions (SEW 2009), pp. 70-75, Boulder, CO, USA.
2008
Manuel Bertran, Oriol Borrega, Marta Recasens i Bàrbara Soriano. 2008. AnCoraPipe: A tool for multilevel annotation. Procesamiento del Lenguaje Natural, 41:291-292. Madrid, Espanya.
Marta Recasens. 2008. Discourse Deixis and Coreference: Evidence from AnCora. Dins Proceedings of the 2nd Workshop on Anaphora Resolution (WAR II). NEALT Proceedings Series Vol. 2:73-82. Tartu, Estònia.
Mariona Taulé, M. Antònia Martí i Marta Recasens. 2008. AnCora: Multilevel Annotated Corpora for Catalan and Spanish. Dins Proceedings of LREC 2008, pp. 96-101, Marràqueix, Marroc.
2007
Marta Recasens, M. Antònia Martí i Mariona Taulé. 2007. Where Anaphora and Coreference Meet. Annotation in the Spanish CESS-ECE Corpus. Dins Proceedings of RANLP 2007, pp. 504-509, Borovets, Bulgària.
Marta Recasens, M. Antònia Martí i Mariona Taulé. 2007. Text as Scene: Discourse Deixis and Bridging Relations. Procesamiento del Lenguaje Natural, 39:205-212. Sevilla, Espanya.
Xerrades convidades
• "The Long Tail of Coreference Resolution"
University of California at Santa Cruz, Califòrnia. Abril 2015.
• "What Real Data Reveals About Coreference"
University of California at Davis, Califòrnia. Abril 2014.
• "Taking Coreference Resolution beyond the 60% Performance Barrier"
Carnegie Mellon University, Pittsburgh, Pensilvània. Abril 2013.
• "Deconstructing Coreference"
University of the Basque Country, San Sebastià. Juny 2011.
University of Wolverhampton, Wolverhampton, UK. Abril 2011.
Universitat Pompeu Fabra, Barcelona. Abril 2011.
Universitat Politècnica de Catalunya, Barcelona. Novembre 2010.
• "Learning-based Coreference Resolution for Spanish and Catalan"
Information Sciences Institute, University of Southern California, Marina del Rey, Califòrnia. Maig 2009.
Comitès
• Chair d'ACL 2015 (Àrea de Discourse, Coreference and Pragmatics), EACL 2012 - Student Research Workshop.
• Membre del Comitè de programa de ACL 2014, 2n Workshop on EVENTS, EMNLP 2014, ACL 2013, 1st Workshop on EVENTS, *SEM 2013, NAACL 2013 - Student Research Workshop, COLING 2012, CoNLL-2012 Shared Task, EACL 2012, CREDISLAS Workshop, IJCNLP 2011, Language Resources and Evaluation Special issue on Computational Semantic Analysis of Language: SemEval-2010, RANLP 2011 - Student Research Workshop, RANLP 2011, DAARC 2011, Beyond Semantics 2011, LAW IV, CBA 2010, DAARC 2009, CBA 2008.
• Revisora de TACL, Revue TAL, ACL 2011, SEPLN 2010, LREC 2010, RANLP 2009.
• Membre del Comitè organitzador de la Task1: Coreference Resolution in Multiple Languages dins de SemEval-2(2010).
• Membre del Comitè organitzador del CBA 2008.
• Membre del Student Board de l'EACL (2009-2011).
Projectes I+D
Títol: La coreferència entesa com un contínuum: Validació interlingüística i marc computacional (2010 PBR 00039)
Entitat finançadora: Generalitat de Catalunya.
Durada: 2011.
Participants: Universitat de Barcelona, University of Wolverhampton.
IP: M. Antònia Martí.
Títol: TEXT-Knowledge 2.0: El modelatge de coneixement davant dels nous reptes de la comunicació digital (TIN2009-13391-C04-04). Subprojecte de TEXT-MESS 2.0
Entitat finançadora: Ministeri de Ciència i Innovació.
Durada: 2010-2012.
Participants: Universitat d'Alacant, Universitat Politècnica de València, Universitat de Barcelona, Universidad de Jaén.
IP: M. Antònia Martí.
Títol: ANCORA-NET: Integració multilingüe de recursos lingüístics semàntics (FFI2009-06497-E/FILO)
Entitat finançadora: Ministeri de Ciència i Innovació.
Durada: 2010.
Participants: Universitat de Barcelona.
IP: Mariona Taulé.
Títol: ANCORA-NOM: Anotació semàntica del SN en els corpus AnCora (FFI2008-02691-E/FILO)
Entitat finançadora: Ministeri de Ciència i Innovació.
Durada: 2009.
Participants: Universitat de Barcelona.
IP: Mariona Taulé.
Títol: Praxem, etiquetatge semàntic i pragmàtic del corpus CESS-ECE (HUM2006-27378-E)
Entitat finançadora: Ministeri d'Educació i Ciència.
Durada: 2007-2008.
Participants: Universitat de Barcelona, Universitat Politècnica de Catalunya, Universidad del País Vasco, Universidad de Alicante.
IP: Mariona Taulé.
Títol: Lang2World: Descobrint el coneixement del món codificat en la llengua (TIN2006-15265-C06-06). Subprojecte de TEXT-MESS.
Entitat finançadora: Ministeri d'Educació i Ciència.
Durada: 2006-2009.
Participants: Universidad de Alicante, Universidad Politécnica de Valencia, Universitat de Barcelona, Universitat Politècnica de Catalunya, Universidad de Jaén, Universidad Nacional de Educación a Distancia.
IP: M. Antònia Martí.
Títol: CESS-ECE: Corpus Etiquetat Sintàctico-Semàntic del Castellà, Català i Euskera (HUM2004-21127-E)
Entitat finançadora: Ministeri d'Educació i Ciència.
Durada: 2005-2007.
Participants: Universitat de Barcelona, Universitat Politècnica de Catalunya, Universidad del País Vasco.
IP: M. Antònia Martí.
Beques i premis
2013 • NAACL Best Short Paper.
2011 - 2013 • Beca postdoctoral Beatriu de Pinós de la Generalitat de Catalunya.
2011 • Premi J. Manuel Blecua al millor treball científic derivat d'una tesi doctoral. Consell Social de la Universitat de Barcelona.
2009 • Best Paper Award en el 4th ISI Graduate Student Symposium. Information Sciences Institute, University of Southern California.
2009 • Beca de viatge per fer una estada a l'estranger. Ministeri d'Educació.
2007 - 2010 • Beca predoctoral FPU (Formació de Professorat Universitari) del Ministeri d'Educació i Ciència.
2007 • Menció Especial en els Premis Nacionals Fi de Carrera del curs 2005-2006. Ministeri d'Educació i Ciència.
2007 • Premi Extraordinari de Llicenciatura. Universitat de Barcelona.
Formació acadèmica
2011-2013 • Postdoc, Stanford University.
2010 • Doctora en Lingüística, Universitat de Barcelona.
Recasens, M. (2010) Coreferència: Teoria, anotació, resolució i avaluació. Tesi doctoral. Universitat de Barcelona.
2009 • Estada de recerca al Information Sciences Institute, University of Southern California, Estats Units.
2008 • DEA en Lingüística, Universitat de Barcelona.
Recasens, M. (2008) Towards Coreference Resolution for Catalan and Spanish. Tesina de DEA. Universitat de Barcelona.
2006 • Llicenciada en Filologia Anglesa, Universitat de Barcelona.
Idiomes
Català Llengua materna
Castellà Segona llengua materna
Anglès Fluïdesa oral i escrita
Alemany Fluïdesa oral i escrita
Francès Bo oral i escrit
Hongarès Bàsic
Coneixements informàtics
• Llenguatges de programació: Java, C++, R
• Llenguatges de marques: LaTeX, XML, Wikitext
Materials
Estímuls utilitzats a l'experiment psicolingüístic sobre quasi-identitat [pdf]
Diccionari de coreferència [zip]