Marta Recasens
Research Scientist, Google Inc.
recasens <preposición locativa> google <punto> com
1600 Amphitheatre Pkwy
Mountain View, CA 94043
USA
Publicaciones | Charlas invitadas | Comités | Proyectos I+D | Becas y premios | Formación | Idiomas | Conocimientos informáticos | Materiales |
|
Llegué a este mundo con los ojos bien abiertos, lo que probablemente era un signo de lo que más tarde sería mi fascinación y curiosidad constantes por los secretos de esta vida. Mi investigación se centra principalmente en las aproximaciones basadas en corpus a la semántica y la pragmática y, en concreto, la integración del conocimiento semántico y del mundo. Valoro especialmente los trabajos interdisciplinarios entre la lingüística, la informática, la ciencia cognitiva, la estadística... El problema que me tiene fascinada desde que entré en el mundo de la lingüística computacional es la resolución de la correferencia, que sigue siendo uno de los grandes retos de este campo. Desde 2013 soy investigadora en Google. Anteriormente, fui investigadora posdoctoral en el Departamento de Lingüística de la Universidad de Stanford y miembro del grupo de investigación Stanford NLP. Allí trabajé con el Dr. Dan Jurafsky. Obtuve el título de doctora en 2010 en la Universidad de Barcelona, donde era miembro del grupo de investigación CLiC, con la tesis titulada Correferencia: Teoría, anotación, resolución y evaluación. Mis directores fueron la Dra. M. Antònia Martí (UB) y el Dr. Eduard Hovy (USC). |
Publicaciones
2017
Ingrid L. Falkum, Marta Recasens y Eve Clark. 2017. "The moustache sits down first": on the acquisition of metonymy. Journal of Child Language, 44(1):87-119. Disponible en CJO 2016 DOI:10.1017/S0305000915000720.
2016
Marta Recasens y Sameer Pradhan. 2016. Evaluation Campaigns. En M. Poesio, R. Stuckardt y Y. Versley (eds.), Anaphora Resolution: Algorithms, Resources, and Applications, pp. 165-208. Springer-Verlag Berlin Heidelberg.
Massimo Poesio, Sameer Pradhan, Marta Recasens, Kepa Rodríguez y Yannick Versley. 2016. Annotated Corpora and Annotation Tools. En M. Poesio, R. Stuckardt y Y. Versley (eds.), Anaphora Resolution: Algorithms, Resources, and Applications, pp. 97-140. Springer-Verlag Berlin Heidelberg.
Marta Recasens, Zhichao Hu y Olivia Rhinehart. 2016. Sense Anaphoric Pronouns: Am I One?. En Proceedings of CORBON 2016, pp. 1-6.
2015
Sujay Kumar Jauhar, Raul Guerra, Edgar Gonzàlez y Marta Recasens. 2015. Resolving Discourse-Deictic Pronouns: A Two-Stage Approach to Do It. En Proceedings of *SEM 2015, pp. 299-308, Denver, Colorado, USA.
Marie-Catherine de Marneffe, Marta Recasens y Christopher Potts. 2015. Modeling the Lifespan of Discourse Entities with Application to Coreference Resolution. Journal of Artificial Intelligence Research, 52(2015):445-475.
2014
Sameer Pradhan, Xiaoqiang Luo, Marta Recasens, Eduard Hovy, Vincent Ng y Michael Strube. 2014. Scoring Coreference Partitions of Predicted Mentions: A Reference Implementation. En Proceedings of ACL 2014, pp. 30-35, Baltimore, MD, USA.
Xiaoqiang Luo, Sameer Pradhan, Marta Recasens y Eduard Hovy. 2014. An Extension of BLANC to System Mentions. En Proceedings of ACL 2014, pp. 24-29, Baltimore, MD, USA.
Marta Recasens, Liliana Tolchinsky y M. Antònia Martí. 2014. Coreference is not always either/or: Psycholinguistic evidence for near-identity. Language, Cognition and Neuroscience, 29(7):844-855.
2013
Marta Recasens, Cristian Danescu-Niculescu-Mizil y Dan Jurafsky. 2013. Linguistic Models for Analyzing and Detecting Biased Language. En Proceedings of ACL 2013, pp. 1650-1659, Sofia, Bulgaria.
Marta Recasens, Marie-Catherine de Marneffe y Christopher Potts. 2013. The Life and Death of Discourse Entities: Identifying Singleton Mentions. En Proceedings of NAACL-HLT 2013, pp. 627-633, Atlanta, Georgia. [video] Best Short Paper Award
Marta Recasens, Matthew Can y Dan Jurafsky. 2013. Same Referent, Different Words: Unsupervised Mining of Opaque Coreferent Mentions. En Proceedings of NAACL-HLT 2013, pp. 897-906, Atlanta, Georgia. [datos] [video]
2012
Heeyoung Lee, Marta Recasens, Angel Chang, Mihai Surdeanu y Dan Jurafsky. 2012. Joint Entity and Event Coreference Resolution across Documents. En Proceedings of EMNLP 2012, pp. 489-500, Jeju, Corea del Sur.
David McClosky, Wanxiang Che, Marta Recasens, Mengqiu Wang, Richard Socher y Christopher D. Manning. 2012. Stanford's System for Parsing the English Web. En Notes of the First Workshop on Syntactic Analysis of Non-Canonical Language (SANCL 2012), Montreal, Canadá.
Marta Recasens, M. Antònia Martí y Constantin Orasan. 2012. Annotating Near-Identity from Coreference Disagreements. En Proceedings of LREC 2012, pp. 165-172, Estambul, Turquía.
M. Antònia Martí, Raquel G. Alhama y Marta Recasens. 2012. Los avances tecnológicos y la ciencia del lenguaje. En T. Jiménez Juliá, B. López Meirama, V. Vázquez Rozas y Alexandre Veiga (eds.), Cum corde et in nova grammatica. Estudios ofrecidos a Guillermo Rojo. Santiago de Compostela: Universidade de Santiago de Compostela Publicaciones, pp. 543-553.
Lluís Màrquez, Marta Recasens y Emili Sapena. 2012. Coreference Resolution: An Empirical Study Based on SemEval-2010 Shared Task 1. Language Resources and Evaluation, 47(3):661-694.
2011
Marta Recasens, Eduard Hovy y M. Antònia Martí. 2011. Identity, non-identity, and near-identity: Addressing the complexity of coreference. Lingua, 121(6):1138-1152. Premio J. Manuel Blecua de la Universidad de Barcelona
Marta Recasens y Eduard Hovy. 2011. BLANC: Implementing the Rand Index for coreference evaluation. Natural Language Engineering, 17(4):485-510. © Cambridge University Press 2010
2010
Marta Recasens y Marta Vila. 2010. On Paraphrase and Coreference. Computational Linguistics, 36(4):639-647.
Marta Recasens y Eduard Hovy. 2010. Coreference Resolution across Corpora: Languages, Coding Schemes, and Preprocessing Information. En Proceedings of ACL 2010, pp. 1423-1432, Uppsala, Suecia.
Marta Recasens, Lluís Màrquez, Emili Sapena, M. Antònia Martí, Mariona Taulé, Véronique Hoste, Massimo Poesio y Yannick Versley. 2010. SemEval-2010 Task 1: Coreference Resolution in Multiple Languages. En Proceedings of the ACL International Workshop on Semantic Evaluation (SemEval-2010), pp. 1-8, Uppsala, Suecia.
Marta Recasens, Eduard Hovy y M. Antònia Martí. 2010. A Typology of Near-Identity Relations for Coreference (NIDENT). En Proceedings of LREC 2010, pp. 149-156, Valletta, Malta.
Marta Recasens y M. Antònia Martí. 2010. AnCora-CO: Coreferentially annotated corpora for Spanish and Catalan. Language Resources and Evaluation, 44(4):315-345.
2009
Marta Recasens y Eduard Hovy. 2009. A Deeper Look into Features for Coreference Resolution. En S. Lalitha Devi, A. Branco y R. Mitkov (eds.), Anaphora Processing and Applications (DAARC 2009), LNAI 5847:29-42. Springer-Verlag Berlin Heidelberg.
Marta Recasens. 2009. A Chain-starting Classifier of Definite NPs in Spanish. En Proceedings of the EACL Student Research Workshop, pp. 46-53, Atenas, Grecia.
Marta Recasens, M. Antònia Martí y Mariona Taulé. 2009. First-mention Definites: More than Exceptional Cases. En S. Featherston y S. Winkler (eds.), The Fruits of Empirical Linguistics. Volume 2: Product, pp. 217-237. Berlin: de Gruyter.
Marta Recasens, M. Antònia Martí, Mariona Taulé, Lluís Màrquez y Emili Sapena. 2009. SemEval-2010 Task 1: Coreference Resolution in Multiple Languages. En Proceedings of the NAACL HLT Workshop on Semantic Evaluations: Recent Achievements and Future Directions (SEW 2009), pp. 70-75, Boulder, CO, USA.
2008
Manuel Bertran, Oriol Borrega, Marta Recasens y Bàrbara Soriano. 2008. AnCoraPipe: A tool for multilevel annotation. Procesamiento del Lenguaje Natural, 41:291-292. Madrid, España.
Marta Recasens. 2008. Discourse Deixis and Coreference: Evidence from AnCora. En Proceedings of the 2nd Workshop on Anaphora Resolution (WAR II). NEALT Proceedings Series Vol. 2:73-82. Tartu, Estonia.
Mariona Taulé, M. Antònia Martí y Marta Recasens. 2008. AnCora: Multilevel Annotated Corpora for Catalan and Spanish. En Proceedings of LREC 2008, pp. 96-101, Marrakech, Marruecos.
2007
Marta Recasens, M. Antònia Martí y Mariona Taulé. 2007. Where Anaphora and Coreference Meet. Annotation in the Spanish CESS-ECE Corpus. En Proceedings of RANLP 2007, pp. 504-509, Borovets, Bulgaria.
Marta Recasens, M. Antònia Martí y Mariona Taulé. 2007. Text as Scene: Discourse Deixis and Bridging Relations. Procesamiento del Lenguaje Natural, 39:205-212. Sevilla, España.
Charlas invitadas
• "The Long Tail of Coreference Resolution"
University of California at Santa Cruz, California. Abril 2015.
• "What Real Data Reveals About Coreference"
University of California at Davis, California. Abril 2014.
• "Taking Coreference Resolution beyond the 60% Performance Barrier"
Carnegie Mellon University, Pittsburgh, Pensilvania. Abril 2013.
• "Deconstructing Coreference"
University of the Basque Country, San Sebastián, España. Junio 2011.
University of Wolverhampton, Wolverhampton, UK. Abril 2011.
Universitat Pompeu Fabra, Barcelona, España. Abril 2011.
Universitat Politècnica de Catalunya, Barcelona, España. Noviembre 2010.
• "Learning-based Coreference Resolution for Spanish and Catalan"
Information Sciences Institute, University of Southern California, Marina del Rey, California. Mayo 2009.
Comités
• Chair del ACL 2015 (Área de Discourse, Coreference and Pragmatics), EACL 2012 - Student Research Workshop.
• Miembro del Comité de programa de ACL 2014, 2n Workshop on EVENTS, EMNLP 2014, ACL 2013, 1st Workshop on EVENTS, *SEM 2013, NAACL 2013 - Student Research Workshop, COLING 2012, CoNLL-2012 Shared Task, EACL 2012, CREDISLAS Workshop, IJCNLP 2011, Language Resources and Evaluation Special issue on Computational Semantic Analysis of Language: SemEval-2010, RANLP 2011 - Student Research Workshop, RANLP 2011, DAARC 2011, Beyond Semantics 2011, LAW IV, CBA 2010, DAARC 2009, CBA 2008.
• Revisora de TACL, Revue TAL, ACL 2011, SEPLN 2010, LREC 2010, RANLP 2009.
• Miembro del Comité organitzador de la Task1: Coreference Resolution in Multiple Languages dins de SemEval-2(2010).
• Miembro del Comité organitzador del CBA 2008.
• Miembro del Student Board de l'EACL (2009-2011).
Proyectos I+D
Título: La correferencia entendida como un continuo: Validación interlingüística y marco computacional (2010 PBR 00039)
Entidad financiadora: Generalitat de Catalunya.
Duración: 2011.
Participantes: Universitat de Barcelona, University of Wolverhampton.
IP: M. Antònia Martí.
Título: TEXT-Knowledge 2.0: El modelado de conocimiento ante los nuevos retos de la comunicación digital (TIN2009-13391-C04-04). Subproyecto de TEXT-MESS 2.0
Entidad financiadora: Ministerio de Ciencia e Innovación.
Duración: 2010-2012.
Participantes: Universitat d'Alacant, Universitat Politècnica de València, Universitat de Barcelona, Universidad de Jaén.
IP: M. Antònia Martí.
Título: ANCORA-NET: Integración multilingüe de recursos lingüísticos semánticos (FFI2009-06497-E/FILO)
Entidad financiadora: Ministerio de Ciencia e Innovación.
Duración: 2010.
Participantes: Universitat de Barcelona.
IP: Mariona Taulé.
Título: ANCORA-NOM: Anotación semántica del SN en los corpus AnCora (FFI2008-02691-E/FILO)
Entidad financiadora: Ministerio de Ciencia e Innovación.
Duración: 2009.
Participantes: Universitat de Barcelona.
IP: Mariona Taulé.
Título: Praxem, etiquetado semántico y pragmático del corpus CESS-ECE (HUM2006-27378-E)
Entidad financiadora: Ministerio de Educación y Ciencia.
Duración: 2007-2008.
Participantes: Universitat de Barcelona, Universitat Politècnica de Catalunya, Universidad del País Vasco, Universidad de Alicante.
IP: Mariona Taulé.
Título: Lang2World: Descubriendo el conocimiento del mundo codificado en la lengua (TIN2006-15265-C06-06). Subproyecto de TEXT-MESS.
Entidad financiadora: Ministerio de Educación y Ciencia.
Duración: 2006-2009.
Participantes: Universidad de Alicante, Universidad Politécnica de Valencia, Universitat de Barcelona, Universitat Politècnica de Catalunya, Universidad de Jaén, Universidad Nacional de Educación a Distancia.
IP: M. Antònia Martí.
Título: CESS-ECE: Corpus Etiquetado Sintáctico-Semántico del Español, Catalán y Euskera (HUM2004-21127-E)
Entidad financiadora: Ministerio de Educación y Ciencia.
Duración: 2005-2007.
Participantes: Universitat de Barcelona, Universitat Politècnica de Catalunya, Universidad del País Vasco.
IP: M. Antònia Martí.
Becas y premios
2013 • NAACL Best Short Paper.
2011 - 2013 • Beca postdoctoral Beatriu de Pinós de la Generalitat de Catalunya.
2011 • Premio J. Manuel Blecua al mejor artículo derivado de una tesis doctoral. Consell Social de la Universidad de Barcelona.
2009 • Best Paper Award en el 4th ISI Graduate Student Symposium. Information Sciences Institute, University of Southern California.
2009 • Beca de viaje para hacer una estancia en el extranjero. Ministerio de Educación.
2007 - 2010 • Beca predoctoral FPU (Formación de Profesorado Universitario) del Ministerio de Educación y Ciencia.
2007 • Mención Especial en los Premios Nacionales Fin de Carrera del curso 2005-2006 del Ministerio de Educación y Ciencia.
2007 • Premio Extraordinario de Licenciatura. Universidad de Barcelona.
Formación académica
2011-2013 • Postdoc, Stanford University.
2010 • Doctora en Lingüística, Universidad de Barcelona.
Recasens, M. (2010) Coreference: Theory, Annotation, Resolution and Evaluation. Tesis doctoral. Universidad de Barcelona.
2009 • Estancia de investigación en el Information Sciences Institute, University of Southern California, Estados Unidos.
2008 • DEA en Lingüística, Universidad de Barcelona
Recasens, M. (2008) Towards Coreference Resolution for Catalan and Spanish. Tesina de DEA. Universidad de Barcelona.
2006 • Licenciada en Filología Inglesa, Universidad de Barcelona.
Idiomas
Catalán Lengua materna
Castellano Segunda lengua materna
Inglés Fluidez oral y escrita
Alemán Fluidez oral y escrita
Francés Bueno oral y escrito
Húngaro Básico
Conocimientos informáticos
• Lenguajes de programación: Java, C++, R
• Lenguajes de marcas: LaTeX, XML, Wikitext
Materials
Estímulos usados en el experimento psicolingüístico sobre casi-identidad [pdf]
Diccionario de correferencia [zip]