CoMIT. Corpus Multimodal de Informativos televisados

Corpus textual constituido por la transcripción de la totalidad del componente lingüístico oral y escrito de 9 telediarios (6h 5’ 53’’) emitidos en España, en horario de máxima audiencia, por Televisión Española (TVE 1 y La2) y Antena 3 en 2002. Es un corpus de 98.958 palabras.

El corpus se presenta con una propuesta de transcripción y de etiquetado que tiene en cuenta las características internas del discurso informativo de un telediario, su superestructura y su contexto extralingüístico.

La propuesta està ideada para recoger la dimensión audiovisual (multimodal) de los telediarios, analizar la interacción de los modos visual, verbal y sonoro, y reflejar las variedades lingüísticas. Permite, asismismo, el análisis de las formas y estrategias con que los periodistas reproducen las voces ajenas.

Documentación detallada sobre el corpus

Acceso al corpus CoMIT