Vés al contingut

Hopinion

 

Hopinion és un corpus d’opinions en espanyol. Hopinion conté 17.934 opinions (2.388.848 paraules), bàsicament sobre hotels, procedents de la pàgina web de TripAdvisor.

Les opinions van acompanyades d’informació lingüística i de metadades. Pel que fa a la informació lingüística, 4.740 textos estan anotats amb el lema i la categoria morfològica de les paraules. Les metadades fan referència a usuaris i ítems. Dels usuaris s’han recuperat, entre d’altres, l’àlies, el sexe, l’edat, la procedència, l’estil i el motiu del viatge. Dels ítems s’han recollit el tipus d’allotjament, la seva categoria (número d’estrelles), la puntuació donada per l’usuari i pels viatgers, la seva localització, etc.

Addicionalment, Hopinion incorpora els resultats (anotacions, freqüències, etc.) de diversos experiments realitzats sobre les dades de base. En aquest últim cas, es recomana llegir la publicació associada a cada experiment. L’arxiu LEEME.txt conté més detalls sobre aquest recurs.

El corpus es pot descarregar en forma de text pla (CSV) o base de dades. La base de dades permet realitzar cerques complexes segons l’esquema que es presenta a continuació.