Pověst značky

Jak hodnotíme emoční zaujetí (tzv. sentiment) zmínek?

Pokud se pokusíte o hodnocení nebo klasifikování příspěvků a zmínek, dříve nebo později se setkáte s odborným pojmem „sentiment“. Sentimentem zde nazýváme kladné nebo záporné osobní zaujetí dané osoby, zejména postoj na stupnici: náklonnost … odpor.

Takto pojatý sentiment se liší od běžného českého pojmu „sentimentální“, což se často vykládá jako „citový“ nebo „přecitlivělý“.

https://cs.wikipedia.org/wiki/Sentiment

Analýza emočního postoje zmínek (sentiment: negativní – neutrální – kladný) neoznačuje, jaký je postoj autora zmínky k testovanému tématu, ale měří emoční náboj obsažený v dané zmínce.

Algoritmus automatického hodnocení zmínek v systému SentiOne je založený na výzkumech britských vědců Johna D. Crawforda a Julie D. Henry. Ti zavedli stupnici nazvanou PANAS – škálu pozitivní a negativní afektivity. Díky jejich výzkumu jsme s jistou přesností (která závisí na délce a charakteru zmínky) schopni statistickými metodami odhadnout aktuální emoční zaujetí autora zkoumané zmínky.

Dobře, k čemu ale stupnice PANAS slouží a jak vůbec funguje?

PANAS – je anglickou zkratkou termínu Positive and Negative Affect Schedule.

Psychometrická škála pozitivní a negativní afektivity slouží k určování aktuálního stavu testovaného subjektu, pomocí analýzy četnosti a výskytu pozitivních a negativních symbolů (v textu zmínky slov a pojmů – obecně však manifestovaných pocitů a postojů). Lidé s kladnou afektivitou „se na svět dívají růžovými brýlemi“, jsou nadšeni, hrdí a silní, ti s negativní afektivitou „vidí vše černě“, mají obavy, cítí se vinní a nervózní.

Škála PA / NA vyjadřuje dva nezávislé aspekty přizpůsobení subjektu. Vysoká hodnota NA poukazuje na úzkosti a nepříjemné pocity (np. spojené s obavami a povinnostmi), nízká hodnota NA zase jejich nepřítomnost. PA pak vyjadřuje míru příjemných pocitů, které subjekt cítí ve spojení s daným prostředím. Emoce jako: nadšení a aktivita jsou indikátorem vysokého PA, zatímco ospalost a smutek jsou charakteristické pro nízké PA. Zkráceně – jestliže někdo použije ve svém projevu (v analyzované zmínce) především slova emočně patřící do skupiny NA, je velice pravděpodobné, že celá zmínka má negativní emoční náboj.

PANAS se skládá z 20-ti analyzovaných postojů – 10-ti kladných emočních stavů (PA) a 10-ti záporných emočních stavů (NA). Stupnici PANAS zavedli v roce 1988 pánové Watson, Clark a Tellegen. Od této doby se objevilo několik rozšířených variant této stupnice. Níže uvedeme model výzkumníků: Iolandy Costa GalinhaI, Cicera Roberta Pereira a Francisca Gomesa Estevese: (http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0102-79722013000400007&lng=pt&nrm=iso&tlng=en).

Rozšířená stupnice PANAS-t byla v roce 2013 poprvé s úspěchem použitá k analýze zmínek v sociálních sítích Facebook a Twitter. Výzkum je k dispozici zde.

Pro určení aktuálního sentimentu používáme upravené algoritmy založené na metodě PANAS, přičemž neustále pracujeme na jejich zdokonalování a zpřesňování (přičemž vycházíme i z automatického vs manuálního určování sentimentu).

Co je důležité vědět

Automaticky určený postoj není vždy relevantní ke všem možným tématům obsaženým ve zmínce. Autor zmínky se totiž v jednom příspěvku může stavět k jednomu tématu pozitivně, zatímco stejné vyjádření je vůči jinému (opačnému) tématu možné vnímat jako negativní. Dalším “šumovým faktorem” analýzy sentimentu je také v češtině tak běžná ironie (kdy kladné postoje vyjadřují záporný sentiment a naopak).

Výhodou takto statisticky stanoveného sentimentu je, že čím více zmínek analyzujete, tím dosáhnete přesnějšího odhadu výsledného sentimentu (chyby a nepřesnosti se vzájemně ruší).

Jako jistý problémový příklad si uvedeme jednu zmínku, která se vztahuje k prohránemu hokejovému zápasu: Dnešní výhra Švédska nebyla fér – měli vyhrát Češi. Celý zápas podělali rozhodčí. Tato zmínka má převažující negativní sentiment (identifikované pojmy: starosti smutek, strach, zlost). Avšak čistě z pohledu českého týmu se jedná o fanouška našich hokejistů. O někoho, kdo o českém týmu smýšlí pozitivně. Dalším příkladem může být ironické prohlášení: Milane, ty jsi děsný hajzlík (poté co v žertu pomaloval opilého kolegu spícího na lavici) nebo: Tak ti Petře děkuji za pěkný večer (nové šaty polité červeným vínem).

Pro tyto případy (zejména při nízkém počtu zmínek) tady máme nástroje, jak výše zmíněné nepřesnosti korigovat – viz. funkce Hodnotič.