Projekt Infosecurity je jedným z mnohých členov iniciatívy #BezHejtu. Na kampani spolupracujú členovia PR agentúry Seesame a technologickej spoločnosti Trollwall. Cieľom kampane je očista informačného priestoru od nenávistných prejavov a urážok, zaistenie bezpečného a inkluzívneho online priestoru pre všetkých ľudí, ako aj snaha znižovať politickú a spoločenskú polarizáciu v online sfére.
Tieto ciele je možné dosahovať zvyšovaním úrovne kultúrnosti a slušnosti v komentárových sekciách, čo umožňuje unikátny nástroj Trollwall. Ten vďaka rozpoznávaniu jazyka a zapojeniu umelej inteligencie dané sekcie automaticky moderuje a odstraňuje komentáre obsahujúce nenávistné prejavy, expresívne výrazy či toxickú rétoriku.
Hejty a dezinformácie v komentároch Infosecurity nenájdete
Infosecurity spolupracuje s Trollwall približne pol roka. Počas tohto obdobia bolo z celkového počtu 1 500 komentárov na Facebooku automaticky skrytých takmer 300. Išlo primárne o komentáre, ktoré zahŕňali nadávky a expresívne výrazy, ale aj komentáre obsahujúce nenávistné prejavy.
Podľa CEO spoločnosti Trollwall AI Tomáša Halásza dokáže nástroj vďaka použitiu umelej inteligencie automaticky odstraňovať vulgárne a toxické prejavy v komentároch, a to hneď po ich publikovaní. Tým poskytuje ochranu pred online nenávisťou, ktorá je smerovaná nielen voči samotnej stránke, ale aj na jej podporovateľom či menšinám.
Podľa Halásza je umelá inteligencia trénová na reálnych komentároch v slovenskom jazyku, aby dokázala spoľahlivejšie identifikovať problematický obsah. Tieto komentáre boli ako problematické označené minimálne troma ľuďmi nezávisle od seba, čo zaručuje predchádzaniu nestabilným výsledkom či osobným predsudkom. Vďaka tomu má TrollWall – na rozdiel od ľudskej moderácie – stabilné výsledky.
S hejtermi a trollmi nemusíme prichádzať do kontaktu
Halász upozorňuje na výhodu aj u používateľa služby, ktorou môže byť firma, ale aj organizácia, médium či štátna inštitúcia. Takýto používateľ má o moderácii komentárov s Trollwall dostatočný prehľad. Má teda vedomie o tom, ktoré komentáre boli umelou inteligenciou skryté, pričom toto rozhodnutie môže podľa vlastného uváženia zmeniť. Podľa CEO spoločnosti sa vďaka automatickému odstraňovaniu problematických komentárov môžu klienti kontrole komentárových sekcií venovať minimálne a svoj čas investovať do komunikácie so slušnými sledovateľmi.
Spolu s prehľadnosťou a šetrením času prináša automatizácia moderovania komentárových sekcií aj ekonomické výhody. Zvyšuje totiž efektivitu práce a šetrí financie, ktoré by museli stránky vynakladať na osobitne dedikovaných moderátorov. Zároveň, takáto moderácia je podstatná nielen z pohľadu vytvárania priateľskejšieho online prostredia, ale aj zachovania dobrého mena značiek, ktoré nechcú byť spájané s nenávisťou či dezinformáciami.
„Sme hrdí, že TrollWall chráni vyše sto profilov na Slovensku a v Čechách a čoskoro aj v ďalších krajinách. Na podporu našej misie obmedziť nenávisť na sociálnych sieťach podporujeme desiatky mimovládnych organizácií bezplatne.“
Tomáš Halász, CEO Trollwall
Trollwall bol testovaný rôznymi mimovládnymi organizáciami, zdokonaľovanie ale prebehlo aj počas prezidentskej kampane Petra Pavla v českých voľbách. V súčasnosti ponúka ochranu rôznym typom aktérov vrátane profilu prezidentky SR Zuzany Čaputovej, médií (v súčasnosti napríklad Denník N), alebo firiem (okrem iných napríklad O2). Okrem toho sa spoločnosť postupne rozširuje – aktuálne prebieha rozširovanie do Poľska, na pláne sú však aj ďalšie európske štáty.
Nenávisť v online priestore môže mať reálne dôsledky offline
Slovenský Facebook podľa Halásza nie je presným obrazom slovenskej spoločnosti. CEO Trollwall upozornil na skutočnosť, že väčšina ľudí sa na sociálnych sieťach nevyjadruje. Sú tichou väčšinou, ktorá zvyčajne nemá potrebu písať pod príspevkami komentáre. Zároveň však táto skupina spoločnosti komentáre iných používateľov číta a je nimi vedome či podvedome ovplyvňovaná.
V konečnom dôsledku môže mať online nenávisť tragické dôsledky aj v „reálnom“ svete. Halász v tomto kontexte apeluje na morálku organizácií a firiem, ktoré aktívne komunikujú na sociálnych sieťach. Slabá moderácia komentárov podľa neho vedie k prehlbujúcej sa polarizácii, normalizácii nenávistných prejavov, negatívnym dopadom na ohrozené skupiny (primárne menšiny a ženy), či dokonca k fyzickým útokom.
„Je morálnou povinnosťou každej organizácie či firmy moderovať diskusie pod svojimi profilmi, tak, aby hlučná menšina agresívnych vulgárnych ľudí neudávala, čo je štandardom.“
Tomáš Halász, CEO Trollwall
V online diskusiách podľa neho platí tzv. teória rozbitého okna. „Hovorí o tom, že špinavé (rozbité) prostredie motivuje aj ďalších návštevníkov (v našom prípade diskutérov) tvoriť ďalšiu špinu. V zanedbanom prostredí ľudia strácajú zábrany. Slušní ľudia sa boja zapojiť do toxickej debaty alebo na to úplne stratia chuť,“ dodáva Halász.
Moderácia ≠ cenzúra
V mnohých prípadoch dochádza zo strany publika k obvineniu, že moderovanie komentárov znamená cenzúru. V skutočnosti je však cenzúra nedemokratickým nástrojom režimov pre formovanie diskusie, naproti čomu moderácia smeruje k ochrane demokratických princípov a hodnôt. Sloboda slova totiž nie je bezbrehá a nepokrýva typy prejavu ako je nenávisť, hanobenie, dehumanizácia či výzvy na násilie.
Umelá inteligencia od Trollwall nemá za cieľ cenzurovať názory. Spôsob prejavu by mal byť rozpoznaný od názoru tak, aby konštruktívne pohľady neboli v komentároch potláčané. Zároveň, AI identifikuje nenávisť či dehumanizáciu v rôznych kontextoch, odstraňuje teda komentáre, ktoré útočia na rôzne osoby či skupiny obyvateľstva. Slušne vyjadrený názor takejto moderácii nepodlieha.
V rámci kampane #BezHejtu bola nedávno vydaná správa mapujúca charakter komentárov na slovenskom Facebooku počas obdobia medzi augustom a októbrom 2023. Výsledky analýzy takmer 7 miliónov komentárov na 492 facebookových profiloch ukázali, že na slovenskom Facebooku je takmer 13 % všetkých komentárov hejterských. Z celkového počtu analyzovaných komentárov teda až 899 543 obsahovalo istú formu nenávisti.
Pre porovnanie, u členov #BezHejtu predstavovali v rovnakom období nenávistné komentáre menej ako 2 %. Analýza teda ukazuje, že komentáre obsahujúce nenávistné prejavy alebo nadávky sú stále veľkým problémom. S použitím nástrojov na ich detekciu a spoľahlivé odstraňovanie však môžeme úroveň toxicity znižovať.