Akademické práce výskumníkov mohli byť znehodnotené nesprávnymi dátami poskytnutými Facebookom

Facebook pri poskytovaní dát výskumnému konzorciu Harvardskej univerzity Social Science One omylom vynechal dáta polovice všetkých svojich používateľov v USA. Spoločnosť využila ich pravidelný mesačný telefonát s výskumníkmi združenými v tomto konzorciu, aby priznala chybu a ospravedlnila sa za negatívny dopad na ich prácu.

Facebook data
Obrázok: Unsplash

Podľa informácií v článku denníka The Washington Post a v článku The New York Times Facebook tento neúplný súbor dát konzorciu poskytol minulý rok. Obsahoval závažné chyby, ktoré ovplyvnili zistenia v zatiaľ neznámom množstve akademických prác.

Údaje sa týkali vplyvu sociálnych sietí na voľby a demokraciu. Zameriavali sa prevažne na webové adresy, na ktoré používatelia Facebooku klikali.

Ako mohlo dôjsť k tak veľkej chybe?

Chyba vznikla v dôsledku toho, že Facebook omylom vylúčil dáta od amerických používateľov, ktorí nemali žiadne preukázateľné politické sklony. Táto skupina však tvorila v danom čase približne polovicu všetkých používateľov Facebooku v Spojených štátoch.

Dáta používateľov z iných krajín údajne ovplyvnené neboli. Na chybu upozornil taliansky výskumník Fabio Giglietto. Nedávno totiž objavil anomálie v dátach a upovedomil spoločnosť Facebook. 

„Sú to dáta. Samozrejme, že sú tam chyby,“ povedal pre The Washington Post Gary King, profesor z Harvardu, ktorý spolupredsedá Social Science One. „Toto bola, samozrejme, veľká chyba, dodal.

O dopade na výskumy zatiaľ existujú iba dohady 

Gary King pre denník uviedol, že od februára 2020, keď spoločnosť Facebook zdieľala chybný dátový súbor, sa o tieto údaje opierali desiatky prác. Autormi bolo približne 110 výskumníkov prepojených na dané konzorcium. King si však zatiaľ nie je istý celkovým dopadom.

Niektoré z chýb môžu spôsobiť len malé alebo žiadne problémy, ale iné by mohli byť vážne. To sa však ukáže až po preskúmaní prác s kompletnými údajmi.

Správny anonymizovaný súbor dát je jedným z najväčších v histórii sociálnych vied. Súbor zahŕňa ochranu proti identifikácii jednotlivých používateľov na základe toho, čo zverejnili na Facebooku.

Bývalý spolupredseda Social Science One, profesor práva na Stanforde Nathaniel Persily o incidente povedal: „Je to nehoráznosť a zásadné porušenie sľubov, ktoré Facebook dal výskumnej komunite. Ukazuje to tiež, prečo potrebujeme vládnu reguláciu, ktorá by prinútila sociálne siete vytvoriť bezpečné programy na zdieľanie údajov s externými nezávislými výskumníkmi.

„Tento problém bol spôsobený technickou chybou v našom dátovom súbore o zdieľaných adresách URL, o ktorej sme proaktívne informovali partnerov, ktorých sa to týka, a na jej vyriešení rýchlo pracujeme, uviedla pre The Washington Post hovorkyňa spoločnosti Facebook Mavis Jonesová.

Problémy s dátami nie sú pre Facebook ničím novým 

Facebook nemá problémy s dátami prvýkrát. Medzi najznámejšie a najzávažnejšie pochybenia spoločnosti patrí napríklad škandál okolo Cambridge Analytica.

Taktiež tu môžeme spomenúť nedávny škandál ohľadom hackerského útoku a úniku údajov takmer 500 miliónov užívateľov, ktorý ilustruje značné problémy spoločnosti ustrážiť alebo pracovať s dátami vlastných užívateľov.

Vyššie uvedené prípady poukazujú skôr na zneužívanie či nedostatočnú ochranu dát. V tomto prípade však ide najmä o dôveryhodnosť poskytnutých dát, ktoré využívajú výskumníci. To, že viac ako rok pracovali rešpektovaní odborníci na prácach s nesprávnymi dátami môže do budúcna ohroziť dôveryhodnosť ich výskumov.

Cody Buntain, člen konzorcia a odborný asistent informatiky na Technologickom inštitúte v New Jersey, uviedol, že detailnejšie údaje zo spoločnosti Facebook by výskumníkom umožnili odhaliť chybu skôr prostredníctvom bežných kontrol dát. „Je to úplne predvídateľný problém, ktorému sa dalo predísť,“ povedal Buntain.

Absolvent medzinárodný vzťahov a európskych štúdií. Zaujíma sa prevažne o politické a bezpečnostné dianie mimo Európskej únie, v regiónoch strednej či východnej Ázie, ale aj amerického kontinentu. Kontakt: richard.straka@infosecurity.sk