Podľa informácií v článku denníka The Washington Post a v článku The New York Times Facebook tento neúplný súbor dát konzorciu poskytol minulý rok. Obsahoval závažné chyby, ktoré ovplyvnili zistenia v zatiaľ neznámom množstve akademických prác.
Údaje sa týkali vplyvu sociálnych sietí na voľby a demokraciu. Zameriavali sa prevažne na webové adresy, na ktoré používatelia Facebooku klikali.
Ako mohlo dôjsť k tak veľkej chybe?
Chyba vznikla v dôsledku toho, že Facebook omylom vylúčil dáta od amerických používateľov, ktorí nemali žiadne preukázateľné politické sklony. Táto skupina však tvorila v danom čase približne polovicu všetkých používateľov Facebooku v Spojených štátoch.
Dáta používateľov z iných krajín údajne ovplyvnené neboli. Na chybu upozornil taliansky výskumník Fabio Giglietto. Nedávno totiž objavil anomálie v dátach a upovedomil spoločnosť Facebook.
„Sú to dáta. Samozrejme, že sú tam chyby,“ povedal pre The Washington Post Gary King, profesor z Harvardu, ktorý spolupredsedá Social Science One. „Toto bola, samozrejme, veľká chyba,“ dodal.
O dopade na výskumy zatiaľ existujú iba dohady
Gary King pre denník uviedol, že od februára 2020, keď spoločnosť Facebook zdieľala chybný dátový súbor, sa o tieto údaje opierali desiatky prác. Autormi bolo približne 110 výskumníkov prepojených na dané konzorcium. King si však zatiaľ nie je istý celkovým dopadom.
Niektoré z chýb môžu spôsobiť len malé alebo žiadne problémy, ale iné by mohli byť vážne. To sa však ukáže až po preskúmaní prác s kompletnými údajmi.
Správny anonymizovaný súbor dát je jedným z najväčších v histórii sociálnych vied. Súbor zahŕňa ochranu proti identifikácii jednotlivých používateľov na základe toho, čo zverejnili na Facebooku.
Bývalý spolupredseda Social Science One, profesor práva na Stanforde Nathaniel Persily o incidente povedal: „Je to nehoráznosť a zásadné porušenie sľubov, ktoré Facebook dal výskumnej komunite. Ukazuje to tiež, prečo potrebujeme vládnu reguláciu, ktorá by prinútila sociálne siete vytvoriť bezpečné programy na zdieľanie údajov s externými nezávislými výskumníkmi.“
„Tento problém bol spôsobený technickou chybou v našom dátovom súbore o zdieľaných adresách URL, o ktorej sme proaktívne informovali partnerov, ktorých sa to týka, a na jej vyriešení rýchlo pracujeme,“ uviedla pre The Washington Post hovorkyňa spoločnosti Facebook Mavis Jonesová.
Problémy s dátami nie sú pre Facebook ničím novým
Facebook nemá problémy s dátami prvýkrát. Medzi najznámejšie a najzávažnejšie pochybenia spoločnosti patrí napríklad škandál okolo Cambridge Analytica.
Taktiež tu môžeme spomenúť nedávny škandál ohľadom hackerského útoku a úniku údajov takmer 500 miliónov užívateľov, ktorý ilustruje značné problémy spoločnosti ustrážiť alebo pracovať s dátami vlastných užívateľov.
Vyššie uvedené prípady poukazujú skôr na zneužívanie či nedostatočnú ochranu dát. V tomto prípade však ide najmä o dôveryhodnosť poskytnutých dát, ktoré využívajú výskumníci. To, že viac ako rok pracovali rešpektovaní odborníci na prácach s nesprávnymi dátami môže do budúcna ohroziť dôveryhodnosť ich výskumov.
Cody Buntain, člen konzorcia a odborný asistent informatiky na Technologickom inštitúte v New Jersey, uviedol, že detailnejšie údaje zo spoločnosti Facebook by výskumníkom umožnili odhaliť chybu skôr prostredníctvom bežných kontrol dát. „Je to úplne predvídateľný problém, ktorému sa dalo predísť,“ povedal Buntain.