Reddit se rozhodl přijmout drastická opatření na ochranu svých dat před neoprávněným používáním ze strany společností zabývajících se umělou inteligencí (AI). Reddit zjistil, že tyto společnosti využívají data z Wayback Machine, nástroje internetového archivu, který umožňuje uživatelům vidět, jak vypadaly webové stránky v minulosti. V reakci na to Reddit omezí přístup Internet Archive ke svému obsahu a zabrání mu v indexování většiny informací z Redditu, jako jsou podrobnosti o příspěvcích, komentáře a profily uživatelů.
Díky této nové politice bude moci Internet Archive indexovat pouze domovskou stránku Reddit. To znamená, že nástroj bude moci archivovat pouze informace o nejpopulárnějších titulcích a příspěvcích v daný den, což výrazně omezí rozsah jeho archivu. Toto rozhodnutí je v souladu s rostoucími obavami společnosti Reddit o to, jak jsou její data využívána.
Internetový archiv je nezisková organizace, jejímž posláním je uchovávat digitální archiv webových stránek a dalšího kulturního obsahu. Wayback Machine, často označovaný jako „internetový stroj času“, je cenným nástrojem pro výzkumné pracovníky, novináře i širokou veřejnost, protože jim umožňuje prohlížet webové stránky tak, jak se objevily v určitý den.
Obavy ze zneužívání dat
Mluvčí Redditu Tim Rathschmidt vysvětlil serveru The Verge, že „Internet Archive poskytuje službu otevřenému webu, ale byli jsme upozorněni na případy, kdy společnosti zabývající se umělou inteligencí porušují zásady platformy, včetně našich vlastních, a získávají data z Wayback Machine“. Tato praxe vedla společnost Reddit k přehodnocení způsobu archivace dat.
Společnost Reddit se domnívá, že by neměl být archivován veškerý její obsah bez rozdílu.
Rathschmidt dodal: „Dokud nebudou schopni obhájit své stránky a dodržovat zásady platformy (např. respektování soukromí uživatelů nebo odstraňování smazaného obsahu), omezujeme některé jejich přístupy k datům Redditu, abychom ochránili redditery.“
Omezení přístupu k údajům Redditu se začalo zavádět postupně a bude se dále rozšiřovat. Kromě toho společnost Reddit již dříve komunikovala o tomto rozhodnutí s internetovým archivem a snažila se o vzájemné porozumění ohledně používání svých dat.
Právo být zapomenut a ochrana údajů
Společnost Reddit také vyjádřila obavy ohledně možnosti jednotlivců získat obsah z Internet Archive. Platforma umožňuje uživatelům sdílet své zkušenosti, hledat rady a vyjadřovat své emoce. Mnoho lidí však své příspěvky po nějaké době odstraní, ať už proto, že se jim dostalo potřebné zpětné vazby, nebo proto, že chtějí chránit své soukromí.

Zdroj: Youtube.com
V minulosti společnost Reddit podnikla kroky k odříznutí přístupu k nástrojům pro vytěžování dat, protože je společnosti zabývající se umělou inteligencí masivně využívají bez povolení. Reddit je sice ochoten těmto společnostem data poskytovat, ale činí tak na základě obchodních smluv, jak bylo zjištěno v předchozích obchodech.
V loňském roce uzavřel Reddit dohodu se společností Google o využívání svých dat ve vyhledávání Google a pro trénink umělé inteligence. Následně Reddit začal omezovat přístup vyhledávačů ke svým datům, pokud za ně nezaplatí, jak informoval server The Verge.
Nedávno společnost Reddit obvinila společnost Anthropic, že více než 100 000krát použila její data k trénování umělé inteligence, poté co tvrdila, že s tím přestala. Anthropic navíc údajně najal bývalého manažera společnosti Google Books, aby získal „všechny knihy světa“ a použil je při tréninku AI, než se jich zbaví.