Het internetwayback-archief is het nieuwste slachtoffer van de repressie van Reddit als het gaat om toegang tot gegevens. Het bedrijf heeft nieuwe beperkingen ingesteld voor wat de archiefsite mag bekijken, wat de capaciteit van de Wayback-machine om informatie van Reddit te bewaren aanzienlijk zal beperken.
Met deze wijzigingen zal de Wayback-machine, een project beheerd door het non-profit internetarchief, alleen nog de Reddit-startpagina kunnen crawlen. Andere informatie zoals opmerkingen, subreddits, gepubliceerde details, profielen en andere gegevens zullen niet langer toegankelijk zijn.
Deze stap is onderdeel van Reddit’s streven om het gebruik van zijn gegevens door kunstmatige intelligentiebedrijven te beperken zonder daarvoor licentiekosten te betalen. Dit staat in schril contrast met het standpunt dat Reddit vorig jaar innam, toen ze expliciet verklaarden dat ze “goedbedoelde actoren” niet zouden beperken, inclusief het internetarchief. Het is niet helemaal duidelijk wat er sindsdien is veranderd. Reddit lijkt te geloven dat kunstmatige intelligentiebedrijven hun regels omzeilen door gegevens te schrapen via de Wayback-machine. Het internetarchief is benaderd voor een reactie.
Het verkrijgen van licenties voor gegevens is een belangrijke focus geworden voor Reddit. Het bedrijf heeft lucratieve overeenkomsten gesloten met Openai en Google, waardoor zij Reddit-gegevens kunnen gebruiken voor het trainen van hun AI-modellen. Tegelijkertijd neemt Reddit een hardere houding aan tegen bedrijven die hun gegevens proberen te gebruiken zonder dergelijke overeenkomsten. Eerder dit jaar heeft het bedrijf Antropisch aangeklaagd wegens het schrapen van Reddit-gegevens zonder toestemming.
BRON






