Het internetarchief is een belangrijke bron geweest voor journalisten, die verwijderde tweets hebben gevonden of academische teksten hebben gebruikt voor achtergrondonderzoek. Met de opkomst van kunstmatige intelligentie is er echter een nieuwe spanning ontstaan tussen partijen. Sommige grote publicaties hebben de toegang van de non-profit digitale bibliotheek tot hun inhoud geblokkeerd uit angst dat AI-bedrijven internetarchiefcollecties zouden gebruiken om hun artikelen te ontginnen.
“Veel van deze AI-bedrijven zoeken naar gestructureerde, gemakkelijk toegankelijke inhoudsdatabases,” zegt Robert Hahn, hoofd bedrijfszaken en licentieverlening voor De Bewaker, in een interview met Nieman Lab. “De Internet Archive API zou een voor de hand liggende plek zijn geweest om machines aan te sluiten en gegevens te extraheren.”
De New York Times heeft een vergelijkbare stap gezet. “We blokkeren de toegang van de Internet Archive-bot tot onze inhoud omdat de Wayback Machine onbeperkte toegang biedt tot onze inhoud, ook voor AI-bedrijven, zonder toestemming,” bevestigde een vertegenwoordiger van de krant aan Nieman Lab. Financiële tijden en Reddit hebben ook maatregelen genomen om selectief te blokkeren hoe het internetarchief hun materiaal catalogiseert.
Veel uitgevers hebben geprobeerd AI-bedrijven aan te klagen vanwege de manier waarop ze toegang krijgen tot inhoud die wordt gebruikt om grote taalmodellen te trainen. Enkele voorbeelden zijn De New York Times die OpenAI en Microsoft heeft aangeklaagd, Het Center for Investigative Reporting dat OpenAI en Microsoft heeft aangeklaagd, en De Wall Street Journal en New York Post die Perplexity hebben aangeklaagd. Een groep redacteuren, waaronder De Atlantische Oceaan, De Bewaker en Politiek, heeft Cohere aangeklaagd. Ook De New York Times en de Chicago Tribune hebben Perplexity aangeklaagd.
Andere mediakanalen hebben financiële deals gezocht voordat ze hun bibliotheken als trainingsmateriaal aanbieden, hoewel deze deals voornamelijk compensatie lijken te bieden aan uitgeverijen in plaats van schrijvers. Daarnaast zijn er auteursrecht- en piraterijkwesties die ook door andere creatieve vakgebieden worden aangepakt, van fictieschrijvers tot beeldend kunstenaars en muzikanten. Dit verhaal is het waard om te lezen voor iedereen die de reacties van deze creatieve industrieën op AI heeft gevolgd.
BRON






