Loqal – новинний агрегатор Loqal
Новини

Reddit Limits Access for Internet Archive's Wayback Machine

Reddit Limits Access for Internet Archive's Wayback Machine
HiTech.Expert • 2 переглядів • 1 хв читання

Коротко

Reddit is implementing new restrictions that prevent the Internet Archive’s Wayback Machine from accessing most of its content. This decision follows Reddit's efforts to control how its data is used and monetized, particularly concerning artificial intelligence training. The change will primarily affect access to comments, subreddits, and user profiles, impacting the preservation of Reddit's history.

Wayback Machine від Internet Archive стала останньою жертвою жорстких заходів Reddit щодо доступу до даних. Компанія почала вводити нові обмеження на доступ до архівного сайту, що значно обмежить можливості Wayback Machine щодо збереження інформації з Reddit.

З цією зміною Wayback Machine, проект, що реалізується некомерційною організацією Internet Archive, зможе сканувати лише головну сторінку Reddit. Він більше не матиме доступу до коментарів, сторінок субреддитів, деталей публікацій, профілів та інших даних.

Цей крок є останнім кроком Reddit у його прагненні обмежити можливість компаній, що займаються штучним інтелектом, використовувати його дані для навчання великих мовних моделей без сплати ліцензійних зборів. Це також значно відрізняється від позиції, яку компанія займала минулого року, коли вона чітко заявила, що не буде обмежувати «добросовісних учасників», включаючи Internet Archive. Незрозуміло, що саме змінилося з того часу. Reddit, схоже, вважає, що компанії, що займаються штучним інтелектом, обходять його правила, збираючи дані за допомогою Wayback Machine. Ми звернулися до Інтернет-архіву за коментарем.

Ліцензування даних стало важливим напрямком бізнесу для Reddit. Компанія уклала багатомільйонні угоди з OpenAI та Google, які дозволяють їм використовувати публікації Reddit для навчання своїх моделей штучного інтелекту. Водночас Reddit займає все більш жорстку позицію щодо компаній, які намагаються використовувати його дані без таких домовленостей. Раніше цього року компанія подала позов проти Anthropic, звинувачуючи її в тому, що вона роками без дозволу збирала дані з Reddit.

2