Reddit подала до суду на Perplexity – компанія звинувачує конкурентів у масовому обходженні захисту – новини технологій

Reddit подала до суду на Perplexity - компанія звинувачує конкурентів у масовому обходженні захисту - новини технологій 1 Компанія звинувачує Perplexity у незаконному копіюванні її контенту для навчання ШІ.

Reddit ініціювала судовий позов проти чотирьох компаній, серед яких Perplexity.  Соцмережа звинувачує їх у незаконному копіюванні контенту з платформи для використання у системах штучного інтелекту. У позові зазначено, що відповідачі діяли “в промислових масштабах”, обходячи технічні засоби захисту Reddit, пише The Verge.

Згідно з документами, поданими до суду, позов спрямований проти Perplexity, а також сервісів збору даних SerpApi, Oxylabs та AWMProxy. У Reddit порівняли їхню діяльність із “грабіжниками банку, які, не маючи доступу до сховища, вриваються у броньовану вантажівку з готівкою”. Компанія стверджує, що Perplexity є клієнтом “принаймні однієї” з цих структур і “робить усе, щоб отримати дані Reddit, замість укладання законної угоди”.

У травні 2024 року Reddit надіслала Perplexity вимогу припинити збір даних із платформи. У відповідь компанія запевнила, що не використовує контент Reddit для навчання ШІ та дотримуватиметься обмежень, визначених у файлі robots.txt. Проте, за даними позову, після цього кількість цитувань Reddit у Perplexity зросла.

Reddit також створила тестову публікацію, яку міг бачити лише Google. За кілька годин вміст цієї сторінки з’явився у відповідях Perplexity. 

“Єдиний спосіб, яким Perplexity могла отримати цей контент, — це через пошукові результати Google, після чого швидко включила його у свою систему відповідей”, — йдеться у позові.

Представники Reddit наголошують, що дані користувачів платформи мають значну цінність для розробників штучного інтелекту. Компанія вже уклала угоди з OpenAI та Google, щоб легально надавати доступ до контенту для навчання моделей. Водночас у минулому Reddit вже подавала позови проти інших компаній, зокрема Anthropic, за дії подібні з Perplexity.

Головний юрисконсульт Reddit Бен Лі назвав нинішню ситуацію частиною “гонки озброєнь” серед компаній, що розробляють штучний інтелект: “Компанії беруть участь у гонці за якісний контент, отриманий від людей, і цей тиск підживлює економіку “відмивання даних” промислового масштабу. Вебскрейпери обходять захист, викрадають дані й продають їх клієнтам. Reddit — головна мішень, бо це одна з найбільших колекцій людських розмов”.

Він також схарактеризував відповідачів Oxylabs, AWM Proxy та SerpApi як “хрестоматійні приклади незаконної поведінки”, що маскують свою діяльність і викрадають контент Reddit із пошуку Google. За його словами, Perplexity добровільно купувала дані цих сервісів замість укладання офіційного контракту з Reddit.

У відповідь представник Perplexity Джессі Дваєр заявив у коментарі The Verge, що компанія ще не отримала позову, але готова захищати свої позиції: “Ми завжди будемо рішуче боротися за права користувачів на вільний та справедливий доступ до публічних знань. Наш підхід залишається принциповим та відповідальним, оскільки ми надаємо фактичні відповіді за допомогою точного штучного інтелекту та не потерпимо загроз відкритості та суспільним інтересам”.

Раніше Anthropic погодилася виплатити щонайменше 1,5 мільярда доларів для врегулювання колективного позову щодо порушення авторських прав, в якому її звинувачували у використанні мільйонів піратських книг для навчання своїх мовних моделей Claude. Ця угода стане найбільшим в історії врегулюванням справи такого типу і передбачає знищення Anthropic наборів даних з піратськими матеріалами.

Цей веб-сайт використовує файли cookie, щоб покращити ваш досвід. Ми припустимо, що ви з цим згодні, але ви можете відмовитися, якщо хочете. Прийняти Детальніше

Політика конфіденційності