RedditがデータマイニングでPerplexityを提訴:訴訟の主要事実

  • Redditは、Perplexityと3社に対し、無許可でデータを抽出したとしてニューヨークで訴訟を起こした。
  • Perplexity社は容疑を否定し、公知情報への公正なアクセスを擁護している。SerpApi社とOxylabs社も容疑を否認している。
  • このプラットフォームはすでにGoogleとOpenAIからコンテンツのライセンスを取得しており、事前審査通知を提出し、Redditへの参照が40倍に増加したとしている。
  • リトアニアの企業オキシラボに関するこの訴訟は欧州に影響を及ぼし、EUの規制枠組み内でのスクレイピングと権利に関する議論を再燃させた。

RedditがデータマイニングでPerplexityを提訴

サンフランシスコを拠点とするソーシャルネットワークは、 ニューヨークの連邦訴訟 Perplexity AIとウェブデータ収集に関連する複数の企業に対し、AIベースのツールに供給するために許可なくRedditのコンテンツを入手したと申し立てている。

文書によると、Perplexityはプラットフォームの素材を使用するライセンスを持っていないが、RedditはGoogleやOpenAIなどの他のテクノロジー企業と合意に達している。さらに、 停止命令 同社は昨年提出した資料で、Perplexity のシステムにおける Reddit の言及が 40 倍に増加したと主張している。

報告内容

Redditは、さまざまなスクレイピングサービスが 反抽出措置を回避した この行為は産業規模の「データロンダリング経済」であると説明し、プラットフォームからのデータとGoogle検索結果を通じて収集された出版物からのデータを分析した。

訴訟では、パープレキシティはRedditのコンテンツを入手するために、これらのプロバイダーの少なくとも1つを使用していたと述べられている。 ライセンスを購読する プラットフォーム自体と連携し、抽出者は制御を回避するために身元と所在地を隠していたと考えられます。

関係者は誰ですか?

訴訟では、困惑に加えて、 オキシラボUAB(リトアニア)、AWMProxyドメイン(Redditでは旧ロシアのボットネットにリンクされていると説明されている)およびスタートアップ企業SerpApi(テキサス)にまで及ぶことで、この事件は米国とヨーロッパのアクターが混在する地図上に位置づけられることになる。

被告企業の対応

パープレキシティ社は、まだ正式な通知を受けていないと述べ、ユーザーの権利を積極的に擁護すると述べた。 自由かつ公平にアクセスする 同社は、AIを活用して責任ある方法で正確な回答を提供することを目指しているというアプローチを強調し、これを公開しました。

SerpApiの広報担当者は、この告発を完全に否定し、同社は 激しく自らを守るだろう 法廷では、オキシラボ側は驚きと失望を表明し、レディットから事前に連絡を受けていなかったと主張し、公開データの収集を擁護した。

AWMProxyに関しては、プラットフォームはそれが不可能であることを示しています コメントを集める エンティティの。

背景とライセンス契約

この法的措置は、Redditが開いた別の前線に追加されるものである。6月に同社はAI企業Anthropicに対して同様の訴訟を起こしており、 進行中 連邦裁判所に移送された後。

Redditは、数千のサブレディットと1000万人以上のユーザーで構成されるコミュニティを強調しています。 100日XNUMX億XNUMX万人のユーザーはインターネット上の会話の重要な情報源であり、そのため同社はモデルトレーニングのためにGoogle、OpenAI、その他の企業とライセンス契約を結んでいる。

株式市場では、訴訟の報道を受けて、レディット株は取引を終えた。 4%以上の減少 これは、AI分野のデータ紛争に対する市場の敏感さを反映している。

ヨーロッパとスペインへの影響

EUに拠点を置くオキシラボの存在は、論争にヨーロッパの視点をもたらし、議論を 公開データの利用、スクレイピング、および EU 法に基づく著作権の制限。

米国の訴訟以外にも、パブリッシャー、プラットフォーム、開発者を含む欧州のプレイヤーは、バランスがどうなるかを注視し続けている。 情報へのアクセス 著作権指令と AI に関する新たな規制枠組みを特徴とする文脈において、権利保護と使用条件付きで公開されます。

Redditが求めていることと次のステップ

同社は、 金銭的補償 詳細は不明だが、Perplexity が Reddit のデータを使用することを禁止する差し止め命令が出されており、権利が侵害されたかどうか、また差し止め命令の範囲については裁判所の判決が出るまで保留となっている。

手続きの時間と弁護側の適合性はまだ定義されていないが、すべてがこの事件を指し示している。 前例となるだろう 情報、知的財産、AI システムのトレーニングのニーズに対する公共の関心が衝突する分野です。

人間の会話の大規模なリポジトリを持つプラットフォームと人工知能企業との戦いが激化している。一方ではライセンス、他方ではスクレイピング疑惑をめぐり、RedditとPerplexityの争いは激化している。 新しいボードを示す オンライン データの価値、権限、制限が交渉される場所です。

ChatGPT-2からの購入方法
関連記事
ChatGPTでの購入:オンラインショッピングでAIを活用するための完全ガイド