AIコミュニティサイトが学習データの使用に対して補償を求める動き

2023年4月19日2025年1月9日

AIコミュニティサイトが学習データの使用に対して補償を求める動き

大規模なAIプロジェクトを立ち上げる企業は、従来、学習データの多くを無償で提供してきましたが、これが変わる可能性があります。スタックオーバーフローは、早ければ今年半ばにも、同社のサービスにある5000万件の質問と回答へのアクセス料を請求する予定であるとCEOが発表しました。これは、AI開発者による同社のデータの使用に対して補償を求める動きの一環であり、Redditも同様の措置を取ることを発表しました。

このような動きは、出版社の米業界団体「News/Media Alliance」によっても支持されており、生成AI開発者に対し、トレーニングなどの目的でデータを使用する場合は交渉し、公正な報酬を得る権利を尊重するよう求める原則を発表しました。

LLMと呼ばれる大規模言語モデルの開発において、Stack OverflowやRedditを含む何千ものオンラインソースからコンテンツを抽出したデータセットが使用されています。この技術は、AIテキストジェネレーターやチャットボットの開発に大きく貢献していますが、データにアクセスするためには費用がかかる可能性があります。

AI開発者にとっては、大規模なシステムを開発するために高価なコンピュータを必要とするため、データ使用にお金を支払うことは負担になりますが、適切な補償は高品質なLLMの開発を促進することにもつながると考えられます。しかし、貴重なデータを制限することは、一部のAIの訓練を抑止し、LLMの改善を遅らせる可能性もあるため、データの利用について議論が続くことが予想されます。

まとめ

AIコミュニティサイトであるStack OverflowやRedditが、学習データの使用に対して補償を求める動きを見せています。これは、大規模言語モデルの開発において、オンラインソースから抽出されたデータセットが使用されているためです。これにより、AIテキストジェネレーターやチャットボットの開発が大きく促進されていますが、データ使用に費用がかかる可能性があります。

AI開発者は、高価なコンピュータを必要とする大規模なシステムを開発するため、データ使用にお金を支払うことは負担になりますが、適切な補償は高品質なLLMの開発を促進することにつながると考えられます。ただし、データを制限することは、一部のAIの訓練を抑止し、LLMの改善を遅らせる可能性があるため、データ使用について議論が続くことが予想されます。

オンライン講座の紹介

最新のAI技術を使って、業務をよりスマートに行いたいと思いませんか？そんなあなたにおすすめなのが、ChatGPT・最新AI講座です！

この講座では、ChatGPTをはじめとする最新のAIツールを使いながら、実践的な方法を学ぶことができます。ビジネスやブログ記事、スライド資料、データ分析など、用途に合わせたAIツールの活用法を提供し、最適なプロンプト作成術を身につけることができます。

もし、あなたがAIに興味がある、または業務をより効率的に行いたいと思っているなら、ぜひこの講座を受講してみてください。きっとあなたの業務の効率化につながる知識が身につくことでしょう。講座の詳細はこちらからご確認ください。

→Udemy講座：【超実践的！】【ビジネスマン向け】ChatGPTを中心に最新AIツールを使いこなすためのわかりやすい講座

この記事を書いた人

comachi

神戸大学卒、中小企業診断士。システム開発会社にてITシステム導入支援、プロジェクトマネジメント業務に従事したのち、Webエンジニア兼・講師として独立。SaaS立ち上げ支援やエンジニアリング支援等を担当しています。Udemyでは、自身が強みを持つ「生成AI」「IT」や「財務会計」「管理会計」「業務効率化」を軸に、スキルアップ術・ノウハウを紹介しています。