RedditのIPOから学ぶLLMデータライセンス・広告生成AI戦略

ソフトウエア

先日、米大手の掲示板型ソーシャルニュースサイトのRedditがIPOを発表しました。

IPOの詳細はSECのS-1の資料で公表されていますが、Redditは上場に伴い生成AIの活用の戦略を公開しています。

この記事では、掲示板型のソーシャルニュースサイトのRedditがどのように生成AIを活用して利益を上げていくのか、IPO関連の情報から分析していきます。

redditinc.com

 ✍️ 要点

  • RedditはIPOを発表し、SECのS-1資料でAI企業とのデータライセンス契約を含む生成AI活用戦略を公開。Googleとの6000万ドル年間契約など、総額2億ドル以上の契約が示され、AIモデルトレーニング用のRedditデータの活用を可能にしています。
  • Redditは広範囲なユーザー生成コンテンツを持ち、10億件超の投稿と160億件超のコメントを有し、米国でトップ10のアクセス数を誇る。この豊富なデータを基に、AIとの統合によるサービスの改善や新機能の開発に注力しています。
  • 主要収益源はオンライン広告であり、2023年には収益の98%を占める804億ドルを記録。しかし、19年間の運営で収益性を確保できず、年間約1億ドルの損失を出していることから、AIを活用した新しい広告モデルやユーザーエコノミーの強化に向けた戦略が重要視されています。
  • 広告事業の拡充として、キーワード提案機能や動的ショッピング広告のテスト実施など、AIを利用した広告主向けのソリューションを開発。これにより、広告出稿の最適化やユーザーへの適切な商品提供を目指しています。
  • IPO資料では、データライセンスビジネスモデルのリスクも詳細に説明されており、契約の不確実性、商用市場の発展の不透明性、AIの規制リスクなどが指摘されている。これらはRedditにとって重要な考慮事項であり、将来のビジネス戦略に影響を与える可能性がある。

RedditがAI企業と契約したデータライセンス

Redditは、IPOの申請書の一部として、AI企業とのデータライセンス契約を公開しました。 これらの契約は2億ドル以上の価値があり、AIモデルにRedditのデータを合法的にトレーニングする能力を与えています。

そのうちの1つの取引がGoogleとのもので、年間6000万ドルの契約であることがわかっています。Reddit は Google と契約を結び、AIモデルのトレーニングや Google 検索などのサービスの改善にRedditの投稿を使用できるようにしたのです。

redditinc.com

世の流れとして、Redditだけではなく、大手ニュースメディアも同様にデータライセンスを協議しています。つまり、AI企業がライセンスと合成データに注力しており、独自のデータが競争力を持つ重要性が高まっていることが示されています。今後、AI企業とデータ提供元との間で重要な取引が行われることを示唆しているのです。

Redditは、様々なトピックが投稿できるタイムリーで人間の同士の会話を記録した広大なアーカイブなのです。

検索、AI トレーニング、研究など、さまざまな目的に使用できる貴重なデータセットということです。(ちなみに、Twitterもデータの質としては同様にLLMにとって重要ですが、彼らは自社のモデルを作っており、LLMのメイン戦略が分かれています。)

sec.gov

Redditのコミュニティは、独自の 3 層モデレーションモデルで組まれており、ユーザーがプラットフォームや投稿の質を担保して責任を共有する独自のガバナンスモデルを採用しており、人間の興味関心をAIに学習させるにはもってこいということです。

sec.gov

2023 年 12 月 31 日までに 10 億件を超える投稿と 160 億件を超えるコメントがあり、2023 年 12 月には米国で最もアクセス数の多いサイトのトップ 10 に入っています。

sec.gov

Redditは、2023年の収益成長率を20%と開示していますが、その中核ビジネスはオンライン広告がメインとなっています。この収益の多角化に生成AIを活用しようというわけです。

sec.gov

Redditは以前からNFTのアバター活用など新しい技術を取り込み、広告以外のビジネスに取り組むことに積極的なため、生成AIもどのように活用するのか、必死に考えているわけです。

必死になるのもそのはずで、Redditは広告を主な収益源としており、2023年には収益の804億ドルのうち98%が広告から得られています。残りの2%はRedditプレミアムサブスクリプションやユーザーエコノミー内の製品(Reddit Gold / Avatars)から得られています。

しかも、Redditは19年間存在していますが、未だに収益性を確保できておらず、年間で約1億ドルの損失を出しています。RedditのR&D費用は2023年には収益の55%に相当する4億3800万ドルであり、これはかなり高いと言えます。

それゆえ、RedditのIPOにおけるデータライセンスの収益モデルがどれだけ価値があるかについての期待が高まっており、これが会社の評価を正当化する可能性があるとされています。

しかも、実はOpenAIのCEOであるサム・アルトマンはRedditの9%ほどの株式をもっているので、公表してないだけで協業を進めている可能性は大いにあります。

sec.gov
sec.gov

ちなみに、生成 AI×自社データ活用においては、生成AIを使用してユーザーがコミュニティ ルールに準拠した投稿やコメントを作成できるようにしたり、関連性の高いコンテンツをレコメンドしたり、コンテンツ翻訳の取り組みを拡大したりする実験も行っていると書かれています。

ライセンスはもちろんのこと、プラットフォーム自体の満足度を生成AIで上げることでデータライセンスの価値も維持する戦略です。

Redditの生成AI×広告のグロース戦略

Redditは、従来から、広告プラットフォームの拡充を通じてビジネス成長を図り、広告主に有益なコンテンツとブランド体験を提供することでユーザーとの一体感を生み出すことを目指しています。

そして、IPOの資料では、従来の広告のビジネスに加えて、Redditはデータライセンスとユーザーエコノミーによる成長戦略を掲げています。

sec.gov

データライセンスに関しては、Redditの豊富なユーザー生成コンテンツを活用し、AIモデルトレーニングとAPIによる新たな市場機会を追求します。ユーザーエコノミーは、マイクロタスクの売買やスニーカーなどの専用のマーケットプレイスや開発者向けの機会を強化していくそうです。

ちなみに、APIや開発者向けサービスとしては、サードパーティ アプリケーションの構築、行動分析、アルゴリズム取引などの顧客のユースケースを可能にする計画があります。余談ですが、Web3版RedditのFarcasterをみると、独自のクライアントが増える未来もあるかもしれません。

さて、IPOの資料では、広告事業についても生成AIの活用が示唆されています。

Redditはもともと、広告主向けにReddit Ads Managerという広告管理システムを運営しており、昨年には、AIを活用したKeyword Suggestionsという新機能を出しています。

redditinc.com

これは、機械学習を使用して関連キーワードを生成し、キーワードを月間Reddit閲覧数でランク付けし、各広告主の要件に最も適合するRedditの投稿や会話を選択することで、広告出稿を最適化できるものです。

こうした広告主向けのビジネスに加えて、Redditは動的ショッピング広告をテスト中しているそうです。これは、広告主が商品カタログをアップロードし、カタログから広告を自動的に生成し、適切な商品を適切なRedditのチャンネルや会話上で適切なユーザーに提供することを目指しています。

sec.gov

消費者が購入を決定するまさにその瞬間に広告主が表示できるよう、会話などの文脈に関連したスペースにショッピング広告の導入を考えているわけです。

また、将来的には広告業務の自動化がさらに進み、パートナーシップと需要創出によって、より多くの中小企業が利用しやすくなるようなユースケースも検討しています。

例えば、生成AIを活用して顧客の Web サイトやランディング ページをスクレイピングして Reddit 上に広告を簡単に作成するなど、スケーラブルなクリエイティブ アセット サポートを提供することで、中小企業が Reddit での視聴者とパフォーマンスを解放できるようにする計画もあります。

具体的には、広告主のクリエイティブ サービスとして、クリエイティブ リソースが限られている広告主が生成 AI を通じて Reddit に適した複数の広告ヘッドラインを迅速に作成できるようにする「AI Headline Generator」を開始しているとも書かれています。

広告主はウェブサイトを提供するだけで、Reddit は広告マネージャー内でキャンペーンの複数の広告見出しを動的に生成できます。

ここからも広告主分野に特化したソリューションに注力するそうで、AI×広告により力いれるようです。

Redditの生成AIビジネスのリスク

ただし、IPOの資料では、当然ながら投資家向けにリスクの説明があります。

例えば機械学習や AI トレーニングを目的としたデータのライセンス供与は、実績が確立されていない斬新なビジネス モデルであるため、将来の見通しや、この機会を利用して実行しようとする際に遭遇する可能性のあるリスクや課題を評価することが困難である、と述べています。

  • Redditは少数のパートナーと中期的なデータ契約を交渉しているが、契約は更新されない可能性がある。
  • より少ないサービスをより低い価格で使用するなど、あまり有利ではない条件に基づいて更新される場合もある。
  • データライセンス契約には、API パフォーマンス要件を含む利用規約が適用されており、これを満たせない場合がある。
  • 当社の既存のデータ ライセンス契約は終了されるか、更新されないか、または不利な条件で更新される場合がある。
  • 大規模な言語モデルの商用市場は発展しない可能性があり、規制やその他の要因によって制限される可能性がある。
  • AI トレーニング目的のデータの価値は時間の経過とともに減少する可能性があり、同様の条件での取り決めを確保できない可能性もある。
  • データライセンス契約には Reddit データの悪用や悪用に対する保護が含まれていますが、パートナーの不正行為を適切に制御したり、外部およびコミュニティに関する当社の評判を適切に保護したりできない可能性がある。
  • AI は米国のさまざまな政府機関や規制機関による進化する審査の対象となっており、米国のさまざまな州やその他の外国の法域は、プラットフォームのモデレーション、サイバーセキュリティ、およびデータ保護法を AI に適用または適用することを検討している。

といったリスクが列挙されており、どれもRedditにとってはバッドシナリオでありながら、実現性は十分にあるものも含まれているでしょう。

さらに、競合他社のパートでは、Google、Amazon、YouTube、Wikipedia、X、およびその他のニュース サイトに加えて、ChatGPT、Gemini、Anthropic などのLLMも競合としてリストされています。

sec.gov

データライセンスを行う他方で、情報収集に関してはLLMを競合として注意を向けていることもわかります。

たしかに、LLMにおいては、モデル自体の小規模化の流れもあるため、データライセンスを一生つづけるというよりかは、そのアライアンスを通じてユースケースを生み出すナレッジをためていくつもりなのかもしれません。

以上のように、Redditでは、既存の広告ビジネス以外の柱を立てる必要性と、LLMの学習との相性の良さが相まって、データライセンスおよび広告×生成AIの戦略が立ち上がろうとしています。

自社のユーザーデータがLLMの特定の用途での学習ニーズがあることや、広告モデルへの転用ができる場合は、Redditの事例を参考にしながら自社活用を議論してみると良いと思われます。

調査手法について

こちらの記事はデスクリサーチAIツール/エージェントのDeskrex.AIを使って作られています。DeskRexは市場調査のテーマに応じた幅広い項目のオートリサーチや、レポート生成ができるAIデスクリサーチツールです。

調査したいテーマの入力に応じて、AIが深堀りすべきキーワードや、広げるべき調査項目をレコメンドしながら、自動でリサーチを進めることができます。

また、ワンボタンで最新の100個以上のソースと20個以上の詳細な情報を調べもらい、レポートを生成してEmailに通知してくれる機能もあります。

ご利用をされたい方はこちらからお問い合わせください。

また、生成AI活用におけるLLMアプリ開発や新規事業のリサーチとコンサルティングも受け付けていますので、お困りの方はぜひお気軽にご相談ください。

ソフトウエア広告・出版・マスコミ

メディアを購読する

メディアの更新をメールでお知らせします。

冨田到をフォローする

コメント

タイトルとURLをコピーしました