現在、業界内でAIエージェントの定義は、環境を認識し、適切な行動を取ることができるインテリジェントシステムを指します。センサーを通じて環境情報を取得し、処理を経てアクチュエーターを介して環境に影響を与えるものです(Stuart Russell & Peter Norvig, 2020)。私たちは、AIエージェントはLLM、RAG、記憶、タスク計画、およびツール使用能力を統合したアシスタントであると考えています。それは単に情報を提供するだけでなく、タスクを計画し、分解し、実際に実行することができます。
AIエージェントはWeb3+AIの次のトレンドになるのか 現在の発展状況と未来のトレンドを解析する
AIエージェントはWeb3+AIの救いの手になることができるか?
AIエージェントプロジェクトはWeb2の起業において人気があり成熟したタイプで主に企業向けサービスですが、Web3分野ではエコシステム構築における重要な役割のためにモデル訓練、プラットフォーム集合型プロジェクトが主流となっています。
現在、Web3のAIエージェントプロジェクトは数が少なく、全体の8%を占めていますが、それらのAI分野における時価総額の割合は23%にも達しています。したがって、強力な市場競争力を示しています。私たちは、技術の成熟と市場の認知度の向上に伴い、将来的には10億ドル以上の評価を受けるプロジェクトが多数登場することを予測しています。
Web3プロジェクトにおいて、AIコアではないアプリケーション端製品にAI技術を導入することは戦略的な優位性となる可能性があります。AIエージェントプロジェクトの結合方法は、全エコシステムの構築とトークン経済モデルの設計に重点を置く必要があり、分散化とネットワーク効果を促進することが重要です。
AIの波:プロジェクトの続出と評価の上昇の現状
ChatGPTが2022年11月に登場して以来、わずか2ヶ月で1億人以上のユーザーを引き付け、2024年5月にはChatGPTの月収が驚異的な2030万ドルに達しました。また、OpenAIはChatGPTのリリース後すぐにGPT-4やGP4-4oなどのバージョンアップを行いました。このような急速な動きにより、各大手テクノロジー企業はLLMなどの最前線AIモデルの重要性を認識し、自社のAIモデルやアプリケーションを次々と発表しています。例えば、Googleは大規模言語モデルPaLM2を発表し、MetaはLlama3をリリースし、中国の企業は文心一言や智谱清言などの大モデルを発表しました。明らかにAI分野は競争の激しい場となっています。
各大科技巨头の競争はビジネスアプリケーションの発展を促進するだけでなく、オープンソースAI研究の調査統計からもわかるように、2024年のAI Indexレポートによれば、GitHub上のAI関連プロジェクトの数は2011年の845件から2023年の約180万件に急増し、特にGPTのリリース後の2023年にはプロジェクト数が前年同期比で59.3%増加し、世界の開発者コミュニティのAI研究への熱意を反映しています。
AI技術への熱意は投資市場に直接反映されており、AI投資市場は強力な成長を示し、2024年の第2四半期には爆発的な成長を見せています。世界中で合計16件の1.5億ドルを超えるAI関連投資があり、これは第1四半期の2倍にあたります。AIスタートアップの資金調達総額は240億ドルに急増し、前年同期比で倍増しました。その中で、マスク氏のxAIは60億ドルを調達し、評価額は240億ドルに達し、OpenAIに次いで評価額が2番目に高いAIスタートアップとなりました。
! AIエージェントはWeb3+AIの命の恩人になれるか?
2024年第2四半期AIトラックファイナンスTOP10、出典:イーヨウ
AI技術の急速な発展は、かつてない速度でテクノロジー分野の地図を再構築しています。テクノロジーの巨人間の激しい競争から、オープンソースコミュニティプロジェクトの活発な発展、さらには資本市場のAIコンセプトへの熱心な追随まで、プロジェクトは次々と登場し、投資額は新たな高値を更新し、評価もそれに伴って高騰しています。全体的に見て、AI市場は急成長の黄金時代にあり、大型言語モデルと検索強化生成技術は言語処理分野で重大な進展を遂げています。それにもかかわらず、これらのモデルは技術的優位性を実際の製品に変える際に依然として課題に直面しています。例えば、モデル出力の不確実性、生成された不正確な情報に対する幻想的なリスク、そしてモデルの透明性の問題などです。これらの問題は、信頼性が非常に求められるアプリケーションシーンでは特に重要になります。
この背景の下で、私たちはAIエージェントの研究を開始しました。なぜなら、AIエージェントは実際の問題を解決し、環境と相互作用することの包括性を強調しているからです。この変化は、AI技術が純粋な言語モデルから、実際の問題を真に理解し、学習し、解決できるインテリジェントシステムへと進化していることを示しています。したがって、私たちはAIエージェントの発展から希望を見出しました。これはAI技術と実際の問題解決との間のギャップを徐々に埋めています。AI技術の進化は生産力の構造を絶えず再形成し、Web3技術はデジタル経済の生産関係を再構築しています。AIの三大要素:データ、モデル、計算能力が、Web3の分散型、トークン経済、スマートコントラクトなどの核心理念と融合することで、一連の革新的なアプリケーションが生まれると予見しています。この潜在能力に満ちた交差分野において、AIエージェントはその自律的なタスク実行能力により、大規模なアプリケーションを実現する巨大な潜力を示しています。
そのため、私たちはWeb3におけるAIエージェントの多様な応用について深く研究を始めました。Web3の基盤インフラ、中間層、アプリケーションレイヤー、データとモデル市場など、さまざまな次元から最も有望なプロジェクトタイプとアプリケーションシナリオを特定し評価することを目指し、AIとWeb3の深い融合を深く理解するためです。
概念の明確化:AIエージェントの紹介と分類の概要
基本的な紹介
AIエージェントの紹介の前に、読者がその定義とモデル自体の違いをよりよく理解できるように、実際のシナリオを例に挙げます:あなたが旅行を計画していると仮定します。従来の大規模言語モデルは目的地の情報や旅行の提案を提供します。検索強化生成技術は、より豊かで具体的な目的地のコンテンツを提供できます。そして、AIエージェントはアイアンマン映画のジャービスのように、ニーズを理解し、あなたの一言に基づいてフライトやホテルを積極的に検索し、予約を実行し、スケジュールをカレンダーに追加します。
現在、業界内でAIエージェントの定義は、環境を認識し、適切な行動を取ることができるインテリジェントシステムを指します。センサーを通じて環境情報を取得し、処理を経てアクチュエーターを介して環境に影響を与えるものです(Stuart Russell & Peter Norvig, 2020)。私たちは、AIエージェントはLLM、RAG、記憶、タスク計画、およびツール使用能力を統合したアシスタントであると考えています。それは単に情報を提供するだけでなく、タスクを計画し、分解し、実際に実行することができます。
この定義と特性に基づいて、私たちはAIエージェントがすでに私たちの生活に統合されていることを発見できます。AlphaGo、Siri、テスラのL5レベル以上の自動運転など、さまざまなシーンで応用されています。これらのシステムの共通の特質は、外部のユーザー入力を感知し、それに基づいて現実の環境に影響を与えることができる点です。
ChatGPTの例を用いて概念を明確にするために、TransformerはAIモデルを構成する技術的アーキテクチャであることを明確に指摘する必要があります。GPTはこのアーキテクチャに基づいて発展したモデル系列であり、GPT-1、GPT-4、GPT-4oはそれぞれ異なる発展段階のバージョンを表しています。ChatGPはGPTモデルに基づいて進化したAIエージェントです。
分類プロファイル
現在、AIエージェント市場は統一された分類基準を形成していません。私たちは、Web2とWeb3市場の204のAIエージェントプロジェクトにラベルを付ける方法で、各プロジェクトに対応する顕著なラベルに基づいて、一次分類と二次分類に分けました。その中で、一次分類は基盤構築、コンテンツ生成、ユーザーインタラクションの3つのカテゴリーに分けられ、さらに実際のユースケースに基づいて細分化されています。
基礎インフラストラクチャ:このタイプは、エージェント分野の比較的基本的な内容の構築に焦点を当てており、プラットフォーム、モデル、データ、開発ツール、および成熟した基本アプリケーションのB2Bサービスを含みます。
開発ツール:開発者にAIエージェントを構築するための支援ツールとフレームワークを提供します。
データ処理タイプ:さまざまな形式のデータを処理および分析し、主に意思決定を支援し、トレーニングのためのソースを提供します。
モデル訓練タイプ:AI向けのモデル訓練サービスを提供し、推論、モデルの構築、設定などを含みます。
B2Bサービス:主に企業ユーザーを対象とし、企業サービス、垂直型、オートメーションのソリューションを提供します。
プラットフォーム集約型:多種多様なAIエージェントサービスとツールを統合するプラットフォーム。
インタラクティブタイプ:コンテンツ生成タイプに似ていますが、持続的な双方向のインタラクションが異なります。インタラクティブエージェントは、ユーザーのニーズを受け入れ理解するだけでなく、自然言語処理(NLP)などの技術を通じてフィードバックを提供し、ユーザーとの双方向のインタラクションを実現します。
感情的なサポートを提供するAIエージェント。
GPTクラス:GPT(生成的事前学習トランスフォーマー)モデルに基づくAIエージェント。
検索タイプ:検索機能に特化し、より正確な情報検索を提供するエージェント。
コンテンツ生成型:このタイプのプロジェクトは、ユーザーの指示に基づいてさまざまな形式のコンテンツを生成する大規模モデル技術を利用してコンテンツの作成に特化しています。テキスト生成、画像生成、動画生成、音声生成の4つのカテゴリに分かれています。
! AIエージェントはWeb3+AIの命の恩人になれるか?
Web2 AI Agentの開発状況の分析
私たちの統計によると、Web2の従来のインターネットにおけるAIエージェントの開発は、明らかなセクター集中傾向を示しています。具体的には、約3分の2のプロジェクトが基盤インフラストラクチャに集中しており、その中で主にB2Bサービスや開発ツールが多く見られます。この現象についてもいくつかの分析を行いました。
技術成熟度の影響:インフラストラクチャプロジェクトが主導的な地位を占める理由は、まずその技術成熟度にあります。これらのプロジェクトは通常、時間の試練に耐えた技術とフレームワークの上に構築されており、開発の難易度とリスクを低減します。AI分野における「シャベル」に相当し、AIエージェントの開発と応用に堅固な基盤を提供します。
市場の需要の推進:もう一つの重要な要因は市場の需要です。消費者市場と比較して、企業市場はAI技術に対する需要がより切実であり、特に運営効率を向上させ、コストを削減するソリューションを求めています。同時に、開発者にとって企業からのキャッシュフローは比較的安定しており、彼らが後続のプロジェクトを開発するのに有利です。
アプリケーションシーンの制限:同時に、私たちはB2B市場におけるコンテンツ生成AIのアプリケーションシーンが相対的に限られていることに注意しました。生成物の不安定性のため、企業は生産性を安定して向上させることができるアプリケーションを好む傾向があります。これにより、プロジェクトライブラリにおけるコンテンツ生成AIの占有率は比較的小さくなっています。
このトレンドは、技術の成熟度、市場の需要、そしてアプリケーションシナリオの実際の考慮を反映しています。AI技術の進歩と市場の需要がさらに明確になるにつれて、この構造が調整される可能性がありますが、インフラストラクチャー関連は依然としてAIエージェントの発展の堅固な基盤となるでしょう。
Web2のAIエージェントのリーディングプロジェクト分析
! AIエージェントはWeb3+AIの命の恩人になれるか?
Web2のAIエージェントリーダープロジェクトの整理、出典:ArkStreamプロジェクトデータベース
私たちは現在のWeb2市場におけるAIエージェントプロジェクトを深く掘り下げ、Character AI、Perplexity AI、Midjourneyの3つのプロジェクトを例に分析を行います。
キャラクターAI:
製品紹介:Character.AIは、人工知能に基づく対話システムとバーチャルキャラクター作成ツールを提供しています。このプラットフォームでは、ユーザーがバーチャルキャラクターを作成、訓練し、自然言語対話を行い、特定のタスクを実行できるキャラクターと対話することが可能です。
データ分析:Character.AIの5月の訪問者数は2.77億で、プラットフォームには350万人以上のデイリーアクティブユーザーが存在します。その大部分のユーザーは18歳から34歳の間であり、若年層のユーザー群の特徴を示しています。Character AIは資本市場で優れたパフォーマンスを示し、1.5億ドルの資金調達を完了し、評価額は10億ドルに達しました。a16zがリード投資しました。
テクニカル分析:Character AIは、Googleの親会社であるAlphabetと自社の大規模言語モデルを使用するための非独占ライセンス契約を締結しました。これは、Character AIが自社開発の技術を採用していることを示しています。言及すべきは、会社の創設者であるNoam ShazeerとDaniel De FreitasがGoogleの対話型言語モデルLlamaの開発に関与していたことです。
パープレキシティAI:
製品紹介:Perplexityはインターネットから情報を取得し、詳細な回答を提供することができます。引用と参照リンクにより情報の信頼性と正確性が確保されており、ユーザーが質問を続けたりキーワードを検索したりするのを教育し、導くことで、ユーザーの多様な問い合わせニーズを満たします。
データ分析:Perplexityの月間アクティブユーザー数は1000万人に達し、2月にはモバイルおよびデスクトップアプリケーションのアクセスが8.6%増加し、約5000万人のユーザーを引き付けました。資本市場では、Perplexity AIが最近6270万ドルの資金調達を発表し、評価額は10.4億ドルに達しました。主な出資者はダニエル・グロスで、参加者にはスタン・ドラッケンミラーやNVIDIAが含まれています。
技術分析:Perplexityが使用している主要なモデルは、微調整されたGPT-3.5と、オープンソースの大規模モデルを微調整した2つの大型モデル:pplx-7b-onlineとpplx-70b-onlineです。このモデルは専門的な学術研究や特定の分野のクエリに適しており、情報の真実性と信頼性を確保します。
ミッドジャーニー:
製品紹介:ユーザー