# データは資産:DataFiが新しいブルーオーシャンを切り開く世界は最高の基盤モデルを構築する競争の時代にあります。計算能力やモデルアーキテクチャも重要ですが、本当の競争優位はトレーニングデータにあります。今月、AI界での最大のニュースはMetaが実力を示し、ザッカーバーグが人材を広く募り、中国人研究者を中心とした豪華なAIチームを結成したことです。チームリーダーは28歳のAlexander Wangで、彼が設立したScale AIは現在290億ドルの評価額を持ち、アメリカ軍、OpenAI、Anthropic、Metaなどの競争関係にある多くのAI大手にデータサービスを提供しています。Scale AIのコアビジネスは、大量の正確なラベル付きデータを提供することです。## AIのスケールアップのレシピScale AIが多くのユニコーンの中で際立つ理由は、AI産業におけるデータの重要性を早い段階で発見したからです。計算力、モデル、データはAIモデルの三大柱です。大規模モデルを人間に例えるなら、モデルは身体、計算力は食物、データは知識/情報です。LLMの急速な発展の過程で、業界の焦点はモデルから計算力への移行を経験しました。現在、多くのモデルがtransformerをフレームワークとして確立しており、時折MoEやMoReなどの革新が見られます。各大手は自社でスーパーコンピュータ集群を構築するか、クラウドサービスプロバイダーと長期契約を結んで計算力の問題を解決しています。基本的な計算力のニーズが解決された後、データの重要性が徐々に浮き彫りになっています。Scale AIはAIモデルのために堅固なデータ基盤を構築することに専念しており、そのビジネスは既存データの掘り起こしだけでなく、長期的なデータ生成ビジネスにも目を向けています。同社は異なる分野の人工専門家で構成されたAIトレーニングチームを通じて、AIモデルのトレーニングにより質の高いデータを提供します。! [資産としてのデータ:DataFiは新しいブルーオーシャンを開く](https://img-cdn.gateio.im/social/moments-833187943a7b99d3f3b1aa6c4281e397)## モデル訓練の二つの段階モデルのトレーニングは、事前トレーニングとファインチューニングの2つの部分に分かれています。人間の赤ちゃんが話すことを学ぶ過程に似た事前学習には、AIモデルにインターネットから収集した大量のテキストやコードなどの情報を入力する必要があり、モデルは自己学習を通じて基本的なコミュニケーション能力を習得します。ファインチューニングは学校に似ており、通常は明確な正解と方向性があります。異なる「学校」は異なる特徴を持つ「人材」を育成します。私たちはいくつかの注意深く準備された、ターゲットを絞ったデータセットを通じて、モデルが私たちの期待する能力を持つようにします。したがって、私たちは2種類のデータが必要です:1. あまり手を加える必要のない膨大なデータは、主に大規模UGCプラットフォームのクローラーデータ、公開文献データベース、企業のプライベートデータベースなどから来ています。2. 精密に設計され選別された専門データセットは、データのクレンジング、選別、アノテーション、人工フィードバックなどの作業が必要です。これらの二つのデータセットは、AIデータトラックの主体を構成しています。現在、計算能力の優位性が徐々に消失するにつれて、データが大規模モデルの企業が競争力を維持するための鍵になると広く考えられています。モデルの能力がさらに向上するにつれて、さまざまなより精密で専門的なトレーニングデータがモデルの能力を決定する重要な要素となります。モデルのトレーニングを武林の達人を育てることに例えるなら、質の高いデータセットは最上級の武功の秘訣です。長期的に見て、AIデータは雪だるま効果を持つ長期的なトラックです。初期作業の蓄積に伴い、データ資産は複利能力を持ち、価値は時間とともに増加します。! [資産としてのデータ:DataFiは新しい青い海を開いています](https://img-cdn.gateio.im/social/moments-3b7474fe7d6a646b19d553dc21b7d42d)## Web3 DataFi:AIデータの理想的な土壌従来のデータ企業と比べて、Web3はAIデータ分野において天然の優位性を持っており、それによりDataFiの概念が生まれました。理想的には、Web3 DataFiの利点には次のものが含まれます:1. スマートコントラクトはデータの主権、安全性、プライバシーを保証します2. 分散型アーキテクチャは、最も適したグローバルな労働力を引き付けます3. ブロックチェーンは明確なインセンティブと決済の利点を提供します4. 効率的でオープンなワンストップデータマーケットの構築に寄与する一般のユーザーにとって、DataFiは最も参加しやすい分散型AIプロジェクトです。ユーザーはシンプルにウォレットにログインするだけで、データ提供、モデル評価、AIツールを使った簡単な創作、データ取引など、さまざまなタスクを完了することで参加できます。## Web3 DataFiの潜在プロジェクト現在、複数のDataFiプロジェクトが大規模な資金調達を行っており、以下は代表的なプロジェクトの一部です:- Sahara AI:分散型AIのインフラと取引市場の構築に注力しています- Yupp:AIモデルフィードバックプラットフォーム、ユーザーによるモデル出力の評価を収集する- Vana:ユーザーの個人データをマネタイズ可能なデジタル資産に変換する- Chainbase:オンチェーンデータに焦点を当て、200以上のブロックチェーンをカバー- Sapien:人間の知識を高品質なAIトレーニングデータに変換する- Prisma X:ロボットのオープンコーディネーション層の構築に専念- Masa:Bittensorエコシステムのサブネットプロジェクトで、リアルタイムデータアクセスを提供します。- Irys:プログラム可能なデータストレージと計算に焦点を当てている- ORO:普通の人々がAIに貢献することを可能にする- Gata:分散型データ層で、さまざまなデータ参加方法を提供します。これらのプロジェクトは現在、一般的に障壁が低いですが、ユーザーとエコシステムの粘着性の蓄積とともに、プラットフォームの優位性が迅速に形成されます。初期のプロジェクトは、インセンティブとユーザーエクスペリエンスに重点を置いて、十分なユーザーを引き付けるべきです。同時に、これらのプラットフォームは人材管理やデータ品質の確保に注意を払い、"毛を剃る党"による劣貨排除現象を避ける必要があります。一部のプロジェクト、例えばSaharaやSapienは、データ品質を強調し、プラットフォームのユーザーとの長期的で健全な協力関係を築くために努力しています。さらに、透明性の向上も現在のオンチェーンプロジェクトが直面している課題の一つです。多くのプロジェクトは、Web3 DataFiの長期的な健全な発展を促進するために、オープンで透明な取り組みを加速させる必要があります。DataFiの大規模な採用は、二つの側面から進める必要があります。一つは、十分な数の個人ユーザーをデータ収集/生成に参加させ、AI経済の消費者群を形成することです。もう一つは、主流企業の認知を得ることです。なぜなら、短期的には彼らがデータの大口契約の主要な供給元だからです。! [資産としてのデータ:DataFiは新しい青い海を開いています](https://img-cdn.gateio.im/social/moments-c629c990916b7e1fbd4699663c3cbcff)## まとめある意味で、DataFiは人間の知性を利用して長期的に機械の知性を育てる一方で、スマートコントラクトを通じて人間の知的労働の利益を保障し、最終的には機械の知性からの恩恵を享受することです。AI時代に不安を抱く人や、ブロックチェーン分野で理想を持ち続ける人にとって、資本家の足跡を追ってDataFiに身を投じることは、流れに乗る選択肢と言える。
DataFi:Web3が推進するAIデータ資産化の新しいトレンド
データは資産:DataFiが新しいブルーオーシャンを切り開く
世界は最高の基盤モデルを構築する競争の時代にあります。計算能力やモデルアーキテクチャも重要ですが、本当の競争優位はトレーニングデータにあります。今月、AI界での最大のニュースはMetaが実力を示し、ザッカーバーグが人材を広く募り、中国人研究者を中心とした豪華なAIチームを結成したことです。チームリーダーは28歳のAlexander Wangで、彼が設立したScale AIは現在290億ドルの評価額を持ち、アメリカ軍、OpenAI、Anthropic、Metaなどの競争関係にある多くのAI大手にデータサービスを提供しています。Scale AIのコアビジネスは、大量の正確なラベル付きデータを提供することです。
AIのスケールアップのレシピ
Scale AIが多くのユニコーンの中で際立つ理由は、AI産業におけるデータの重要性を早い段階で発見したからです。
計算力、モデル、データはAIモデルの三大柱です。大規模モデルを人間に例えるなら、モデルは身体、計算力は食物、データは知識/情報です。
LLMの急速な発展の過程で、業界の焦点はモデルから計算力への移行を経験しました。現在、多くのモデルがtransformerをフレームワークとして確立しており、時折MoEやMoReなどの革新が見られます。各大手は自社でスーパーコンピュータ集群を構築するか、クラウドサービスプロバイダーと長期契約を結んで計算力の問題を解決しています。基本的な計算力のニーズが解決された後、データの重要性が徐々に浮き彫りになっています。
Scale AIはAIモデルのために堅固なデータ基盤を構築することに専念しており、そのビジネスは既存データの掘り起こしだけでなく、長期的なデータ生成ビジネスにも目を向けています。同社は異なる分野の人工専門家で構成されたAIトレーニングチームを通じて、AIモデルのトレーニングにより質の高いデータを提供します。
! 資産としてのデータ:DataFiは新しいブルーオーシャンを開く
モデル訓練の二つの段階
モデルのトレーニングは、事前トレーニングとファインチューニングの2つの部分に分かれています。
人間の赤ちゃんが話すことを学ぶ過程に似た事前学習には、AIモデルにインターネットから収集した大量のテキストやコードなどの情報を入力する必要があり、モデルは自己学習を通じて基本的なコミュニケーション能力を習得します。
ファインチューニングは学校に似ており、通常は明確な正解と方向性があります。異なる「学校」は異なる特徴を持つ「人材」を育成します。私たちはいくつかの注意深く準備された、ターゲットを絞ったデータセットを通じて、モデルが私たちの期待する能力を持つようにします。
したがって、私たちは2種類のデータが必要です:
あまり手を加える必要のない膨大なデータは、主に大規模UGCプラットフォームのクローラーデータ、公開文献データベース、企業のプライベートデータベースなどから来ています。
精密に設計され選別された専門データセットは、データのクレンジング、選別、アノテーション、人工フィードバックなどの作業が必要です。
これらの二つのデータセットは、AIデータトラックの主体を構成しています。現在、計算能力の優位性が徐々に消失するにつれて、データが大規模モデルの企業が競争力を維持するための鍵になると広く考えられています。
モデルの能力がさらに向上するにつれて、さまざまなより精密で専門的なトレーニングデータがモデルの能力を決定する重要な要素となります。モデルのトレーニングを武林の達人を育てることに例えるなら、質の高いデータセットは最上級の武功の秘訣です。
長期的に見て、AIデータは雪だるま効果を持つ長期的なトラックです。初期作業の蓄積に伴い、データ資産は複利能力を持ち、価値は時間とともに増加します。
! 資産としてのデータ:DataFiは新しい青い海を開いています
Web3 DataFi:AIデータの理想的な土壌
従来のデータ企業と比べて、Web3はAIデータ分野において天然の優位性を持っており、それによりDataFiの概念が生まれました。
理想的には、Web3 DataFiの利点には次のものが含まれます:
一般のユーザーにとって、DataFiは最も参加しやすい分散型AIプロジェクトです。ユーザーはシンプルにウォレットにログインするだけで、データ提供、モデル評価、AIツールを使った簡単な創作、データ取引など、さまざまなタスクを完了することで参加できます。
Web3 DataFiの潜在プロジェクト
現在、複数のDataFiプロジェクトが大規模な資金調達を行っており、以下は代表的なプロジェクトの一部です:
これらのプロジェクトは現在、一般的に障壁が低いですが、ユーザーとエコシステムの粘着性の蓄積とともに、プラットフォームの優位性が迅速に形成されます。初期のプロジェクトは、インセンティブとユーザーエクスペリエンスに重点を置いて、十分なユーザーを引き付けるべきです。
同時に、これらのプラットフォームは人材管理やデータ品質の確保に注意を払い、"毛を剃る党"による劣貨排除現象を避ける必要があります。一部のプロジェクト、例えばSaharaやSapienは、データ品質を強調し、プラットフォームのユーザーとの長期的で健全な協力関係を築くために努力しています。
さらに、透明性の向上も現在のオンチェーンプロジェクトが直面している課題の一つです。多くのプロジェクトは、Web3 DataFiの長期的な健全な発展を促進するために、オープンで透明な取り組みを加速させる必要があります。
DataFiの大規模な採用は、二つの側面から進める必要があります。一つは、十分な数の個人ユーザーをデータ収集/生成に参加させ、AI経済の消費者群を形成することです。もう一つは、主流企業の認知を得ることです。なぜなら、短期的には彼らがデータの大口契約の主要な供給元だからです。
! 資産としてのデータ:DataFiは新しい青い海を開いています
まとめ
ある意味で、DataFiは人間の知性を利用して長期的に機械の知性を育てる一方で、スマートコントラクトを通じて人間の知的労働の利益を保障し、最終的には機械の知性からの恩恵を享受することです。
AI時代に不安を抱く人や、ブロックチェーン分野で理想を持ち続ける人にとって、資本家の足跡を追ってDataFiに身を投じることは、流れに乗る選択肢と言える。