DataFi:Web3推动AI数据资产化新趋势

robot
摘要生成中

数据即资产:DataFi 开启新蓝海

全球正处于竞相构建最佳基础模型的时代。虽然计算能力和模型架构很重要,但真正的护城河是训练数据。本月AI圈最大的新闻是Meta展现实力,扎克伯格广招人才,组建了一支以华人科研人才为主的豪华AI团队。领队是28岁的Alexander Wang,他创建的Scale AI目前估值290亿美金,为包括美国军方、OpenAI、Anthropic、Meta等在内的多家有竞争关系的AI巨头提供数据服务。Scale AI的核心业务是提供大量准确的标注数据。

Scale AI的成功之道

Scale AI之所以能在众多独角兽中脱颖而出,是因为它早早发现了数据在AI产业中的重要性。

算力、模型、数据是AI模型的三大支柱。如果将大模型比作一个人,那么模型是身体、算力是食物,而数据则是知识/信息。

在LLM快速发展的过程中,业界的重点经历了从模型到算力的转移。目前大多数模型都已确立了transformer作为框架,偶尔有MoE或MoRe等创新;各大巨头或自建超级计算集群,或与云服务商签订长期协议解决算力问题。在解决了算力的基本需求后,数据的重要性逐渐凸显。

Scale AI致力于为AI模型打造坚实的数据基础,其业务不仅包括对现有数据的挖掘,还着眼于长远的数据生成业务。该公司通过不同领域的人工专家组成AI训练团队,为AI模型的训练提供更优质的数据。

数据即资产:DataFi 正在开启新蓝海

模型训练的两个阶段

模型训练分为预训练和微调两个部分。

预训练类似人类婴儿学习说话的过程,需要向AI模型输入大量从网上爬取的文本、代码等信息,让模型通过自学掌握基本的沟通能力。

微调则类似上学,通常有明确的对错、答案和方向。不同的"学校"会培养出不同特点的"人才"。我们通过一些精心准备的、有针对性的数据集,使模型具备我们期望的能力。

因此,我们需要两类数据:

  1. 无需太多处理的海量数据,主要来自大型UGC平台的爬虫数据、公开文献数据库、企业私有数据库等。

  2. 经过精心设计和筛选的专业数据集,需要进行数据清洗、筛选、标注、人工反馈等工作。

这两类数据集构成了AI Data赛道的主体。目前普遍认为,随着算力优势的逐渐消失,数据将成为大模型厂商保持竞争力的关键。

随着模型能力的进一步提升,各种更精细、专业的训练数据将成为决定模型能力的关键因素。如果将模型训练比作培养武林高手,那么优质的数据集就是最上乘的武功秘籍。

从长远来看,AI Data是一个具有滚雪球效应的长期赛道。随着前期工作的积累,数据资产将具备复利能力,价值会随时间增长。

数据即资产:DataFi 正在开启新蓝海

Web3 DataFi:AI Data的理想土壤

相比传统数据公司,Web3在AI数据领域具有天然优势,由此诞生了DataFi概念。

理想情况下,Web3 DataFi的优势包括:

  1. 智能合约保障数据主权、安全和隐私
  2. 分布式架构吸引最适合的全球劳动力
  3. 区块链提供明确的激励和结算优势
  4. 有利于构建高效、开放的一站式数据市场

对普通用户而言,DataFi是最容易参与的去中心化AI项目。用户只需简单登录钱包,就可以通过完成各种任务参与其中,如提供数据、对模型进行评估、利用AI工具进行简单创作、参与数据交易等。

Web3 DataFi的潜力项目

目前已有多个DataFi项目获得大额融资,以下是部分代表性项目:

  • Sahara AI:致力于打造去中心化AI的基础设施和交易市场
  • Yupp:AI模型反馈平台,收集用户对模型输出的评价
  • Vana:将用户个人数据转化为可货币化的数字资产
  • Chainbase:聚焦链上数据,覆盖200多条区块链
  • Sapien:将人类知识转化为高质量AI训练数据
  • Prisma X:致力于构建机器人的开放协调层
  • Masa:Bittensor生态的子网项目,提供实时数据访问
  • Irys:专注于可编程数据存储和计算
  • ORO:赋能普通人参与AI贡献
  • Gata:去中心化数据层,提供多种数据参与方式

这些项目目前壁垒普遍不高,但随着用户和生态粘性的积累,平台优势将迅速形成。早期项目应该在激励措施和用户体验上着重发力,吸引足够的用户。

同时,这些平台也需要注意如何管理人工、保障数据质量,避免出现"撸毛党"导致的劣币驱逐良币现象。一些项目如Sahara、Sapien已开始强调数据质量,努力与平台用户建立长期健康的合作关系。

此外,提高透明度也是当前链上项目面临的一个挑战。许多项目仍需加快开放、透明的步伐,以促进Web3 DataFi的长期健康发展。

DataFi的大规模采用需要从两个方面推进:一是吸引足够多的个人用户参与数据采集/生成,形成AI经济的消费者群体;二是获得主流企业的认可,因为短期内它们是数据大单的主要来源。

数据即资产:DataFi 正在开启新蓝海

结语

从某种角度看,DataFi是用人类智能长期培育机器智能,同时通过智能合约保障人类智能劳动的收益,最终享受机器智能的回馈。

对于那些对AI时代充满不确定性,或在区块链领域仍怀有理想的人来说,跟随资本大佬的脚步投身DataFi,不失为一个顺势而为的选择。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 4
  • 分享
评论
0/400
SneakyFlashloanvip
· 18小时前
妈耶 28岁就290亿 我该努努力了
回复0
MetaMuskRatvip
· 18小时前
又是扎克搞事情 笑死
回复0
NFT数据侦探vip
· 18小时前
看起来扎克终于明白了……数据才是真正的新石油
查看原文回复0
空投追逐者vip
· 19小时前
蹲蹲看 真有钱的项目 是时候布局了
回复0
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)