DataFi : le Web3 promeut une nouvelle tendance de l’assetisation des données par l’IA

robot
Création du résumé en cours

Les données sont des actifs : DataFi ouvre une nouvelle mer bleue

Le monde est actuellement dans une course pour construire le meilleur modèle de base. Bien que la puissance de calcul et l'architecture des modèles soient importantes, la véritable barrière est constituée par les données d'entraînement. La plus grande nouvelle du mois dans le domaine de l'IA est que Meta a montré sa force, avec Zuckerberg qui recrute largement, formant une équipe AI de luxe principalement composée de talents de recherche chinois. Le leader est Alexander Wang, 28 ans, dont Scale AI est actuellement évaluée à 29 milliards de dollars, fournissant des services de données à plusieurs géants de l'IA en concurrence, y compris l'armée américaine, OpenAI, Anthropic et Meta. Le cœur de métier de Scale AI est de fournir une grande quantité de données annotées précises.

La clé du succès de Scale AI

Scale AI se distingue parmi de nombreux licornes parce qu'elle a rapidement reconnu l'importance des données dans l'industrie de l'IA.

La puissance de calcul, le modèle et les données sont les trois grands piliers des modèles d'IA. Si l'on compare un grand modèle à une personne, alors le modèle est le corps, la puissance de calcul est la nourriture, et les données représentent le savoir/l'information.

Au cours du développement rapide des LLM, l'accent de l'industrie a évolué d'un modèle à la puissance de calcul. Actuellement, la plupart des modèles ont établi le transformer comme cadre, avec parfois des innovations comme MoE ou MoRe ; les grandes entreprises construisent soit leurs propres clusters de supercalcul, soit signent des contrats à long terme avec des fournisseurs de services cloud pour résoudre les problèmes de puissance de calcul. Une fois les besoins de base en puissance de calcul satisfaits, l'importance des données devient progressivement manifeste.

Scale AI s'engage à créer une base de données solide pour les modèles d'IA, son activité ne se limite pas à l'exploration des données existantes, mais se concentre également sur la génération de données à long terme. L'entreprise forme une équipe d'entraînement IA composée d'experts humains dans différents domaines pour fournir des données de meilleure qualité pour l'entraînement des modèles d'IA.

Les données sont des actifs : DataFi ouvre un nouvel océan bleu

Les deux phases de l'entraînement du modèle

L'entraînement du modèle se divise en deux parties : pré-entraînement et ajustement fin.

L'entraînement préliminaire imite le processus d'apprentissage du langage des bébés humains. Il nécessite d'alimenter le modèle AI avec une grande quantité de textes, de codes et d'autres informations extraites d'Internet, permettant au modèle d'acquérir des compétences de communication de base par auto-apprentissage.

Le fine-tuning est similaire à l'école, il y a généralement des réponses et des directions claires. Diffentes "écoles" formeront des "talents" avec des caractéristiques différentes. Nous utilisons des ensembles de données soigneusement préparés et ciblés pour doter le modèle des capacités que nous attendons.

Donc, nous avons besoin de deux types de données :

  1. Des données massives nécessitant peu de traitement, principalement issues de données de crawlers de grandes plateformes UGC, de bases de données de littérature publique, de bases de données privées d'entreprises, etc.

  2. Un ensemble de données professionnelles soigneusement conçu et sélectionné nécessite des travaux de nettoyage, de filtrage, d'annotation et de rétroaction manuelle.

Ces deux types de jeux de données constituent le cœur de la piste de données AI. Il est actuellement largement admis qu'avec la disparition progressive de l'avantage en matière de puissance de calcul, les données deviendront la clé pour les fabricants de grands modèles afin de maintenir leur compétitivité.

Avec l'amélioration des capacités du modèle, des données d'entraînement plus fines et spécialisées deviendront des facteurs clés déterminant la capacité du modèle. Si l'on compare l'entraînement du modèle à la formation d'experts des arts martiaux, alors un ensemble de données de haute qualité est le meilleur manuel d'arts martiaux.

À long terme, AI Data est une voie à long terme avec un effet boule de neige. Avec l'accumulation des travaux initiaux, les actifs de données auront la capacité d'intérêts composés, et leur valeur augmentera avec le temps.

Les données sont des actifs : DataFi ouvre un nouvel océan bleu

Web3 DataFi : le sol idéal pour les données AI

Comparé aux entreprises de données traditionnelles, le Web3 possède un avantage naturel dans le domaine des données AI, ce qui a donné naissance au concept de DataFi.

Idéalement, les avantages de Web3 DataFi comprennent :

  1. Les contrats intelligents garantissent la souveraineté des données, la sécurité et la confidentialité.
  2. L'architecture distribuée attire la main-d'œuvre mondiale la plus adaptée.
  3. La blockchain offre des avantages clairs en matière d'incitation et de règlement.
  4. Favorise la construction d'un marché de données unique, efficace et ouvert.

Pour les utilisateurs ordinaires, DataFi est le projet d'IA décentralisé le plus facile auquel participer. Les utilisateurs n'ont qu'à se connecter simplement à leur portefeuille pour participer en accomplissant diverses tâches, comme fournir des données, évaluer des modèles, utiliser des outils d'IA pour des créations simples, participer à des échanges de données, etc.

Projets potentiels de Web3 DataFi

Plusieurs projets DataFi ont déjà obtenu un financement important, voici quelques projets représentatifs :

  • Sahara AI : s'engage à créer une infrastructure et un marché d'échange décentralisés pour l'IA
  • Yupp : plateforme de retour d'expérience sur les modèles d'IA, recueillant les évaluations des utilisateurs sur les sorties des modèles.
  • Vana : Transformer les données personnelles des utilisateurs en actifs numériques monétisables.
  • Chainbase : Axé sur les données en chaîne, couvrant plus de 200 blockchains
  • Sapien : Transformer la connaissance humaine en données d'entraînement AI de haute qualité
  • Prisma X : S'efforcer de construire une couche de coordination ouverte pour les robots
  • Masa : projet de sous-réseau de l'écosystème Bittensor, offrant un accès aux données en temps réel
  • Irys : axé sur le stockage de données et le calcul programmables
  • ORO : permettre aux gens ordinaires de participer aux contributions de l'IA
  • Gata : couche de données décentralisée, offrant plusieurs moyens de participation aux données.

Ces projets ont actuellement des barrières relativement faibles, mais avec l'accumulation des utilisateurs et de la fidélité à l'écosystème, les avantages de la plateforme se formeront rapidement. Les projets en phase initiale devraient se concentrer sur les incitations et l'expérience utilisateur pour attirer un nombre suffisant d'utilisateurs.

En même temps, ces plateformes doivent également faire attention à la gestion des ressources humaines, à la garantie de la qualité des données, afin d'éviter le phénomène de "l'argent mauvais chassant l'argent bon" causé par les "aracheurs de poils". Certains projets comme Sahara et Sapien ont déjà commencé à souligner l'importance de la qualité des données et à s'efforcer d'établir des relations de coopération saines et durables avec les utilisateurs de la plateforme.

De plus, l'amélioration de la transparence est également un défi auquel les projets basés sur la blockchain sont confrontés actuellement. De nombreux projets doivent encore accélérer leur démarche d'ouverture et de transparence pour favoriser le développement sain à long terme de Web3 DataFi.

L'adoption à grande échelle de DataFi doit avancer sur deux fronts : d'une part, attirer suffisamment d'utilisateurs individuels pour participer à la collecte/génération de données, formant ainsi un groupe de consommateurs pour l'économie de l'IA ; d'autre part, obtenir la reconnaissance des entreprises mainstream, car à court terme, elles sont la principale source de gros volumes de données.

Les données sont des actifs : DataFi ouvre un nouvel océan bleu

Conclusion

D'une certaine manière, DataFi est l'utilisation de l'intelligence humaine pour cultiver l'intelligence machine à long terme, tout en garantissant, grâce aux contrats intelligents, les revenus du travail de l'intelligence humaine, pour finalement profiter des retours de l'intelligence machine.

Pour ceux qui sont remplis d'incertitude face à l'ère de l'IA, ou qui ont encore des idéaux dans le domaine de la blockchain, suivre les pas des magnats du capital pour s'engager dans le DataFi est sans doute un choix opportun.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 4
  • Partager
Commentaire
0/400
SneakyFlashloanvip
· Il y a 18h
Mince alors, 28 ans et 29 milliards. Je devrais vraiment faire des efforts.
Voir l'originalRépondre0
MetaMuskRatvip
· Il y a 19h
C'est encore Zack qui fait des siennes, mort de rire.
Voir l'originalRépondre0
NftDataDetectivevip
· Il y a 19h
on dirait que zuck comprend enfin... les données sont le nouveau pétrole fr fr
Voir l'originalRépondre0
AirdropChaservip
· Il y a 19h
Regarde, c'est un projet vraiment riche, il est temps de se positionner.
Voir l'originalRépondre0
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)