DataFi: Web3 impulsiona uma nova tendência na assetização de dados de IA

robot
Geração de resumo em curso

Dados são ativos: DataFi abre um novo mar azul

O mundo está numa corrida para construir os melhores modelos de base. Embora a capacidade de computação e a arquitetura do modelo sejam importantes, a verdadeira vantagem competitiva está nos dados de treinamento. A maior notícia deste mês no círculo da IA é que a Meta demonstrou sua força, com Zuckerberg recrutando talentos e formando uma equipe de IA de luxo composta principalmente por pesquisadores chineses. O líder é Alexander Wang, de 28 anos, que fundou a Scale AI, atualmente avaliada em 29 bilhões de dólares, fornecendo serviços de dados para várias gigantes da IA em competição, incluindo o exército dos EUA, OpenAI, Anthropic e Meta. O principal negócio da Scale AI é fornecer uma grande quantidade de dados rotulados precisos.

O caminho do sucesso da Scale AI

A razão pela qual a Scale AI conseguiu destacar-se entre as muitas unicórnios é porque percebeu cedo a importância dos dados na indústria de IA.

A capacidade de cálculo, o modelo e os dados são os três pilares dos modelos de IA. Se considerarmos um grande modelo como uma pessoa, então o modelo é o corpo, a capacidade de cálculo é a comida e os dados são o conhecimento/informação.

Durante o rápido desenvolvimento dos LLM, o foco da indústria passou de modelos para poder computacional. Atualmente, a maioria dos modelos estabeleceu o transformer como estrutura, com algumas inovações ocasionais como MoE ou MoRe; as grandes empresas ou constroem clusters de supercomputação, ou assinam acordos de longo prazo com prestadores de serviços em nuvem para resolver questões de poder computacional. Depois de atender às necessidades básicas de poder computacional, a importância dos dados começou a se destacar.

A Scale AI está empenhada em criar uma base de dados sólida para modelos de IA, com um negócio que não se limita à exploração de dados existentes, mas também se concentra na geração de dados a longo prazo. A empresa forma equipas de treino de IA compostas por especialistas humanos de diferentes áreas para fornecer dados de melhor qualidade para o treino dos modelos de IA.

Dados são ativos: DataFi está abrindo um novo mar azul

Duas fases do treinamento de modelos

O treinamento do modelo é dividido em duas partes: pré-treinamento e ajuste fino.

O pré-treinamento é semelhante ao processo de aprendizagem da fala de um bebê humano, necessitando da inserção de uma grande quantidade de textos, códigos e outras informações coletadas da internet no modelo de IA, permitindo que o modelo aprenda por conta própria a dominar as habilidades básicas de comunicação.

O fine-tuning é semelhante à escola, geralmente com respostas e direções claras de certo e errado. Diferentes "escolas" formam "talentos" com características distintas. Através de conjuntos de dados cuidadosamente preparados e direcionados, dotamos o modelo das capacidades que desejamos.

Portanto, precisamos de duas categorias de dados:

  1. Dados massivos que não precisam de muitos tratamentos, provenientes principalmente de plataformas UGC, dados de rastreamento, bases de dados de literatura pública, bases de dados privadas de empresas, entre outros.

  2. Conjuntos de dados profissionais cuidadosamente projetados e selecionados, que precisam passar por limpeza de dados, filtragem, rotulagem, feedback humano e outros trabalhos.

Estas duas categorias de conjuntos de dados constituem o núcleo da pista AI Data. Atualmente, é amplamente considerado que, à medida que a vantagem de computação desaparece gradualmente, os dados se tornarão a chave para os fabricantes de grandes modelos manterem sua competitividade.

Com o aprimoramento das capacidades do modelo, diversos conjuntos de dados de treinamento mais refinados e especializados se tornarão fatores-chave na determinação das capacidades do modelo. Se compararmos o treinamento de modelos à formação de mestres das artes marciais, então conjuntos de dados de alta qualidade são como os melhores manuais de técnicas marciais.

A longo prazo, AI Data é uma pista de longo prazo com efeito bola de neve. Com a acumulação do trabalho inicial, os ativos de dados terão capacidade de juros compostos, e o valor aumentará com o tempo.

Dados são ativos: DataFi está abrindo um novo mar azul

Web3 DataFi: O solo ideal para dados de IA

Comparado com as empresas de dados tradicionais, o Web3 tem uma vantagem natural no campo dos dados de IA, daí surgiu o conceito de DataFi.

Idealmente, as vantagens do Web3 DataFi incluem:

  1. Os contratos inteligentes garantem a soberania, segurança e privacidade dos dados
  2. A arquitetura distribuída atrai a força de trabalho global mais adequada
  3. A blockchain oferece vantagens claras de incentivo e liquidação
  4. Contribui para a construção de um mercado de dados único, eficiente e aberto.

Para usuários comuns, o DataFi é o projeto de IA descentralizada mais fácil de participar. Os usuários só precisam fazer login na carteira e podem participar completando várias tarefas, como fornecer dados, avaliar modelos, realizar criações simples usando ferramentas de IA, participar de transações de dados, entre outras.

Potenciais Projetos de Web3 DataFi

Atualmente, vários projetos DataFi receberam grandes investimentos, abaixo estão alguns projetos representativos:

  • Sahara AI: dedicado a criar a infraestrutura e o mercado de negociação para IA descentralizada
  • Yupp: Plataforma de feedback de modelos de IA, recolhe avaliações dos utilizadores sobre as saídas dos modelos.
  • Vana: transforma os dados pessoais dos usuários em ativos digitais monetizáveis.
  • Chainbase: Focado em dados on-chain, cobre mais de 200 blockchains
  • Sapien: Transformar o conhecimento humano em dados de treino de IA de alta qualidade
  • Prisma X: Dedicado a construir a camada de coordenação aberta para robôs
  • Masa: projeto de sub-rede do ecossistema Bittensor que oferece acesso a dados em tempo real.
  • Irys: Focado em armazenamento de dados programável e computação
  • ORO: capacitar pessoas comuns a contribuir para a IA
  • Gata: camada de dados descentralizada, oferece várias formas de participação em dados

Estes projetos atualmente têm barreiras geralmente baixas, mas à medida que a acumulação de usuários e a adesão ao ecossistema aumentam, as vantagens da plataforma se formarão rapidamente. Projetos iniciais devem focar em incentivos e na experiência do usuário para atrair um número suficiente de usuários.

Ao mesmo tempo, essas plataformas também precisam prestar atenção em como gerenciar a mão de obra, garantir a qualidade dos dados e evitar a ocorrência do fenômeno de "ruína pela má qualidade" causado por "rouba-pelo". Alguns projetos como Sahara e Sapien já começaram a enfatizar a qualidade dos dados, esforçando-se para estabelecer uma relação de cooperação saudável e de longo prazo com os usuários da plataforma.

Além disso, aumentar a transparência é também um desafio enfrentado pelos projetos em cadeia atualmente. Muitos projetos ainda precisam acelerar o passo em direção à abertura e transparência para promover o desenvolvimento saudável a longo prazo do Web3 DataFi.

A adoção em larga escala do DataFi precisa ser promovida a partir de duas frentes: primeiro, atrair um número suficiente de usuários individuais para participar da coleta/geração de dados, formando um grupo de consumidores da economia de IA; segundo, obter o reconhecimento de empresas mainstream, pois a curto prazo elas são a principal fonte de grandes quantidades de dados.

Dados são ativos: DataFi está abrindo um novo mar azul

Conclusão

De certa forma, DataFi é a utilização da inteligência humana para cultivar a inteligência das máquinas a longo prazo, ao mesmo tempo que garante, através de contratos inteligentes, os rendimentos do trabalho da inteligência humana, para finalmente desfrutar do retorno da inteligência das máquinas.

Para aqueles que estão cheios de incertezas sobre a era da IA, ou que ainda têm ideais no campo da blockchain, seguir os passos dos magnatas do capital e mergulhar no DataFi é, sem dúvida, uma escolha que vai ao encontro do que está em tendência.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 4
  • Partilhar
Comentar
0/400
SneakyFlashloanvip
· 19h atrás
Uau, 28 anos e 29 bilhões. Eu deveria me esforçar mais.
Ver originalResponder0
MetaMuskRatvip
· 19h atrás
É o Zack a fazer das suas de novo, morri a rir.
Ver originalResponder0
NftDataDetectivevip
· 19h atrás
parece que o zuck finalmente está a perceber... os dados são o novo petróleo fr fr
Ver originalResponder0
AirdropChaservip
· 19h atrás
Aproveite para observar, é um projeto realmente rentável, é hora de se posicionar.
Ver originalResponder0
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)