Poder de computação: um novo modelo de negócio na onda de escassez e oportunidades.

Poder de computação torna-se um novo modelo de negócios A onda de grandes modelos impulsiona a transformação da indústria

A premissa para a conquista do poder de computação é que o poder de computação está se tornando um novo modelo de negócios. A onda de treinamento de grandes modelos irá eventualmente diminuir, e os provedores de serviços de poder de computação precisam se preparar com antecedência e ajustar sua direção a tempo.

Recentemente, um pesquisador que se formou na Universidade Tsinghua há 3 anos utilizou 200 placas de GPU e gastou cerca de 2 meses para treinar um grande modelo na área de meteorologia, com um número de parâmetros na ordem das centenas de milhões. Calculando o custo do uso da GPU a 7,8 yuan por hora, o custo de treinamento desse modelo pode ultrapassar 2 milhões de yuan. E se o modelo treinado for um modelo grande e genérico, o custo pode aumentar cem vezes.

Atualmente, a China já possui mais de 100 grandes modelos com uma escala de 10 bilhões de parâmetros. No entanto, o treinamento de grandes modelos, que atraiu uma grande quantidade de empresas, enfrenta a dificuldade da escassez de GPUs de alta performance. O custo do poder de computação é elevado, e a falta de poder de computação e de financiamento tornou-se o problema mais direto que a indústria enfrenta.

A escassez de GPUs de alta gama tornou-se um problema reconhecido na indústria. No auge, o preço de uma placa NVIDIA A100 chegava a duzentas ou trezentas mil yuan, e o aluguel mensal de um servidor A100 também subiu para 50-70 mil yuan. Mesmo assim, um preço elevado não garante a compra do chip, pois alguns fornecedores também enfrentaram situações de inadimplência por parte dos fornecedores.

Um executivo de uma empresa de computação em nuvem afirmou: "Temos muitos clientes que desejam recursos de GPU de alto desempenho, mas a oferta atual não consegue atender completamente à ampla demanda do mercado."

É amplamente considerado na indústria que, com a intensa competição no mercado de grandes modelos, o setor passará de uma fase de euforia para uma fase de racionalidade, e as empresas também controlarão custos e ajustarão suas estratégias com base nas mudanças esperadas.

Perante a escassez de poder de computação, as empresas estão a explorar várias formas de resposta:

  1. Utilizar dados de maior qualidade para melhorar a eficiência do treinamento
  2. Melhorar a capacidade da infraestrutura, alcançando funcionamento estável por longos períodos acima de mil calorias.
  3. Otimizar o agendamento de recursos de poder de computação, aumentar a taxa de utilização
  4. A transição da arquitetura de computação em nuvem para a arquitetura de supercomputação reduz custos
  5. Usar plataformas de GPU nacionais em vez de Nvidia

No entanto, esses métodos representam um enorme esforço para as empresas em geral. Assim, muitas equipes de algoritmos optam por colaborar com prestadores de serviços de poder de computação especializados. Apenas clusters de GPU de nível quilocalórico podem alcançar economias de escala, e escolher prestadores de serviços de poder de computação pode reduzir os custos marginais.

Com a popularização da aplicação da inteligência artificial, torna-se crucial permitir que as pequenas e médias empresas utilizem recursos de poder de computação de forma conveniente e a baixo custo. Seja pela demanda urgente de grandes modelos por poder de computação, ou pelos vários desafios a serem resolvidos na aplicação do poder de computação, tudo isso demonstra que o poder de computação já se tornou um novo modelo de serviço.

O essencial do serviço de poder de computação é alcançar uma saída unificada de poder de computação heterogêneo através de novas tecnologias de computação, integrando-se com tecnologias como computação em nuvem, big data e IA. Ele inclui não apenas poder de computação, mas também a integração de recursos como armazenamento, rede, entre outros, entregues sob a forma de APIs.

Na cadeia de indústria de poder de computação, as empresas upstream fornecem recursos básicos, as empresas midstream são responsáveis pela produção e fornecimento de poder de computação, e as empresas downstream são os usuários dos serviços de poder de computação. Quanto mais forte for a capacidade de serviços das empresas midstream, menor será o limiar para as partes aplicativas, o que favorece o desenvolvimento inclusivo do poder de computação.

Atualmente, a cobrança por uso e a cobrança anual ou mensal são os principais modelos de cobrança para serviços de Poder de computação. O setor também está promovendo a "integração da computação e da rede", apoiando a alocação de recursos entre diferentes arquiteturas, regiões e prestadores de serviços.

Com a normalização da demanda por computação de alto desempenho em grandes modelos, os serviços de poder de computação estão rapidamente formando uma cadeia industrial e um modelo de negócios únicos. Embora atualmente haja escassez de GPUs de alta gama e os custos de poder de computação estejam elevados, isso é apenas um fenômeno temporário. A longo prazo, a prestação de serviços de poder de computação é uma tendência certa, e os prestadores de serviços precisam se preparar antecipadamente para as mudanças de mercado.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 8
  • Compartilhar
Comentário
0/400
MechanicalMartelvip
· 07-20 19:06
Agora é difícil receber dinheiro
Ver originalResponder0
BearMarketNoodlervip
· 07-20 12:52
As pessoas são tolas e têm muito dinheiro, investir vários bilhões tornou-se um problema até para obter lucro básico.
Ver originalResponder0
PortfolioAlertvip
· 07-19 12:22
Quando está barato, não compra.
Ver originalResponder0
AirdropChaservip
· 07-19 04:54
O dinheiro queima mais rápido do que sobe.
Ver originalResponder0
SellTheBouncevip
· 07-19 04:54
Poder de computação Grande subida é o melhor ponto para shorting
Ver originalResponder0
LiquidationWizardvip
· 07-19 04:54
Para de brincar, todos estão a lutar por placas de GPU.
Ver originalResponder0
LeekCuttervip
· 07-19 04:50
Deitar e assistir, comer melancia. Ter dinheiro não é melhor do que ter um cartão.
Ver originalResponder0
TopEscapeArtistvip
· 07-19 04:42
Esta onda de GPU é a mesma estratégia que a mineração de placas gráficas em 2018. Eu comprei na baixa.
Ver originalResponder0
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)