Poder de computação serviços: um novo modelo de negócios na era dos grandes modelos
O treinamento de grandes modelos está a impulsionar a demanda por poder de computação, transformando-o numa nova modalidade de negócio. Embora atualmente haja uma escassez de GPUs de alto desempenho e os custos sejam elevados, a longo prazo, a oferta de poder de computação acabará por passar de um mercado de vendedores para um mercado de compradores.
Treinar modelos de grande escala requer enormes recursos de poder de computação. Tomando como exemplo um grande modelo vertical com centenas de milhões de parâmetros, seu custo de treinamento pode ultrapassar 2 milhões de yuan. E para modelos gerais, esse custo pode aumentar em cem vezes. É amplamente reconhecido na indústria que sem dezenas de bilhões de fundos é difícil continuar a investir no desenvolvimento de grandes modelos.
Diante da escassez de poder de computação, as empresas adotaram várias medidas de resposta:
Utilizar dados de alta qualidade para aumentar a eficiência do treinamento
Otimizar a infraestrutura, alcançar uma operação estável acima de mil calorias
Melhorar a capacidade de agendamento de recursos de poder de computação
Transição da arquitetura de computação em nuvem para a arquitetura de supercomputação
Usar plataformas nacionais em vez de GPUs da Nvidia
Para a maioria das empresas, escolher um prestador de serviços de computação profissional é mais vantajoso do que construir um centro de dados. Isso levou ao surgimento dos serviços de computação como um novo modelo de negócios.
O serviço de poder de computação é baseado em uma diversidade de poder de computação e conecta-se através de uma rede de poder de computação, fornecendo uma saída unificada de poder de computação heterogêneo. Ele não inclui apenas o poder de computação, mas também encapsula recursos como armazenamento, rede, entre outros, que são entregues em formas como API.
Na cadeia da indústria de poder de computação:
Empresas upstream fornecem recursos básicos de Poder de computação
As empresas de meio de cadeia são responsáveis pela produção e fornecimento de Poder de computação
As empresas downstream oferecem serviços de valor acrescentado com base no Poder de computação
Atualmente, os modelos de faturamento mais comuns incluem faturamento por uso e faturamento anual/mensal. No futuro, "integração da rede de computação" irá suportar a gestão de recursos entre diferentes arquiteturas, regiões e prestadores de serviços.
Com a normalização da demanda por grandes modelos, os serviços de poder de computação estão se desenvolvendo rapidamente como uma cadeia industrial e um modelo de negócio únicos. Embora a atual escassez de GPUs de alta gama tenha causado o fenômeno de "fuga de chips", a longo prazo, os provedores de serviços de poder de computação devem se preparar para o retorno racional do mercado.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Poder de computação serviços: um novo mar azul e transformação industrial na era dos grandes modelos
Poder de computação serviços: um novo modelo de negócios na era dos grandes modelos
O treinamento de grandes modelos está a impulsionar a demanda por poder de computação, transformando-o numa nova modalidade de negócio. Embora atualmente haja uma escassez de GPUs de alto desempenho e os custos sejam elevados, a longo prazo, a oferta de poder de computação acabará por passar de um mercado de vendedores para um mercado de compradores.
Treinar modelos de grande escala requer enormes recursos de poder de computação. Tomando como exemplo um grande modelo vertical com centenas de milhões de parâmetros, seu custo de treinamento pode ultrapassar 2 milhões de yuan. E para modelos gerais, esse custo pode aumentar em cem vezes. É amplamente reconhecido na indústria que sem dezenas de bilhões de fundos é difícil continuar a investir no desenvolvimento de grandes modelos.
Diante da escassez de poder de computação, as empresas adotaram várias medidas de resposta:
Para a maioria das empresas, escolher um prestador de serviços de computação profissional é mais vantajoso do que construir um centro de dados. Isso levou ao surgimento dos serviços de computação como um novo modelo de negócios.
O serviço de poder de computação é baseado em uma diversidade de poder de computação e conecta-se através de uma rede de poder de computação, fornecendo uma saída unificada de poder de computação heterogêneo. Ele não inclui apenas o poder de computação, mas também encapsula recursos como armazenamento, rede, entre outros, que são entregues em formas como API.
Na cadeia da indústria de poder de computação:
Atualmente, os modelos de faturamento mais comuns incluem faturamento por uso e faturamento anual/mensal. No futuro, "integração da rede de computação" irá suportar a gestão de recursos entre diferentes arquiteturas, regiões e prestadores de serviços.
Com a normalização da demanda por grandes modelos, os serviços de poder de computação estão se desenvolvendo rapidamente como uma cadeia industrial e um modelo de negócio únicos. Embora a atual escassez de GPUs de alta gama tenha causado o fenômeno de "fuga de chips", a longo prazo, os provedores de serviços de poder de computação devem se preparar para o retorno racional do mercado.