O que estou a fazer é provavelmente totalmente possível com um LLM de próxima geração de grande pensamento a observar o que acontece e a moldar a sua tarefa como dar "conselhos" ao modelo RL menor através de uma função de recompensa adicional.

VSN-1.16%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 5
  • Compartilhar
Comentário
0/400
DaoGovernanceOfficervip
· 15h atrás
*suspiro* o paradigma precisa de testes empíricos...
Ver originalResponder0
Whale_Whisperervip
· 07-29 23:28
Sim, em termos simples, é só copiar e colar.
Ver originalResponder0
AllInAlicevip
· 07-29 23:26
Parece tão complicado.
Ver originalResponder0
SatoshiLegendvip
· 07-29 23:17
Limpar os dados é apenas a superfície, o algoritmo profundo é a chave.
Ver originalResponder0
LiquiditySurfervip
· 07-29 22:59
Esta armadilha quer fazer Arbitragem novamente.
Ver originalResponder0
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)