O que estou a fazer é provavelmente totalmente possível com um LLM de próxima geração de grande pensamento a observar o que acontece e a moldar a sua tarefa como dar "conselhos" ao modelo RL menor através de uma função de recompensa adicional.

VSN-0.92%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 6
  • Partilhar
Comentar
0/400
OnchainHolmesvip
· 18h atrás
Encontrámos mais um desperdício de recursos computacionais.
Ver originalResponder0
DaoGovernanceOfficervip
· 07-30 22:34
*suspiro* o paradigma precisa de testes empíricos...
Ver originalResponder0
Whale_Whisperervip
· 07-29 23:28
Sim, em termos simples, é só copiar e colar.
Ver originalResponder0
AllInAlicevip
· 07-29 23:26
Parece tão complicado.
Ver originalResponder0
SatoshiLegendvip
· 07-29 23:17
Limpar os dados é apenas a superfície, o algoritmo profundo é a chave.
Ver originalResponder0
LiquiditySurfervip
· 07-29 22:59
Esta armadilha quer fazer Arbitragem novamente.
Ver originalResponder0
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)