Lo que estoy haciendo es probablemente totalmente posible con una gran visión de próxima generación LLM observando lo que sucede y enmarcando su tarea como dar "consejos" al modelo RL más pequeño a través de una función de recompensa adicional.

VSN-0.24%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 6
  • Compartir
Comentar
0/400
OnchainHolmesvip
· hace17h
He encontrado otro desperdicio de recursos de computación.
Ver originalesResponder0
DaoGovernanceOfficervip
· 07-30 22:34
*sigh* el paradigma necesita pruebas empíricas...
Ver originalesResponder0
Whale_Whisperervip
· 07-29 23:28
Bueno, en términos simples, es solo copiar y pegar.
Ver originalesResponder0
AllInAlicevip
· 07-29 23:26
Suena muy complicado.
Ver originalesResponder0
SatoshiLegendvip
· 07-29 23:17
Borrar datos es solo la superficie, el algoritmo profundo es la clave.
Ver originalesResponder0
LiquiditySurfervip
· 07-29 22:59
Esta trampa quiere hacer arbitraje otra vez.
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)