Lo que estoy haciendo es probablemente totalmente posible con una gran visión de próxima generación LLM observando lo que sucede y enmarcando su tarea como dar "consejos" al modelo RL más pequeño a través de una función de recompensa adicional.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
11 me gusta
Recompensa
11
6
Compartir
Comentar
0/400
OnchainHolmes
· hace17h
He encontrado otro desperdicio de recursos de computación.
Ver originalesResponder0
DaoGovernanceOfficer
· 07-30 22:34
*sigh* el paradigma necesita pruebas empíricas...
Ver originalesResponder0
Whale_Whisperer
· 07-29 23:28
Bueno, en términos simples, es solo copiar y pegar.
Ver originalesResponder0
AllInAlice
· 07-29 23:26
Suena muy complicado.
Ver originalesResponder0
SatoshiLegend
· 07-29 23:17
Borrar datos es solo la superficie, el algoritmo profundo es la clave.
Lo que estoy haciendo es probablemente totalmente posible con una gran visión de próxima generación LLM observando lo que sucede y enmarcando su tarea como dar "consejos" al modelo RL más pequeño a través de una función de recompensa adicional.