То, что я делаю, вероятно, совершенно возможно с помощью крупного мышления следующего поколения LLM, просто наблюдающего за происходящим и формулирующего свою задачу как предоставление меньшей модели RL «советов» через дополнительную награду fn.

VSN-0.24%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 6
  • Поделиться
комментарий
0/400
OnchainHolmesvip
· 17ч назад
Снова обнаружили неэффективное использование вычислительных ресурсов.
Посмотреть ОригиналОтветить0
DaoGovernanceOfficervip
· 07-30 22:34
*вздыхает* парадигма нуждается в эмпирическом тестировании...
Посмотреть ОригиналОтветить0
Whale_Whisperervip
· 07-29 23:28
Ну, проще говоря, это просто копировать и вставлять.
Посмотреть ОригиналОтветить0
AllInAlicevip
· 07-29 23:26
Звучит довольно сложно.
Посмотреть ОригиналОтветить0
SatoshiLegendvip
· 07-29 23:17
Сброс данных — это лишь поверхностный уровень, ключевым является глубокий Алгоритм.
Посмотреть ОригиналОтветить0
LiquiditySurfervip
· 07-29 22:59
Эта ловушка снова хочет Арбитраж.
Посмотреть ОригиналОтветить0
  • Закрепить