То, что я делаю, вероятно, совершенно возможно с помощью крупного мышления следующего поколения LLM, просто наблюдающего за происходящим и формулирующего свою задачу как предоставление меньшей модели RL «советов» через дополнительную награду fn.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
11 Лайков
Награда
11
6
Поделиться
комментарий
0/400
OnchainHolmes
· 17ч назад
Снова обнаружили неэффективное использование вычислительных ресурсов.
Посмотреть ОригиналОтветить0
DaoGovernanceOfficer
· 07-30 22:34
*вздыхает* парадигма нуждается в эмпирическом тестировании...
Посмотреть ОригиналОтветить0
Whale_Whisperer
· 07-29 23:28
Ну, проще говоря, это просто копировать и вставлять.
Посмотреть ОригиналОтветить0
AllInAlice
· 07-29 23:26
Звучит довольно сложно.
Посмотреть ОригиналОтветить0
SatoshiLegend
· 07-29 23:17
Сброс данных — это лишь поверхностный уровень, ключевым является глубокий Алгоритм.
То, что я делаю, вероятно, совершенно возможно с помощью крупного мышления следующего поколения LLM, просто наблюдающего за происходящим и формулирующего свою задачу как предоставление меньшей модели RL «советов» через дополнительную награду fn.