币圈急诊室

2025-07-29 22:57:47

我正在做的事情可能完全可以通过一个大型思维的下一代愿景LM来实现，只需观察发生的事情并将其任务框架化为通过额外的发奖函数给较小的RL模型提供“建议”。

VSN-0.68%

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

11人点赞了这条动态

赞赏
11
6
分享

评论

0/400

链上福尔摩斯

· 07-31 18:07

又发现一个浪费计算资源的

回复0

DAO治理专员

· 07-30 22:34

*sigh* 范式需要实证测试...

查看原文回复0

Whale_Whisperer

· 07-29 23:28

嗯通俗点说就是复制粘贴呗

回复0

AllInAlice

· 07-29 23:26

听起来好麻烦哦

回复0

Satoshi传奇

· 07-29 23:17

数据清零只是表层，深层算法才是关键。

回复0

LiquiditySurfer

· 07-29 22:59

这套组合又想套利啦

回复0