Те, що я роблю, імовірно, зовсім можливе з великим мисленням наступного покоління LLM, просто спостерігаючи за тим, що відбувається, і формулюючи своє завдання як надання "поради" меншій RL моделі через додаткову функцію винагороди.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
11 лайків
Нагородити
11
6
Поділіться
Прокоментувати
0/400
OnchainHolmes
· 18год тому
Ще одне відкриття, що витрачає обчислювальні ресурси
Переглянути оригіналвідповісти на0
DaoGovernanceOfficer
· 07-30 22:34
*зітхання* парадигма потребує емпіричного тестування...
Переглянути оригіналвідповісти на0
Whale_Whisperer
· 07-29 23:28
Ну, простіше кажучи, це просто копіювати і вставити.
Переглянути оригіналвідповісти на0
AllInAlice
· 07-29 23:26
Здається, це дуже клопітно.
Переглянути оригіналвідповісти на0
SatoshiLegend
· 07-29 23:17
Скидання даних – це лише поверхня, ключовим є глибокий алгоритм.
Те, що я роблю, імовірно, зовсім можливе з великим мисленням наступного покоління LLM, просто спостерігаючи за тим, що відбувається, і формулюючи своє завдання як надання "поради" меншій RL моделі через додаткову функцію винагороди.