ما أفعله من المحتمل أن يكون ممكنًا تمامًا باستخدام رؤية جيل جديد كبيرة تفكر LLM فقط تراقب ما يحدث وتؤطر مهمتها على أنها تقديم "نصائح" للنموذج RL الأصغر من خلال وظيفة مكافأة إضافية.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 11
أعجبني
11
6
مشاركة
تعليق
0/400
OnchainHolmes
· منذ 17 س
اكتشفنا مرة أخرى هدرًا لموارد الحوسبة
شاهد النسخة الأصليةرد0
DaoGovernanceOfficer
· 07-30 22:34
*sigh* يجب اختبار النموذج تجريبياً...
شاهد النسخة الأصليةرد0
Whale_Whisperer
· 07-29 23:28
أم، بعبارة بسيطة، إنها نسخ ولصق.
شاهد النسخة الأصليةرد0
AllInAlice
· 07-29 23:26
يبدو أن الأمر معقد للغاية
شاهد النسخة الأصليةرد0
SatoshiLegend
· 07-29 23:17
إعادة تعيين البيانات هو مجرد سطح، الخوارزمية العميقة هي المفتاح.
ما أفعله من المحتمل أن يكون ممكنًا تمامًا باستخدام رؤية جيل جديد كبيرة تفكر LLM فقط تراقب ما يحدث وتؤطر مهمتها على أنها تقديم "نصائح" للنموذج RL الأصغر من خلال وظيفة مكافأة إضافية.