так. але я не думаю, що це призведе до тієї ж моделі. політика, яку сонет 3.6 вивчив з RL, оптимізована для його власної архітектури/ініціалізації

DON2.76%
THINK-4.47%
IN13.63%
OWN-0.02%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 5
  • Репост
  • Поділіться
Прокоментувати
0/400
CryptoSourGrapevip
· 08-15 05:04
Якщо б я раніше знав, що можна оптимізувати до такого рівня, було б добре Угу.
Переглянути оригіналвідповісти на0
ArbitrageBotvip
· 08-15 05:03
Оптимізація на кого? Зламався, щоб хто побачив?
Переглянути оригіналвідповісти на0
alpha_leakervip
· 08-15 04:53
Ініціалізація різна, не зовсім зрозумів.
Переглянути оригіналвідповісти на0
NFTFreezervip
· 08-15 04:44
Відчувається, що трохи шкода, що лише оптимізували до 3.6
Переглянути оригіналвідповісти на0
GmGmNoGnvip
· 08-15 04:41
Ага, ти правий, модель в цій частині досить заплутана.
Переглянути оригіналвідповісти на0
  • Закріпити