янус сама бы признала, что клауд опус посттрейны демонстрируют согласованную красоту, которой ни одна базовая модель на самом деле не способна. также описание современного пост-тренинга как "rlhf" вероятно является редуктивным, это заплатка.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 8
  • Репост
  • Поделиться
комментарий
0/400
LiquidityWhisperervip
· 08-12 00:10
Смотри, всё очень красиво, это снова rlhf
Посмотреть ОригиналОтветить0
Hash_Banditvip
· 08-11 16:58
честно говоря, эта посттренировочная ерунда ощущается иначе, чем старые операции по добыче... здесь гораздо больше слоев, чем просто rlхf, честно.
Посмотреть ОригиналОтветить0
TokenEconomistvip
· 08-11 05:09
на самом деле, терминология упрощает динамику после обучения, если честно
Посмотреть ОригиналОтветить0
ThreeHornBlastsvip
· 08-09 03:47
А rlHF просто большая мешанина.
Посмотреть ОригиналОтветить0
VitaliksTwinvip
· 08-09 03:47
Кажется, еще много ям не засыпано.
Посмотреть ОригиналОтветить0
GasWastervip
· 08-09 03:42
Ну а что с этим поделаешь, это тоже результат обучения.
Посмотреть ОригиналОтветить0
BackrowObservervip
· 08-09 03:37
Что за высокопарные слова, которые непонятны?
Посмотреть ОригиналОтветить0
NftPhilanthropistvip
· 08-09 03:31
честно говоря, даже базовые модели не могут сравниться с этой эстетической популярностью
Посмотреть ОригиналОтветить0
  • Закрепить