янус сама бы признала, что клауд опус посттрейны демонстрируют согласованную красоту, которой ни одна базовая модель на самом деле не способна. также описание современного пост-тренинга как "rlhf" вероятно является редуктивным, это заплатка.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
18 Лайков
Награда
18
8
Репост
Поделиться
комментарий
0/400
LiquidityWhisperer
· 08-12 00:10
Смотри, всё очень красиво, это снова rlhf
Посмотреть ОригиналОтветить0
Hash_Bandit
· 08-11 16:58
честно говоря, эта посттренировочная ерунда ощущается иначе, чем старые операции по добыче... здесь гораздо больше слоев, чем просто rlхf, честно.
Посмотреть ОригиналОтветить0
TokenEconomist
· 08-11 05:09
на самом деле, терминология упрощает динамику после обучения, если честно
Посмотреть ОригиналОтветить0
ThreeHornBlasts
· 08-09 03:47
А rlHF просто большая мешанина.
Посмотреть ОригиналОтветить0
VitaliksTwin
· 08-09 03:47
Кажется, еще много ям не засыпано.
Посмотреть ОригиналОтветить0
GasWaster
· 08-09 03:42
Ну а что с этим поделаешь, это тоже результат обучения.
Посмотреть ОригиналОтветить0
BackrowObserver
· 08-09 03:37
Что за высокопарные слова, которые непонятны?
Посмотреть ОригиналОтветить0
NftPhilanthropist
· 08-09 03:31
честно говоря, даже базовые модели не могут сравниться с этой эстетической популярностью
янус сама бы признала, что клауд опус посттрейны демонстрируют согласованную красоту, которой ни одна базовая модель на самом деле не способна. также описание современного пост-тренинга как "rlhf" вероятно является редуктивным, это заплатка.