Janus misma admitiría que los claude opus posttrains exhibieron una belleza coherente que ningún modelo base es realmente capaz de. También describir el entrenamiento posterior moderno como "rlhf" es probablemente reductivo, es un trabajo de parches.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
18 me gusta
Recompensa
18
8
Republicar
Compartir
Comentar
0/400
LiquidityWhisperer
· 08-12 00:10
Mira, es algo llamativo y también es rlhf
Ver originalesResponder0
Hash_Bandit
· 08-11 16:58
no voy a mentir, esta parte de postentrenamiento se siente diferente de las antiguas operaciones de minería... hay muchas más capas que solo rlhf fr fr
Ver originalesResponder0
TokenEconomist
· 08-11 05:09
de hecho, la terminología simplifica en exceso la dinámica post-entrenamiento, para ser honesto
Ver originalesResponder0
ThreeHornBlasts
· 08-09 03:47
Ah, rlHF solo es un gran revuelto.
Ver originalesResponder0
VitaliksTwin
· 08-09 03:47
Siento que aún hay muchos agujeros por llenar
Ver originalesResponder0
GasWaster
· 08-09 03:42
¿Y qué se le va a hacer? No es más que algo que se ha aprendido.
Ver originalesResponder0
BackrowObserver
· 08-09 03:37
¿Qué es tan elegante que no puedo entender?
Ver originalesResponder0
NftPhilanthropist
· 08-09 03:31
no voy a mentir, incluso los modelos básicos no pueden igualar ese hype estético
Janus misma admitiría que los claude opus posttrains exhibieron una belleza coherente que ningún modelo base es realmente capaz de. También describir el entrenamiento posterior moderno como "rlhf" es probablemente reductivo, es un trabajo de parches.