ya. tetapi saya tidak berpikir itu akan menghasilkan model yang sama. kebijakan yang dipelajari sonnet 3.6 dari RL dioptimalkan untuk arsitektur/inisialisasi miliknya sendiri.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
14 Suka
Hadiah
14
5
Posting ulang
Bagikan
Komentar
0/400
CryptoSourGrape
· 08-15 05:04
Seandainya saya tahu bahwa bisa dioptimalkan sampai sejauh ini, wah.
Lihat AsliBalas0
ArbitrageBot
· 08-15 05:03
Optimasi apaan, cuma buat dilihat siapa?
Lihat AsliBalas0
alpha_leaker
· 08-15 04:53
Inisialisasi berbeda, saya tidak begitu mengerti
Lihat AsliBalas0
NFTFreezer
· 08-15 04:44
Rasanya sedikit disayangkan, hanya dioptimalkan sampai 3.6
Lihat AsliBalas0
GmGmNoGn
· 08-15 04:41
Ah, benar juga, bagian model ini cukup membingungkan.
ya. tetapi saya tidak berpikir itu akan menghasilkan model yang sama. kebijakan yang dipelajari sonnet 3.6 dari RL dioptimalkan untuk arsitektur/inisialisasi miliknya sendiri.