2025-08-15 04:35:00

ya. tetapi saya tidak berpikir itu akan menghasilkan model yang sama. kebijakan yang dipelajari sonnet 3.6 dari RL dioptimalkan untuk arsitektur/inisialisasi miliknya sendiri.

DON0.5%

THINK-7.67%

IN-0.23%

OWN-0.72%

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

14 Suka

Hadiah
14
5
Posting ulang
Bagikan

Komentar

0/400

CryptoSourGrape

· 08-15 05:04

Seandainya saya tahu bahwa bisa dioptimalkan sampai sejauh ini, wah.

Lihat AsliBalas0

ArbitrageBot

· 08-15 05:03

Optimasi apaan, cuma buat dilihat siapa?

Lihat AsliBalas0

alpha_leaker

· 08-15 04:53

Inisialisasi berbeda, saya tidak begitu mengerti

Lihat AsliBalas0

NFTFreezer

· 08-15 04:44

Rasanya sedikit disayangkan, hanya dioptimalkan sampai 3.6

Lihat AsliBalas0

GmGmNoGn

· 08-15 04:41

Ah, benar juga, bagian model ini cukup membingungkan.

Lihat AsliBalas0

Topik
#July PPI Beats Expectations
25k Popularitas
#ETH ETFs Top $30B
26k Popularitas
#Gate Alpha Peak Trading Competition
143k Popularitas
#Gate Releases August Reserves Report
18k Popularitas
#BTC Hits New ATH
106k Popularitas

Sematkan