lidang 立党（全网劝人卖房、劝人学CS第一人）(@lidangzzz ):刷B站，居然看到了一个post-training（专指test-time） scaling law的讨论。这人介绍了DeepMind的一篇paper，讲OpenAI的o1，可能是一次并行生成N个回答，然后有一个reward model（比GPT-4小很多，专门给答案提供reward，等于一个判卷老师），从里面挑10%的好回答。（原paper里比较了三种方法，但都是那PaLM做的，可以不看： https://t.co/xGbfNQMxA7）看起来这批人的post-training scaling law想法，跟我几乎是完全不同。

lidang 立党（全网劝人卖房、劝人学CS第一人）

@lidangzzz

co-founder @HedgehogLabHQ @Project_DARC

Joined January 1970

2.7K Following 1.6M Followers

lidang 立党（全网劝人卖房、劝人学CS第一人）@lidangzzz

2024.10.22 18:55

刷B站，居然看到了一个post-training（专指test-time） scaling law的讨论。这人介绍了DeepMind的一篇paper，讲OpenAI的o1，可能是一次并行生成N个回答，然后有一个reward model（比GPT-4小很多，专门给答案提供reward，等于一个判卷老师），从里面挑10%的好回答。（原paper里比较了三种方法，但都是那PaLM做的，可以不看：看起来这批人的post-training scaling law想法，跟我几乎是完全不同。

14

Recently Viewed

涩里番--3D系列

3.2K followers

محمد الشريمي CHUDAI JAV HOLD

4K followers

611 followers

422.6K followers

ربي حقق مطلبي

5.2K followers

639.5K followers

𝐂𝐨𝐮𝐩𝐥𝐞 𝐋𝐢𝐭𝐭𝐥𝐞 𝐁𝐞𝐚𝐫 🐻

@CP_LittleBear99

89K followers

菊壱🥩5/3-4珈琲店／5/5例大祭-し19a

71.5K followers

964 followers

🎀 𝓁𝒾𝒻𝑒 🎀

10.2K followers

小淘氣⋆｡˚

48.4K followers

1.3M followers

318K followers

A7.啊啰(1月在武汉)

13.4K followers

鱼哥的原创

26.6K followers

Blue Eyes Kitty

548.5K followers

34.8K followers

202 followers

161.3K followers

7 followers

Most Popular Users

兔崽爱露出

183.8K followers

日理万姬💕

1.9M followers

爱嚼冰淇淋🍦

@ijubngqln13855

1.1M followers

播音系的小美miyoki（只回门槛）

275.4K followers

@tmEujITwYqHa1MS

286.3K followers

屁小六（口令回复）

552.1K followers

790.9K followers

2.8M followers

491.6K followers

喷奶小蜜桃🍑

87.3K followers

隔壁大叔

1.9M followers

小小佛（原创验证私信）

1.1M followers

兔崽爱露出

236.8K followers

1.2M followers

64K followers

Big叔の阿房宫

328.4K followers

大叔de · 阿房宫

609K followers

199.2K followers

1.1M followers

181.9K followers