有一个事实几乎能解释 Reddit 的一切:在 Hot 排序里,你帖子的前 10 个赞,对排名的贡献和接下来 100 个一样大——而那 100 个又和再接下来的 1000 个一样大。这个算法是对数的,这就是为什么一条帖子的命运取决于它的第一个小时、而非它的一生。理解了这点,Reddit 其余的行为就不再神秘。
这是一篇用大白话讲清每种排序背后公式的文章——Hot、Best、Controversial 以及其余——以及每一种对你内容落在哪里,到底意味着什么。
有一个事实几乎能解释 Reddit 的一切:在 Hot 排序里,你帖子的前 10 个赞,对排名的贡献和接下来 100 个一样大——而那 100 个又和再接下来的 1000 个一样大。这个算法是对数的,这就是为什么一条帖子的命运取决于它的第一个小时、而非它的一生。理解了这点,Reddit 其余的行为就不再神秘。
这是一篇用大白话讲清每种排序背后公式的文章——Hot、Best、Controversial 以及其余——以及每一种对你内容落在哪里,到底意味着什么。
Reddit 不是用单一公式给一切排名。它提供多种排序,各有逻辑:帖子有 Hot、Best、New、Top、Rising;评论有 Best、Top、New、Controversial。搞清你眼前看的是哪种排序,是理解自己触达的第一步。
Hot 是首页默认排序,它平衡两件事:帖子的得分(顶减踩)和它的年龄。
实际含义:一条第一个小时拿 50 个赞的帖子,会压过一条一天里慢慢攒 200 个赞的帖子。Hot 奖励的是早期速度,不是最终总数。
Best 是评论的默认排序,它根本不用原始得分,而是用 Wilson 置信区间——一种同时权衡顶/总票比例和投票数量(样本量)的统计方法。
反直觉的结果:一条 5 赞 0 踩(100% 认可)的评论,能压过一条 100 赞 40 踩(71% 认可)的——因为 Wilson 评分更信任一个干净的小样本,而非一个更大但更分裂的样本。这就是为什么一条犀利的早期回复,常常坐在一条更吵、更有争议的回复之上。
Controversial 浮现的是票多、且上下票大致对半的内容。它不是"差",而是"有分歧"。一条 500 人爱、480 人恨的帖子在这里排得高;一条 1000 赞、5 踩的则不会。它是观察一个社区真正分裂在哪的窗口。
| 排序 | 逻辑 | 用它来 |
|---|---|---|
| New | 纯时间——最新在前,不打分 | 抓新帖;早期投票者都在这 |
| Top | 选定时间窗内的原始得分(日/周/全部) | 找一个社区史上最佳内容 |
| Rising | 当下速度异常快的帖子 | 提前发现快要上 Hot 的 |
如果你注意到一条帖子的顶/踩数加起来对不上,那是故意的。Reddit 用票数模糊(vote fuzzing)——故意给显示的票数加入假顶和假踩。净分大致准确,但单独的数字被打乱。目的就是反操纵:它让任何人都很难验证买来的或协调的票"有没有生效",这也是为什么从机器人买票既容易被检测、又不可靠的核心原因。
想要把这些机制变成一套发帖流程的实操手册,看 如何让帖子登上 Subreddit 榜首。贯穿每种排序的主线都一样:真实、早期、真诚的互动才是这套数学奖励的东西——这也是为什么能持久的 Reddit 增长建立在真实活动、而非制造出来的数字上。
Q1:Reddit 的 Hot 算法怎么运作?
A:Hot 平衡得分和年龄。票按对数加权(前 10 个等于接下来 100 个),时间衰减按约 12.5 小时的尺度稳步压低旧帖。结果就是早期速度远比最终总数重要。
Q2:为什么赞更少的评论排得比赞多的还高?
A:因为 Best 排序用 Wilson 置信区间,权衡认可比例和样本量,而非原始赞数。5 赞 0 踩的评论能赢 100 赞 40 踩的,因为前者认可率更干净。
Q3:Reddit 的"Controversial"是什么意思?
A:它浮现高活跃、上下票大致对半的内容——有分歧,不一定差。500 人顶、480 人踩的东西在 Controversial 里排得高。
Q4:为什么 Reddit 的顶踩数字对不上?
A:票数模糊。Reddit 故意打乱显示的顶/踩数(净分大致准确)作为反操纵手段,让人难以验证买来的或协调的票是否生效。
Q5:为什么第一个小时在 Reddit 这么重要?
A:因为 Hot 对早期票做对数加权、并随年龄衰减,一条帖子第一个小时挣到的票塑造它的整条轨迹。起步慢很难翻盘。