有一個事實幾乎能解釋 Reddit 的一切:在 Hot 排序裡,你貼文的前 10 個讚,對排名的貢獻和接下來 100 個一樣大——而那 100 個又和再接下來的 1000 個一樣大。這個演算法是對數的,這就是為什麼一條貼文的命運取決於它的第一個小時、而非它的一生。理解了這點,Reddit 其餘的行為就不再神秘。
這是一篇用大白話講清每種排序背後公式的文章——Hot、Best、Controversial 以及其餘——以及每一種對你內容落在哪裡,到底意味著什麼。
有一個事實幾乎能解釋 Reddit 的一切:在 Hot 排序裡,你貼文的前 10 個讚,對排名的貢獻和接下來 100 個一樣大——而那 100 個又和再接下來的 1000 個一樣大。這個演算法是對數的,這就是為什麼一條貼文的命運取決於它的第一個小時、而非它的一生。理解了這點,Reddit 其餘的行為就不再神秘。
這是一篇用大白話講清每種排序背後公式的文章——Hot、Best、Controversial 以及其餘——以及每一種對你內容落在哪裡,到底意味著什麼。
Reddit 不是用單一公式給一切排名。它提供多種排序,各有邏輯:貼文有 Hot、Best、New、Top、Rising;留言有 Best、Top、New、Controversial。搞清你眼前看的是哪種排序,是理解自己觸及的第一步。
Hot 是首頁預設排序,它平衡兩件事:貼文的得分(頂減踩)和它的年齡。
實際含義:一條第一個小時拿 50 個讚的貼文,會壓過一條一天裡慢慢攢 200 個讚的貼文。Hot 獎勵的是早期速度,不是最終總數。
Best 是留言的預設排序,它根本不用原始得分,而是用 Wilson 置信區間——一種同時權衡頂/總票比例和投票數量(樣本量)的統計方法。
反直覺的結果:一條 5 讚 0 踩(100% 認可)的留言,能壓過一條 100 讚 40 踩(71% 認可)的——因為 Wilson 評分更信任一個乾淨的小樣本,而非一個更大但更分裂的樣本。這就是為什麼一條犀利的早期回覆,常常坐在一條更吵、更有爭議的回覆之上。
Controversial 浮現的是票多、且上下票大致對半的內容。它不是「差」,而是「有分歧」。一條 500 人愛、480 人恨的貼文在這裡排得高;一條 1000 讚、5 踩的則不會。它是觀察一個社區真正分裂在哪的窗口。
| 排序 | 邏輯 | 用它來 |
|---|---|---|
| New | 純時間——最新在前,不打分 | 抓新貼;早期投票者都在這 |
| Top | 選定時間窗內的原始得分(日/週/全部) | 找一個社區史上最佳內容 |
| Rising | 當下速度異常快的貼文 | 提前發現快要上 Hot 的 |
如果你注意到一條貼文的頂/踩數加起來對不上,那是故意的。Reddit 用票數模糊(vote fuzzing)——故意給顯示的票數加入假頂和假踩。淨分大致準確,但單獨的數字被打亂。目的就是反操縱:它讓任何人都很難驗證買來的或協調的票「有沒有生效」,這也是為什麼從機器人買票既容易被檢測、又不可靠的核心原因。
想要把這些機制變成一套發文流程的實操手冊,看 如何讓貼文登上 Subreddit 榜首。貫穿每種排序的主線都一樣:真實、早期、真誠的互動才是這套數學獎勵的東西——這也是為什麼能持久的 Reddit 成長建立在真實活動、而非製造出來的數字上。
Q1:Reddit 的 Hot 演算法怎麼運作?
A:Hot 平衡得分和年齡。票按對數加權(前 10 個等於接下來 100 個),時間衰減按約 12.5 小時的尺度穩步壓低舊貼。早期速度遠比最終總數重要。
Q2:為什麼讚更少的留言排得比讚多的還高?
A:因為 Best 排序用 Wilson 置信區間,權衡認可比例和樣本量,而非原始讚數。5 讚 0 踩的留言能贏 100 讚 40 踩的,因為前者認可率更乾淨。
Q3:Reddit 的 Controversial 是什麼意思?
A:它浮現高活躍、上下票大致對半的內容——有分歧,不一定差。500 人頂、480 人踩的東西在 Controversial 裡排得高。
Q4:為什麼 Reddit 的頂踩數字對不上?
A:票數模糊。Reddit 故意打亂顯示的頂/踩數(淨分大致準確)作為反操縱手段,讓人難以驗證買來的或協調的票是否生效。
Q5:為什麼第一個小時在 Reddit 這麼重要?
A:因為 Hot 對早期票做對數加權、並隨年齡衰減,一條貼文第一個小時掙到的票塑造它的整條軌跡。起步慢很難翻盤。