Đây là sự thật giải thích gần như mọi điều về Reddit: trên bảng xếp hạng Hot, 10 lượt upvote đầu tiên của bài đăng có sức nặng tương đương 100 lượt tiếp theo — và 100 lượt đó lại tương đương 1.000 lượt sau nữa. Thuật toán mang tính logarit, đó là lý do số phận của một bài đăng được định đoạt trong giờ đầu tiên, chứ không phải trong cả vòng đời của nó. Một khi bạn hiểu điều đó, mọi hành vi còn lại của Reddit không còn là bí ẩn nữa.
Đây là phần giải thích bằng ngôn ngữ dễ hiểu về các công thức đằng sau mỗi kiểu sắp xếp — Hot, Best, Controversial, và phần còn lại — cũng như ý nghĩa thực tế của từng kiểu đối với vị trí mà nội dung của bạn xuất hiện.
1. Reddit không phải một thuật toán duy nhất — đó là nhiều kiểu sắp xếp
Reddit không xếp hạng mọi thứ bằng một công thức duy nhất. Nó cung cấp nhiều tùy chọn sắp xếp, mỗi tùy chọn có logic riêng: Hot, Best, New, Top, Rising (cho bài đăng) và Best, Top, New, Controversial (cho bình luận). Biết được kiểu sắp xếp nào đang chi phối thứ bạn đang xem là bước đầu tiên để hiểu phạm vi tiếp cận của mình.
2. Hot: Phiếu bầu logarit + Suy giảm theo thời gian
Hot là kiểu sắp xếp mặc định của trang đầu, và nó cân bằng hai yếu tố: điểm số của bài đăng (upvote trừ đi downvote) và độ tuổi của nó.
- Trọng số phiếu bầu logarit. 10 lượt upvote đầu tiên đẩy thứ hạng nhiều ngang với 100 lượt tiếp theo, và 100 lượt đó ngang với 1.000 lượt sau nữa. Những phiếu bầu sớm có giá trị lớn hơn nhiều so với phiếu bầu muộn — lợi ích giảm dần rất nhanh.
- Suy giảm theo thời gian. Các bài đăng mới hơn được ưu tiên. Thành phần thời gian hoạt động trên thang khoảng 12,5 giờ — cứ mỗi khoảng 12,5 giờ tuổi sẽ trừ đi một điểm "trọng số" trọn vẹn, nên một bài đăng dần mất vị thế khi nó cũ đi, dù nó hay đến đâu.
Ý nghĩa thực tế: một bài đăng thu được 50 lượt upvote trong giờ đầu tiên sẽ xếp trên một bài chậm rãi gom được 200 lượt trong một ngày. Hot tưởng thưởng cho tốc độ sớm, chứ không phải tổng số cuối cùng.
3. Best: Điểm Wilson (Vì sao 5–0 thắng 100–40)
Best là kiểu sắp xếp mặc định cho bình luận, và nó hoàn toàn không dùng điểm số thô. Nó dùng một khoảng tin cậy điểm Wilson — một phương pháp thống kê cân nhắc cả tỷ lệ upvote trên tổng số phiếu lẫn số lượng phiếu bầu (cỡ mẫu).
Kết quả phản trực giác: một bình luận với 5 upvote và 0 downvote (đồng thuận 100%) có thể xếp trên một bình luận với 100 upvote và 40 downvote (đồng thuận 71%) — bởi điểm Wilson tin tưởng một mẫu nhỏ sạch sẽ hơn là một mẫu lớn hơn nhưng chia rẽ hơn. Đây là lý do một câu trả lời sắc bén từ sớm thường nằm trên đầu một luồng thảo luận, phía trên những bình luận ồn ào hơn và gây tranh cãi hơn.
4. Controversial: Hoạt động cao + Phiếu bầu chia rẽ
Controversial làm nổi bật nội dung có nhiều phiếu bầu nhưng gần như cân bằng giữa up và down. Nó không "tệ" — nó "gây chia rẽ". Một bài đăng hay bình luận mà 500 người yêu thích và 480 người ghét sẽ xếp hạng cao ở đây; một bài có 1.000 lượt up và 5 lượt down thì không. Đó là một cửa sổ nhìn vào điều mà một cộng đồng thực sự bị chia rẽ.
5. New, Top, và Rising
| Kiểu sắp xếp | Logic | Dùng để |
| New | Hoàn toàn theo thời gian — mới nhất trước, không chấm điểm | Bắt kịp bài đăng mới; nơi những người vote sớm tụ họp |
| Top | Điểm số thô trong một khung thời gian đã chọn (ngày/tuần/toàn bộ) | Tìm nội dung hay nhất từ trước đến nay của một cộng đồng |
| Rising | Bài đăng đang tăng tốc nhanh bất thường ngay lúc này | Phát hiện thứ sắp lọt vào Hot |
6. Làm nhiễu phiếu bầu: Vì sao những con số bạn thấy bị xáo trộn
Nếu bạn từng để ý rằng số lượt up/down trên một bài đăng không hoàn toàn khớp nhau, đó là cố ý. Reddit áp dụng làm nhiễu phiếu bầu — nó cố tình thêm những lượt upvote giả và downvote giả vào các con số được hiển thị. Điểm số ròng vẫn giữ độ chính xác tương đối, nhưng các con số riêng lẻ bị xáo trộn. Mục đích là chống thao túng: nó khiến việc xác minh xem các phiếu bầu được mua hoặc phối hợp có "ăn" hay không trở nên khó khăn hơn nhiều, đó là một lý do cốt lõi khiến việc mua phiếu từ bot vừa có thể bị phát hiện vừa không đáng tin cậy.
7. Điều này thực sự có ý nghĩa gì với nội dung của bạn
Chuyển các công thức thành các quyết định:
- Vì Hot mang tính logarit + suy giảm theo thời gian → giờ đầu tiên là tất cả; hãy đăng khi khán giả của bạn đang thức và thúc đẩy các phiếu bầu sớm.
- Vì Best dùng điểm Wilson → một bình luận sạch sẽ, được đồng thuận cao sẽ thắng một bình luận phổ biến nhưng gây chia rẽ; hãy viết câu trả lời mà không ai muốn downvote.
- Vì Controversial tưởng thưởng sự chia rẽ → nếu bạn muốn vào Hot (chứ không phải Controversial), hãy nhắm tới sự đồng thuận rộng rãi, đừng tạo ra một cuộc khẩu chiến.
- Vì làm nhiễu phiếu bầu → bạn không thể "kiểm tra" xem thao túng có hiệu quả không, và các phiếu từ bot tụ lại theo những kiểu mà hệ thống bắt được; tương tác chân thật, từ từ là con đường đáng tin cậy duy nhất.
Nếu bạn muốn cẩm nang chiến thuật biến những cơ chế này thành một quy trình đăng bài, hãy xem cách đưa bài đăng của bạn lên đầu một subreddit. Sợi chỉ xuyên suốt mọi kiểu sắp xếp đều như nhau: tương tác thật, sớm và chân thành là thứ mà những phép toán tưởng thưởng — đó cũng là lý do vì sao sự tăng trưởng bền vững trên Reddit được xây dựng từ hoạt động thật, chứ không phải những con số được dàn dựng.
Câu hỏi thường gặp
Q1: Thuật toán Hot của Reddit hoạt động như thế nào?
A: Hot cân bằng điểm số và độ tuổi. Phiếu bầu được tính trọng số theo logarit (10 lượt đầu tiên có giá trị ngang 100 lượt tiếp theo), và một mức suy giảm theo thời gian trên thang khoảng 12,5 giờ dần hạ thấp các bài đăng cũ hơn. Kết quả: tốc độ sớm quan trọng hơn nhiều so với tổng số cuối cùng.
Q2: Vì sao một bình luận có ít upvote hơn lại xếp trên một bình luận có nhiều hơn?
A: Bởi kiểu sắp xếp Best dùng một khoảng tin cậy điểm Wilson, vốn cân nhắc tỷ lệ đồng thuận và cỡ mẫu — chứ không phải số upvote thô. Một bình luận với 5 upvote và 0 downvote có thể thắng một bình luận với 100 upvote và 40 downvote vì tỷ lệ đồng thuận của nó sạch hơn.
Q3: "Controversial" trên Reddit nghĩa là gì?
A: Nó làm nổi bật nội dung có hoạt động cao và phiếu up/down gần như cân bằng — gây chia rẽ, không nhất thiết là tệ. Một thứ được 500 người upvote và 480 người downvote sẽ xếp hạng cao trong Controversial.
Q4: Vì sao các con số upvote và downvote của Reddit không khớp nhau?
A: Làm nhiễu phiếu bầu. Reddit cố tình xáo trộn các con số up/down được hiển thị (điểm số ròng vẫn giữ độ chính xác tương đối) như một biện pháp chống thao túng, khiến khó xác minh xem các phiếu bầu được mua hoặc phối hợp có tác dụng gì không.
Q5: Vì sao giờ đầu tiên lại quan trọng đến vậy trên Reddit?
A: Bởi Hot tính trọng số các phiếu bầu sớm theo logarit và làm suy giảm điểm số theo độ tuổi, những phiếu bầu mà một bài đăng kiếm được trong giờ đầu tiên định hình toàn bộ quỹ đạo của nó. Một khởi đầu chậm rất khó để gỡ lại.