# 刚刚！X 官方算法源码全公开小白保姆级深度解读：Grok 是怎么决定你看到什么的？

- 状态 / Status: 已发布 / Published
- 时间 / Time: 2026-01-21T00:08:33+08:00
- 作者 / Author: -
- 主题 / Topics: 方法论 / Methodology
- 原文 / Source: https://mp.weixin.qq.com/s/YOtSXeB6T-knGOHJDJnYhQ

⚠️ 免责声明：本文基于 X 官方开源代码库解读整理，旨在帮助理解算法原理。平台政策持续迭代中，具体运营效果因人而异，仅供参考学习。

---

⚠️ 免责声明 ：本文基于 X 官方开源代码库解读整理，旨在帮助理解算法原理。平台政策持续迭代中，具体运营效果因人而异，仅供参考学习。

🔥 刚刚！X 官方算法源码全公开

小白保姆级深度解读：Grok 是怎么决定你看到什么的？

2026年1月19日 · GitHub: xai-org/x-algorithm · 大白话拆解

🚨 刚刚发生的大事

就在 几小时前 ，X（原 Twitter）正式在 GitHub 开源了他们的 最新推荐算法 ！

这不是 2023 年那个旧版本，而是 全新的 Grok AI 驱动版本 ——代码仓库才 3 颗星，你可能是第一批看到这篇解读的人！

📍 github.com/xai-org/x-algorithm

✦ ✦ ✦

⚡ TL;DR 速览：30秒看懂核心变化

📋 Cheatsheet：新算法 vs 旧算法

❌ 旧算法（2023） 手工设计特征 + 规则系统 + 多个独立模型

✅ 新算法（2026） Grok Transformer 一个模型搞定一切 ，完全消除手工特征

🎯 一句话总结

Grok 会 阅读你的每一次互动历史 ，然后预测你对每条帖子会做什么（点赞？回复？拉黑？），按预测分数排序推给你。

🧩 四大核心组件（记住这四个名字）：

🏠 Home Mixer · 总指挥 · 协调所有流程

⚡ Thunder · 关注流 · 你关注的人发的帖子

🔥 Phoenix · AI大脑 · Grok模型做检索+排序

🔧 Candidate Pipeline · 流水线框架 · 可复用的推荐管道

✦ ✦ ✦

一 大白话：X 算法到底在干啥？

先别慌，咱们用 点外卖 来打个比方 👇

🍜 想象你打开美团点外卖...

美团怎么知道该给你推什么？

✦ 你之前点过什么（ 互动历史 ）

✦ 你收藏了哪些店（ 关注列表 ）

✦ 你给差评的店（ 屏蔽/拉黑 ）

✦ 附近还有什么新店（ 全网发现 ）

X 的 For You 信息流，原理一模一样！只不过"外卖"变成了"帖子"。

📐 核心公式（人话版）

你看到的帖子 = 关注的人发的 + AI 帮你发现的

（Thunder 提供） + （Phoenix 提供）

🔄 一条帖子是怎么出现在你首页的？

1 你打开 X 系统开始给你"备菜"

2 Thunder 去冰箱拿食材 把你关注的人最近发的帖子全拿出来

3 Phoenix 去外面采购 用 AI 从全网找你可能喜欢的帖子

4 过滤掉坏食材 删重复的、太老的、你拉黑的人发的...

5 Grok 大厨来打分 预测你会对每道菜做什么（吃？扔？投诉？）

6 按分数排序上菜 分高的帖子先让你看到

✦ ✦ ✦

二 Phoenix：算法的"AI 大脑"深度解析

Phoenix 是整个系统的 灵魂 ，它干两件事：

🔍 功能1：检索（Two-Tower Model）

作用： 从全网几十亿条帖子里，找出你可能感兴趣的那几千条

🏗️ 怎么实现的？双塔模型！

User Tower（用户塔） ：把你的特征（关注谁、最近点赞啥）变成一串数字

Candidate Tower（候选塔） ：把每条帖子也变成一串数字

匹配 ：用向量点积找最像的帖子（就像找"味道最像"的菜）

💡 打个比方：这就像相亲软件

把你变成一个"画像"（喜欢什么、讨厌什么），把帖子也变成"画像"，然后找最匹配的介绍给你。

📊 功能2：排序（Grok Transformer）

作用： 对检索出来的帖子精排，决定谁排第一、谁排最后

🎯 Grok 会预测你对每条帖子的 15 种行为概率：

✅ 正向行为（分数加分）：

P(favorite) 点赞概率

P(reply) 回复概率

P(repost) 转发概率

P(quote) 引用转发概率

P(click) 点击详情概率

P(profile_click) 点击作者主页概率

P(video_view) 看视频概率

P(photo_expand) 展开图片概率

P(share) 分享概率

P(dwell) 停留阅读概率 ⭐

P(follow_author) 关注作者概率 ⭐

❌ 负向行为（分数减分）：

P(not_interested) 点"不感兴趣"概率

P(block_author) 拉黑作者概率 💀

P(mute_author) 静音作者概率

P(report) 举报概率 ☠️

📐 最终分数计算公式：

Final Score = Σ (weight × P(action))

正向行为权重为正，负向行为权重为负 如果 Grok 预测你大概率会拉黑这条帖子，它的分数会被压得很低

✦ ✦ ✦

三 过滤器：哪些帖子会被"踢出局"？

在打分之前和之后，系统会用一堆 过滤器 把不该出现的帖子干掉：

🚧 打分前过滤（Pre-Scoring Filters）：

DropDuplicatesFilter · 删重复帖子

AgeFilter · 删太老的帖子

SelfpostFilter · 删你自己发的帖子（不会给你推你自己的）

AuthorSocialgraphFilter · 删你拉黑/静音的人的帖子

MutedKeywordFilter · 删包含你屏蔽关键词的帖子

PreviouslySeenPostsFilter · 删你已经看过的帖子

PreviouslyServedPostsFilter · 删这次会话已经推给你的帖子

IneligibleSubscriptionFilter · 删你没订阅看不了的付费内容

🛡️ 打分后过滤（Post-Selection Filters）：

VFFilter · 删已删除/垃圾/暴力/血腥等违规内容

DedupConversationFilter · 删同一个对话线程的重复分支

💡 运营启示：

如果你的帖子 从来没被推荐过 ，先检查：

✦ 是不是被当成"太老"的帖子过滤了？

✦ 是不是触发了某些安全审核？

✦ 是不是被目标用户设置了关键词屏蔽？

✦ ✦ ✦

四 官方透露的 5 个关键设计决策

这部分是 X 官方在 README 里直接写的，非常有价值：

🎯 决策1：完全消除手工特征

官方原话： "We have eliminated every single hand-engineered feature."

人话翻译： 以前算法是"工程师觉得什么重要就加什么特征"，现在全交给 Grok 自己学。

运营启示： 没有"绝对的规则"了，Grok 会根据用户反馈动态调整什么重要。

🔒 决策2：候选隔离（Candidate Isolation）

官方原话： "Candidates cannot attend to each other—only to the user context."

人话翻译： 一条帖子的分数，不会因为"同一批里有哪些其他帖子"而变化。

运营启示： 你的帖子是"独立打分"的，不用担心被同时期的爆款"压下去"。

🎲 决策3：基于哈希的嵌入

官方原话： "Both retrieval and ranking use multiple hash functions for embedding lookup."

人话翻译： 用哈希技术来快速查找相似内容，效率极高。

📊 决策4：多行为预测

官方原话： "Rather than predicting a single 'relevance' score, the model predicts probabilities for many actions."

人话翻译： 不是简单的"相关/不相关"，而是预测 15 种具体行为的概率。

运营启示： 想被推荐，就要让 Grok 预测用户会对你 做出正向行为 （点赞、回复、转发...）

🧩 决策5：可组合的管道架构

官方原话： "Easy addition of new sources, hydrations, filters, and scorers."

人话翻译： 整个系统是模块化的，可以随时加新功能。

运营启示： 算法会持续迭代，保持学习和观察。

✦ ✦ ✦

五 给普通人的运营启示

基于这份源码，我们可以得出一些 可执行的策略 ：

🎯 新算法下的核心原则

让 Grok 预测用户会对你的帖子 做正向行为 ，而不是 做负向行为

✅ 策略1：最大化「正向行为概率」

✦ 写能引发 回复 的内容（提问、观点争议、征求意见）

✦ 写能引发 转发 的内容（实用干货、独家爆料、情绪共鸣）

✦ 写能让人 停留阅读 的内容（P(dwell) 是关键指标！）

✦ 写能让人想 关注你 的内容（展示专业性、独特价值）

❌ 策略2：最小化「负向行为概率」

✦ 避免发让人想 拉黑 的内容（人身攻击、极端言论）

✦ 避免发让人想 静音 的内容（刷屏、重复内容）

✦ 避免发让人想 举报 的内容（违规、低质、垃圾）

✦ 避免发让人点 不感兴趣 的内容（与你账号定位不符的内容）

💡 策略3：理解「互动历史」的重要性

Grok 是根据用户的 历史互动 来预测的，这意味着：

✦ 和你互动过的用户，更容易再看到你的内容

✦ 回复别人的评论很重要 ——这会增加"双向互动记录"

✦ 持续发布内容，建立稳定的"互动用户群"

📌 策略4：关于「网外流量」的机会

Phoenix Retrieval 会从全网帮用户发现内容，这对小号是 好消息 ：

✦ 即使没人关注你，只要内容好，也可能被 AI 推给潜在用户

✦ 关键是让你的内容"匹配"上某类用户的兴趣画像

✦ 专注垂直领域，让 AI 更容易把你归入某个"兴趣社区"

✦ ✦ ✦

六 SOP Checklist：发帖前检查清单

每次发帖前，用这个清单过一遍：

✅ 发帖前检查（提升正向行为概率）

☐ 这条帖子有没有 引发回复的点 ？（问题、观点、征求意见）

☐ 这条帖子有没有 转发价值 ？（对别人有用、能帮他表达观点）

☐ 这条帖子能不能让人 停下来看完 ？（信息密度、故事性、悬念）

☐ 这条帖子 符合我的账号定位 吗？（避免让关注者"不感兴趣"）

☐ 如果是视频， 前3秒吸引人 吗？（P(video_view) 很重要）

☐ 如果有图片， 会让人想点开看大图 吗？（P(photo_expand)）

❌ 避免事项（降低负向行为概率）

☐ 避免人身攻击、极端言论（ P(block) 飙升）

☐ 避免短时间内刷屏发相似内容（ P(mute) 飙升）

☐ 避免发违规/低质/垃圾内容（ P(report) 飙升 + VFFilter 过滤）

☐ 避免发与账号定位完全无关的内容（ P(not_interested) 飙升）

☐ 避免使用被大量用户屏蔽的关键词（被 MutedKeywordFilter 过滤）

📊 发帖后检查

☐ 前30分钟 是否在线回复评论？（增加互动历史权重）

☐ 有没有 引导用户做正向行为 ？（点赞、转发、回复）

☐ 有没有 关注数据表现 ，记录什么类型内容效果好？

🛡️ 长期账号维护

☐ 保持 稳定的发帖频率 （建立用户互动习惯）

☐ 保持 垂直领域聚焦 （让 AI 更容易给你打标签）

☐ 主动与粉丝互动 （增加双向互动记录）

☐ 避免被大量用户拉黑/静音/举报（ 负向信号会累积 ）

✦ ✦ ✦

七 一句话总结

新算法的本质：

Grok 在预测「用户会对你做什么」

让它预测到 正向行为 ，你就赢了

"The Grok-based transformer does all the heavy lifting by understanding your engagement history."

「Grok Transformer 通过理解你的互动历史来完成所有重活。」—— X 官方 README

💬 互动话题

你觉得这个新算法对小创作者是好事还是坏事？

欢迎在评论区分享你的看法！

📚 参考来源：

1. X 官方开源算法仓库 (2026年1月19日公开)

2. xAI Grok-1 开源模型

3. 仓库 README.md 文档

参考原文信息列表：

1. https://github.com/xai-org/x-algorithm

2. https://github.com/xai-org/grok-1

3. https://github.com/xai-org/x-algorithm/blob/main/phoenix/README.md

✨

— END —
