起源:香港女星称在榆林买房不到200万港
马斯克彻底把X平台给开源了,但是我却复刻不出来
自从马斯克开源X以来,各人总会抱怨说“马斯克你这人不地路,承诺开源却没有开源齐全,各人拿到代码也没法子自己做个X平台”。
但是此刻能够了,X开源仓库页迎来史上最大更新,你真的能够下回去自己造个X平台了。
马斯克第一次公开X推荐算法代码,是在2023年3月31日。那时平台还叫Twitter,官方把twitter/the-algorithm和 twitter/the-algorithm-ml两个仓库放上 GitHub,公开了For You功夫线背后的部门推荐逻辑。
但那次更像一次“代码通明度展示”,表界能看到推荐系统的根基运作方式,却拿不到训练数据、模型权沉、告白推荐系统等关键部门。
而这次,马斯克玩真的了。
诚然,X并不是全球最大的社交平台。它的月活数量为5.7亿,X在2026年的预计收入约为29亿美元,比马斯克收购前的50.8亿美元降落了43%,收购前X的告白收入占比高达90%,收购后告白收入仍占总收入的不到70%。
但是它依然是全球最沉要的社交平台之一,每天处置12亿条内容、服务5亿用户的齐全出产系统。Anthropic、OpenAI这些全球最顶尖的AI公司,都以X作为第一信息分发平台。
马斯克发出这条X不到24幼时,X的开源GitHub仓库瞬间冲到了2万颗星星。
马斯克在开源申明中说:“我们知路这个算法很笨,必要大幅改进,但至少你能够看到我们实时且通明地致力让它变得更好。没有其他社交媒体公司这样做。”
推荐算法是社交媒体的主题贸易机密,是决定用户“看什么、信什么、买什么”的底层逻辑。
在此之前,没有任何一家主流平台愿意把这套逻辑齐全地摆到台面上。
马斯克做了。
开源的具体内容?
这次开源的X算法,主题是一个基于Grok的transformer推荐系统。
整个系统的架构并不复杂,设计思路很清澈:从两个起源获取候选内容,而后用机械进建模型统一排序,最后过滤掉不相宜的内容,推送给用户。
两个内容起源别离是Thunder和Phoenix Retrieval。
Thunder掌管“网内内容”(In-Network),也就是你关注的账号颁布的帖子。它是一个内存数据库,实时追踪所有效户的最新发帖,响应速度能够达到亚毫秒级别。
当你刷新信息流时,Thunder会立刻把你关注的人最近发的内容拉出来。
Phoenix Retrieval掌管“网表内容”(Out-of-Network),也就是你没关注、但系统以为你可能感兴致的帖子。
它通过机械进建做类似度搜索,从全球语料库里找出和你从前互动内容有关的帖子。这是推荐系统最关键的部门,决定了你会不会在信息流里看到陌生账号的爆款内容。
两个起源的候选内容汇总之后,会进入统一的排序阶段。这个阶段的主题是Phoenix Scorer,一个基于Grok的Transformer模型。
这个模型不预测“有关性”,而是预测你对每条内容可能采取的具体行动,好比点赞概率、转发概率、回复概率、点击概率、举报概率、屏蔽概率。
每个行动都有一个权沉,正向行动(点赞、转发)权沉为正,负向行动(举报、屏蔽)权沉为负。最终得分是所有预测概率的加权求和。
得分高的内容排在前面,得分低的内容排在后面。
仅此而已。
X在开源文德凤出格强调了一点:我们已经彻底解除了所有手工特点工程和大部吩祠发式规定。
Grok-based Transformer承担了所有繁沉的工作,它通过理解你的互动汗青,好比你点赞了什么、回复了什么、分享了什么,而后基于此自动判断什么内容和你有关。
这意味着,从前那些依赖关键词堆砌、标签匹配的运营战术已经失效了。系统此刻更注沉语义理解,可能深度分析内容的现实价值和用户的真实需要。
开源是开源了,但并不是齐全开源。
首先,模型权沉没有齐全盛开。
GitHub仓库里的确蕴含了一个预训练的mini Phoenix模型,256维嵌入、4个把稳力头、2层Transformer,打包成一个3GB的压缩包,通过Git LFS分发。这个模型能够让开发者直接跑起来端到端的推理流程,不必要自己训练。
但这只是一个“迷你版”。X在出产环境里真正使用的Phoenix模型,规模要大得多,参数量、层数、嵌入维度都不在一个量级上?吹恼飧鰉ini模型,更像是一个讲授样本,让你理解系统怎么工作,但不是X真在用的那个。
它像一台讲授用幼发起机,能让你看懂发起机道理,也能真的转起来,但它不是X每天给几亿用户刷For You信息流时用的那台真正发起机。
真正的出产模型或许率更大、更复杂、训练数据更多、调参更多,知路的用户行为也更多。所以它推荐得准禁绝、反映快不快、能不能扛住真实流量,和这个 mini 模型不是一个量级。
其次,训练数据没有公开。
推荐系统的主题竞争力,一半在模型,一半在数据。X每天处置12亿条内容,堆集了海量的用户行为数据,好比谁点赞了什么、谁屏蔽了谁、谁在什么功夫看了哪些内容、看了多久。
这些数据才是Phoenix模型可能正确预测用户行为的底子原因。
但这些数据不成能开源。一方面是隐衷问题,另一方面是贸易机密。
没有这些数据,即便你拿到了齐全的模型架构和代码,也训练不出一个和X一样好用的推荐系统。
第三,告白系统只开源了框架,没有开源战术。
这次开源蕴含了一个新的ads?,处置告白注入和定位,蕴含品牌安全追踪,会尊沉敏感内容天堑。但具体的告白竞价逻辑、出价战术、ROI优化算法,这些直接关系到X收入的主题思造,并没有齐全公开。
第四,内容理解管路Grox(Grox是X推荐系统里,基于Grok构建的内容理解工程服务)只开源了部门能力。
Grox是一个新参与的服务,提供分类器、嵌入器和工作执行引擎,用于垃圾检测、帖子分类、PTOS政策执行等内容理解工作。但Grox具体怎么判断一条内容是垃圾、怎么鉴别违规内容、怎么执行平台政策,这些细节并没有齐全通明。
所以,你固然能够凭据GitHub开源的这些器材去造一个类似X的社交平台,但你造不出一个和X一样好用的推荐系统。
你能够拿到齐全的系统架构、候选召回逻辑、排序框架、过滤规定,能够跑通端到端的推理流程。若是你有足够的工程能力,的确能够搭建一个类似的推荐系统。
但是你没有X的数据、没有X的出产级模型、没有X在从前几年里堆集的工程优化和调度战术。也就没法子1比1复刻X平台。
为什么要开源?
早在2022年10月收购Twitter的时辰,他就公开暗示:“让算法开源以增长信赖”是他对这个平台的愿景之一。
2023年3月31日,马斯克兑现了第一个承诺。其时还叫Twitter的X平台,在GitHub上颁布了部门推荐算法的源代码,蕴含用户功夫线里推文推荐的算法逻辑。
那次开源引发了巨大关注。
开发者们第一次看到了Twitter推荐系统的内部运作方式,也第一次确认了一些持久流传的传闻,好比,某些账号的确会被算法降权,某些内容类型的确会被优先推荐。
马斯克其时说,提供“代码通明度”一路头会“令人难以相信地狼狈”,但最终会“导致推荐质量的急剧提升”。
他还说:“最沉要的是,我们但愿赢得你们的信赖。”
但那次开源并不齐全。GitHub仓库里的大部门文件都来自最初的上传,后续更新很少。好多开发者抱怨,代码库没有持续守护,文档不够具体,好多关键?槊挥泄。
这次开源,马斯克显然汲取了教训。
更有意思的是,马斯克在X上颁布算法更新的那条推文时,他人在北京。但这次开源的真正指标,是欧洲。
X平台在欧洲面对着越来越严格的监管审查,而马斯克在用“通明”和“盛开”作为兵器,去匹敌监管压力。
2025年7月,法国检察机关对X平台发展调查,疑惑其算法存在私见和诓骗性数据提取行为。
欧盟委员会也对X发出了文件保留令,要求其提供算法有关内容,调查沉点是虚伪信息传布、内容审核不力和信息通明度缺点。
X平台其时回绝共同调查,并指控这是一场“出于政治动机的刑事调查”,威胁到用户的舆论自由。
马斯克甚至在欧盟委员会的推文下回复了一个脏话。
但回绝共同显然不是悠久之计,因而马斯克把算法给开源了。
与其被动接受监管机构的审查,不如自动把代码公开,让全世界的开发者、钻研者、监管者都能看到X的推荐逻辑。
这样一来,X能够宣称自己是“全球最通明的社交平台”,任何干于算法私见、内容把持的指控,都能够用“代码已经开源,你们自己去看”来回应。
进攻步崆最好的防守。
当然,开源也不是没有价值的。
首先,竞争敌手能够直接进建X的架构设计和工程实际。此刻别人彻彻底底地钻研X是怎么做召回、怎么做排序、怎么做多样性节造的。
若是X的某些设计的确比竞品好,那么这些设计很快就会被复造。
其次,开源露出了X的弱点。
开发者们已经在GitHub issue区指出了一些问题:为什么某些过滤规定设计得不够合理?为什么多样性节造的参数设置得这么守旧?为什么告白注入的逻辑这么单一粗鲁?
但马斯克以为,这些价值是值得的。
X此刻面对的最大问题不是技术,而是信赖。用户不信赖X的内容审核,告白主不信赖X的品牌安全,监管机构不信赖X的算法公正性。
开源算法,是沉建信赖的最直接方式。
它不能解决所有问题,但至少能够证明X没有在暗箱操作,X的推荐逻辑是能够被检验的,X愿意接受公家监督。
在一个越来越强调通明度和问责造的时期,这种姿势自身就是一种竞争力。
马斯克在2023年开源Twitter算法时说过一句话:“我们但愿X成为互联网上最通明的系统,并让它像最驰名、最成功的开源项目Linux一样壮大。”
此刻看来,他是当真的。
X能不能真的造成“社交媒体界的Linux”,还必要功夫验证。
但至少在开源这件事上,马斯克已经走在了所有主流社交平台的前面。
@林宗吉:炸金花手机版金币,雪饼猴带400只幼猴燃爆东北超@王娇莹:内蒙农大校门? 有学生以为不合理
@王子睿:峨眉山猴子侧手翻下台阶
热点排行
- 1 抢庄斗牛1块可玩的
- 2 豹城娱乐
- 3 电竞虎app安卓下载
- 4 k体育app官网入口链接
- 5 365体育网址多少
- 6 万豪斗地主官网
- 7 意大利 真人国际象棋
- 8 10bet电竞app下载
- 9 威尼斯官方真人