起源:评论员:不理解亚历山大为何不讨喜作
哈佛华人创办的AI搜索公司Exa实现C轮融资,要做Agent时期的谷歌
专为 AI 构建搜索引擎的基础设施公司 Exa 颁发实现 2.5 亿美元 C 轮融资,投后估值达到 22 亿美元,由 a16z 领投,a16z 合资人 Sarah Wang 主导了本轮买卖。
此前,Exa 在 2024 年 7 月和 2025 年 9 月别离实现了 2,200 万美元 A 轮和 8,500 万美元 B 轮,B 轮由 Benchmark 合资人 Peter Fenton 领投并参与董事会,估值 7 亿美元。不到一年,估值翻了三倍。
新一轮资金将用于把索引领域扩大到盛开网页之表,训练下一代检索模型,以及将基础设施扩容到每秒处置数十万次搜索要求。与此同时,Exa 也在积极扩张市场团队。结合首创人 Jeffrey Wang 在接受 DeepTech 采访时暗示,“关于这些资金的规划用处其实极度单一,技术和市场双方都必要持续提速。”
Exa 目前服务超过 5,000 家企业客户和 40 万开发者,客户名单里有 Cursor、HubSpot、OpenRouter、Gamma、Lovable 等公司。据 Exa 披露,其客户查问量从 2025 年 4 月的约 1 亿次增长到 2026 年 4 月的约 10 亿次,一年翻了十倍。它的爬虫追踪着超过 5,000 亿个 URL,背后是自建的索引系统、自训练的 embedding 模型、自研的向量数据库,以及一个由 H200 GPU 组成的自有训练集群。
这些数字背后的故事起头于 2021 年。那时辰 ChatGPT 还没出现,“AI 必要搜索引擎」剽个判断甚至显得有些超前。
撞上 ChatGPT 的搜索引擎
Jeffrey Wang 本科毕业于哈佛大学,毕业后在金融科技公司 Plaid 工作了三年,掌管数据与网络基础设施。2021 年,他和大学室友 Will Bryk 结合创办了 Exa(其时叫 Metaphor),Bryk 担任 CEO。两人其时的信想很斗胆:世界必要一个比谷歌更好的搜索引擎,而他们能做到。
图丨Will Bryk 和 Jeffrey Wang(起源:Exa)
在创业早期,他们就下沉注,花 5百万美元买了一个 GPU 集群,以便急剧构建大规模索引系统,尝试了多种新型搜索技术。指标是开发一个让用户能以谷歌做不到的方式搜索网络的引擎。好比,“给我找出所有在纽约、占有博客的机械进建工程师,按经验年限排序。”
2022 年 11 月,Exa 推出了第一款搜索引擎产品。两周后,ChatGPT 上线。
很快,需要涌了过来。大量公司起头研发 AI 利用,而这些利用必要从网上获守信息。Wang 和 Bryk 意识到了两件事:AI 也必要搜索,并且 AI 的搜索频率很快就会远超人类。
谷歌搜索被设计出来服务人类用户,人类想要的是十个蓝色链接。AI 想要的齐全分歧:它必要的是高质量的齐全页面内容,而不是 SEO 内容或告白;它对延长极其敏感,由于在单个要求中搜索往往只是多个工具挪用之一;它要求零数据保留,由于企业客户的查问往往高度敏感。
Wang 通知我们,Exa 产品的底层是统一个引擎:自己的爬虫,自己的索引,自己的 embedding 模型,自己的向量数据库。网站上每个产品只是用分歧方式向这个引擎提问。
搜索 API 是最原始的接口,依照延长和质量的分歧,分为几个层级。Exa Instant 响应功夫低于 200 毫秒,为实时对话、语音副手和编程 agent 而生,Wang 称之为“全球最快的搜索 API”。Exa Auto 约莫 1 秒,是默认模式,提供最好的单次查问质量。
Exa Deep 和 Deep Max 则是 agentic search,系统自主推理、并行发展多个子查问、汇总了局,Deep Max 在 Google DeepMind 的 DeepSearchQA 基准测试和 FRAMES 等评测中拿到了 SOTA。
(起源:Exa)
在 API 之上还有两个产品。Highlights 是 Exa 的文本提取模型,能从页面中抽取最有关的段落。Wang 提到一个数据:在 SimpleQA 评测上,500 个字符的 Highlights 输出匹配了 8,000 个字符齐全页面的正确度,token 亏损降低了约 20 倍。
Websets 则是异步、大规模的产品,用户给出天然说话描述和验证前提,好比“美国做农业科技的 A 轮公司”,系统会自行搜索、逐一验证、丰硕数据。企业 GTM 和运营团队是 Websets 的沉杜酌户。
Jeff Wang 把这概括为“一条从 200 毫秒到数分钟的曲线”,以为用统一套引擎覆盖“快”和“正确”的两端是 Exa 的关键差距。同样的索引、模型和向量数据库,通过调整推算预算和路由,一端做到 200 毫秒以下,另一端做到分钟级的 agentic 搜索。“只有自己造引擎能力做到这一点,套壳产品是做不到的。”
搜索不只是推理工具,也是训练基底
Exa 最近颁布的一项钻研佐证了 Wang 的判断。他们发现,用 Exa 而非 Google 作为搜索后端来训练 RL 搜索 agent,agent 学得更快、最终阐发更好。具体数字是:训练同样的 pass@k 水平,用 Exa 迸酌传统搜索引擎了局页(SERP)基线节俭了 69% 的 token 亏损,搜索挪用次数削减 62%,交互轮数削减 58%。
图丨Pass@k 的提升在各个独立基准测试中维持一致(起源:Exa)
Wang 以为这个了局固然过后看很切合直觉,但其意思沉大:“搜索不仅仅是推理时的工具,它也是训练时的基底(substrate),这个分辨值真金白银。”RL 训练是当下 AI 领域最耗 token 的工作负载之一,60% 到 70% 的削减意味着齐全分歧的训练账单。并且用 Exa 训练出来的 agent 在推理时也更高效,每个查问使用更少的 token、更少的轮数和更少的搜索挪用。
随着越来越多的尝试室起头构建搜索 agent,Wang 预判它们会必要一个专为此主张打造的训练环境,“而不是套壳一个正本为人类点击蓝色链接而优化的消费级搜索引擎。”
这一判断指向了 Exa 反复强调的主题护城河:自建 vs.套壳(wrapper)。Wang 向我们诠释,大无数搜索 API 提供商在底层封装的是谷歌搜索。“这是行衣凤一个鲜为人知的奥秘。”当查问达到这些服务商时,会被路由到某个匿名服务器上的浏览器,在谷歌搜索中执行查问,再把了局返回。这意味着至少 700 毫秒的中位延长,意味着无法真正实现零数据保留(由于谷歌搜索自身会纪录查问),也意味着无法为特定用例深度定造。
“六个月前PokerStars扑克官网代码搜索还不如谷歌,”Wang 说,“此刻我们训练了代码专用模型之后,险些所有编程 agent 都在用我们。这件事若是你只是谷歌上面的一层套壳,底子做不到。”
Wang 还提到一个更现实的威胁:谷歌不会始终允许自己 90% 的流量来自机械人。一旦谷歌收紧政策,所有依赖它的套壳产品城市同时失去根基。
10^18>10^100
Exa 去年在旧金山竖过一块告白牌,上面写着“10^18>10^100”(10^18 对应国际单元造前缀 exa,10^100 是数学术语 googol,即 Google 名字的由来),意思不言自明。Wang 说他们依然认同告白牌通报的概想:为 AI 构建的搜索和为人类构建的搜索是分歧的产品,这个差距很沉要。
图丨Exa 去年火出圈的告白牌(起源:Reddit)
但 Google Cloud 和 Gemini 是另一回事。几周前的 Google Next 大会上,Exa 成为 Gemini Enterprise 新推出的 Agent Marketplace 的首批合作同伴。Vertex AI 上线了“Grounding with Exa”职能,Gemini 企业客户能够直接用 Exa 做搜索落地,从 Google commit 中直接挪用。Exa 的 Highlights 模型为 Gemini 提供高密度、高有关性的高低文,在新闻、产品数据、技术文档等时效性敏感的场景里尤其关键。
“竞争者 or 合作同伴的二元框架并不是理解这件事的正确方式”Wang 说,“Google Cloud 有重大的企业客户群,他们在构建 agent,而 agent 必要高质量的实时网页信息。我们很愿意服务这些客户。”
赛路上其他玩家的动态也在印证这个领域受到的关注在日益提高。Tavily 在 2026 年 2 月被云推算公司 Nebius 收购,Parallel AI 拿到了 1 亿美元 A 轮融资。
两年前,“为 AI 做搜索”还只是别人产品里的一个职能。如今它被本钱市场确以为独立的基础设施层。Wang 对这个赛路未来一到两年的判断是:自建引擎和套壳谷歌之间的差距会变得极度显著。“随着 agent 做越来越沉要的工作,它们对证量、延长、时效性和定造化的要求只会不休提高,而只有占有全栈技术的产品能力满足。”
Exa 的团队也在急剧变动。最近参与的人蕴含 Meta 检索基础设施掌管人、Yandex 搜索后端掌管人,以及一支来自 Google Search 苏黎世团队的钻研组。“人们来这里,是由于这里在真正建造搜索引擎,”Wang 说。
Exa 已在新加坡开设了亚洲办公室,并在急剧扩张。Wang 提到 Exa 的亚洲客户已经涵盖日本大型商社、千亿美元级金融机构、科技巨头、云和推理服务商、风险投资机构,以及一大批“Global First”的 agent 创业公司。
截至目前,Exa 累计融资约 3.6 亿美元,团队规模过百人。Wang 在采访中沉复了他时时说的一句话:全世界真正独立的搜索引擎数量比能发射火箭的公司还少。造搜索引擎极其难题,但也极其必要。
当数万亿 agent 在未来几年陆续上线,搜索需要将增长到谷歌今天总搜索量的千倍以上。而当 agent 起头为人类做出越来越沉要的贸易决策,它们对全面性、时效性和精确性的要求会远远超出人类自身的尺度。若何来为这些 agent 提供可信任的信息基础设施,仍是一个盛开的问题。Exa 押注的答案是:从第一性启程,所有从零沉造。
“信息是我们这个 AI 时期的文化基座。政治在割裂,战争在舒展,AI 在加快——我们必要值得信任的工具,来通知我们这个世界到底在产生什么。美满的搜索,让每个 AI 都能获取最高质量的信息,进而让每幼我也能。”
参考资料:
1.https://exa.ai/blog/webcode
2.https://exa.ai/blog/deep-max
3.https://exa.ai/blog/composing-a-search-engine
4.https://exa.ai/blog/rl-search-outcomes
运营/排版:何晨龙
注:封面/首图由 AI 辅助天生
@张淑慧:拍击打视频网站,学堂辟谣“女教员台下给校长打伞”@张芷想:两名巴基斯坦航天员到中国参与训练
@许雅娟:电视剧《主角》里的“黄金配角”
热点排行
- 1 jjzz网站
- 2 久久.com
- 3 成人做爰A片一区二区app
- 4 国产又大又长
- 5 老头操
- 6 影音av资源
- 7 一区毛片
- 8 欧美黄色的
- 9 惩罚校花扒开 往下摸