本周AI项目推荐 :AirJelly、Boxy、Paperboy…Proactive Agent的野心和现实
作者 | 黄幼艺邮箱 | huangxiaoyi@pingwest.com
Manus在去年3月引爆了“通用Agent”的概想——不再是大模型套个壳,而是真正能自主规划、挪用工具、端到端执行复杂工作的独立系统。它给整个行业成立了一种设想力:Agent是一个独立于大模型的品类,有自己的技术栈和产品逻辑,不会等闲被基础模型“吃掉”。
一大批“通用Agent”跟进了这个叙事。但一年从前,你很难再听到它们的新动向。
旧人走,新人来。这一轮Agent的关键词来了:Proactive。
上一波Agent的主题是“你给工作,它去执杏妆;这一波的区别是——它不等你开口。 它自己盯着你的邮件、日历、文档、谈天纪录,发现该做的事就自动推到你刻下,甚至直接替你做了。
OpenClaw在今年直接带火了这个概想,以及它背后的Runtime心跳系统——Agent不再是被动期待指令的工具,而是一个7×24幼时在后盾巡航的“集成员工”。在此之前,谷歌管类似的器材叫Ambient Agent,VC们则套的是“从Copilot到Autopilot”的框架。
但名自熹实不沉要。沉要的是:这一波 Agent 创业公司,又给自己讲了一个新故事——技术更先进、设想力更大、护城河更深,不会被模型吃掉。
而这,正是上一波 Manus 们也讲过的故事。
上一轮的赢家,赢的是首创人和投资人;这一轮值得等待的,是有没有一家,能让公司自身赢。
我们先来看看,谁在场上。
新一波Proactive Agent产品
相比上一轮以Manus为代表的通用Agent(你给工作,它去执行),Proactive Agent的共同特点是它们吃进你形形色色的高低文——邮件、日历、通讯APP、屏幕、端侧文档——而后自动天生行动建议或直接替你执行。
ColaOS:感情优先
产品介绍:ColaOS是首个提出“Soul-First”的AI操作系统。主题创新在三层:第一,强调无感高低文获取——通过度析用户的文件、浏览纪录等数字痕迹自动构建画像,不必要你手动填任何资料就能实现个性化服务;第二,自动式工作执杏转—支持“One Prompt”深度理解,好比一句“互联网寻回犬”指令,它会自动拆解为多平台监控、智能筛选和定期推送;第三,人格化交互设计——具备思路通明、自我进化和自动关切三个维度的“魂灵系统”。
典型案例蕴含整顿桌面时发现用户壁纸是某一电影,ColaOS能自动提醒该电影即将上映,自动关联用户关注事务。
总体来看,Cola的界面极度简洁,和其他Proactive Agent的底子区别在于:它不只是在助你干活,而是在试图成立一种持续的理解关系,这点体此刻产品职能和交互设计上。
好比,语音入口更能干;有心迹职能——会写“日志”。
通明思路并非单纯的模型思想链,更像AI自己的内心OS。
团队及融资布景:由ListenHub团队开发,2026年岁首ListenHub母公司MarsWave颁发实现了200万美元天使+轮融资,由天际资能力投,幼米结合首创人王川跟投。同时,MarsWave也对表颁布了盈利情况:目前公司年时时性收入(ARR)已突破300万美元,并达到月杜庄亏平衡,成为少数已跑通盈利模型的AI原生公司。
AirJelly:屏幕即高低文
产品介绍:桌面端自动式AI副手,2026年4月上线。
在屏幕上以一只悬浮的幼水母状态持续存在。最大的设计亮点是“Enter键意图捕获”——不像传统录屏Agent那样不间断截取屏幕画面(成本高、数据冗余),而是在你按下Enter键的瞬间捕获屏幕高低文,把这个操作建模为一个事务,再转化为可追踪的工作。
自动推送链路:截图→分析→建模Event→综合Task→揣度Next Step→触发Proactive→Agent执杏推送给用户。主题指标看两个:Token亏损量(证明Agent真的在助用户干活)和Proactive接管率(用户愿不愿意接受推送,代表整条链路是否正确)。
首创人布景:首创人柏特,西安电子科技大学人为智能专业,曾在字节跳动主导开发MineContext(一款高低文工程产品,AirJelly的技术脚手架)。2025年尝试将MineContext接入OpenClaw的Pi框架后,团队发现Context+Agent执行能产生1+1大于2的成效,2026年2月确定方向,转型为自动式Agent。
融资情况:获得五源本钱投资,具体金额未公开。
AirJelly的“Enter键触发”是一个主题工程弃取——与其像其他录屏Agent一样一向截图而后用视觉模型鉴别(成本高、噪音多),不如只在用户有明确操作意图的瞬间捕获高低文,数据更干净、成本更低。
通过Enter+截图,相比Cola,AirJelly更像Agent全天候和你一路使用电脑,它的“操作台”也越发丰硕。但幼水母以悬浮窗状态的“窥屏”,若何把控滋扰性和自动性是一个天堑问题。
Paperboy:本地意图鉴别
产品介绍:macOS桌面端Proactive Agent,目前处于Private Beta阶段。定位“ambient desktop assistant”——在后盾持续观察你的工作方式,跨平台进建你的全数高低文,而后在你开口之前就把事件做了。
名字起源很直白:以前送报纸的paperboy知路你家在哪、你几点起床、下雨天报纸该放哪。Paperboy想成立的就是这种关系——靠得住、个人、用得越久越好用。
技术上有几个值妥贴心的选择:第一,本地推理优先。所有高低文都存在本地,利用端侧模型在200毫秒内实现意图揣度——不是鉴别你按了什么键,而是揣度你为什么按这个键。团队以为此刻本地推理终于快到能做实时意图鉴别了;第二,高低文天堑可诠释。Netflix追剧纪录不该传染你的工作推荐,工作压力不该影响你和伴侣谈天的语气——分歧场景的高低文有明确隔离。第三,权限细粒度节造。“助我管邮件”不蹬宗永远接见所有邮件,而是指定发件人、功夫段、项目领域。
团队布景:John Yang,YC布景,此前创办了Million(React极速机能优化框架),从Pratt休学;Vivian Kong,沃顿商学院布景。
融资情况:2026年1月实现了$5M的种子轮融资,投资方未公开。
相比Cola和AirJelly更全栈的野心,Paperboy更像一个安静但靠谱的个人秘书。它不试图成为你的操作系统,而是默默在后盾助你把信息整顿好。目前上一轮内测已关关,产品临时还未上线。
Boxy:交互创新
产品介绍:面向海表市场的Proactive Agent。主题做法是通过授权获取用户的社交数据——WhatsApp、LinkedIn、Instagram蹬爪用,在虚构机内节造鼠标,合规拿到全量汗青谈天纪录和浏览数据,把所有信息流蒸馏成一张卡片——检测到的高低文、建议的行动规划,直接推送给用户,右划执杏注左划回绝。
好比你在赶汇报,合作方发新闻问能不能改日程,Boxy发现你明全国午有空,直接推一张卡片:“已确认明下午无会,是否回复'没问题,明全国午2点线上见'?”
团队布景:首创人John,1998年,12岁赴美留学,毕业于Emory University。AGI海潮前作为第8号员工参与MiniMax,参加从零搭建AI数据管线和多模态数据采集系统。
融资情况:近期获得红杉中国种子基金数百万美元融资。
Boxy最有意思的处所是虚构机数据获取这条路——既绕开了平台API关闭(豆包手机被其他大厂封禁就是前车之鉴),又比录屏规划拿到的数据深得多(齐全谈天汗青vs屏幕片段)。“卡片划动”很新鲜,作为RLHF机造也比传统对话框的反馈效能高,用户每次划动都在训练模型但感知不到职守。
Creao :对话即自动化
产品介绍:“7×24幼时AI员工”,2026年3月上线了新版本。新版本中,用户和Creao的交互方式是:你描述一个工作工作,Agent自己拆解、自己写代码实现、在独立沙盒环境里运行。工作跑通之后,系统会自动建议你把这个流程保留为一个可复用的Agent——以来能够按时自动运行,不必要每次沉新来过。这是它的Proactive设计:不是等你提问才回覆,而是鉴别出你有沉复性工作后,自动助你固化成自动化流程。
首创人布景:CEO Kai Cheng,十年产等第AI系统构建经验。结合首创人Clark Gao掌管GTM,此前在LinkedIn和腾讯搭建数据团队。CTO Peter Pang,前Meta Llama 3团队钻研科学家,曾在Apple做多模态模型。公司2025年1月底成立,产品方向经历了两次转型:最早做类似Dify的工作流工具;2025年6月转做Vibe Coding平台,9月上线;2026年1月起头第二次转型,2月实现团队AI-first刷新,一个月内重新沉构整个新产品,迭代速度快。
融资情况:刚刚实现千万技金融资,领投方为 Prosperity7 Ventures——阿美风险投资(Aramco Ventures)旗下的多元化风投基金和经纬创投,并获得过往投资人—蕴含云启本钱、MONOLITH、高瓴创投、红杉中国、华业天成本钱持续加注。在从前不到一年的功夫内,CREAO AI已累积实现超3000万美元融资。
Creao的产品逻辑比力切实:“先手动做一次,好用就自动化”——这比直接允诺“全自动Agent”要恳切。$20-$150/月的定价已经上线,注明它过了demo阶段。主题问题是:当对话造成自动化Agent后,质量能不能持续不变?这是所佑装对话转工作流”产品的共同挑战。
比Proactive概想更沉要的,是“用户是谁”?
回头看上面这份名单——能真正跑起来不多。Paperboy、Boxy还在waiting list,Creao已上线但更靠近“对话固化为流程”的工具,离纯 Proactive Agent还有距离。除此之表,目前还有不少Proactive Agent在筹备上线,例如FreeU等。
这是一个挺奇怪的状态:词已经烂大街,但产品没几个能让通常用户上手。
我们在《AI创业公司们,困在“面前一黑”的账单里》那篇里发展过,一种原因是自动型Agent对高低文和模型能力的需要更大,在SOTA模型Token单价没跌、工作复杂度反而陡升的情况下,了局就是普遍的:发得了声,跑不起量。
此表,另一个原因是Proactive不是2026年才发现的词,这个概想早就比产品跑得快了。
2023年和2024年,学术界就出现了大量分辨Reactive和 Proactive Agent的论文和会商,直到 2025 年下半年后,跨会话影象、Agent 间通讯、后盾心跳等基础设施顺次补齐,“自动性”才从一个论文术语、一个幼职能的迭代,造成能支持整体产品叙事的代际界说。
但话说回来,“新代际真的来了」剽种叙事,Agent 圈每一轮都讲过。
从前三年,Agent 赛路的标签换得比模型迭代还勤:从AutoGPT到Autonomous Agent,从Copilot到Autopilot,中央还穿插着谷歌的Ambient Agent、Agentic AI 等等变体。每一轮热潮来的时辰,所有产品都急着给自己贴上新标签——哪怕底层技术的迭代,约有名词更换得那么快。
这种概想追随的价值也是双倍的。对用户来说,每隔几个月就要沉新理解一遍“Agent 到底是什么”——你刚搞懂 Copilot,它通知你此刻是 Autopilot;你刚搞懂 Autopilot,它又说其实应该叫 Proactive;对创业者来说,每一轮热潮城市吸引一批新玩家、推高一波估值、造作一批 PPT。但热潮一过,没有找到真实场景的产品就要面对“叙事沉构”,不论它的Demo多酷。
上一轮的通用 Agent,就是这么变寡言的。
所以其实沉要的不是你叫自己 Copilot、Autopilot 还是 Proactive。沉要的是:你是否真的在替客户/用户实现他们正本的工作。
Proactive Agent的性质,不是表表意思上的“自动性”——自动性只是它的一种阐发。真正的转变是:它从一个“执行工具”,造成了一个“工作结算单元”。它能吃进几多 context、挪用几多工具,很炫酷,但那是地基;客户愿不愿意按了局付钱,愿意付几多,才是主题。
以Harvey为例,2022 年成立,早期做的是律师 Copilot——助律师查案例、草拟文件、做司法钻研。后来,它推出了 Agent 模式,能自主执行端到端的司法工作流:备忘录撰写、尽职调查、合同监控。再之后,是2026年4月的内部Agent “Spectre”披露——自动监控律所的数据和事务,发现潜在问题就提醒,Proactive。
这个技术演进极度的天然:先让人信赖你的建议,再让人信赖你的执行,目前Harvey估值已经到了110亿美元。
问题是,这个样板,新一轮的 Proactive Agent不好学。Harvey 能跑通,依赖一个 C 端没有的前提:司法、管帐、保险这些行业自身就堆满了规定、审计流程和合规要求。规定越明确、流程越尺度化,AI 从“建议”到“自主执杏妆的逾越就越顺畅——由于检验尺度是现成的。
Sequoia Capital把这个分界叫做 “Intelligence vs Judgment”:Intelligence工作(规定复杂但规定存在)在被 AI 收受;Judgment工作(必要经验、品尝、直觉)临时还是人类的领地。翻译一下就是:哪里有现成的对错尺度,哪里就先被 Proactive Agent 拿下。
而 C 端的Proactive Agent缺的就是这个Intelligence前提。多大的自动性相宜?必要拿几多权限?要找什么样的用户、切什么样的场景?怎么定价?怎么触达?通用可所以终局,但人群的增长蹊径必要选择,每一路题都得自己摸索。
决定一个Agent产品生死的,从来不是它叫什么名字。Proactive也好,Autonomous也好,Ambient也好——这些词的半衰期或许是六个月。但有一个问题的半衰期是永远的:你到底在助谁,解决什么问题?
答得出来的人,不论风口怎么换,城市留在场上。
点个“爱心”,再走 吧
文章点评
未查问到任何数据!
颁发评论
◎欢迎参加会商,请在这里颁发您的见解、互换您的概想。