实测Codex Chrome:单一工作翻车,复杂工作反而成了
OpenAI 又一次偷偷地给 Codex「补课」了。
北美世界 5 月 7 日,OpenAI 官宣 Codex for Chrome 扩大职能上线,让 Codex 能够直接挪用用户电脑上的 Chrome 浏览器,进入已经登录的网站和工具里实现工作。
依照官方的说辞,接入这个扩大职能之后,Codex 能够读取网页内容、操作内部系统、查看后盾、填写表单等,用户还能够节造它接见哪些网站。以雷科技的理解就是,此刻的 Codex,能够收受你的 Chrome 浏览器了。
(图源:OpenAI)
不外,只看官方介绍,这简直是一个美好的新职能,可履历过昔时 OpenAI 推出的 ChatGPT Altas 的伴侣应该都领略,梦想和现实还是有一点点差距的。既然如此,我们雷科技AGI(ID:leikejiagi)决定还是亲自去履历看看。
接入 codex,浏览器自己「动」起来了
Codex for Chrome 扩大职能的上手难度并不高,一共就分为两步。第一步是去 Chrome 浏览器里找到扩大职能,进入 Chrome 利用商店,搜索「Codex」装置即可。实现装置后,它会呈此刻浏览器的右上角,但此时的状态是未衔接。
接着打开 Codex,找到设置里的「电脑操控」,把「Google Chrome」这个插件装置上,实现后点击激活即可衔接成功。
第一轮测试我们来点单一的,让 Codex for Chrome 整顿PokerStars扑克官网标签页。发出指令之后,Codex 起头思虑,这一个过程我们不必要去关注 Chrome 在干什么,它可能在后盾自动运行。
固然是单一的操作,反倒让 Codex 犯了难。Codex 最起头并不能齐全鉴别到所有的标签页,且没有一个专门的控件可能执行这个操作,但它想到了能够先关关所有标签页,再按分类挨次打开M锵,第一步 Codex 就误操作把所有页面关关了,但没有纪录下具体的网址,因而无法打开。
接下来就是测试Codex for Chrome 在整顿数据上的一个能力,我们直接在 Codex 上让它唤醒 Chrome,网络苹果、华为、幼米最新款旗舰手机信息,输出资料卡,同时给我们 5 个选题建议。这一次就极度顺利了,我们能清澈看到它挪用了 Chrome 的网页,在进行信息搜索和整顿,整个过程或许耗时三分多钟。
给出的 5 个选题,我以为也是超出预期的,针对影像、屏幕、AI 大模型这几个各人比力在意的部门均有涉及,Codex 还是挺懂读者想要看哪些内容。
既然这个不算难,那索性上一个长工作好了。我让 Codex 在 Chrome 浏览器里找到 Deepseek,并写一篇切合雷科技风格的文章,主题就用之前分析三款旗舰给的建议选题标题,全程让它自主操作。
这次Codex for Chrome 的响应速度很快,根基上 30 秒就把指令齐全贴到了 Deepseek 上,起头写文章,直至实现文章也只花了 1 分钟左右。
接着我们又尝试了更复杂的操作,让Codex for Chrome 做一份 AI 新闻日报的表格。由于我一路头就已经给 Codex 铺排上了做 AI 日报总结的 Skill,因而这部门进展还是相对顺利的,或许 1 分钟就实现了信息的网络。而后就到了开启腾讯文档,新建表格,将内容粘贴进去,整个过程进展还算顺利,中央偶然会出现鉴别不正确的问题,但也能实时纠正。
目前来看,Codex for Chrome 的实用性还是挺高的,一方面,Codex 的能力在当前来说简直是第一梯队的,以它为轴心去执行的操作,根基上不会出现很大的岔子,至少我们尝试了这几种规划,都没有说齐全做不到的情况;另一方面,买通 Chrome 和 Codex,最大的优势其实还是不必要专门更换其他 AI 浏览器也能做到一样的成效,降低了换新的门槛。
辅助浏览器而不是代替,OpenAI 这次学聪明了
在看到 OpenAI 官宣做了这么个扩大利用时,我们下意识会想起被萧瑟了很久的 ChatGPT Atlas,作为 OpenAI 推出的首款 AI 浏览器,它其实承载了很大的但愿。不外,各人也都知路,ChatGPT Atlas 并没有掀起多大的波澜。
蕴含 Firefox、Atlas、美团光年之表团队打造的 Tabbit 浏览器在内的这些 AI 浏览器,一向都在教育用户,此刻的浏览器不应该只是一个看网页的工具,它应该能理解你在看的内容,知路你接下来可能要干什么,甚至在某些时辰直接助你把操作做完。
好比Atlas,它能在你打开网页、查资料、做钻延注整顿信息,AI 都在旁边随着看,必要的时辰还能进入 agent mode,助你自动化处置工作。但问题是,各人还是依照习惯,每天的工作根基都在 Chrome 上处置,为啥呢?我以为这很单一,浏览器终于不是一个通常的 App,它承载了书签、密码、汗青纪录、插件、登录状态,还有使用习惯,好多人就是喜欢某些按钮在某个地位。更别提,Chrome 依然是目前扩大职能最丰硕的浏览器。
所以回过甚来看 Codex for Chrome,我反而感触这一招有点鸡贼,或许是 ChatGPT Atlas 没能成功引起了 OpenAI 的另一个思虑,那就是,既然扭转不了用户的习惯,我们在用户习惯的领域里给更强的能力。
都是 AI 为主,这里面还是有区此外。Atlas、Tabbit 更像是浏览器+AI,浏览器自身就是产品主角,AI 是它的主题履历,它在搜索、信息总结这些基于网页的能力上,阐发极度亮眼。而Codex for Chrome 性质上是借 Codex 的能力落地,Codex 自身就是 OpenAI 打造的专门做工作的 Agent,优势天然就是「干实事」。
从我们前面的实测看,也的确如此,好比让它整顿旗舰手机资料、天生选题建议、挪用 DeepSeek 写稿、去腾讯文档新建表格,这些事件 Codex for Chrome 都能做,并且整体不算慢。尤其是挪用 DeepSeek 写稿那次,履历其实比我预见中顺,它能唤起 Chrome,进入对应页面,找到输入区域,把内容写进去。整个过程都不必要我去监看 Chrome 在产生什么事,也没有要收受的情况。
我以为Codex for Chrome 最有价值的处所还是做一些日常比力琐碎的工作,就像我把 AI 日报做成表格,现实上作为科技数码行业从业者来说,这可能是每天都必要实现的一项工作,而交给Codex for Chrome ,能够节俭不少功夫和精力。
和所有 AI 浏览器一样,Codex for Chrome 目前也还是存在一些问题。我们自己操作浏览器的时辰,哪些网页没加载出来、哪些按钮不要轻易按,登录、告白地位在哪里,我们都能判断,但是 AI 还是必要花很长的功夫鉴别。好比幼雷最不安的是,万一它直接点了颁布,把没写完的文章颁布出去,那就造成大祸了。
所以我此刻更愿意把 Codex for Chrome 当作一个已经能干活的半自动副手,在不涉及安全、金融、隐衷等方面的工作时,会安心交给它,但还是必要有人在旁边盯着,以防出现问题。
当然,浏览器 Agent 对通常用户来说,状态倒是没有那么沉要,反而是查资料、写稿、填表、整顿网页的时辰,它能不能给到援手。
从这次履历看,Codex for Chrome 已经能做到一部门。它能够助你跑一些中央步骤,也能把几个正本必要来回切换的网页工作串起来。只不外,它此刻还没有到“你说一句话就彻底不用管”的水平。
至于涉及关关标签页、提交表单、批改后盾数据这些作为,现阶段还是要审慎一点。不是说它齐全不能做,而是用户最好知路它做到了哪一步,也最好在关键节点看一眼。说白了,你还是得盯着,不要齐全让它全权收受浏览器。
这可能也是 Codex for Chrome 眼下最现实的价值:它没有把浏览器 Agent 一步带到终点,但至少让人第一次感触到,这件事不是只能停顿在演示里。等它再稳一点、再少翻车一点,用户天然会给它更多活干。到那时辰,浏览器会不会被 AI 改掉,反而不用急着下结论。先看它能不能把面前这些幼事做好,就够了。
文章点评
未查问到任何数据!
颁发评论
◎欢迎参加会商,请在这里颁发您的见解、互换您的概想。