内分泌失调什么意思| 药师是干什么的| 放大镜不能放大的东西是什么| 提前吃什么药喝酒不醉| 什么蜘蛛有毒| 什么是安全期| 口头禅是什么意思| 女性内分泌失调有什么症状| 前列腺炎吃什么药最好| 梦见吃花生是什么意思| 3月22日什么星座| sm是什么| modal是什么意思| 人生最大的幸福是什么| 五海瘿瘤丸主要治什么病| mac是什么意思啊| 下肢静脉血栓挂什么科| 什么是有机物什么是无机物| 惊弓之鸟什么意思| 莫迪是什么种姓| 什么居什么业| 免冠照片是什么意思| 智齿为什么叫智齿| 医生停诊是什么意思| 乐不思蜀什么意思| 血脂高是什么原因引起的| 甘油脂肪酸酯是什么| 枕头太低了有什么危害| 晒伤了涂什么药| 哦多桑是什么意思| 甲亢可以吃什么水果| 一本万利是什么意思| 7月初七是什么日子| 如意丹的作用是什么| 胃痛吃什么药| 什么时候有胎心胎芽| 什么是贡菜| 血脂高吃什么降血脂| 淋巴结反应性增生是什么意思| 男人吃韭菜有什么好处| 男士皮带什么品牌好| 牛肚是什么| 国家发改委主任什么级别| 啤酒和什么不能一起吃| 载脂蛋白是什么意思| 亥时是什么时候| gr是什么单位| youtube是什么软件| 乙基麦芽酚是什么| 甘草有什么功效| 相向是什么意思| 失温是什么意思| 不惑是什么意思| 安琪儿是什么意思| 什么样的蝴蝶| 淼淼是什么意思| 白手起家是什么生肖| 为什么会做梦中梦| 鹅蛋有什么营养| 温良是什么意思| 慢性萎缩性胃炎是什么意思| 化疗后吃什么药| 柠檬和什么一起泡减肥| canyou是什么意思| 牙周炎有什么症状| 怀孕一周有什么症状| 胃胀吃什么药效果最好| 黄金属于五行属什么| 心慌气短吃什么药最好| 抗缪勒氏管激素是检查什么的| 新疆有什么民族| 左室舒张功能减低吃什么药| 体贴是什么意思| 舌头起泡吃什么药好| pc是什么塑料| 步步高升是什么意思| 该说不说的是什么意思| 白带豆腐渣用什么药| 吃什么能降低尿蛋白| 盆底肌松弛有什么症状| 朝鲜人一日三餐吃什么| 心机重的人弱点是什么| 电子厂是做什么的| 拈花一笑什么意思| 孕吐是什么时候开始| 吕洞宾代表什么生肖| 芝士是什么做的| 婴儿坐高铁需要什么证件| 中医说的湿气重是什么意思| 宫颈糜烂有什么症状和现象| 十月五号是什么星座| 变白吃什么| 即兴表演是什么意思| 住院需要带什么东西| 什么情况下需要做造影| 吃什么补脑子| 男士脸黑穿什么颜色好| 血虚是什么原因造成的| 属鼠的守护神是什么菩萨| 少阳是什么意思| 长痘痘是什么原因| 什么是职业年金| 薪字五行属什么| 下嘴唇发麻什么病兆| 女人吃山竹有什么好处| 囧途什么意思| 晚上老是做梦是什么原因| 男生为什么喜欢女生| 杨桃是什么季节的水果| 过敏挂什么科室| 荷叶有什么作用| 侃侃而谈什么意思| 月经不来要吃什么药| 劣质是什么意思| 看脑血管挂什么科| 什么叫中出| 重症医学科是干什么的| 儿童贫血吃什么补血最快| 什么病会引起背部疼痛| au是什么金属| 心理健康是什么| 耳朵疼吃什么消炎药| 维生素h是什么| 卵巢多囊是什么原因造成的| 身体冒虚汗什么原因| 15朵玫瑰花代表什么意思| 出品人是干什么的| 脚底疼是什么原因引起的| 兔子跟什么生肖最配对| 平安夜送女朋友什么| 什么酒好喝| 1909年属什么生肖| 什么窃什么盗| 寒食节是什么时候| 肌酐高是什么原因造成的| 吃饭出汗多是什么原因| 心得安是什么药| 离线缓存是什么意思| 体寒的女人吃什么能调理好身体| 吃什么东西对心脏好| 豹纹守宫吃什么| 孙红雷的老婆叫什么名字| 子宫疼是什么原因| 离岗是什么意思| babyface是什么意思| 莲雾是什么| 珈字五行属什么| 生性是什么意思| 喜欢吃酸的是什么原因| 众什么意思| 无利不起早是什么意思| 仙灵脾又叫什么| 低聚木糖是什么| 孕妇感冒了对胎儿有什么影响| 孕妇贫血吃什么补血最快| 6克血是什么概念| 艾拉是什么药| 检查肺部挂什么科室| dpl是什么意思| 高烧用什么方法降温最快| 肩膀骨头响是什么原因| 煮虾放什么| 头晕出虚汗是什么原因引起的| 老打喷嚏是什么原因| plt是什么| 动物园里有什么动物| 复方木尼孜其颗粒治什么病| 神是什么意思| 日语斯国一是什么意思| 米其林什么意思| 动手术后吃什么对伤口恢复比较快| 女人做爱什么感觉| 七月八日是什么日子| 圣诞节送女生什么礼物好| 补充公积金是什么意思| 爱的本质是什么| 1962年五行属什么| 白细胞少了会得什么病| 突然心慌是什么原因| 小孩抵抗力差吃什么提高免疫力| 男人纹身纹什么运气好| 睡眠不好什么原因| 事物是什么意思| 全自动洗衣机不排水是什么原因| 1月19号是什么星座| 顾家什么意思| 11月份什么星座| 不排卵是什么原因造成| 说话鼻音重是什么原因| 丝字五行属什么| 内分泌失调是什么原因| 梦见已故母亲预示什么| 催产素是什么| 绿原酸是什么| 来年是什么意思| 胃胀吃什么药好| Lady什么意思| 腹主动脉壁钙化是什么意思| 鸡是什么命| 音容笑貌的意思是什么| 肚子有硬块是什么原因| 后脑袋疼是什么原因| 桑葚补什么| 吊儿郎当是什么意思| 蛤蟆吃什么| 晚上扫地有什么说法| ec50是什么意思| fashion什么意思| 耍大牌是什么意思| 经常流眼泪是什么原因| 硬度单位是什么| 肺炎支原体抗体阳性是什么意思| 彩金和黄金有什么区别| 高中什么时候分文理科| 藏红花有什么作用和功效| 长命百岁的动物是什么| 甘油是什么油| 人吃什么才能长胖| 缺维生素c会得什么病| 枸杞泡茶喝有什么功效| 吃什么长头发快| 失足妇女是什么意思| 喝黄芪水有什么好处| 拉肚子发热是什么情况| 护士是干什么的| 网球肘用什么方法能彻底治好呢| 梦到自己结婚什么意思| 什么光没有亮度| 一天老是放屁是什么原因| 11月10号是什么星座| 心血虚吃什么中成药| 泌尿系统由什么组成| us检查是什么意思| 流清鼻涕是什么感冒| 阁老相当于现在什么官| 1979属什么| 地道战在河北什么地方| 单身领养孩子需要什么条件| 风流是什么意思| 心什么气什么| 准妈妈是什么意思| 佳偶天成什么意思| 入睡困难是什么原因引起的| 不吃早饭有什么危害| 看鼻子挂什么科| 吸允的读音是什么| 梦见蘑菇是什么预兆| 柔式按摩是什么意思| 大拇指旁边是什么指| 女人下嘴唇厚代表什么| 目加此念什么| 云南白药治什么| 中医七情指的是什么| 红细胞是什么意思| 八面玲珑是什么数字| 蛇进家是什么意思| 冰丝是什么面料| 带状疱疹是什么| gp什么意思| 睡鼠吃什么| 高考都考什么| 两个火念什么| 急忙的反义词是什么| 妇联是干什么的| 百度
订阅
纠错
加入自媒体

终极“打工人”诞生:OpenAI发布ChatGPT Agent,重新定义生产力边界

2025-08-05 13:38
智能进化论
关注

发布会.png

当Agent能够完成复杂任务,我们需要学习如何与这个星球上最聪明的“打工人”共事。

作者 | 小葳

AI Agent的时代,比所有人预想的,来得更早、更猛烈。

北京时间7月18日凌晨,科技圈再次被OpenAI投下的一枚重磅炸弹引爆。没有冗长的预热,没有华丽的舞台,Sam Altman和他的团队通过一场25分钟的发布会直播,推出ChatGPT Agent

这不再是我们熟悉的那个“聊天机器人”,它是一个拥有了自己的虚拟电脑、能够自主思考、规划并执行复杂任务的“行动者”。

当看到ChatGPT Agent熟练地打开浏览器、分析网页、调用API、生成PPT、制作表格时,Sam Altman在直播中坦言:“对我来说,在观看它工作时,这是最让我感受到AGI的时刻之一。”

看完发布会,令人印象深刻的有三个方面:

第一,  面对多目标的复杂任务,ChatGPT Agent虽然耗时长一些,但完成度很高;

第二,  ChatGPT Agent可以随时被打断,人类用户可以随时补充信息和指导,或增加新任务,人机协作的体验更加凸显;

第三,Agent通过自己专属的虚拟计算机完成所有任务,并将执行任务过程可视化实时展现,用户可以回放视频查看Agent每一步动作。

  从“能聊”到“能干”:

  统一智能体,OpenAI的必然一步

ChatGPT Agent的诞生并非凭空而来,它是OpenAI在智能体(Agent)道路上不断积累的必然结果。今年早些时候,OpenAI陆续推出了两个重磅工具:Deep Research Operator

然而,这两个工具如同两个“偏科生”。Deep Research擅长长文阅读,却无法与需要登录、交互的网页打交道;Operator擅长处理交互式与可视化的网页,却在深度分析和长文阅读方面力不从心。而许多真实世界的复杂任务,恰恰需要二者能力的结合。

正如Sam Altman在发布会上所说:“人们想要一个统一的智能体,它能自主运行,使用它自己的电脑,帮助人们完成真正复杂的任务。它能够无缝地切换,从思考到采取行动。它能使用各种工具,比如调用终端、在网页上点击操作,甚至能生成电子表格、幻灯片等文件,以及具备更多功能。”

ChatGPT Agent正是两者“强强联合”的实现,它融合了Deep Research的分析能力和Operator的执行能力,相当于赋予了Agent“大脑”和“双手”。

真正完成复杂任务:

自主选择工具,可视化执行过程

发布会上演示的第一个demo是一个多目标的复杂任务,用户9月份要出席朋友婚礼,需要准备服装、礼物、预订酒店等一揽子事情,用户把这些需求一股脑抛给Agent:

- 一套与所有场合的着装要求相匹配的服装(男士)。

- 提出五个服装选项。选择一些轻奢档次的服装,并应与场地和天气相配 

- 找到那些两端都有几天缓冲期的酒店。

- 使用Booking进行预订,并务必检查可用性和当前价格。

- 同样别忘了为新人挑选一件礼物,价格最好在500美元以内。

Agent确认关键需求后就开始工作。整个任务完成花费了20分钟左右,在发布会最后,提供了完善的方案。5件服装备选直接提供了价格对比和购买链接。

当用户提出新增要求,安排一个包括美国职业棒球联盟(MLB)所有运动球场参观的旅行计划时,Agent直接给出精确到天的Excel行程表格。

Agent所有动作都是通过专属虚拟电脑完成,这台电脑上安装了很多不同的工具,Agent能自行选择如何使用。

同时,Agent将它执行任务的全过程展示为一个可视化的电脑屏幕,并在不断变化的对话框中显示文本形式的思维链过程,也就是Agent在想什么,它决定下一步做什么。

揭秘Agent的工作台:

一台虚拟电脑和它的工具集

要理解ChatGPT Agent的强大,首先要看它的“工作台”——一台专属的虚拟电脑。在这个工作台上,集成了一些强大的工具:

文本浏览器 (Text Browser):和Deep Research工具类似,它能快速抓取和解析大量网页的文本内容,进行高效的搜索和信息提炼,这让它能够非常高效快速阅读大量网页并进行搜索,是Agent高效处理信息的“利器”。

可视化浏览器 (Visual Browser):和operator工具类似,这是Agent的“眼睛”和“手”。让Agent能像人一样“看”到网页的图形界面,进行点击、

滚动、拖拽、填写表单等操作,轻松应对为人类设计的复杂交互界面。

终端 (Terminal)和API,通过与终端的连接,Agent可以运行代码、进行复杂的数据分析、处理文件,甚至直接生成可编辑的PowerPoint演示文稿和Excel电子表格。发布会演示中,Agent自行编写代码编译幻灯片,并调用图像API美化页面的场景,令人印象深刻。

通过API,Agent能够调用外部服务。包括公共API,以及用于访问你私有数据源的API,比如谷歌云端硬盘,谷歌日历,github,sharepoint等等。

拥有工具是一回事,懂得何时使用何种工具,则是更高维度的智能。OpenAI通过强化学习(Reinforcement Learning)的训练方式,学会在面对复杂任务时,自主规划并智能地选择最优工具组合。

比如,当被要求预订餐厅时,Agent可能会先用文本浏览器进行海量筛选,然后切换到可视化浏览器查看菜品图片,最后确认空位并完成预订。

从“指令-响应”到“委托-协作”:

人机协作的全新体验

如果说完成复杂任务是ChatGPT Agent的“硬实力”,那么其高度协作的交互模式则是它的“软实力”,也是它与其他AI工具显著区别。

过去,我们与AI的交互是僵硬的。一旦任务下达,我们能做的只有等待。而ChatGPT Agent被设计成一个真正的“协作伙伴”。

用户和智能体随时都能够主动与对方沟通,是ChatGPT Agent重要的交互理念。在ChatGPT Agent执行任务的任何时刻,用户都可以随时“插话”:

“Agent模型的一个关键能力是能够被随时打断,就像是在进行多轮对话。用户可以插话,引导它。”ChatGPT Agent研发人员表示。

用户可以中途补充新的要求(哦对了,再帮我找一双9.5码的黑皮鞋),可以纠正它的方向,甚至可以完全改变任务(我忘了提这件事,或者你的进度如何?做得怎么样了?)。Agent会理解新的指令,并在不丢失已有进度的前提下,继续工作。

同时,Agent也会主动沟通。在信息不足时,它会提出澄清性问题让用户确认;在执行关键操作(如发送邮件、下单支付)前,Agent会主动寻求用户的最终确认。这种双向沟通机制,确保了任务始终在用户的掌控之中。

更重要的是,用户拥有最终的“接管权”。如果对Agent的操作不满意,可以随时暂停,直接进入它的虚拟环境,自己动手修改。这极大增强了用户的安全感和控制感,使得人与AI之间建立起一种前所未有的信任关系。

碾压级跑分:

当Agent的能力被量化

为了证明ChatGPT Agent并非华而不实的“花架子”,OpenAI公布了一系列基准测试成绩。这些数据,将其强大的能力清晰地量化了出来。

在被誉为“人类最后考试”的HLE (Humanity’s Last Exam)基准上,该测试旨在衡量AI在各学科专家级问题上的表现,ChatGPT Agent取得了41.6%的分数,几乎是此前o3和o4-mini模型的两倍。

前沿数学基准FrontierMath上,Agent在工具的辅助下,达到了27.4%的准确率,显著优于o3和o4-mini。

在衡量网页浏览和信息定位能力的BrowseCompWebArena测试中,Agent同样表现优异。

在与办公场景息息相关的SpreadsheetBench(电子表格编辑能力测试)中,Agent的得分高达45.5%

这些数字背后,反映出一个清晰的信号:ChatGPT Agent在通用推理、专业知识、工具使用和任务执行等多个维度上,已经达到了一个全新的高度。它不再是一个只能在特定领域展现才华的工具,而是一个具备广泛能力的“通才”。

“前沿与实验性”:

奥特曼的谨慎与Agent的风险预警

在展示强大能力的同时,Sam Altman也反复强调了这款产品的“前沿和实验性”,并坦诚地揭示了其潜在的风险。这体现了OpenAI在推动技术边界时的审慎态度。

研发团队称,目前最大的担忧之一,是被称为“提示词注入”(Prompt Injection)的新型攻击。

当Agent访问恶意网站时,网站上的隐藏指令可能会“诱骗”它执行不当操作,比如泄露用户的敏感信息。

对此,OpenAI构建了多层防御体系,包括训练模型忽略可疑指令、部署实时监控系统来终止恶意行为等。但OpenAI也承认,他们无法阻止所有攻击。

随着AI能力的指数级增长,如何为其划定安全的伦理和技术边界,已成为整个行业面临的共同挑战。

因此,OpenAI给用户的建议是:充分意识到使用智能体所面临的风险,不随意向智能体透露个人敏感信息。

结语

ChatGPT Agent今天所展示的,还只是一个开始。

Agent不可避免会犯错,有时完成任务可能比人类手动操作更耗时。但它指明的方向,是清晰且不可逆转的。

我们正在从一个需要自己亲手操作每一个软件、点击每一个按钮的时代,迈向一个只需提出目标,便有智能体为你调度一切资源的时代。

而我们,需要学习如何与这个星球上最聪明的“打工人”共事。

       原文标题 : 终极“打工人”诞生:OpenAI发布ChatGPT Agent,重新定义生产力边界

声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

    扫码关注公众号
    OFweek人工智能网
    获取更多精彩内容
    文章纠错
    x
    *文字标题:
    *纠错内容:
    联系邮箱:
    *验 证 码:

    粤公网安备 44030502002758号

    吃人嘴短拿人手软什么意思 妈妈的奶奶叫什么 金渐层是什么品种 狂犬病是什么 iu是什么单位
    人几读什么 股骨头坏死吃什么药 为什么会胃酸 坎坷人生是什么生肖 法西斯战争是什么意思
    女人肝火旺吃什么好 会诊是什么意思 粉瘤是什么东西 青霉素过敏不能吃什么药 关节疼是什么原因
    肚子不舒服是什么原因 什么中药能降血压 巳蛇五行属什么 什么叫k线 心脏跳动过快吃什么药
    酵母菌属于什么菌hcv9jop5ns4r.cn 遍布是什么意思hebeidezhi.com 穆萨是什么意思hcv8jop4ns4r.cn 喝酒对胃有什么伤害hcv7jop9ns1r.cn 烫伤了抹什么hcv9jop3ns3r.cn
    柠檬水喝多了有什么坏处hcv7jop5ns3r.cn zoey是什么意思hcv8jop0ns9r.cn 珍珠状丘疹有什么危害hcv8jop9ns1r.cn 尿道感染是什么原因引起hcv9jop7ns5r.cn 褥疮用什么药jinxinzhichuang.com
    表彰是什么意思hcv9jop6ns1r.cn 治字五行属什么jasonfriends.com 糖尿病人早餐吃什么好hcv8jop9ns0r.cn 高血糖吃什么水果最好hcv7jop9ns4r.cn 腮腺炎是什么原因引起的hcv9jop7ns4r.cn
    败血症是什么症状hcv9jop7ns2r.cn 眼睛老是肿着是什么原因造成的hcv9jop4ns7r.cn 粉玫瑰花语是什么意思96micro.com 什么是夫妻共同财产hcv8jop7ns1r.cn 脸上发痒是什么原因hcv8jop0ns0r.cn
    百度