ChatGPT Agent 正式上线!AI 可自主操作网页,你「想」就能做到

robot
摘要生成中

OpenAI 宣布推出全新升级版的 ChatGPT 智慧体(ChatGPT Agent),这款整合式自主代理 AI 系统,不仅能理解语言、分析资讯,现在更能主动行动、操作网页、处理文件与生成简报,将构想一手包办成为实际成果。

ChatGPT Agent 正式登场

ChatGPT 智慧体是一种可自主选择工具、具备思考与行动能力的 AI 系统。它不只是一个聊天机器人,还能透过虚拟电脑来操作网站、填写表单、制作简报或分析竞争对手,大幅简化繁琐任务。

它整合了三大能力:

Operator: 网页操作专家

深入研究: 多步推理与资讯整合工具

ChatGPT 对话能力: 人机互动自然流畅

使用者只需简单描述需求,ChatGPT 就会自行判断并使用最佳工具完成任务。例如:「请根据最近的新闻摘要我的客户简报」或「分析竞争对手并转为 PowerPoint」。

ChatGPT Agent 串联工具,完成复杂工作流程

ChatGPT 智慧体搭配多种网路工具,包括图形操作浏览器、文字浏览器,以及可直连 API 的模组。它能根据任务需求切换使用方式:

查找资料可使用 API 撷取

操作网站则使用浏览器模拟点击与输入

在虚拟环境中执行整合任务,背景资讯完整流通

它还支援即时互动与修正:任务过程中使用者可随时调整方向,或中断、接管浏览器操作,灵活性极高。

ChatGPT Agent 多项基准测试刷新业界纪录

OpenAI 对 ChatGPT 智慧体进行了多项标准化测试,结果令人惊艳:

  1. Humanity’s Last Exam(专家级问答测验)

ChatGPT 智慧体创下 43.1% 准确率新高纪录,领先其他工具组合模型。

  1. DSBench(资料科学任务测试)

资料分析准确率:89.9%,远胜 GPT-4o(34.1%)与人类(64.1%)

资料建模表现:85.5%,全面领先

  1. SpreadsheetBench(试算表操作能力)

编辑 Excel 试算表的准确率达 45.5%,几乎是 Copilot 的两倍

  1. 投资银行模型建置任务

表现大幅超越深入研究工具与 OpenAI o3 模型

  1. WebArena 与 BrowseComp(网页任务与难找资讯)

ChatGPT 智慧体分别以 78.2% 与 68.9% 的准确率刷新记录,领先业界同类产品

无论是企业、个人或教育领域,ChatGPT 智慧体都能发挥高度实用性。实际应用场景包括:

自动将仪表板数据转成简报

重新安排行程、会议

编辑与更新财务试算表

规划旅游与预订行程

搜寻与预约服务、餐厅等个人生活事项

你也可以排程定期执行任务,例如:每周一自动产出 KPI 报告。

如何启用 ChatGPT Agent?

要使用智慧体功能,只需在 ChatGPT 中选择「智慧体模式」,然后描述任务即可。系统会启动任务执行视窗,并即时显示进度与旁白解说。必要时你可以:

中止任务

提供新指示

亲自接管操作

若你是 Pro、Plus、Team、Enterprise 或 Education 方案用户,将陆续开放使用,Pro 用户还享有几乎无上限的任务额度。

ChatGPT Agent 如何兼顾安全性?

ChatGPT 智慧体首次具备「可实际操作网站」的能力,OpenAI 为此设计了多重安全机制,确保用户掌控权与资讯隐私:

操作前必须取得明确授权:像是购物、预约、填写表单等操作

敏感任务需「监视模式」:逐步核准每一动作

主动拒绝高风险行动:如金融交易、法律事务

防止提示注入攻击与滥用行为

浏览资料不储存,使用者可随时删除 Cookie 与登出

目前智慧体虽能处理简报产出与任务整合,但某些功能(如从零设计精致简报)仍属 Beta 阶段,格式与美观度可能略显粗糙。

未来将推出新一代简报功能,改善排版、内容品质与范本应用,并进一步优化资料读取与呈现。

OpenAI 表示,这只是自主代理系统整合进 ChatGPT 的第一步,未来将持续更新,拓展更多工具与应用能力,进一步将 ChatGPT 打造成专业、可靠且高效率的数位工作伙伴。

这篇文章 ChatGPT Agent 正式上线!AI 可自主操作网页,你「想」就能做到 最早出现于 链新闻 ABMedia。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)