OpenAI将向Pro Plus和Team用户推出ChatGPT Agent
新版ChatGPT智能体,这是一个统一的人工智能代理,能够利用其自有的虚拟计算机和各种工具来执行复杂的任务,该智能体旨在处理复杂任务,能够在思考、执行操作和使用各种工具之间无缝切换,它可以使用终端、在网络上进行点击操作,并生成电子表格和幻灯片等文档
该功能结合了Operator和deep research,新的智能体解决了先前工具的局限性,例如操作员处理长篇文章的困难,以及深度研究在交互式网页或登录需要身份验证的来源方面的限制,该智能体被设计为协作性的,允许用户提供初始指令、澄清问题,并在任务中途提供进一步的指导,它可以提出澄清性问题,可以被中断,并可能在重要步骤前请求确认,例如在发送电子邮件之前,用户还可以直接接管浏览器以纠正错误或输入敏感信息
该智能体在多个基准上进行了评估:
人文科学期末考试: 衡量人工智能解决难题中广泛学科的能力。带工具的智能体模式将性能几乎翻倍,达到42%
Front TMS: 衡量高级数学推理能力。该智能体使用所有工具达到了27%的最新技术水平
Browse Comp: 衡量浏览智能体搜索和定位信息的能力。该智能体显著优于O3和深度研究,达到了69%的通过率
电子表格基准: 衡量模型编辑电子表格的能力。该智能体使用LibreOffice和计算机工具解决了30%的任务,在终端中访问原始Excel文件后,这一比例提高到45%
内部银行基准: 评估模型执行第一至第三年投资银行分析师任务的能力。该智能体显著优于之前的深度研究和O3模型
ChatGPT智能体将向Pro Plus和Team用户推出,Pro用户每月将获得400次查询,一些Team用户每月将获得40次查询,Pro用户的推广应在当天结束前完成,Plus和Team用户也即将推出,该公司的目标是在本月底前向企业和教育用户推出
- 以上信息发布于:2025/07/18 09:42:52 |