计算机行业点评:智能助理潜力从苹果开始扩散.docx

计算机行业点评:智能助理潜力从苹果开始扩散.docx

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

内容目录

智谱 出AutoGLM,智能助理迎来PhoneUSE时刻 3

Agent为产业重要方向,智谱技术 平领先 7

智能助理未来展望:终端厂商、 理侧 力有望高度受益 16

建议关注 20

努表目录

努表1:AutoGLM部分案例展示 3

努表2:AutoGLM任务执行中交互 4

努表3:AutoGLM任务 成后接受反馈 5

努表4:AutoGLM 加快捷指令 6

努表5:ClaudeComputerUse功能,帮助用户 写表单 7

努表6:智谱清言Chrome插件部分功能 8

努表7:o1在具有 战性的理基准上大大优于GPT-4o。实线表示pass@1准确率,阴影区域表示64个样本的多数 票(共识)表现。 9

努表8:OpenAICEO发文称“在目标3上表现出色” 10

努表9:OpenAI正在招聘multiagent 队成员 11

努表10:谷歌Deepmind正在招聘multiagent 队成员 12

努表11:基础智能 解耦合中间界面方案示例 13

努表12:在AndroidLab评测基准上,AutoGLM就显著超越了GPT-4o和Claude-3.5-Sonnet 14

努表13:在简单任务的人工评测中,AutoGLM的成功率 15

努表14:MagicOS9.0部分能力 16

努表15:AutoGLM需要获取设备权限 17

努表16:借助AppleIntelligence,Siri可以在应用程序中和跨应用程序执行数百个新操作 18

努表17:OlaFriend智能 耳机宣传努 19

智谱推出AutoGLM,智能助理迎来PhoneUSE时刻

10月26日,智谱技术团队推出GLM第一个产品化的智能AutoGLM,基于GLM技术团队在语言模型、多模态模型和工具使用方面的努力和研究成果,AutoGLM只需接收简单的文字/语音指令,就可以模拟人类操作手机。目前用户可以在Chrome或Edge安装智谱清言插件来体验AutoGLM-Web。在手机端,AutoGLM首批开放给部分清言用户,暂时仅支持安卓系统。

图表1:AutoGLM部分案例展示

资料来源:AutoGLMGithub项目,

在安卓端,测试版AutoGLM能力范围目前限于操作一部分特定APP,出于内测安全性的考虑,现阶段以下列表以外的APP/任务场景将会被直接拒绝,无法尝试执行,目前可操作的APP如下:

微信:发消息(文字/位置等等),公众号文章总结,朋友圈点赞/评论,打电话等;淘宝:商品选购,店铺查找,评价总结/撰写,订单/购物车操作等美团:点外卖相关;大众点评:打卡,写好评,查评价/榜单,查店铺等小红书:点赞/评论笔记,关注指定用户,写总结等;

高德地图:导航,路线规划,查询周边等;

12306:订车票,订机票,查车次等;携程:订酒店等。

在任务执行过程中如果出现了多个符合要求的有哪些信誉好的足球投注网站结果,或者需要用户进一步进行选择,AutoGLM会主动询问用户的意见。

图表2:AutoGLM任务执行中交互

资料来源:AutoGLM用户手册,

任务执行完后,AutoGLM会反馈成功/失败的状态,并且通过文字信息告诉用户详细的结

果,用户可以通过左右拖动悬浮球进行反馈。

图表3:AutoGLM任务完成后接受反馈

资料来源:AutoGLM用户手册,

用户可以点击编辑,创建自己的常用指令,一键点击即可快速触发,省去反复输入任务的困扰。

图表4:AutoGLM添加快捷指令

资料来源:AutoGLM用户手册,

智谱团队表示AutoGLM的应用场景还远不止于此。理论上,通过对GUI的深刻理解,

AutoGLM可以完成人类在可视化电子设备(电脑,手机,平板……)上能做的任何事。

它不受限于简单的任务场景或API调用,也不需要用户手动搭建复杂繁琐的工作流,操作逻辑与人类类似,真正做到在日常生活、工作中辅助人类。

Agent为产业重要方向,智谱技术水平领先

10月22日Anthropic宣布推出升级版Claude3.5Sonnet,开创性推出ComputerUSE(计算机使用)功能。开发人员可以在API上使用Claude来指导Claude像人们一样使用计算机-通过查看屏幕、移动光标、单击按钮和键入文本。Anthropic不是制作特

定的工具来帮助Claude完成单个任务,而是向它传授通用的计算机技能,让它能够使用各种专为人们设计的标准工具和软件程序。Anthropic构建了一个API,允许Claude感知计算机界面并与之交互。

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档