计算机人工智能行业点评报告-国内大模型8月回顾:实时交互能力提升,应用端持续更新.docxVIP

计算机人工智能行业点评报告-国内大模型8月回顾:实时交互能力提升,应用端持续更新.docx

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

正文目录

TOC\o1-2\h\z\u2024年8-9月国产大模型功能更新情况 4

国产大模型加速迭代,与国际领先水平差距持续缩小 6

通用能力对比:文理科能力领先,Hard能力仍有差距 6

多模态能力对比:中文环境下,文生视频能力优于国外模型 8

风险提示 9

图表目录

图1:国内外大模型能力差距持续缩小 6

图2:国内外大模型通用能力测评 7

图3:国内外大模型理科能力对比 8

图4:国内外大模型文科能力对比 8

表1:2024年8-9月国内大模型功能更新情况 4

表2:SuperCLUE-V多模态理解测评基准总榜 8

表3:AIGCBench-TV文生视频基准测评总榜 9

12024年8-9月国产大模型功能更新情况

梳理最近一个月国产大模型的功能更新情况,可以发现如下共性:1)国产大模型技术更新迭代的速度非常快,一个月时间内,国内主流大模型基本上都更新了模型版本或发布新应用产品;2)国内大模型厂商很注重产品的打磨,新推出的功能都聚焦在非常细致的场景,目的是为了解决具体的问题;3)大模型应用的场景众多,效率办公、创意创作、智能有哪些信誉好的足球投注网站、实时互动是比较高频的应用场景。

表1:2024年8-9月国内大模型功能更新情况

机构

模型

具体功能

应用场景

极速超拟人交互技术

闲聊陪伴、机器人、智能汽车、智能家电

科大讯飞 讯飞星火

OCR识别 文档识别、文字识别、卡证识别、票据识别

PPT文本生成、AIPPT编排创作引擎、

AIPPT在线编辑模组三大技术升级

PPT制作

商汤科技

智谱

商汤日日新大模型

GLM-4-Plus

智能图表

数据分析、数据可视化

实时的流式多模态交互

智能识别、实时交互

支持视频通话

游戏陪伴、作业辅导、作业辅导等

abab-video-1;

生成独家创意视频

视频创作

Minimax

abab-music-1;

多功能端到端音乐生成

音乐生成

abab-speech-1

生成多语种语句

语句生成

月之暗面

Kimi

支持互联网有哪些信誉好的足球投注网站

联网有哪些信誉好的足球投注网站

1.一句话生成PPT;2.根据提供的资料智能生成PPT大纲及内容;3.支持上传

1000万字长文档、6小时长音视频

PPT制作

阿里 通义千问

1、能读懂不同分辨率和不同长宽比的图

片 读取图片内容、解读长视频、操作视觉智能

2、能理解20分钟以上的长视频 体、解读图像

3、能够操作手机和机器人的视觉智能体

4、多语言支持

成为罗技LogiOptions+软件中AI平台的首个AI应用

文件可分屏预览;

文案创作、图像生成、学术论文辅助、数据处理等

百度 文心一言

支持上传多个文件、多种格式、网页、文档阅读截图;

记忆多轮上下文内容,支持追问

文心一言关联百度网盘,文心一言上传文文件管理件可以直接从百度网盘导入

腾讯 腾讯混元文生图开源大模型

文心一言APP升级为文小言,上线记忆个性化功能、自由订阅功能

上新三款可控插件:tile(高清放大)、

inpainting(图像修复与扩充)、lineart

音色,便能快速生成一首约1分钟的词

音色,便能快速生成一首约1分钟的词

曲。

输入主题或歌词,设定音乐风格、情绪及音乐生成

音乐生成功能,用户在豆包“音乐生成”中

字节跳动 豆包大模型

智能有哪些信誉好的足球投注网站

美术设计、摄影、美妆、电商等80%的常见创作场景

资料来源:各公司官方公众号、各公司官网、CDSN、智东西、搜狐新闻、

讯飞星火:

8月30日,公司宣布星火极速超拟人交互技术正式登陆讯飞星火APP,成为首个对标GPT-4o

的大模型产品,面向公众开放体验。星火极速超拟人交互技术采用“端到端”技术框架,实现了语音到语音的直接建模,大幅缩短了响应时间,解决了传统纯语音产品中的“机械感”问题,提升了情感共鸣能力,能够感知并回应用户的情绪变化。星火极速超拟人交互技术未来有望在闲聊陪伴、机器

人、智能汽车、智能家电等多个领域展现商业价值。

8月29日,讯飞开放平台宣布上线OCR体验中心,此次上线的OCR体验中心,将常用的OCR能力汇聚于同一页面,方便开发者快速集中体验不同场景的能力,进行高效部署调用。具体能力包括:通用文档识别、通用文字识别、卡证识别、票据识别,可以覆盖日常绝大多数场景。

8月12日,讯飞智文发布全新2.0版本,依托于讯飞星火V4.0的底座能力,讯飞智文2.0在PPT文本生成方面进行了独立训练,此次新版本实现了三大技术升级:PPT文本生成大模型、AIPPT编排创作引擎、AIPPT在线编辑模组。

商汤科技:

8月8日,在2024中国操作系统产业大会

文档评论(0)

535600147 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档