中文大模型基准测评2024年4月报告.docx

下载文档

0
0
约6.18万字
约 143页
2024-12-13 发布于山西
举报
版权申诉
保障服务

中文大模型基准测评2024年4月报告.docx

1、本文档共143页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

中文大模型基准测评2024年4月报告

—2024年度中文大模型阶段性进展评估

SuperCLUE团队2024.4.30

精准量化AGI进展，定义人类迈向AGI的路线图

AccuratelyquantifyingtheprogressofAGI,

definingtheroadmapforhumanitysjourneytowardsAGI.

一、国内大模型关键进展

?2023-2024年大模型关键进展

?2024年值得关注的中文大模型全景图

二、测评体系

?中文大模型基准SuperCLUE介绍

?测评体系、方法及示例说明

三、大模型综合测评结果

?SuperCLUE模型象限

?国内外大模型总体表现及竞争格局

?大模型对战胜率、成熟度指数及开源格局

?评测与人类一致性分析

四、通用维度测评详细分析及示例介绍

?十大能力详细测评分数

?测评结果及示例

五、SuperCLUE2.0专项与行业基准测评

?各行业、专项、多模态测评基准

?未来两个月基准发布计划

六、优秀模型案例介绍

?优秀模型案例介绍

第1部分

2024年4月大模型关键进展

1.2023-2024大模型关键进展2.中文大模型全景图

2023-2024大模型关键进展

u自2022年11月30日ChatGPT发布以来，AI大模型在全球范围内掀起了有史以来规模最大的人工智能浪潮。国内学术和产业界在过去一年也有了实质性的突破。大致可以分为三个阶段，即准备期（ChatGPT发布后国内产学研迅速形成大模型共识）、成长期（国内大模型数量和质量开始逐渐增长）、爆发期（各行各业开源闭源大模型层出不穷，形成百模大战的竞争态势）。

SuperCLUE：AI大模型2023-2024年关键进展

爆发期（关键进展）

爆发期

OpenAI发布文生视频Sora百川智能发布Baichuan3智谱AI发布GLM-4

OpenAI发布文生视频Sora

百川智能发布Baichuan3

智谱AI发布GLM-4科大讯飞发布星火3.5MiniMax发布ABAB6

Google发布Gemini1.5Google开源Gemma

阿里云开源qwen1.5

Meta开源Llama3

??商汤发布SenseChat5.0

?腾讯发布混元助手

??KimiChat支持200万上下文X.A

KimiChat支持200万上下文

X.AI开源Grok-1

MiniMax发布ABAB6.5

???百度升级文心一言4.0

成长期?????OpenAI发布GPT-4?

成长期

?OpenAI发布GPT-4

?百度发布文心一言1.0

?清华开源ChatGLM

?360发布360智脑

?科大讯飞发布星火

?阿里云发布通义千问

?Meta开源Llama2

?百川智能开源Baichuan

?华为发布盘古3.0

?商汤科技发布商量2.0

?云从科技发布从容大模型

?西湖心辰发布西湖大模型

??Claude3发布

?零一万物开源Yi-34B

准备期故事的起点：ChatGPT发布

准备期

故事的起点：ChatGPT发布国内迅速形成大模型共识

?科大讯飞升级星火3.0

阿里云开源Qwen-7B???阶跃星辰发布Step系列

阿里云开源Qwen-7B

???............小米发布大模型MiLM

......

?Google发布

多模态大模型Gemini

2022.122023.02

6月

12月2024年1-2月2024年3-4月

时间

通用大模型

行业大模型

闭源

你通义千问vivoBlueLMAndesGPT

你通义千问

vivoBlueLM

孟子ollnMIN

孟子

ollnMINIMAX

玉言

们出n,aa

npn云天书

npn

开源

WBaichuan2-13B-chatchatGLM3-6BmYi-34B

您可能关注的文档

文档评论（0）

4A方案 + 关注: 实名认证

服务提供商

擅长策划，|商业地产|住房地产|暖场活动|美陈|圈层活动|嘉年华|市集|生活节|文化节|团建拓展|客户答谢会

咨询作者（1388人已咨询）服务中

1亿VIP精品文档

更多 >

中文大模型基准测评2024年4月报告.docx