中文大模型基准测评2024年4月报告.docx

  1. 1、本文档共143页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

中文大模型基准测评2024年4月报告

—2024年度中文大模型阶段性进展评估

SuperCLUE团队2024.4.30

精准量化AGI进展,定义人类迈向AGI的路线图

AccuratelyquantifyingtheprogressofAGI,

definingtheroadmapforhumanitysjourneytowardsAGI.

目录

一、国内大模型关键进展

?2023-2024年大模型关键进展

?2024年值得关注的中文大模型全景图

二、测评体系

?中文大模型基准SuperCLUE介绍

?测评体系、方法及示例说明

三、大模型综合测评结果

?SuperCLUE模型象限

?国内外大模型总体表现及竞争格局

?大模型对战胜率、成熟度指数及开源格局

?评测与人类一致性分析

四、通用维度测评详细分析及示例介绍

?十大能力详细测评分数

?测评结果及示例

五、SuperCLUE2.0专项与行业基准测评

?各行业、专项、多模态测评基准

?未来两个月基准发布计划

六、优秀模型案例介绍

?优秀模型案例介绍

第1部分

2024年4月大模型关键进展

1.2023-2024大模型关键进展2.中文大模型全景图

2023-2024大模型关键进展

u自2022年11月30日ChatGPT发布以来,AI大模型在全球范围内掀起了有史以来规模最大的人工智能浪潮。国内学术和产业界在过去一年也有了实质性的突破。大致可以分为三个阶段,即准备期(ChatGPT发布后国内产学研迅速形成大模型共识)、成长期(国内大模型数量和质量开始逐渐增长)、爆发期(各行各业开源闭源大模型层出不穷,形成百模大战的竞争态势)。

SuperCLUE:AI大模型2023-2024年关键进展

爆发期(关键进展)

爆发期

OpenAI发布文生视频Sora百川智能发布Baichuan3智谱AI发布GLM-4

OpenAI发布文生视频Sora

百川智能发布Baichuan3

智谱AI发布GLM-4科大讯飞发布星火3.5MiniMax发布ABAB6

Google发布Gemini1.5Google开源Gemma

阿里云开源qwen1.5

Meta开源Llama3

?

?

?

??商汤发布SenseChat5.0

?

?

?腾讯发布混元助手

?

??KimiChat支持200万上下文X.A

?

?

KimiChat支持200万上下文

X.AI开源Grok-1

MiniMax发布ABAB6.5

?

???百度升级文心一言4.0

?

?

?

成长期?????OpenAI发布GPT-4?

成长期

?

?

?

?

?OpenAI发布GPT-4

?百度发布文心一言1.0

?清华开源ChatGLM

?360发布360智脑

?科大讯飞发布星火

?阿里云发布通义千问

?Meta开源Llama2

?百川智能开源Baichuan

?华为发布盘古3.0

?商汤科技发布商量2.0

?云从科技发布从容大模型

?西湖心辰发布西湖大模型

??Claude3发布

?

?

?零一万物开源Yi-34B

?

准备期故事的起点:ChatGPT发布

准备期

故事的起点:ChatGPT发布国内迅速形成大模型共识

?

?

?科大讯飞升级星火3.0

?

阿里云开源Qwen-7B???阶跃星辰发布Step系列

阿里云开源Qwen-7B

?

?

?

???............小米发布大模型MiLM

?

?

?

......

......

?Google发布

?

多模态大模型Gemini

2022.122023.02

6月

12月2024年1-2月2024年3-4月

时间

通用大模型

通用大模型

行业大模型

闭源

你通义千问vivoBlueLMAndesGPT

你通义千问

vivoBlueLM

孟子ollnMIN

孟子

ollnMINIMAX

玉言

们出n,aa

npn云天书

npn

开源

WBaichuan2-13B-chatchatGLM3-6BmYi-34B

文档评论(0)

4A方案 + 关注
实名认证
服务提供商

擅长策划,|商业地产|住房地产|暖场活动|美陈|圈层活动|嘉年华|市集|生活节|文化节|团建拓展|客户答谢会

1亿VIP精品文档

相关文档