网站大量收购独家精品文档,联系QQ:2885784924

2025大模型通识:人工智能的前沿.pptx

  1. 1、本文档共64页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

大模型通识:人工智能的前沿

01大模型概述目录02大模型产品03大模型的基本原理04大模型的特点05大模型的分类06大模型的成本07大模型的应用领域09大模型对人们工作和生活的影响10大模型的挑战与未来发展08基于大模型的智能体

01大模型概述Partone

大模型(英文为“FoundationModel”)是指具有庞大的参数规模和复杂程度的机器学习模型,这些模型可以在训练过程中处理大规模的数据集,并且能够提供更高的预测能力和准确性。大模型通常需要大量的计算资源和更长的训练时间大模型可以被分为多种类型,其中一类就是大语言模型(LLM,LargeLanguageModel),另一类则是图像、语音和推荐等领域的大模型。大语言模型主要用于处理自然语言处理任务,例如文本分类、情感分析、机器翻译等,而大模型在图像领域可以用于图像分类、目标检测等任务,在语音领域可以用于语音识别、语音合成等任务,在推荐领域则可以用于个性化推荐、广告推荐等任务5.1.1大模型的概念

在深度学习领域,大模型通常是具有数百万到数十亿甚至上万亿参数的神经网络模型比如,2020年,OpenAI公司推出了GPT-3,模型参数规模达到了1750亿,2023年3月发布的GPT-4的参数规模是GPT-3的10倍以上,达到1.8万亿,2021年11月阿里推出的M6模型的参数量达10万亿这些模型需要大量的计算资源和存储空间来训练和存储,并且往往需要进行分布式计算和特殊的硬件加速技术。简单来讲,大模型就是用大数据模型和算法进行训练的模型,它能够捕捉到大规模数据中的复杂模式和规律,从而预测出更加准确的结果大模型的“大”的特点体现在:参数数量庞大训练数据量大计算资源需求高......很多先进的模型由于拥有很“大”的特点,使得模型参数越来越多,泛化性能越来越好,在各种专门的领域输出结果也越来越准确5.1.1大模型的概念

大模型的设计和训练旨在提供更强大、更准确的模型性能,以应对更复杂、更庞大的数据集或任务。大模型通常能够学习到更细微的模式和规律,具有更强的泛化能力和表达能力大模型具有更强的上下文理解能力,能够理解更复杂的语意和语境。这使得它们能够产生更准确、更连贯的回答上下文理解能力大模型可以从大量的数据中学习,并利用学到的知识和模式来提供更精准的答案和预测。这使得它们在解决复杂问题和应对新的场景时表现更加出色学习能力强大模型可以生成更自然、更流利的语言,减少了生成输出时呈现的错误或令人困惑的问题语言生成能力学习到的知识和能力可以在不同的任务和领域中迁移和应用。这意味着一次训练就可以将模型应用于多种任务,无需重新训练可迁移性高5.1.1大模型的概念

当前在我国,百度、阿里巴巴、腾讯和华为等公司均已开发出AI大模型,并且这些模型各自有所侧重百度由于其在AI领域的多年布局,具有显著的大模型先发优势,其文心一言API调用服务已经吸引了大量企业进行测试。在行业大模型应用方面,百度已经与国网、浦发、人民网等组织合作,实现了多个案例应用另一方面,阿里巴巴的通义大模型在逻辑运算、编码能力和语音处理方面表现突出,而阿里巴巴集团丰富的生态和在线产品使得该模型在出行、办公和购物等场景中得到了广泛应用5.1.1大模型的概念

小模型通常指参数较少、层数较浅的模型,它们具有轻量级、高效率、易于部署等优点,适用于数据量较小、计算资源有限的场景,例如移动端应用、嵌入式设备、物联网等5.1.2大模型与小模型的区别

而当模型的训练数据和参数不断扩大,直到达到一定的临界规模后,其表现出了一些未能预测的、更复杂的能力和特性,模型能够从原始训练数据中自动学习并发现新的、更高层次的特征和模式,这种能力被称为“涌现能力”。而具备涌现能力的机器学习模型就被认为是独立意义上的大模型,这也是其和小模型最大意义上的区别相比于小模型,大模型通常参数较多、层数较深,具有更强的表达能力和更高的准确度,但也需要更多的计算资源和时间来训练和推理,适用于数据量较大、计算资源充足的场景,例如云端计算、高性能计算、人工智能等5.1.2大模型与小模型的区别

大模型发展历经三个阶段,分别是萌芽期、沉淀期和爆发期5.1.3大模型的发展历程

萌芽期(1950-2005)这是一个以CNN(ConvolutionalNeuralNetworks,卷积神经网络)为代表的传统神经网络模型阶段1956年,从计算机专家约翰·麦卡锡提出“人工智能”概念开始,AI发展由最开始基于小规模专家知识逐步发展为基于机器学习1980年,卷积神经网络的雏形CNN诞生1998年,现代卷积神经网络的基本结构LeNet-5诞生,机器学习方法由早期基于浅层机器学习的模型,变为了基于深度学习的模型,为自然语言生成、计算机视觉等领域的深入研究奠定了基础,对后续深度学习框

您可能关注的文档

文档评论(0)

优选文档 + 关注
实名认证
内容提供者

专注于发布优质文档,喜欢的可以关注一下哦~

1亿VIP精品文档

相关文档