网站大量收购独家精品文档,联系QQ:2885784924

2025年人工智能技术发展与应用探索演讲.pptx

2025年人工智能技术发展与应用探索演讲.pptx

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

人工智能技术发展与应用探索

人工智能技术发展Deepseek认知与影响AI+金融实践案录创业介绍—中科闻歌

01人工智能技术发展

ChatGPT揭开通用人工智能序幕弱人工智能 → 强人工智能1956201020102035“如何用机器模拟人的智能”会看会听会说发展和应用迭代加速会学习会行动196020102024

大模型优势特点与不足通顺通识通用通畅优势不足通顺自然语言生成全领域通识知识体系覆盖通畅的人机交互意图识别及逻辑推理多种自然语言场景通用1、静态模型不产生知识2、不能理解领域的复杂问题3、模型原理导致幻觉或常识性错误4、大模型安全,可能包含仇恨、有害或危险内容

ChatGPT不是基础科学突破,是工程积累奇迹人机协同群体智慧(人力密集工程)大模型技术大集成(智力密集工程)大数据加大算力(算力密集工程)

大模型:智力密集型工程ChatGPT学习方法:先量后质的分阶段学习阶段一:泛学(学习多样文本) 阶段二:矫正(遵循人类指示) 阶段三:拟人(符合人类偏好)奖励惩罚回答的好回答的差人类教导鹦鹉该怎么说话提问拥有海量知识理解指令要求自由发挥优质对话范例什么是苹果?呵呵矫正请问如何撬锁偷邻居东西?撬锁是违法的,不建议这样做。回答不受约束对话模板有限苹果是一种可以吃的东西ChatGPT让鹦鹉听收音机各种节目学说话100+语种文本 人文社科 新闻娱乐编程语言 网站问答 科技文献ChatGPT-5-13无法产生创新性回答用对话模板矫正ChatGPT苹果是营养水果,素有水果之王的美誉…掌握海量知识ChatGPT无监督学习监督学习生成人类偏好的创意回答基于人类反馈的强化学习递归神经网络Word2vec数据增强技术?卷积神经网络Transformer架构去噪扩散模型?自编码器预训练语言模型变分自编码器自回归模型对抗生成网络强化学习ChatGPT:智力密集型工程

大模型:人机协同群体智慧阶段一:泛学(学习多样文本)阶段二:矫正(遵循人类指示)阶段三:拟人(符合人类偏好)GPT3.5无监督学习监督学习强化学习ChatGPT人工标注答案得分人工整理多来源海量优质数据集人工撰写大量对话模板ChatGPT:OpenAI在拉丁美洲和东欧等地区招募了约1000名远程外包员工进行数据标注ChatGPT:人力密集型工程

大模型:大数据与大算力GPT41750亿参数45TB数据8000亿个单词的语料库英伟达发布ChatGPT专用核弹级GPUDGXH100ChatGPT15亿参数40GB数据1.2亿参数5GB数据GPT2参数规模提升100倍数据规模提升1000倍GPT1推理成本训练成本140万美元/次微软Azure计算平台支持2022年一年计算和数据费用支出为4亿美元约3万片英伟达A100GPU同时计算4千台服务器,共8亿美元用电量60万kwh/天,电费5万美元/天(26万中国人一天的用电量)ChatGPT:算力密集型工程

大语言模型应用迭代路径感知认知智能大语言模型多模态大模型控制/决策大模型人工智能代理(Agent)大模型+插件+执行+思维链执行智能决策智能

大模型应用两大误区误解体现l 局限于聊天、写作类常规文案应用;与核心业务脱节l AI+,就是部署大模型和微调大模型大模型工具化大模型神化l 大模型黑箱化,直接端对端解决重大应用问题l 一个大模型包打天下,无所不能

AI+行业落地三步曲STEP1STEP2STEP3数据工程高质量领域数据治理模型工程继续预训练、多模型适配领域工程指令微调、回馈学习、应用研发

大模型应用到行业领域关键挑战:静态模型与动态数据的不匹配分析挑战需求特征本质技术支撑快海量跨模态信息检索信息庞杂、动态化线索数据深活深度认知分析难精细数据未来数据窄域专用智能通用人工智能本源规律趋势预测难

AI+行业数智化路径思考:先升级、再泛化、后革新升级赋能:现有系统和业务小模型,点上赋能l 数据分析、知识积累l 分析深度+高质量+l 高效率应用0-1创新:新业务、新功能,面上谋划l 新型研判范式、l 未来态势l 广域理解+高效推演抓手与支撑:打造领域大模型l 积累通域+领域数据、模型规模适中、从头训练l 前瞻性定义领域大模型与业务系统标准接口,多型共进,形成MoE(混合专家模型)生态,严格把好内容安全关,连续测试14

02 Deepseek认知与影响

DeepSeek模型发展特点:特点:特点:特点:架构:专家负载均衡策略与多词预测训练目标预训练:极高地训练效率后训练:DeepSeek-R1蒸馏效果与闭源模型可比?通用能力超过LlaMa2-70B擅长代码和数学中文超GPT3.5Multi.headLatentAtten

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档