网站大量收购独家精品文档,联系QQ:2885784924

浙江大学DeepSeek之火,可以燎原.pptx

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

浙江大学DeepSeek系列专题线上公开课DeepSeek之火可以燎原

从中华文化基因看DeepSeek成功之道DeepSeek的二点争议报告提纲关于人工智能未来发展之路的思考DeepSeek私有化应用方法

求仁得仁,求佛得佛唐僧,古典名著《西游记》中的人物。俗家姓陈,乳名江流儿,法名玄奘,号三藏。经藏律藏论藏总说根本教义,即佛学的经典著作记述戒规威仪,即律法和仪轨O.-桑托斯三藏阐明经义,即历代高僧大德的读书笔记图片来源/s?id=1809498908099648635wfr=spiderfor=pc

开放、包容和共享历来是我们中华民族的美德克多-D.O.-桑托OpenAIDeepSeek小乘法大乘法以“自渡”为核心,追求个人和家人的幸福以“利他”为核心,追求普度众生

英文的巴别塔魔咒巴别塔魔咒:《圣经》中记载的一个故事,人类为了建造一座通天高塔(巴别塔)以彰显自己的智慧和力量,但上帝为了阻止这一计划,让人类说不同的语言,导致沟通障碍,最终高塔未能建成。这个事件象征着人类因沟通不畅而产生的分裂和冲突。17万+50万+通用词汇,含历史词汇、方言、已经和即将废弃7万专业词汇,各领域总和存克多量100万+总词汇量,含废弃词、科技术语约1000~2000个8500~25000个核心高频词广义新增词增量年

英文将成为AI发展的巨大挑战2050年1.7个地球的算力

英文存储的低效和空间浪费cattle牛meat肉beaf牛肉维克多-D.O.-桑托斯英语发展简史fly飞machine机器airplane飞机图片来源/doc/d47cc98a0233007f900cb41e/2

汉语的高效和可传承汉字起源于上古的象形文字,历经甲骨文、金文、小篆、隶书、楷书、简化字等演变,一路传承,蕴含着中华文明的核心基因密码。从甲骨灼烧的裂纹到手机屏幕的像素点,每一次形态革新都烙印着技术与文化的对话。存量增量37004693350008.5万5万几乎为0年现代常用字维克多-D.O.-桑托斯构词法搭积木,知识迁移康熙字典甲骨文+金文中华字海汉字的演变史生僻字,含古字图片来源/newspage/data/dtlandingsuper?nid=dt_4327727722631580564

DeepSeek与ChatGPT训练语料对比?总语料规模13万亿token?英文语料占比约92.6%,主要来源于互联网公开文本,包括维基百科、新闻报道、书籍、学术论文、程序代码等?中文语料占比仅约0.1%,来源单一,学术文献不足,中文互联网内容(如社交媒体、论坛)噪声较多,需复杂清洗?总语料规模:14.8万亿token,涵盖多语言、数学、编程等领域,其中87%代码、10%英文、3%中文?中文语料特点:有约2.3亿字精校的古典文献;覆盖网络文学、社交媒体、学术论文等现代文本;通过“千字文”式分词算法增强对成语、典故理解?数据处理技术:?过滤机制:采用多层净化技术(如“八面受敌法”),数据噪音剔除精度达99.7%。?分词优化:结合古典语法与现代汉语的分词算法,使成语理解准确率提升38%。?长上下文支持:通过两阶段扩展训练,将上下文窗口扩展至128K,增强长文本处理能力。

用汉字进行模型训练将在这场AI之争中胜出?中文:英文DeepSeek1:3.33ChatGPT1:900

大力出奇迹的范式增加参数提升性能增加数据增加算力产业垄断思想禁锢学术垄断算力性能AI垄断增加算力维克多-D.O.-桑托斯GPT-4oGrok3??27FLOPs??2?FLOPsGPT3BERT-Large??23FLOPs??20FLOPsAlexNet??18FLOPs

中华民族的不屈不挠精神DeepSeek的技术突围算力优化打破CUDA标准库壁垒,为非英伟达算力芯片提供机会维克多-D.O.-桑托斯人工智能三要素我命由我不由天若前方无路我便踏出一条路算法革新采用思维链提升逻辑性能,实现模型的顿悟时刻知识蒸馏+MOE,证明小规模高质量数据远胜低质量大规模数据架构创新

从中华文化基因看DeepSeek的成功之道DeepSeek的二点争议报告提纲关于人工智能未来发展之路的思考DeepSeek私有化应用方法

争议一:知识蒸馏是抄袭还是创新知识蒸馏(KnowledgeDistillation)是一种模型压缩和加速技术,旨在将大型模型(教师模型)的知识迁移到小型模型(学生模型),在减少计算资源消耗,缩短推理时间的同时,尽可能达到接近大型模型的性能。怒发冲冠凭[栏?借?]知识蒸馏的实现过程

争议一:知识蒸馏是抄袭还是创新何为抄袭和剽窃?牛顿第一定律:如果一个物体所受合外力为0,那么这个物体将保持静止或匀速直线运动牛顿第二定律:物体的

文档评论(0)

189****7098 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档