- 1、本文档共42页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
人类经验与AI算法的镜像之旅
语言的奥秘:人类如何解码世界
从符号到智能:AI的语言理解之路
DeepSeek-V3:大语言模型的构建与进化
DeepSeek-R1:推理模型的诞生与突破
智能体时代:AI如何重塑教育未来
语言对我们有多重要
语言造就了人类,人和动物的根本区别就是人具有创造性地运用语言的能力
?语言赋予人类秩序
?语言是思维的工具
?语言是合作的纽带
如果想要实现通用的人工智能,理解人类使用的不太精确、可能有歧义、混乱的语言是一个有效途径。
维克多-D.O.-桑托斯的《是什么让我们成为人类》
语言对我们有多重要,《光明日报》,刘松青,2019-06-01
人类是如何理解语言的?
“下雨”/“家”/“收衣服”这些词语,基于我们的经验,在我们大脑中已经建立了固定的神经连接。
人类是如何理解语言的?
人类大脑通过理解每个词语的意思、进行词语组装,从而得到句子的意思,甚至推断出句子背后的含义。因此,理解语言的基础是理解词语及词语间的关联关系。
人类是如何理解语言的?
人类语言的精准解译与语义歧义的消解具有显著的语境依赖性,需通过系统性整合上下文信息构建语义解析模型。
语言的奥秘:人类如何解码世界
从符号到智能:AI的语言理解之路
DeepSeek-V3:大语言模型的构建与进化
DeepSeek-R1:推理模型的诞生与突破
智能体时代:AI如何重塑教育未来
计算机的数字化世界
计算机理解一切信息的基础是将信息进行数字化。在处理图像时,计算机会将图像的每一个像素转换为数字信号,通常使用颜色的RGB值来表示每个像素。
TowardsSeamlessCommunicationforSignLanguageSupport:Architecture,Algorithms,andOptimization
语言的数字化
计算机无法直接理解离散的人类语言
词向量(wordembedding)和词与词之间的位置关系
词向量及单词之间的相似度
man
man
dog
cat
cat
l欧式距离:两个点(或向量)在空间中的“直线距离”。它反映了两个向量的绝对差异。欧氏距离值越小,说明两个向量越接近;值越大,说明差异越大。
u余弦相似度:两个向量之间夹角的余弦值来衡量它们的相似度。它反映了两个向量的方向是否相似,而不关心向量的大小。更适用于比较两者相似性(如文本相似度)。
词向量模型的缺陷
?在序列数据中,同一个元素处在不同的上下文中意思是不同的。如:
?(1)Theanimaldidn’tcrossthestreetbecauseitwastootired.(那只动物没有过马路,因为它太累了。)
?(2)Theanimaldidn’tcrossthestreetbecauseitwastoowide.(那只动物没有过马路,因为马路太宽了。)
?然而,传统的词向量模型中同一个词只有一个向量,这对于一些词语会造成歧义问题,如何解决这个问题呢?
https://jalammar.github.io/illustrated-transformer/
注意力机制与上下文建模
?
?大语言模型通过使用Transformer架构,可以为每个词生成一个上下文相关的词向量,这解决了传统词向量无法处理多义词和上下文依赖的问题。
?一个单词的真实含义,不仅仅取决于它自身,还取决于句子中的其它上下文信息(来自其它单词的信息)。
?一个单词的向量值,需要融合从句子上下文中的其他单词中的信息,在数学上可以表达为所有单词的向量值的加权平均。这些权重值,我们可以称之为注意力权重(attentionweights)。
it与其他单词之间的注意力权重。蓝色的深浅表达了权重的相对大小。
https://jalammar.github.io/illustrated-transformer/
语言的奥秘:人类如何解码世界
从符号到智能:AI的语言理解之路
DeepSeek-V3:大语言模型的构建与进化
DeepSeek-R1:推理模型的诞生与突破
智能体时代:AI如何重塑教育未来
文字接龙游戏
?大语言模型(LLM)最令人印象深刻的能力是它能够通过对话的方式回答用户的问题。那么LLM回答问题的原理是什么呢?
?不同于传统问答系统中答案来源于现成的网络或者数据库,大语言模型的回答是随着提问的进行自动生成的。
?这一点很像文字接龙游戏,大语言模型会基于前
您可能关注的文档
- 电子行业深度研究报告:AI眼镜洞见未来,SoC智控万物互联.docx
- 餐饮行业产品上新报告(2025年1月)-红餐研究院.docx
- 2024年度中国电商服务商消费投诉数据与典型案例报告-网经社.docx
- 2025面向工程审计行业的DeepSeek大模型应用指南.docx
- 2024年度中国品牌电商消费投诉数据与典型案例报告-网经社.docx
- 2025年deepseek技术全景解析报告-重塑全球AI生态的中国力量.docx
- 2025年防晒市场洞察及趋势前瞻.pptx
- 2024年中国汽车产业出海回顾分析-中汽信科国际化研究团队.pptx
- 连锁超市品牌小红书营销推广方案.docx
- 对标一流-2025年国央企风控合规案例白皮书-启信慧眼.docx
文档评论(0)