2025语言解码双生花：人类经验与AI算法的镜像之旅.docx

下载文档

1
0
约7.39千字
约 42页
2025-03-08 发布于北京
举报
版权申诉
保障服务

2025语言解码双生花：人类经验与AI算法的镜像之旅.docx

1、本文档共42页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

人类经验与AI算法的镜像之旅

语言的奥秘：人类如何解码世界

从符号到智能：AI的语言理解之路

DeepSeek-V3：大语言模型的构建与进化

DeepSeek-R1：推理模型的诞生与突破

智能体时代：AI如何重塑教育未来

语言对我们有多重要

语言造就了人类，人和动物的根本区别就是人具有创造性地运用语言的能力

?语言赋予人类秩序

?语言是思维的工具

?语言是合作的纽带

如果想要实现通用的人工智能，理解人类使用的不太精确、可能有歧义、混乱的语言是一个有效途径。

维克多-D.O.-桑托斯的《是什么让我们成为人类》

语言对我们有多重要，《光明日报》，刘松青，2019-06-01

人类是如何理解语言的？

“下雨”/“家”/“收衣服”这些词语，基于我们的经验，在我们大脑中已经建立了固定的神经连接。

人类是如何理解语言的？

人类大脑通过理解每个词语的意思、进行词语组装，从而得到句子的意思，甚至推断出句子背后的含义。因此，理解语言的基础是理解词语及词语间的关联关系。

人类是如何理解语言的？

人类语言的精准解译与语义歧义的消解具有显著的语境依赖性，需通过系统性整合上下文信息构建语义解析模型。

语言的奥秘：人类如何解码世界

从符号到智能：AI的语言理解之路

DeepSeek-V3：大语言模型的构建与进化

DeepSeek-R1：推理模型的诞生与突破

智能体时代：AI如何重塑教育未来

计算机的数字化世界

计算机理解一切信息的基础是将信息进行数字化。在处理图像时，计算机会将图像的每一个像素转换为数字信号，通常使用颜色的RGB值来表示每个像素。

TowardsSeamlessCommunicationforSignLanguageSupport:Architecture,Algorithms,andOptimization

语言的数字化

计算机无法直接理解离散的人类语言

词向量（wordembedding）和词与词之间的位置关系

词向量及单词之间的相似度

man

dog

cat

l欧式距离：两个点（或向量）在空间中的“直线距离”。它反映了两个向量的绝对差异。欧氏距离值越小，说明两个向量越接近；值越大，说明差异越大。

u余弦相似度：两个向量之间夹角的余弦值来衡量它们的相似度。它反映了两个向量的方向是否相似，而不关心向量的大小。更适用于比较两者相似性（如文本相似度）。

词向量模型的缺陷

?在序列数据中，同一个元素处在不同的上下文中意思是不同的。如：

?(1)Theanimaldidn’tcrossthestreetbecauseitwastootired.(那只动物没有过马路，因为它太累了。)

?(2)Theanimaldidn’tcrossthestreetbecauseitwastoowide.(那只动物没有过马路，因为马路太宽了。)

?然而，传统的词向量模型中同一个词只有一个向量，这对于一些词语会造成歧义问题，如何解决这个问题呢？

https://jalammar.github.io/illustrated-transformer/

注意力机制与上下文建模

?大语言模型通过使用Transformer架构，可以为每个词生成一个上下文相关的词向量，这解决了传统词向量无法处理多义词和上下文依赖的问题。

?一个单词的真实含义，不仅仅取决于它自身，还取决于句子中的其它上下文信息（来自其它单词的信息）。

?一个单词的向量值，需要融合从句子上下文中的其他单词中的信息，在数学上可以表达为所有单词的向量值的加权平均。这些权重值，我们可以称之为注意力权重(attentionweights)。

it与其他单词之间的注意力权重。蓝色的深浅表达了权重的相对大小。

https://jalammar.github.io/illustrated-transformer/

语言的奥秘：人类如何解码世界

从符号到智能：AI的语言理解之路

DeepSeek-V3：大语言模型的构建与进化

DeepSeek-R1：推理模型的诞生与突破

智能体时代：AI如何重塑教育未来

文字接龙游戏

?大语言模型（LLM）最令人印象深刻的能力是它能够通过对话的方式回答用户的问题。那么LLM回答问题的原理是什么呢?

?不同于传统问答系统中答案来源于现成的网络或者数据库，大语言模型的回答是随着提问的进行自动生成的。

?这一点很像文字接龙游戏，大语言模型会基于前

您可能关注的文档

文档评论（0）

哈哈 + 关注: 实名认证

内容提供者

嗨，朋友，我都会用最可爱的语言和最实用的内容，帮助你更好地理解和应对职场中的各种挑战！

咨询Ta 进入空间

1亿VIP精品文档

更多 >

2025语言解码双生花：人类经验与AI算法的镜像之旅.docx