- 1、本文档共118页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
ChatGPT的工作原理
—0—
前言
ChatGPT能够自动生成一些读起来表面上甚至像人写的文字的东西,这非常了不起,而且出乎意料。但它是如何做到的?为什么它能发挥作用?我在这里的目的是大致介绍一下ChatGPT内部的情况,然后探讨一下为什么它能很好地生成我们认为是有意义的文本。
还没使用过ChatGPT的伙伴可以点击下面链接直接使用(不需要科学上网工具,后台对接的是OpenAI和微软的官方接口):
/
我首先要说明一下,我将把重点放在正在发生的事情的大的方向上,虽然我会提到一些工程细节,但我不会深入研究它们。(我所说的实质内容也同样适用于目前其他的“大型语言模型”LLM和ChatGPT)。
首先要解释的是,ChatGPT从根本上说总是试图对它目前得到的任何文本进行“合理的延续”,这里的“合理”是指“在看到人们在数十亿个网页上所写的东西之后,人们可能会期望某人写出什么”。
因此,假设我们已经得到了“人工智能最好的是它能去做……”的文本
(“ThebestthingaboutAIisitsabilityto”)。想象一下,扫描数十亿页的人类书写的文本(例如在网络上和数字化书籍中),并找到这个文本的所有实例——然后看到什么词在接下来的时间里出现了多少。
ChatGPT有效地做了类似的事情,除了(正如我将解释的)它不看字面文本;它寻找在某种意义上“意义匹配”的东西。但最终的结果是,它产生了一个可能出现在后面的词的排序列表,以及“概率”。
值得注意的是,当ChatGPT做一些事情,比如写一篇文章时,它所做的基本上只是反复询问“鉴于到目前为止的文本,下一个词应该是什么?”——而且每次都增加一个词。(更准确地说,正如我将解释的那样,它在添加一个“标记”,这可能只是一个词的一部分,这就是为什么它有时可以“编造新词”)。
在每一步,它得到一个带有概率的单词列表。但是,它究竟应该选择哪一个来添加到它正在写的文章(或其他什么)中呢?人们可能认为它应该是“排名最高”的词(即被分配到最高“概率”的那个)。
但是,这时就会有一点巫术开始悄悄出现。因为出于某种原因——也许有一天我们会有一个科学式的理解——如果我们总是挑选排名最高的词,我们通常会得到一篇非常“平淡”的文章,似乎从来没有“显示出任何创造力”(甚至有时一字不差地重复)。但是,如果有时(随机的)我们挑选排名较低的词,我们会得到一篇“更有趣”的文章。
这里有随机性的事实意味着,假如我们多次使用同一个提示,我们也很可能每次都得到不同的文章。而且,为了与巫术的想法保持一致,有一个特定的所谓“温度”参数(temperatureparameter),它决定了以什么样的频率使用排名较低的词,而对于论文的生成,事实证明,0.8的“温度”似乎是最好的。(值得强调的是,这里没有使用任何“理论”;这只是一个在实践中被发现可行的问题)。例如,“温度”的概念之所以存在,是因为恰好使用了统计物理学中熟悉的指数分布,但没有“物理”联系——至少到目前为止我们如此认为。)
在我们继续之前,我应该解释一下,为了论述的目的,我大多不会使用ChatGPT中的完整系统;相反,我通常会使用更简单的GPT-2系统,它有一个很好的特点,即它足够小,可以在标准的台式电脑上运行。
因此,对于我展示的所有内容,包括明确的沃尔弗拉姆语言(WolframLanguage)代码,你可以立即在你的计算机上运行。
例如,这里是如何获得上述概率表的。首先,我们必须检索底层的“语言模型”神经网:
稍后,我们将看看这个神经网的内部,并谈谈它是如何工作的。但现在我们可以把这个“网络模型”作为一个黑匣子应用于我们迄今为止的文本,并要求按概率计算出该模型认为应该选择的前五个词:
这就把这个结果变成了一个明确的格式化的“数据集”:
如果重复“应用模型”——在每一步中加入概率最高的词(在此代码中被指定为模型的“决定”),会发生什么:
如果再继续下去会发生什么?在这种情况下(“零温度”),很快就会出现相当混乱和重复的情况:
但是,如果不总是挑选“顶级”词,而是有时随机挑选“非顶级”词(“随机性”对应“温度”为0.8)呢?人们又可以建立起文本:
而每次这样做,都会有不同的随机选择,文本也会不同——如这5个例子:
值得指出的是,即使在第一步,也有很多可能的“下一个词”可供选择(温度为
您可能关注的文档
- 三分钟看懂ChatGPT分享.docx
- ChatGPT 提问艺术分享.docx
- 02-王淑娟-政策对分布式光伏市场的影响.pptx
- 04-黄伟-阳光智维S3新品发布.pptx
- 05-于文涛-不同上网模式投资风险分享北控清洁能源.pptx
- 06-赵为-智慧阳光解决方案7.0-阳光电源.pptx
- 09-沈文忠-晶硅双面电池技术助力光伏领跑者计划升级.pptx
- 15-张显立-质胜分布 领跑未来.pptx
- 16-董晓青-“双玻+”在光伏电站中的应用.pptx
- 17-肖福勤-漂浮式光伏电站新挑战与新技术.pptx
- 2025年中国个人生活护理行业发展潜力分析及投资方向研究报告.docx
- 2025年中国印刷业和记录媒介复制行业市场深度分析及投资规划研究报告.docx
- 中国自来水行业发展趋势预测及投资战略咨询报告.docx
- 2025-2031年中国男士美容SPA行业市场深度分析及投资策略研究报告.docx
- 2018-2024年中国锅炉燃料油市场深度评估及投资方向研究报告.docx
- 2023-2028年中国多孔介质燃烧行业市场深度分析及投资策略咨询报告.docx
- 2025年中国建筑能源管理市场深度分析及投资战略咨询报告.docx
- 《自觉维护正义》课件.ppt
- 2025年中国智慧健康养老行业发展监测及投资前景展望报告.docx
- 2020-2025年中国浙江省特色小镇建设行业发展潜力分析及投资方向研究报告.docx
- 资料网上有哪些信誉好的足球投注网站整理 + 关注
-
实名认证服务提供商
资料网上有哪些信誉好的足球投注网站整理,资料网上有哪些信誉好的足球投注网站整理,资料网上有哪些信誉好的足球投注网站整理。
文档评论(0)