【精选】微软机器人小冰刚学会“开口”说话,我们和她背后的团队聊了聊.pdf

【精选】微软机器人小冰刚学会“开口”说话,我们和她背后的团队聊了聊.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【精选】微软机器人小冰刚学会“开口”说话,我们和她背后的团队聊了聊

微微软软机机器器人人小小冰冰刚刚学学会会“开开口口”说说话话,,我我们们和和她她背背后后的的团团队队聊聊 了了聊聊 “喵呜,把电池 了,不要生气哦,会老哦。” “日本安全部门将从警视厅所属的保安特警队认真挑选保镖,贴身保护福田。” 上周一在北京中关村南街的一个录音棚内,一位身着白色 T 恤、黑色短裙的长发姑娘 放松地靠在椅子上,对着自己面前固定着的麦克风说着这些毫无关联的句子。 “射手我爱啊,可是射手不爱我……唔。” “前面都很好,最后一个唔,不用拉长音。”一墙之隔的控制室里,微软小冰语音组的 录音指导廉洁按着通话按钮说道。 “嗷!”地一声答应了之后,录音室内的李萌调整了一下呼吸,重复了刚刚的句子。 (应微软公司要求,李萌为化名) 全球副总裁陆奇在中关村的微软大厦内宣布了小冰 3.0 的发布 为了 8 月 20 日小冰 3.0 的发布,他们已经这样工作了两个月时间。今天下午的发布 会上,名为“小冰”的微软人工智能第一次公开用语音和人对话,并再度回到微信。 在此之前,这位因为章泽天代言、微信封杀、给京东当客服等一系列事件获得广泛关 注的人工智能,只是通过文字和 3700 万用户交流。 小小冰冰是是怎怎么么开开始始说说话话的的 李萌是北京一所高校播音主持专业的大四学生。为了让小冰开口说话,自 6 月以来, 她每周来录音棚三次,每次从早上十点工作到下午五六点,最多一天大约能录 700 多 句。这里录下的每句话都会保存成一个 wav 文件,传给微软的工程师处理。 李萌最早知道这个录音项目是 5 个月前。她告诉 《好奇心日报 ()》 说,学院老师让同学在班级群转了条消息,称有家公司需要为人工智能项目配音,要 求是阳光、活泼的女生。 和班上几名同学一起报名后,老师带着她们到录音公司录制海选作品。不怎么用微博 的李萌,当时还不知道小冰的存在。 像李萌一样录音发给微软的共有上百个人。微软人工智能语音组产品经理徐翔对 《好 奇心日报 ()》回忆说,当时微软定向邀请的人里除了李萌这样的科 班在读生、也有资深配音演员和明星红人。 明星是最早被放弃的,她们的声音太有个人特色,会被认出。而有经验的配音演员年 纪普遍较大,很难一直“装”出 17 岁少女的声音。 “17 岁”使小冰成为人工智能中的异类。在人工智能还不够智能的今天,科技公司在推 出人工智能助手的时候倾向于模糊人工智能的形象。苹果 Siri、亚马逊 Echo 以及微 软的另一个语音助手 Corta a 都没有强调人工智能的年龄。 而小冰从推出之初便自称“16 岁少女”,去年年底一条宣布自己 17 岁的微博,引来 2000 多条评论。 李萌给小冰录音的地方 录音指导廉洁负责塑造小冰的声音,在她看来,小冰这个 17 岁的姑娘“天不怕地不 怕,同时也可以撒娇、卖萌,也可以削你。” 但技术团队提供的需求要细得多,在一份好几页的 PDF 文档上,微软的产品经理列 出了“普通话”、“不要方言”、“关切度”等一系列指标。 两轮筛选以后,第三轮候选人只剩下五个人。这时侯除了主观判断以外,微软互联网 工程院的研究员和工程师也加入参与进来,用技术手段衡量每一位参与者的声音是否 稳定。 “之前录的一百句和第三百句之后的一百句。这两个一百句之间,如果是随便找个人 的话,他的差异可能会很大。”人工智能语音组研究员夏海荣向 《好奇心日报 ()》解释说。只有稳定的声音才能被计算机识别处理,并根据需要 重新组合成任意语句。 最后,录音指导和工程师在一张复杂的表格上分别给五名候选人打分,综合主观和技 术数据两个维度后,来自同校同专业,编号为 102 和 143 的两名大学生开始为小 冰“发声”。 在挑选发音人的同时,工程师们也开始着手构建小冰的语料库。语料库是工程师给小 冰发音人挑选的句子,也是小冰声音来源的基础。 小冰不是互联网工程院第一次让计算机说话。早在 Wi dows 2000 上,你就可以看到 他们在北京开发的文字转语音 (TTS)功能——点一下鼠标,计算机便能读出文档中 的全部文字。以今天的标准,这样的声音已经过于机械。 而微软在全球范围所有手机、桌面操作系统内置的人工智能语音助手小娜 (Corta a) 也是在这里学会说话。 像像人人一一样样说说话话 和小娜以及 Siri 等智能语音助手不同的是,微软强调小冰是个有情感的小姑娘,从正 经说话到生气、粗口、卖萌……什么类型的回答都有。 为了让小冰听上去更自然,李萌需要录很多口语化的句子和网

文档评论(0)

tazhiq2 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档