- 1、本文档共18页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
灵云智能会议转写系统解决方案
变更记录
版本号
修改点说明
变更人
变更日期
审批人
审批日期
1.0
修改点说明的内容有如下几种:创建、修改(+修改说明)、删除(+删除说明)
目 录
TOC \o 1-3 \h \z 1 背景概述 4
2 系统架构 5
2.1 逻辑架构 5
2.2 物理架构 6
3 功能描述 7
3.1 灵云智能会议转写系统 7
3.1.1创建会议 7
3.1.2关键词优化 8
3.1.3会议实时转写 9
3.1.4历史会议记录回听 10
3.1.5会议状态控制 11
3.1.6会议信息自动播报 11
3.1.7导出/打印/保存 12
3.2 灵云全智能能力平台介绍 13
3.2.1语音合成 14
3.2.2语音识别 14
4 系统的益处与价值 17
5 技术要求 18
5.1 软硬件配置清单 18
5.2 软硬件性能要求 18
5.2.1软件参数 18
5.2.2硬件参数 19
背景概述
当前,随着人工智能技术的不断发展和应用普及,针对多人连续语音的识别应用已经十分成熟。将人工智能应用到会议室实时识别转写场景下,改变当前的会议纪要模式,实现在会议过程中对会议的发起方、参与方、主席、主持人、秘书等将各方发言的内容自动实时识别成文字,能够成倍提升会议的效率,并将大幅减轻会议记录员的工作强度和压力。而且部分会议信息量大、讨论问题多、会议时间长等要素,人工记录很难做到完全保存会议信息,这时灵云智能会议转写系统能够做到记录整个会议过程全量信息,从而体现出巨大的实用价值。
系统架构
逻辑架构
智能会议转写系统的逻辑框架如下图所示。
图1系统逻辑架构
系统依托于全智能能力平台提供的语音识别(ASR)和语音合成(TTS)能力,主要包括采音模块、业务系统和存储模块三部分:
采音模块:主要通过麦克风及USB声卡等硬件采集会议音频数据。
业务系统:该系统为会议速记员等提供实时的语音识别文本展现、相关资料展现和会议流程中各种基础处理功能,便于相关人员便捷实用系统,提高工作效率。
存储模块:将业务相关数据存储于Redis数据库、Oracle数据库和文件服务器中,根据实际业务情况提供能力支撑和应用服务。
物理架构
智能会议转写系统的物理框架如下图所示。
图2 系统部署架构
系统物理框架首先需要在公司内网服务器上搭建语音平台,并且针对单个会议室需要新增一台专用采集设备和一台Windows电脑,Windows电脑要能够与语音能力平台服务器相连接。具体系统流程如下:
会议室内的N个麦克风通过并线连接采音设备,采音设备实现将模拟信号音频转换为数字信号,通过USB连线与局域网内的Windows电脑相连接,将音频输出到台式机上。
在速记员电脑上安装录音软件负责把采音设备采集到的数字信号通过公司内网发送给后台语音识别服务器。
语音识别服务器负责将音频识别为文字,发送给速记员电脑上的网页端会议系统。
速记员通过网页端会议系统可以实时查看、编辑、修改识别出的文字内容。
功能描述
智能会议转写系统
产品结构图:
3.1.1创建会议
功能描述:
速记员创建会议的时候,在网页上选择会议室,系统会自动关联到对应会议室的麦克风,速记员即可对麦克风的角色姓名进行编辑,从而在会议转写的直播过程中来达到区分角色的效果。此外,在网页界面上支持对当前会议的编号、名称、开会时间、开会地点等信息进行编辑设置,方便会后整理和查阅。
业务流程图:
界面效果图:
3.1.2关键词优化
功能描述:针对会议转写过程中,某些个性化或者生僻的词语(例如人名、公司名、地名等)可能出现错误的情况,速记员可以提前输入一些关键词来优化语言识别模型,以便在后面的实时转写过程中,系统自动修正这些文字的转写结果,提高识别准确率,从而减少速记员修改识别结果的工作量,提高会议效率。
业务流程图:
界面效果图:
3.1.3会议实时转写
功能描述:智能会议系统自动识别出来的文字内容虽然具有很高的识别率,但仍可能存在小部分的错误问题,速记员通过网页可以进行实时的修订、保存操作,并且支持复制粘贴、删除替换等操作,实现会议记录的快速修正、生成。具体提供以下功能操作:
普通修改:按照正常word操作习惯提供正常的增删改、复制、粘贴的功能、删除替换等。
个性化词汇添加/快捷替换:速记员可以通过会议记录页面快速添加个性化词汇,增强识别效果,同时可以通过双击个性化词汇列表,可将对应的个性化词汇快捷地替换掉转写输出的错误文本。
业务流程图:
界面效果图:
3.1.4历史会议记录回听
功能描述:速记员在会议记录过程中,因记录不及时、发言人语速过快的情况,通过转写过程中打点标
您可能关注的文档
- 民主生活会PPT模板.pptx
- 酒店管理案例分析.doc
- 网络红人达人签约合同(mcn机构).docx
- 酒店民宿新冠疫情防控消毒管理制度.docx
- 质量手册(地质勘察单位).doc
- 复旦大学硕士研究生开题报告.docx
- 发扬艰苦奋斗-厉行勤俭节约.docx
- 教育机构薪酬制度.docx
- 中华百家姓谱.doc
- 公共建筑节能设计审查表.docx
- 《质量及其测量》(教学设计)-2024-2025学年苏科版(2024)初中物理八年级下册.docx
- 《重力 力的示意图》(教学设计)-2024-2025学年苏科版(2024)初中物理八年级下册.docx
- 《压强》(教学设计)-2024-2025学年苏科版(2024)初中物理八年级下册.docx
- (译林2024版三起)英语三年级下册Unit2.1Cartoon time 课件.pptx
- 江西省十校协作体2024—2025学年高三上学期第一次联考生物试题.docx
- 上海市黄浦区2024-2025学年高三上学期期终调研测试(一模)生物试题.docx
- 2025(新人教PEP版)英语五年级下册 Unit2 大单元教学设计.docx
- 2025(新人教PEP版)英语四年级下册 Unit5 大单元教学设计.docx
- 2025年中考化学核心知识点总结 .docx
- (沪教2024版)英语三年级下册Unit1 Period 1 Get ready 同步练习(含答案).docx
文档评论(0)