网站大量收购独家精品文档,联系QQ:2885784924

会计研究方法论 第4版 课件 第9章 非结构化数据分析方法.pptx

会计研究方法论 第4版 课件 第9章 非结构化数据分析方法.pptx

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

主讲人:XXX第九章非结构化数据分析方法

01文本分析方法02图像分析方法03音频分析方法目录CONTENTS04视频分析方法

01文本分析方法

文本书面语言的表现形式通常由具有完整、系统含义的一个或多个句子构成文本分析从文本中提取特征项并进行量化的方法体系文本内容的定性和定量分析(一)文本分析的含义

信息来源公众公司披露的文本外部专业机构发布的文本媒体报道文本社交网络文本(一)文本分析的信息来源

(二)文本分析的实施数据搜集与准备文本分析使用的技术方法文本分析的实施

01数据收集:从各信息来源获取原始文本数据如数据库、社交媒体、互联网等信息来源数据清洗:对文本数据进行一系列预处理包括去除HTML标签、纠正拼写错误、过滤停用词、词干化、词形还原等文本分词:将连续的字序列重新分成词语序列,尤其适用于中文文本1.数据收集与准备(二)文本分析的实施

021.字典法:定义:基于预设的字典和规则识别目标文档中的词汇,通过统计计算得到文本的量化特征文本分析步骤:识别词语识别句子特征提取2.文本分析的技术方法(二)文本分析的实施

022.人工判别法:定义:由专业人员对文本进行分类和标注,适用于需要高精度的文本分类任务优势:基于人类的语言理解能力和专业知识与经验,克服字典法的局限性局限:人工识别工作量大2.文本分析的技术方法(二)文本分析的实施

023.机器学习法:定义:利用训练样本进行反复训练,获得具有文本信息分类能力的模型基于是否需要输入人工标签的分类:有监督的学习算法:根据人工标注的素材来引导计算机模拟人类行为无监督的学习算法:利用聚类算法来识别文本特征2.文本分析的技术方法(二)文本分析的实施

(三)文本特征1.文本数量3.文本可读性文本特征2.文本情绪4.文本相似度

01文本数量定义:对文本数据集进行的计数,以度量与指定主体相关的某类文本的累计数量度量方法:计数特定时间段内或数据集内的文本条目数02文本情绪定义:文本所表达的情感极性(如积极、消极、中性)或情感类别(如喜悦、悲伤、愤怒)度量方法:字典法(三)文本特征

03文本可读性定义:衡量文本是否便于理解度量方法:Fog指数(Li,2008)04文本相似度定义:衡量两个文本之间的相似程度度量方法基于关键词匹配将文本映射到向量空间,计算余弦相似度深度学习算法(三)文本特征

问题的提出分析师报告中的定性文本表述能否为信息使用者提供定量预测以外的增量信息理论分析与研究假设研究假设:分析师报告总体文本语气更积极(消极),投资者对有利(不利)定量预测信息的反应更强研究设计与方法文本分析方法:朴素贝叶斯机器学习方法计算分析师报告层面总体语气研究结果分析师报告文本意见更积极(消极)时,投资者对有利(不利)的分析师定量预测的反应更强烈(四)图像分析在会计学术研究中的应用示例

未来发展可考虑将文本信息整合到大数据的分析框架下02局限现有文献从文本中提取的对象特征碎片化,未充分考虑各类文本特征间影响传统的文本分析框架中,仅考虑文本自身,未考虑所研究的文本信息在各类文本中的位置01(五)文本分析的局限和未来

02图像分析方法

图像的定义“图”指用点、线、符号、文字和数字等描绘事物的几何特征、形态、位置及大小“像”是人的视觉系统所接受的图在人脑中所形成的印象或认识图像分析的定义将数学模型和计算机算法结合处理图像,用来分析图像的底层特征和上层结构,提取智能性信息,对图像进行理解和解释图像分析过程对图像的预处理、特征提取、分类和解释数字图像已转换为由逻辑0和l组成的计算机可读二进制格式的图像图像分析技术主要关注数字图像的处理(一)图像分析的含义与信息来源

图像的信息来源企业管理层与证券分析师的照片高管社交账户头像年报中的董事长签名审计报告中的注册会计师签名脑电图卫星云图(一)图像分析的含义与信息来源

数据来源数据库财务报告互联网公开数据第三方数据图像预处理过程灰度化去噪对比度增强1.数据搜集和准备02人工标注法根据图像内容对图像进行分类和标注软件分析法提取图像基本特征,并利用基本特征和标注后的图像数据集训练卷积神经网络等深度学习模型,以输出需要预测的特征2.图像分析的技术方法01(二)图像分析的实施

①人脸特征会计学指标:面部吸引力、面部宽高比、面部可信度②签名图像特征定义:人们书写或签字时的潜意识行为会计学指标:签名图像的大小④脑电图和眼动仪成像特征定义:使用脑部电极和眼动追踪眼镜识别人类情绪的多模态图形会计学指标:个体注意力③卫星遥感成像特征定义:用于地球科学研究,包括生物圈、冰冻圈、水圈或大气层的影响的分析产品会计学指标:灯光亮度指标(三)图像特征

问题的提出审计师的自恋程度如何影响其出具的审计报告质量理论分析与研究假设自恋审计师的积极自我认知观点,对审计质量呈现出正

您可能关注的文档

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档