网站大量收购闲置独家精品文档,联系QQ:2885784924

数据科学技术与应用——基于Python实现(第2版)课件 9-时序数据和语音处理.pdf

数据科学技术与应用——基于Python实现(第2版)课件 9-时序数据和语音处理.pdf

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

时序数据与语音处理

9.1时序数据

•时间序列数据

•连续观察同一对象在不同时间点上获得的数据样

本集

•处理目标:对给定的时间序列样本,找出统计特

性和发展规律性,推测未来值

2017/1/12119.25118.895119.3118.21

2017/1/13119.04119.11119.62118.81

2017/1/17120118.34120.24118.22

2017/1/18119.99120120.5119.71

2017/1/19119.78119.4120.09119.37

2017/1/20120120.45120.45119.7346

•语音是一类特殊的时序数据

•识别语音对应的文本信息是当前人工智能的热点

时序数据特性从趋势性角度,时间序列可划

分为平稳序列和非平稳序列。

1)趋势性

时间序列在长时间内所呈现出来的行为,指受某种根本性因

素影响而产生的变动或缓慢的运动

2)循环性

指时间序列的变动有规律地徘徊于趋势线上下并反复出现

3)季节性

一年内随季节变换而发生的有规律的周期性变化,比如流感

季,但更小单位的周期变动也被看成季节成分,如日交通流

量反映了一天内“季节”变化情况

4)波动性

围绕前3个要素的随机性波动,是一种无规律可循的变动

观察时序数据

•最简单、有效的方法是以时间为横轴,以序列

观察值为纵轴绘制时间序列图

(a)人口增长趋势(b)语音数据

时序数据特征的提取(1)

(1)基于统计方法的特征提取

•提取数据波形的均值、方差、极值、波段、功率谱、过

零率等统计特征,代替原时序数据作为特征向量

(2)基于模型的特征提取

•用模型去刻画时间序列数据,然后提取模型的系数作为

特征向量

时序数据特征的提取(2)

(3)基于变换的特征提取

•通过变换使数据的特性突显出来,以便提取

•主要有时频变换和线性变换

•如快速傅里叶变换、小波变换和主成分分析

(4)基于分形理论的特征提取

•分形是指具有无限精细、非常不规则、无穷自相似的结

•在大自然中,海岸线、雪花、云雾这些不规则形体都属

于分形,即部分与整体有自相似性,可提取分维数作为

特征参数

例9-1:某公司2017年股票价格保存在数据集

cPice.c,绘制股票收盘价的时序图,并提取该时序

数据的常用特征值

•从文件中读取日期及当日股票收盘价两列数据构成时序

数列

importpandasaspd

importmatplotlib.pyplotasplt

plt.rcParams[font.sans-serif]=[SimHei]#设置中文字体

#设置usecols,从文件中只读取指定列

df=pd.read_csv(data/stockPrice.csv,index_col=0,

usecols=[0,1])

print(df.describe())

#绘制时序图,并添加图元

df.plot(title=2017年某公司股票价格变化图,grid=True)

plt.xlabel(时间(天))

plt.ylabel(股价(美元))

plt.show()

•用DaaFae的decibe()方法统计该序列的一些常用特征

表8-1某公司2017年股票

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档