- 1、本文档共35页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
LPC 分析 (线形予测分析)
* 画像情報特論 (5) ディジタル圧縮とメディア表現 (2) 音声?オーディオ、SMIL、グラフィクス 情報ネットワーク専攻 甲藤二郎 E-Mail: katto@waseda.jp 音声?オーディオ圧縮の 原理 ディジタルオーディオ キャプチャ&圧縮 マイク サウンドキャプチャ 音声: 8 kHz 、8 ビット オーディオ: 22.5, 44.1, 48 kHz、16 ビット 典型的なサンプリングレート 音声?オーディオ符号化の歴史 2 4 8 16 32 64 128 256 512 守谷: “音声符号化” 40 80 90 00 kbit/s G.711 (PCM) G.726 (ADPCM) MPEG1 MPEG4 G.728 (CELP) G.723.1 (CELP) G.729 (CELP) ボコーダ (音源モデル) GSM (CELP) VSELP PSI-CELP AMR (CELP) CD/DAT オーディオ 電話 波形符号化 (フィルタバンク) CELP (音源モデル) PCM 携帯 音声符号化 (1) 音声合成モデル 周期パルス ランダム雑音 x G (ゲイン) 声道モデル 有声音 無声音 ピッチ周期 パルス列 (有声?無声) ピッチ周期 ゲイン LPCパラメータ 以下のパラメータを推定 (予測) して送信する 音源 (パルス源) 声道 (フィルタ) LPC分析合成 L.Rabiner et al: “Fundamentals of Speech Recognition” 励振ベクトル 音声符号化 (2) CELP CELP: Code Excitation Linear Prediction 守谷: “音声符号化” ゲイン探索 ピッチ予測 雑音予測 + - 誤差最小化 局所デコーダ 音声入力 LPC分析 LPC合成 音声出力 音声符号化 (3) LPC 分析 (線形予測分析) : 声道モデル LPC: Linear Prediction Coding s(n): 音声サンプル ak: LPC係数 p: LPC分析次数 G: 励振ゲイン u(n): 正規化励振項 過去の k 個のサンプル値から線形予測 (注) 通常、画像のモデルでは雑音と扱う r(k): 自己相関係数 ak: 推定LPC係数 ^ 予測誤差二乗平均の最小化 自己相関法 (Durbinのアルゴリズム) 音声符号化 (4) ベクトル量子化 : 音源パルス列 励振ベクトルとゲインの探索: d: ひずみ x: 目標ベクトル (入力音声) A: LPC係数行列 g: ゲイン c: 励振ベクトル (パルス列) となる励振ベクトルとゲインを探索 さまざまな探索手法 ... 励振ベクトル → ベクトル量子化 ゲイン → スカラー量子化 (声道パラメータ → ベクトル量子化) コード ブック ベクトル 量子化 入力 出力 インデクス コード ブック 探索 事前学習 音声符号化 (5) ベクトル量子化 :コードブックの学習 (1) K-平均アルゴリズム (一般化 Lloyd アルゴリズム) クラスタ (符号ベクトル) 初期化 最近隣 (NN) 探索 クラスタ重心更新 新しい 学習ベクトルの入力 (M: 符号ベクトル数) (L: 学習ベクトル数) (ユークリッド距離の場合) 欠点: 最終結果が初期ベクトルに依存 音声符号化 (6) ベクトル量子化 :コードブックの学習 (2) LBG アルゴリズム 全学習ベクトルの 重心算出 (初期化) クラスタ分割 最近隣 (NN) 探索 クラスタ重心更新 新しい 学習ベクトルの入力 k-平均アルゴリズム オーディオ符号化 (1) オーディオ符号化の基本 音声入力 周波数 分割 周波数 分析 心理聴覚 分析 量子化 エントロピー 符号化 周波数分割、周波数分析: FFT、サブバンド分割 (QMF)、MDCT 心理聴覚分析: 絶対閾値とマスキング 量子化、エントロピー符号化: スカラー量子化とハフマン符号 オーディオ符号化 (2) 心理聴覚分析 絶対閾値: 人間は絶対可聴閾値よりも大きな音しか知覚できない マスキング (相対閾値): 大きな音の周波数の近傍の小さな音の周波数は知覚できない 振幅 振幅 周波数 周波数 聞こえる 聞こえない 聞こえる 聞こえない オーディオ符号化 (3) MP3 (MPEG-1 Layer III) QMF 適応ブロック長 MDCT FFT 心理聴覚分析 非線形量子化 量子化制御 ハイブリッド分割 ハフマン符号化 QMF FFT 心理聴覚分析 線形量子化 符号化 cf. Layer I, II オーディオ符号化 (4) MPEG-2 A
您可能关注的文档
- HD100U产品规格 产品特性 采集单路HDMI高清视频信号 输入输出.DOC
- HD DVD、蓝光光碟的比较.PPT
- HCS-8300MO 系列8通道音频输出器.PDF
- HDMI切换器- 音频分离输出.DOC
- HDTV数字电视EMC测试用码流信号制作 - 江苏省电子信息产品质量.PDF
- Gompton散射对激光等离子体通道天线特性的影响 - 原子与分子物理.PDF
- HDMI 标准横空出世HDMI 的全称是“High Definition Multimedia.PDF
- Expert PH 使用手册使用前条件确认延长的时间在去离子水中 测量步骤.PDF
- HisSep Ni-NTA Agarose Resin 6FF His 标签蛋白琼脂糖高速纯化树脂.PDF
- HJ_T 334-2006 环境保护产品技术要求电渗析装置.PDF
最近下载
- 番茄小说签约合同范本.docx VIP
- 高中研究性学习报告(第3小组) 饮食与健康.docx
- 国家开放大学《管理英语4》边学边练Unit 1-4(答案全).docx VIP
- 3D工程图学(华中科大)中国大学MOOC慕课 章节测验 客观题答案.docx
- 【2024新教材】道德与法治七年级上册第二课正确认识自我测试卷(含答案).pdf VIP
- 跨学科主题学习的实践探索.pptx
- 基于Price—Mueller模型知识型员工职业幸福感与敬业度关系研究.doc
- 04词根-词根词缀大全doc.doc VIP
- HIKVISION海康威视DS-8664N-I16DS-8600N-I16_210323说明书用户手册.pdf
- 兰州财经大学长青学院关于增设互联网金融本科专业的论证报告.pdf
文档评论(0)