- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
電腦音樂簡介 游擱嘉 3/1/04’
樂音分離 Separation of Musical Sounds:
Question: 如何在混合在一起的樂音中, 分辨並分離出不同的聲音?
目前為止無解
除Fourier Transform外, 沒有可以避免information loss的信號處理演算法.
於是越處理只會使得資訊越來越少, 沒辦法recover原來的資料.
到目前為止還沒有萬全的解決辦法.
Why do we need to separate musical signals?
For better understanding
For better sound effects
For better transcription results
Some Results:
(Tuomas Virtanen, Anssi Klapuri, Signal Processing Laboratory, Tampere University of Technology, Finland) (見Powerpoint)
自動辨識系統 Automatic Transcription System:
Basic Terms in Computer Music:
-- 數位音樂訊號的儲存格式可分為兩類:
Waveform Representation
Music-Content Representaion
單純紀錄analog聲音波形的數位化結果
只紀錄樂曲裡的的音樂資訊:如音色, 音量與音高
.wav檔
Midi檔
平常聽到的CD音樂 / 畫
樂譜/ 文字敘述
電腦音樂研究,主要目的要使波型型式的聲音資訊(wav)或樂譜型式的音樂資訊(MIDI)能夠進行轉換及資訊處理.
Auto-Transcription System(自動採譜系統)
希望能把雜亂的聲音資訊, 記錄成樂譜的格式
Music-Content的data有利於進一步的處理
儲存: 檔案的大小可以大大的縮小
搜尋: 可以用Music-Content來搜尋樂曲, 不再藉助文字.
基本的想法
Wav檔記錄的是聲音訊號的大小.
而Midi檔記錄的是響度, 音調(音高), 音色.
i.e. 看畫展
實作的方法需要跨領域跨領域的知識
信號處理, 樂理, 音樂心理學(psycho-acoustic), 聲學
問題: 如何辨識音調(音高)
樂音: 從頻譜上來看會多個peak value, 並不是單一頻率的信號.
樂音的音高不單純是指基頻頻率的高低, 而是指一種頻譜型式的分佈.
單純用信號處理的方式沒有辦法解決這個問題
One Solution:
A Phonotopic Map Model for Memorization and Recognition of Musical Sounds (Wu-Hsi Li)
模擬大腦中神經元受刺激的形式, 每個神經元記錄了一種一種頻譜的形式(樂音), 經輸入音樂訓練後, 細胞會漸漸分化, 最後對特定聲音才會起反應.
虛擬環場音效
傳統環場音效
人耳分辨
耳機使用者的虛擬環場音效
兩個音響製造的虛擬環場音效
定向聲波
環場音效是虛擬實境不可缺的要素,也是電腦音樂的主要附加價值,藉由程式的精密控制使得簡單的設備也能達到高級的享受,並更進一步做到傳統的播放機無法達成的效果。
傳統環場音效的達成
欲達成音源環場的感覺,最直覺的方法就是---讓音響環場。所以傳統環場音效需由適當的空間、多個音響、適當的擺放達成。如左圖。大致原則是分為三聲道,左右聲道(電視兩側)、中央聲道(電視機上)及後方聲道(沙發兩側)。
左右與中央聲道同高 2.中央聲道較左右聲道後退
左右聲道與使用者夾角45度 4.後方聲道較使用者高90cm
5.後方聲道為相對,不傾斜
然而這樣的環境與經費並不是人人都有,為了窮學生的幸福以及世界的和平,於是我們想要用輕巧的耳機和便宜的音響來達成環場音效。而欲達成模擬環場音源,須先知人腦如何判斷音源的位址
分辨聲音位址
人類看到的影像之所以能夠呈現立體,是因為兩個眼睛成像的像差 (不信的話把一眼閉上,令兩手一左一右由遠而近,試試能否使兩食指相碰)。立體聲
音呢 ? 「聽覺心理分析」這一學門研究結果顯示,四個因素讓我們決定聲音的位置,一是雙耳聽到同一聲音的時間差,一是雙耳聽到同一聲音的強度差,一是你的外耳形狀 (影響聲音的反射),一是所謂的head shadowing 效應 (也就是說由於雙耳位於頭部兩側,所以某一耳不可能直接聽到聲音,而是間接聽到反射的聲音)。3D 聲音企圖重新營造聲音環境,不只注意到左右,還包括上下以及移動。
人類聽
文档评论(0)