語音相關問題 |
尚未結案
|
huei_brother
一般會員 發表:36 回覆:15 積分:10 註冊:2004-08-23 發送簡訊給我 |
|
qmlab
一般會員 發表:0 回覆:6 積分:11 註冊:2008-02-15 發送簡訊給我 |
for example (with 16K 8 bit waveform):
(A). 每次抓256聲音取樣點為一個音框長 Frame (B). x 一階高通數位濾波器 H(Z)=1-0.95Z^-1 (C). x Hamming Windows W(n)=0.54-0.46cos(2n*pi/(N-1)) 0<= n <=N-1 (D). 利用FilterBank or FFT or LPC 可求取12個參數,代表256個取樣點的特徵參數, 所以啦!可巨量簡少語音的資料量! (E). Shift 128 point then goto (A), until waveform of tail waveform I----------------------------------------------------------------------------I Frame0 I---------I (256) x HxW ->12 Feature Frame1 I---------I(256)xHxW ->12 Feature . . . . Frame N I-------I(256)xHxW ->12 Feature
編輯記錄
qmlab 重新編輯於 2008-02-18 18:31:57, 註解 無‧
|
本站聲明 |
1. 本論壇為無營利行為之開放平台,所有文章都是由網友自行張貼,如牽涉到法律糾紛一切與本站無關。 2. 假如網友發表之內容涉及侵權,而損及您的利益,請立即通知版主刪除。 3. 請勿批評中華民國元首及政府或批評各政黨,是藍是綠本站無權干涉,但這裡不是政治性論壇! |