語音相關問題

發文回覆瀏覽次數：1372

推到 Plurk!

推到 Facebook!

尚未結案

huei_brother
一般會員

發表：36
回覆：15
積分：10
註冊：2004-08-23

發送簡訊給我

#1 引用回覆回覆

發表時間：2005-01-02 18:02:16

IP:211.76.xxx.xxx 未訂閱

請問一下板上不知是否有在做語音辨識方面研究的朋友可否告訴一下小弟在取音框方面程式該如何下手啊小弟最近常是寫了幾個程式都無法成功請各位幫個忙謝謝

qmlab
一般會員

發表：0
回覆：6
積分：11
註冊：2008-02-15

發送簡訊給我

#2 引用回覆回覆

發表時間：2008-02-18 17:59:07

IP:60.250.xxx.xxx 訂閱

for example (with 16K 8 bit waveform):

(A). 每次抓256聲音取樣點為一個音框長 Frame

(B). x 一階高通數位濾波器
H(Z)=1-0.95Z^-1

(C). x Hamming Windows
W(n)=0.54-0.46cos(2n*pi/(N-1)) 0<= n <=N-1

(D). 利用FilterBank or FFT or LPC 可求取12個參數,代表256個取樣點的特徵參數, 所以啦!可巨量簡少語音的資料量!

(E). Shift 128 point then goto (A), until waveform of tail

waveform I----------------------------------------------------------------------------I

Frame0 I---------I (256) x HxW ->12 Feature
Frame1 I---------I(256)xHxW ->12 Feature
.
.
.
.
Frame N I-------I(256)xHxW ->12 Feature

編輯記錄

qmlab 重新編輯於 2008-02-18 18:31:57，註解無‧

系統時間：2024-09-29 5:48:47

聯絡我們 | Delphi K.Top討論版

本站聲明

1. 本論壇為無營利行為之開放平台，所有文章都是由網友自行張貼，如牽涉到法律糾紛一切與本站無關。
2. 假如網友發表之內容涉及侵權，而損及您的利益，請立即通知版主刪除。
3. 請勿批評中華民國元首及政府或批評各政黨，是藍是綠本站無權干涉，但這裡不是政治性論壇！