《語音清晰度客觀評(píng)測(cè)》由會(huì)員分享,可在線閱讀,更多相關(guān)《語音清晰度客觀評(píng)測(cè)(29頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、單擊此處編輯母版文本樣式,第二級(jí),第三級(jí),第四級(jí),第五級(jí),*,單擊此處編輯母版標(biāo)題樣式,LOGO,單擊此處編輯母版文本樣式,第二級(jí),第三級(jí),第四級(jí),第五級(jí),單擊此處編輯母版標(biāo)題樣式,*,語音清晰度的客觀評(píng)測(cè),2010.5.21,1,主要內(nèi)容,1,語音清晰度評(píng)測(cè)的發(fā)展概況,2,混響作用下,STIPA,與清晰度的關(guān)系,3,噪聲環(huán)境下,STIPA,與清晰度的關(guān)系,4,總結(jié)與展望,2,1.,語音清晰度的評(píng)測(cè),語音的清晰度或可懂度是音質(zhì)評(píng)價(jià)的重要指標(biāo),反映廳堂或擴(kuò)聲系統(tǒng)的聲音傳輸質(zhì)量,主觀評(píng)價(jià):,組織測(cè)試隊(duì)伍實(shí)地測(cè)試,(,articulation test,),優(yōu)點(diǎn):,直接、真實(shí),缺點(diǎn):,耗費(fèi)人力物力,
2、GB-T 15508-1995,聲學(xué) 語言清晰度測(cè)試方法,3,語音清晰度的客觀評(píng)價(jià)方法,STI,%ALcon,AI,主觀,測(cè)試,盡可能反映真實(shí)的清晰度水平,4,清晰度指數(shù),AI (Articulation Index),French&Steinberg(1947),Fletcher(1953),Kryter(1962),1),測(cè)量或估計(jì)語言頻譜和聽音人處的噪聲有效掩蔽譜計(jì)算得到各頻帶的“有效信噪比”;,2),對(duì)各頻帶信噪比進(jìn)行線性轉(zhuǎn)化至,0,1,得“貢獻(xiàn)值”;,3),基于不同頻帶對(duì)清晰度的貢獻(xiàn)率加權(quán)平均得,AI;,ANSI Std.S3.5-196919861997,特點(diǎn),:特別適用于評(píng)價(jià)諸如
3、,噪聲干擾、有限帶通,等頻域失真引起的語音清晰度惡化程度,不能反映,混響、回聲,或,削峰,等時(shí)域或非線性失真的影響。,5,輔音損失率,%ALcon,(articulation loss of consonants),能不能根據(jù)測(cè)量房間內(nèi)的某些物理量估計(jì)語音清晰度?,Knudsen(1932),Peutz(1971),Klein(1971),根據(jù),大量的實(shí)地測(cè)量和,清晰度,主觀評(píng)價(jià)測(cè)試,的結(jié)果,,Peutz,發(fā)現(xiàn),%ALcon,與房間的聲學(xué)特性相關(guān)。,6,Peutz,公式(經(jīng)驗(yàn)推導(dǎo)),D,聽音處距聲源的距離。單位,m,。,T,60,混響時(shí)間,(1400Hz),。單位,s,。,V,房間的體積。單位
4、,m,3,。,校準(zhǔn)值。針對(duì)不同水平的聽者。,1.5%12.5%,。,D,c,臨界距離。單位,m,。,注意:,SNR25dB,;,單個(gè)無指向性的點(diǎn)聲源,(Q=1),;,7,Klein,對(duì),Peutz,公式的補(bǔ)充,當(dāng)房間聲學(xué)特性難以改善時(shí),采用電聲手段提高語音清晰度。,聲源個(gè)數(shù),n,;聲源指向性因子,Q,;,雖然提高揚(yáng)聲器的,Q,值有助于改善語音清晰度,但,Q,值與清晰度之間是否成簡(jiǎn)單的線性關(guān)系并沒有實(shí)際的實(shí)驗(yàn)數(shù)據(jù)支持。,Jacob(1985),認(rèn)為語音清晰度與,Q,并無直接的關(guān)聯(lián)。,8,輔音損失率,%ALcon,的不足,根據(jù)實(shí)驗(yàn)結(jié)果的經(jīng)驗(yàn)推導(dǎo),物理基礎(chǔ)不夠;,對(duì)于信噪比低于,25dB,的情況估計(jì)
5、不足,不能充分反映噪聲和混響聯(lián)合作用時(shí)的影響;,沒有考慮早期反射聲,單次回響的作用,且結(jié)果僅給出某個(gè)頻帶的清晰度水平,未考慮參數(shù)的頻率特性的影響;,Jacob(1985),9,Hougast&Steeneken(197319801985),IEC Std.60268-16,充分反映聲傳遞系統(tǒng)性能質(zhì)量的優(yōu)劣,輸入端:,說話人發(fā)音,語言傳輸指數(shù),STI(,speech transmission index,),輸出端:,聽者耳朵,語言傳輸系統(tǒng):,充分考慮傳遞過程中噪聲、混響、回響、系統(tǒng)失真等各種干擾因素的影響,Black Box,10,調(diào)制轉(zhuǎn)移函數(shù),MTF(,modulation transfer
6、 function,),連續(xù)的語音可以看成一系列語音碎片,(,音位,),的組合。音位又可以看成是發(fā)音器官對(duì)某種窄帶噪聲調(diào)制的結(jié)果。音位的時(shí)域包絡(luò)中包含了所傳遞的信息。,傳輸過程中,噪聲、混響、系統(tǒng)失真等會(huì)使得包絡(luò)發(fā)生變化,從而導(dǎo)致清晰度惡化,利用,MTF,描述量化包絡(luò)波動(dòng)性能的變化程度。,11,MTF,的計(jì)算,函數(shù)定義為聲信號(hào)經(jīng)傳輸后接收信號(hào)強(qiáng)度包絡(luò)的,調(diào)制度,相對(duì)于原信號(hào)強(qiáng)度包絡(luò)調(diào)制度的降低,它隨調(diào)制頻率不同而變化。,12,STI,的計(jì)算,14,種調(diào)制頻率;,7,種倍頻帶噪聲 作為測(cè)試信號(hào),計(jì)算,98,個(gè),MTF,結(jié)果,類似,AI,計(jì)算中的加權(quán)平均最終得,STI 0,1,根據(jù)房間脈沖響應(yīng)可以
7、直接計(jì)算,MTF,13,STI與語音清晰度,Steeneken(1980),不論是噪聲、帶通限制、削峰、混響等干擾因素,,STI,與語音清晰度得分之間始終有著良好的一致性。,客觀可測(cè)的物理參量,STI,能良好的反映和預(yù)測(cè)真實(shí)的語音清晰度水平。,14,語言傳輸指數(shù),STI,的簡(jiǎn)化算法,限制條件:,無明顯非線性失真;環(huán)境噪聲無脈沖;混響時(shí)間頻率特性平滑;寬帶語言傳輸系統(tǒng);,1,),RASTI(Rapid STI or Room acoustic STI),適用于不包括擴(kuò)聲系統(tǒng)的廳堂語音傳輸質(zhì)量的評(píng)價(jià),選取了語言譜中比較有代表性的頻帶和調(diào)制頻率,15,2,),STIPA(STI for public
8、 address),適用于包括擴(kuò)聲系統(tǒng)的廳堂或電聲系統(tǒng)的語音傳輸質(zhì)量評(píng)價(jià),選取了,7,種倍頻帶載波,每種載波對(duì)應(yīng),2,中調(diào)制頻率,125Hz,250Hz,500Hz,1KHz,2KHz,4KHz,8KHz,1.0Hz,1.0Hz,0.63Hz,2.0Hz,1.25Hz,0.8Hz,2.5Hz,5.0Hz,5.0Hz,3.15Hz,1.0Hz,6.25Hz,4.0Hz,12.5Hz,16,公共廣播系統(tǒng)工程技術(shù)規(guī)范,STIPA,作為評(píng)價(jià)公共廣播語言傳輸質(zhì)量的重要指標(biāo),分類,STIPA,分類,STIPA,業(yè)務(wù)廣播,(一級(jí)),0.55,緊急廣播,(一級(jí)),0.55,業(yè)務(wù)廣播,(二級(jí)),0.45,緊急廣
9、播,(二級(jí)),0.45,業(yè)務(wù)廣播,(三級(jí)),0.35,緊急廣播,(三級(jí)),0.40,17,2.混響作用下STIPA與漢語清晰度的關(guān)系,對(duì)于“聲韻調(diào)”結(jié)構(gòu)語言,漢語,情況是怎樣的?,目的:,在實(shí)驗(yàn)室條件下對(duì)無噪聲純混響作用下,STI-PA,與普通話單音節(jié)清晰度之間的關(guān)系進(jìn)行實(shí)驗(yàn)研究。以期對(duì)搞清楚在純混響作用下普通話單音節(jié)清晰度與語言傳輸指數(shù),STI-PA,的具體關(guān)系有所貢獻(xiàn)和幫助。對(duì)漢語語音清晰度客觀評(píng)測(cè)方法的發(fā)展有著積極的意義。,18,實(shí)驗(yàn)方法,實(shí)驗(yàn)室錄音、模擬測(cè)試的方法,參照,聲學(xué) 語言清晰度測(cè)試方法,GB-T 15508-1995,19,混響時(shí)間:0.5 s6.0 s,步長(zhǎng)0.5 s,共1
10、2種混響條件;,發(fā)音人2名,聽音人11名;聲場(chǎng)中心聲壓級(jí)65dBA;,中、后音節(jié)受混響作用更明顯;,20,實(shí)驗(yàn)結(jié)果,混響時(shí)間與清晰度、,STIPA,的關(guān)系,21,STIPA,與普通話單音節(jié)清晰度的關(guān)系,22,在實(shí)驗(yàn)結(jié)果的基礎(chǔ)上歸納導(dǎo)出了,STI-PA,與普通話單音節(jié)清晰度之間的關(guān)系,此關(guān)系對(duì)制定擴(kuò)聲系統(tǒng)的,STI-PA,指標(biāo)具有實(shí)用意義。,實(shí)驗(yàn)結(jié)果也揭示出漢語普通話單音節(jié)清晰度受混響的影響與英語清晰度受混響的影響程度有明顯的不同。啟示我們?cè)趯?shí)際工程應(yīng)用中,在涉及到普通話語音清晰度的評(píng)測(cè)問題時(shí),對(duì)直接引用已有的國(guó)際標(biāo)準(zhǔn)或基于外語的研究結(jié)果要十分慎重。,23,3.噪聲條件下STIPA與漢語清晰度的
11、關(guān)系,在實(shí)驗(yàn)室條件下分析了不同頻帶范圍、不同信噪比的噪聲環(huán)境下語音清晰度、,STI-PA,與信噪比的關(guān)系,并根據(jù)單音節(jié)清晰度與語言可懂度的關(guān)系,估計(jì)了在滿足一定可懂度條件下的最低信噪比及相應(yīng)的,STI-PA,。,實(shí)驗(yàn)室錄音、模擬測(cè)試的方法,參照,聲學(xué) 語言清晰度測(cè)試方法,GB-T 15508-1995,采用了全頻帶白噪聲和中心頻率為,250Hz,,,500Hz,,,1KHZ,,,2KHz,,,4KHz,,,8KHz,的倍頻帶噪聲作為干擾噪聲,各頻帶噪聲分別設(shè)置,45,種信噪比。,24,實(shí)驗(yàn)結(jié)果,1),信噪比與清晰度、,STIPA,的關(guān)系,(,以白噪聲為例,),25,2),等清晰度曲線,不同的噪
12、聲條件可能有著相同清晰度水平,26,工作是在實(shí)驗(yàn)室條件下進(jìn)行的,考慮到實(shí)際的應(yīng)用情況,可能還有一些不完善的地方,比如房間沖擊響應(yīng)的結(jié)構(gòu)是否會(huì)對(duì),STI-PA,與清晰度的關(guān)系有明顯的影響還需要探討。實(shí)際環(huán)境中的噪聲種類多樣,頻率范圍豐富,由于條件限制無法一一進(jìn)行測(cè)試。每個(gè)頻帶噪聲的信噪比取值區(qū)間可以更加細(xì)致以獲得更為全面的結(jié)果。另外本次實(shí)驗(yàn)只是在,65dBA(,標(biāo)準(zhǔn)說話聲壓級(jí),),的噪聲水平下進(jìn)行的,其它噪聲水平下的語言清晰度和,STI-PA,、信噪比的關(guān)系是否同本次實(shí)驗(yàn)結(jié)果一致還需要進(jìn)一步的研究。,27,4.,展望,STI for Chinese,?,STI,%ALcon,AI,主觀,測(cè)試,28,Thank You!,29,