軟件需求說明書(有示例).doc
《軟件需求說明書(有示例).doc》由會員分享,可在線閱讀,更多相關(guān)《軟件需求說明書(有示例).doc(18頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、Windows語音助手軟件規(guī)格說明書(SRS) 青島大學(xué)First Dream Team小組青島大學(xué)Windows語音助手軟件需求說明書 文檔編號:D01版本號:V1.1編寫:_編寫日期:_校對:_校對日期:_審核:First Dream Team團(tuán)隊(duì)開發(fā)人員批準(zhǔn):_開發(fā)單位:青島大學(xué)First Dream Team團(tuán)隊(duì)項(xiàng)目負(fù)責(zé)人:_ 文檔修改記錄修改人修改時(shí)間版本號備注*2009-6-20V1.0初次編寫*2008-6-30V1.1調(diào)整需求,重點(diǎn)強(qiáng)調(diào)項(xiàng)目功能需求*2008-7-10V1.3細(xì)化需求,重新調(diào)整文檔結(jié)構(gòu)。*2008-8-1V1.4統(tǒng)一文檔結(jié)構(gòu)。目錄一引言51.1 編寫目的51.2
2、 項(xiàng)目背景51.3 定義51.4 參考資料7二任務(wù)概述82.1語音識別技術(shù)的起源與發(fā)展前景82.1.1語音識別技術(shù)簡介82.1.2語音識別技術(shù)的應(yīng)用92.1.3語音識別技術(shù)的發(fā)展102.2 功能簡介(目標(biāo))112.3用戶的特點(diǎn)112.4運(yùn)行環(huán)境112.4.1硬件環(huán)境112.4.2軟件環(huán)境122.5 條件與限制122.6假設(shè)與依賴12三大賽項(xiàng)目要求(功能需求)123.1功能需求介紹123.2功能需求實(shí)例圖133.2功能需求流程圖143.2功能一 語音識別與輸入153.2.1功能說明153.2.2功能描述153.3功能二屏幕取詞153.3.1功能說明153.3.2功能描述153.4功能三語音控制1
3、53.4.1功能說明153.4.2功能描述163.5功能四語音精靈163.5.1功能說明163.5.2功能描述163.6功能五語音朗讀(TTS)163.6.1功能說明163.6.2功能描述16四運(yùn)行要求174.1用戶界面174.2硬件接口174.3軟件接口174.4通信接口(無)18一引言1.1 編寫目的該文檔對所開發(fā)的Windows語音助手達(dá)到功能、性能、用戶界面及運(yùn)行環(huán)境等作出了詳細(xì)的說明。他作為對該系統(tǒng)概要設(shè)計(jì)的依據(jù),幫助開發(fā)人員了解本系統(tǒng)的框架思想及實(shí)現(xiàn)功能,并驗(yàn)證核實(shí)該產(chǎn)品能否滿足用戶要求的標(biāo)準(zhǔn),便于技術(shù)文檔和需求變化的管理。同時(shí)也是用戶與開發(fā)人員雙方對軟件需求取得共同理解的基礎(chǔ)。預(yù)
4、期讀者:大賽評委、項(xiàng)目投資商、產(chǎn)品用戶、開發(fā)人員,指導(dǎo)老師。1.2 項(xiàng)目背景 系統(tǒng)名稱:Windows語音助手 任務(wù)提出者:_ 開發(fā)者:青島大學(xué)First Dream Team團(tuán)隊(duì)。 面向用戶:1、 希望能夠借助語音系統(tǒng)更加快捷、方便的操作電腦的用戶。2、 無法很好利用鼠標(biāo)或鍵盤對電腦進(jìn)行操作的殘障人士用戶。 特此聲明:此軟件的開發(fā)作為后期商業(yè)項(xiàng)目的原型,均采用授權(quán)開發(fā)工具,產(chǎn)品擁有自主知識產(chǎn)權(quán),未經(jīng)允許不得隨意傳播或使用。1.3 定義 SDK:SDK 就是 Software Development Kit 的縮寫,中文意思就是 “軟件開發(fā)工具包”。這是一個(gè)覆蓋面相當(dāng)廣泛的名詞,可以這么說:輔
5、助開發(fā)某一類軟件的相關(guān)文檔、范例和工具的集合都可以叫做“SDK”。 TTS全稱為:TextToSpeech即文本合成語音,此為SAPI的基本類型之一,TTS可以將文本中的字符或文檔合成為語音并“說”出來。 SR全拼:Speech Recognise即語音識別,此也為SAPI的基本類型之二,SR則可以把人說話的語音轉(zhuǎn)換為易讀的字符或文檔。 SAPI SAPI又稱語音應(yīng)用程序編程接口,它減少了語音識別和語音合成應(yīng)用中的程序代碼,使得語音技術(shù)在廣泛和蓬勃發(fā)展的實(shí)際應(yīng)用中更容易使用。SAPI使得應(yīng)用程序和語音引擎之間高度緊密的結(jié)合。SAPI可以實(shí)時(shí)處理各種語音引擎在底層工作中的細(xì)節(jié)。 SAPI包括文本
6、合成語音應(yīng)用程序接口,語音識別應(yīng)用程序接口。SAPI的兩種基本類型是文本合成語音(TTS)引擎和語音識別 (SR)引擎。 WindowsAPI(Win32API)Windows API是一套用來控制Windows的各個(gè)部件(從桌面的外觀到為一個(gè)新進(jìn)程分配的內(nèi)存)的外觀和行為的一套預(yù)先定義的Windows函數(shù).用戶的每個(gè)動作都會引發(fā)一個(gè)或幾個(gè)函數(shù)的運(yùn)行以告訴Windows發(fā)生了什么. API函數(shù)包含在Windows系統(tǒng)目錄下的動態(tài)連接庫文件中(如User32.dll,GDI32.dll,Shell32.dll.). 1.4 參考資料1.大賽題目設(shè)置Windows語音助手的相關(guān)具體要求。2.參考書
7、籍: 語音識別與控制應(yīng)用技術(shù)作者: 劉幺和,宋庭新編著出 版 社: 科學(xué)出版社出版時(shí)間: 2008-2-1 新編API大全2009版 Microsoft MSDN Microsoft Speech SDK 5.1 Help C#開發(fā)技巧大全 中國水利出版社 C#數(shù)據(jù)安全手冊 人民郵電出版社 C#高級編程-清華大學(xué)出版社 國家標(biāo)準(zhǔn)軟件產(chǎn)品需求規(guī)格說明書 國家標(biāo)準(zhǔn)可行性分析報(bào)告 軟件工程作 者: 曾建潮 I S B N: 7562919542 出 版 社: 武漢工大 出版日期: 2004-5-1 軟件工程與軟件文檔寫作 作者: 文斌,劉長青,田原 編著 ISBN: 9787810825702 ,
8、7810825704 出版社: 清華大學(xué)出版社 出版日期: 2005-8-1 軟件需求工程作 者 黃國興 周勇 出 版 社 清華大學(xué)出版社 書 號 302-16860-7 出版時(shí)間 2008年4月 字?jǐn)?shù) 千字 二任務(wù)概述 項(xiàng)目最終采用最新微軟.NET技術(shù),并結(jié)合微軟最新語音識別引擎,通過語音輸入達(dá)到對計(jì)算機(jī)的基本控制。本項(xiàng)目在Visual Studio 2008 集成開發(fā)環(huán)境下開發(fā),基于.NET及Speech語音引擎平臺。給客戶帶來方便快捷的全新體驗(yàn)。2.1語音識別技術(shù)的起源與發(fā)展前景2.1.1語音識別技術(shù)簡介智能翻譯機(jī)、語音撥號、語音查詢、語音自動定票系統(tǒng)、語音工業(yè)控制等等,可以想見,凡用計(jì)
9、算機(jī)的地方都會有語音識別。在計(jì)算機(jī)輔助教育方面,計(jì)算機(jī)就成為專業(yè)的家庭輔導(dǎo)教師;在幼兒進(jìn)行啟蒙教育的玩具中,語音識別也將倍受歡迎。電腦語音合成技術(shù)即CTI(Computer Telephone Integration),是用計(jì)算機(jī)技術(shù)處理電話語音。通常是建一個(gè)信息呼叫中心,用戶打來電話時(shí)計(jì)算機(jī)會自動地一層層地轉(zhuǎn)給相關(guān)部門,一直到為用戶解決問題為止。有的語音信箱可以支持不同語種。CTI并非新技術(shù)。與網(wǎng)絡(luò)電話把數(shù)據(jù)壓縮打包進(jìn)行傳輸有所不同,CTI到底還是一種語音模擬傳輸技術(shù),只不過用上了計(jì)算機(jī)對語音進(jìn)行智能管理而已。發(fā)達(dá)國家早幾年就普及了這項(xiàng)應(yīng)用,“是個(gè)機(jī)構(gòu)就有呼叫中心”,以保證客戶或合作伙伴打來
10、的每一個(gè)電話都有回應(yīng)。中國卻還沒有走到這一步,目前除了電信部門普遍開通了“呼叫中心”服務(wù)之外,大多數(shù)企業(yè)還剛剛起步。這個(gè)差距反映了管理和競爭意識方面的問題。中文語音瀏覽器產(chǎn)品“Interversa”使我們能夠用“嘴”遨游互聯(lián)網(wǎng)實(shí)現(xiàn)了“所說即所得”。Interversa已針對Pentium的SSE指令集進(jìn)行了優(yōu)化,并將在Pentium上實(shí)現(xiàn)最好的性能和識別率。常見的語音識別系統(tǒng)還有“命令和控制(Command&Control)”(是連續(xù)的,擁有小詞匯量和獨(dú)立揚(yáng)聲器)、“語音導(dǎo)航”、微軟的“不連續(xù)聽寫(Discrete Dictation)”(是不連續(xù)、大詞匯量和非獨(dú)立揚(yáng)聲器的),IBM的ViaV
11、oice則屬于連續(xù)聽寫。語音識別技術(shù)就是讓機(jī)器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù),也就是讓機(jī)器聽懂人類的語音。也就是說,如果電腦配置有“語音辨識”的程序組,那么當(dāng)你的聲音通過一個(gè)轉(zhuǎn)換裝置輸入電腦內(nèi)部、并以數(shù)位方式儲存后,語音辨識程序便開始以你輸入的聲音樣本與事先儲存好的聲音樣本進(jìn)行對比工作。聲音對比工作完成之后,電腦就會輸入一個(gè)它認(rèn)為最“象”的聲音樣本序號,就可以知道你剛才念的聲音是什么意義,進(jìn)而執(zhí)行此命令。說起來簡單,但要真正建立辨識率高的語音辨識程序組,卻是非常困難而專業(yè)的,世界各地的學(xué)者們也還在努力研究最好的方式。專家學(xué)者們研究出許多破解這個(gè)問題的方法,如傅立葉轉(zhuǎn)
12、換、倒頻譜參數(shù)等,使目前的語音辨識系統(tǒng)已達(dá)到一個(gè)可接受的程度,并且辨識度愈來愈高。本項(xiàng)目是一個(gè)基于語音識別的一個(gè)智能化服務(wù)產(chǎn)品,是面向服務(wù)設(shè)計(jì)的成功案例之一。2.1.2語音識別技術(shù)的應(yīng)用語音識別技術(shù)的應(yīng)用主要有以下兩個(gè)方面。一是用于人機(jī)交流。目前這方面應(yīng)用的呼聲很高,因?yàn)槭褂面I盤、鼠標(biāo)與電子計(jì)算機(jī)進(jìn)行交流的這種方式,使許多非專業(yè)人員,特別是不懂英語或不熟悉漢語拼音的人被拒之于門外,影響到電子計(jì)算機(jī)的進(jìn)一步普及。語音識別技術(shù)的采用,改變了人與計(jì)算機(jī)的互動模式,人們只需動動口,就能打開或關(guān)閉程序,改變工作界面。這種使電腦人性化的結(jié)果是使人的雙手得到解放,使每個(gè)人都能操作和應(yīng)用計(jì)算機(jī)。電話仍是目前使
13、用最為普遍的通信工具,通過電話與語音識別系統(tǒng)的協(xié)同工作,可以實(shí)現(xiàn)語音撥號、電話購物以及通過電話辦理銀行業(yè)務(wù)、炒股、上網(wǎng)檢索信息或處理電子件等。不久,能按主人口令接通電話、打開收音機(jī),以及通過聲紋識別來者身份的安全系統(tǒng)也將獲得應(yīng)用。語音識別技術(shù)的另一方面應(yīng)用便是語音輸入和合成語音輸出。現(xiàn)在,已經(jīng)出現(xiàn)能將口述的文稿輸入計(jì)算機(jī)并按指定格式編排的語音軟件,它比通過鍵盤輸入在速度上要提高24倍。裝有語音軟件的電腦還能通過語音合成把計(jì)算機(jī)里的文件用各種語言“讀”出來,這將大大推進(jìn)遠(yuǎn)程通信和網(wǎng)絡(luò)電話的發(fā)展。在現(xiàn)階段,語音技術(shù)主要用于電子商務(wù)、客戶服務(wù)和教育培訓(xùn)等領(lǐng)域,它對于節(jié)省人力、時(shí)間,提高工作效率將起到
14、明顯的作用。能實(shí)現(xiàn)自動翻譯的語音識別系統(tǒng)目前也正在研究、完善之中。2.1.3語音識別技術(shù)的發(fā)展語音識別技術(shù)是2000年至2010年間信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。它是一門交叉學(xué)科,正逐步成為信息技術(shù)中人機(jī)接口的關(guān)鍵技術(shù)。語音識別技術(shù)與語音合成技術(shù)結(jié)合使人們能夠甩掉鍵盤,通過語音命令進(jìn)行操作。語音技術(shù)的應(yīng)用已經(jīng)成為一個(gè)具有競爭性的新興高技術(shù)產(chǎn)業(yè)。與機(jī)器進(jìn)行語音交流,讓機(jī)器明白你說什么,這是人們長期以來夢寐以求的事情。語音識別技術(shù)就是讓機(jī)器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。語音識別是一門交叉學(xué)科。近二十年來,語音識別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場。人們預(yù)
15、計(jì),未來10年內(nèi),語音識別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。語音識別聽寫機(jī)在一些領(lǐng)域的應(yīng)用被美國新聞界評為1997年計(jì)算機(jī)發(fā)展十件大事之一。很多專家都認(rèn)為語音識別技術(shù)是2000年至2010年間信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。語音識別產(chǎn)品將是繼電話、計(jì)算機(jī)、Internet之后信息產(chǎn)業(yè)界的又一次革命。如果我們能夠突破人機(jī)交互的瓶頸,就能使任何人都可以對計(jì)算機(jī)“發(fā)號施令”,口授文章,甚至“親切交談”,真正全面地實(shí)現(xiàn)“君子動口不動手”的人機(jī)交互方式。正是這充滿潛力的市場前景使世界上一些知名公司無不看重“語音識別”這塊正待開發(fā)的市場,IBM、Drag
16、on、Intel、Microsoft、Philips、Motorola、Apple、National、Nortel等大公司都設(shè)有專門的語音識別技術(shù)研發(fā)部或子公司,每年投入的研究經(jīng)費(fèi)達(dá)數(shù)千萬美元。Intel公司推出的Pentium為語音產(chǎn)品的實(shí)時(shí)化提供了進(jìn)一步的保證。反過來,語音產(chǎn)品的發(fā)展也將為半導(dǎo)體工業(yè)提供新的契機(jī)。在國際市場上,由于中國的國際地位與日俱增以及在經(jīng)濟(jì)和市場方面所處的重要地位,漢語語音識別越來越受到重視;各大公司都相繼投入到漢語語音識別系統(tǒng)的開發(fā)中,其投資也在逐年增加。日漸火爆的語音市場再一次給我們帶來了機(jī)遇和挑戰(zhàn);不斷涌現(xiàn)和日新月異的新產(chǎn)品將證明,語音識別產(chǎn)品是繼電話、計(jì)算機(jī)、
17、Internet之后,信息產(chǎn)業(yè)界的又一次革命。2.2 功能簡介(目標(biāo))本系統(tǒng)的主要功能是實(shí)現(xiàn)用戶通過語音來進(jìn)行對系統(tǒng)的操作以及完成對系統(tǒng)資源的控制與使用,使我們能夠用“嘴”遨游互聯(lián)網(wǎng)實(shí)現(xiàn)了“所說即所得”。講的通俗一點(diǎn),就是用戶“說話”來操縱電腦,省去使用鼠標(biāo),鍵盤的麻煩了。此外,還可以幫助用戶“讀”文本,實(shí)現(xiàn)文本到語音的轉(zhuǎn)換,同樣免去用戶長期用眼看資料的勞頓。 本產(chǎn)品實(shí)現(xiàn)了人機(jī)交互的功能,就能使任何人都可以對計(jì)算機(jī)“發(fā)號施令”,口授文章,甚至“親切交談”,真正全面地實(shí)現(xiàn)“君子動口不動手”的人機(jī)交互方式。為用戶操作windows系統(tǒng)提供一種更智能,更人性化的操作方式,通過語音來完成windows
18、基本操作,使用戶有一種親切的感覺。為用戶操作系統(tǒng)帶來一種耳目一新,方便、快捷的感受,語音的控制使用戶辦公及基本操作達(dá)到事半功備的效果。更加新穎的操作界面(語音精靈的加入)能使用戶在操作過程中達(dá)到一種娛樂的效果。2.3用戶的特點(diǎn)該語音系統(tǒng)既可使深入了解windows基本操作的用戶操作起來更加快捷、方便,也可對初步有windows操作知識的用戶進(jìn)一步學(xué)習(xí)電腦知識有輔助效果,使其學(xué)得更快??傮w來講本系統(tǒng)適用的用戶范圍較廣,只要具備一點(diǎn)電腦知識的用戶都可以順利的應(yīng)用本系統(tǒng)。2.4運(yùn)行環(huán)境2.4.1硬件環(huán)境CPU:2.2GHZ或更快;內(nèi)存:512MB或更大的內(nèi)存;硬盤:7200RPM或更快的硬盤;其他外
19、設(shè):麥克風(fēng)等音頻輸入設(shè)備,耳麥等音頻輸出設(shè)備;2.4.2軟件環(huán)境(一)操作系統(tǒng):Microsoft Windows XP Microsoft Windows Server 2003 Service Pack 2 Microsoft Windows Server 2008 (二)運(yùn)行環(huán)境 1. .NET FrameWork 3.5或更高版本。 2.正確安裝微軟SDK語音引擎包及微軟SDK語音引擎中日語言包。2.5 條件與限制由于本系統(tǒng)為語音識別系統(tǒng),程序運(yùn)行時(shí)需要接收并分析判斷來自終端輸入的語音音頻,所以程序運(yùn)行時(shí)對周圍環(huán)境的嘈雜程度要求很高,要求周圍環(huán)境噪音越小越好,最好是在一個(gè)安靜的環(huán)境里;
20、其次,在使用我們的產(chǎn)品之前,最好是做一個(gè)語音訓(xùn)練,以便讓計(jì)算機(jī)更熟悉用戶的聲音,方便用戶的操作,讓用戶使用的更舒心,我們更放心;再次,也要求用戶所使用的音頻輸入設(shè)備(麥克風(fēng))的質(zhì)量要好,也就是要保證語音識別率高。2.6假設(shè)與依賴本項(xiàng)目基于.NET并依賴于微軟最新語音識別引擎、Speech API5.1(語音編程接口)。三大賽項(xiàng)目要求(功能需求)3.1功能需求介紹利用現(xiàn)有語音引擎或獨(dú)立底層開發(fā)基于語音識別技術(shù)的Windows操作助手,助手能夠協(xié)助用戶在任何可以輸入文字的地方根據(jù)用戶語音命令輸入文字,也可以幫助用戶使用語音進(jìn)行Windows的常規(guī)操作,如啟動某某軟件,關(guān)閉當(dāng)前窗口,關(guān)閉Window
21、s,點(diǎn)擊特定按鈕或選擇指定的菜單項(xiàng),激活某個(gè)正在運(yùn)行的軟件窗口(即使得該軟件窗口獲得焦點(diǎn)),拷貝屏幕區(qū)域,上翻或下翻當(dāng)前正在瀏覽的網(wǎng)頁或閱讀的文章,刪除文件,清空文件垃圾桶等。助手在協(xié)助用戶進(jìn)行各種操作時(shí)要在屏幕上明顯體現(xiàn)出該操作是助手幫助完成的,以區(qū)別于用戶通過鼠標(biāo)或鍵盤進(jìn)行的其他操作。要保證在不需要助手的時(shí)候,它會安靜的呆在一邊,不能影響用戶的正常操作。賽題中涉及的主要技術(shù)難點(diǎn)有兩個(gè),語音識別及屏幕取詞,本產(chǎn)品都已經(jīng)突破。此語音系統(tǒng)的主要功能是通過語音輸入、識別來實(shí)現(xiàn)最終的語音控制,其中語音識別子系統(tǒng)中又有語音訓(xùn)練向?qū)?、麥克風(fēng)設(shè)置向?qū)А⒆远x詞庫、發(fā)音靈敏度設(shè)置等設(shè)置功能;此外,文本朗讀,
22、語音精靈是本系統(tǒng)的輔助功能;對本系統(tǒng)的功能介紹我們將在功能概要設(shè)計(jì)說明及細(xì)節(jié)說明中給出詳細(xì)的說明,下面通過一個(gè)形象的實(shí)例介紹系系統(tǒng)所提供的服務(wù)。3.2功能需求實(shí)例圖3.2功能需求流程圖3.2功能一 語音識別與輸入3.2.1功能說明 此功能應(yīng)該是本系統(tǒng)實(shí)現(xiàn)主功能的基礎(chǔ)重要功能,優(yōu)先級高。3.2.2功能描述要求系統(tǒng)能夠準(zhǔn)確識別用戶通過終端輸入的語音,在任何可以輸入文字的地方根據(jù)用戶語音命令輸入文字,并也可以幫助用戶使用語音進(jìn)行Windows的常規(guī)操作(涉及語音控制)。語音識別是大賽要求中提到的技術(shù)難點(diǎn)之一。用戶對著麥克風(fēng)說話,實(shí)現(xiàn)和計(jì)算機(jī)的互動,實(shí)際上是我們的產(chǎn)品接受了用戶說的內(nèi)容,然后把聲音轉(zhuǎn)換
23、為文字,在命令模式下,實(shí)現(xiàn)了用戶說什么計(jì)算機(jī)則會根據(jù)用戶所說的命令執(zhí)行相應(yīng)的操作。當(dāng)用戶的命令計(jì)算機(jī)不存在或用戶說的不準(zhǔn)確時(shí),我們的精靈則會提醒用戶沒有該命令,或說的命令不準(zhǔn)確提醒用戶請?jiān)僬f一遍。在輸入模式下,實(shí)現(xiàn)了完全取代鍵盤和鼠標(biāo)的操作,使用戶不用再利用鼠標(biāo)和鍵盤向計(jì)算機(jī)傳輸輸入的信息文字,在此模式下,用戶說什么,計(jì)算機(jī)就會“寫”什么。同時(shí),輸入模式和命令模式可以相互轉(zhuǎn)換。3.3功能二屏幕取詞3.3.1功能說明屏幕取詞功能同樣是實(shí)現(xiàn)主控制功能的重要基礎(chǔ)功能,是實(shí)現(xiàn)語音識別的重要基石之一。其優(yōu)先級別也較高。3.3.2功能描述通過此功能能夠取得桌面,系統(tǒng)窗體,以及任務(wù)欄、選項(xiàng)卡、標(biāo)簽等其內(nèi)部的
24、任何文本,在命令模式下,根據(jù)用戶說出的命令,在打開的窗體中進(jìn)行“查找”和“匹配”,在模糊匹配的協(xié)助下,找到用戶說出的命令然后執(zhí)行相應(yīng)的操作。此功能在描述上簡單,但是實(shí)現(xiàn)上將是一個(gè)難點(diǎn),屏幕取詞同樣也是大賽要求中提到的技術(shù)難點(diǎn)之二。3.4功能三語音控制3.4.1功能說明語音控制功能是本系統(tǒng)的主功能及核心功能,語音控制計(jì)算機(jī)的各個(gè)內(nèi)部操作。其優(yōu)先級別最高。3.4.2功能描述在語音識別,屏幕取詞的基礎(chǔ)上實(shí)現(xiàn)的語音控制最終達(dá)到協(xié)助用戶在任何可以輸入文字的地方根據(jù)用戶語音命令輸入文字,并也可以幫助用戶使用語音進(jìn)行Windows的常規(guī)操作,如啟動某某軟件,關(guān)閉當(dāng)前窗口,關(guān)閉Windows,點(diǎn)擊特定按鈕或選
25、擇指定的菜單項(xiàng),激活某個(gè)正在運(yùn)行的軟件窗口(即使得該軟件窗口獲得焦點(diǎn)),拷貝屏幕區(qū)域,上翻或下翻當(dāng)前正在瀏覽的網(wǎng)頁或閱讀的文章,刪除文件,清空文件垃圾桶等等基礎(chǔ)操作。同時(shí),基于屏幕取詞和模糊匹配的協(xié)助下,語音控制實(shí)現(xiàn)了更深一層的突破,使用戶想要計(jì)算機(jī)執(zhí)行什么操作,只要對我們的產(chǎn)品下命令,應(yīng)用程序就會“告訴”計(jì)算機(jī)用戶想干什么,計(jì)算機(jī)就會執(zhí)行相應(yīng)的操作,達(dá)到用戶的需求。該產(chǎn)品就是“用戶“和“計(jì)算機(jī)”溝通的橋梁,方便他們之間的交流。真正實(shí)現(xiàn)了“君子動口不動手”。3.5功能四語音精靈3.5.1功能說明此功能是本系統(tǒng)的輔助功能之一,為我們的產(chǎn)品添加生趣和色彩。優(yōu)先級別中等。3.5.2功能描述語音小精靈
26、主要提高本系統(tǒng)使用的趣味性,增加了人機(jī)互動,同時(shí)語音小助手實(shí)時(shí)報(bào)時(shí),錯(cuò)誤提示等功能提高了實(shí)用價(jià)值。使用戶在使用我們的產(chǎn)品時(shí)能用的滿意,用的舒心,我們放心。3.6功能五語音朗讀(TTS)3.6.1功能說明此功能是本系統(tǒng)的輔助功能之二,優(yōu)先級別中等。3.6.2功能描述將文本變成語音進(jìn)行朗讀, 能用不同的語音來朗讀文本。可以朗讀中文或英文的(.txt)文本。在進(jìn)行語音朗讀前或朗讀時(shí)您可以隨時(shí)設(shè)置【音量大小】和【語音速度】,以保證文本輸出的語音音律流暢,使得您在聽取信息時(shí)感覺自然。此外,本軟件還可以將所朗讀的文本保存為音頻文件(.wav)。語音朗讀將會幫助用戶朗讀文本文件內(nèi)容,利用的是微軟SAPI的語
27、音合成技術(shù)及語音引擎將文本轉(zhuǎn)化成語音并輸出。在此功能中,您可以選擇“男”或“女“來讀您載入的文本,也可選擇“中文”或“英文”來朗讀。此功能從技術(shù)上來說,我們是調(diào)用系統(tǒng)中存在的各種語音引擎進(jìn)行朗讀,根本是調(diào)用com對象(全反射、沒有引用com ocx),并且使用引擎保存聲音。四運(yùn)行要求4.1用戶界面用戶界面簡介、實(shí)用,助手形象要有趣、大方、可愛。能夠博得用戶喜愛,讓用戶用的滿意舒心,我們也放心。4.2硬件接口1.接口名稱:音頻輸入接口 規(guī)格說明:用戶計(jì)算機(jī)音頻輸入插口。2.接口名稱:音頻輸出接口 規(guī)格說明:用戶計(jì)算機(jī)的音頻輸出接口。4.3軟件接口4.3.1SAPI(語音接口) 接口名稱:SAPI(語音接口) 規(guī)格說明:文本合成語音應(yīng)用程序接口,語音識別應(yīng)用程序接口 版本號:5.1版4.3.2API 接口名稱:win32API(系統(tǒng)編程接口)規(guī)格說明:提供底層系統(tǒng)編程方案。版本號: 待定。4.4通信接口(無)18
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。