湖南大學(xué)人工智能課件5

上傳人:沈*** 文檔編號(hào):253268675 上傳時(shí)間:2024-12-10 格式:PPTX 頁數(shù):32 大小:5.06MB
收藏 版權(quán)申訴 舉報(bào) 下載
湖南大學(xué)人工智能課件5_第1頁
第1頁 / 共32頁
湖南大學(xué)人工智能課件5_第2頁
第2頁 / 共32頁
湖南大學(xué)人工智能課件5_第3頁
第3頁 / 共32頁

下載文檔到電腦,查找使用更方便

10 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《湖南大學(xué)人工智能課件5》由會(huì)員分享,可在線閱讀,更多相關(guān)《湖南大學(xué)人工智能課件5(32頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。

1、Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,#,第五章,對(duì)抗搜索,內(nèi)容提要,博弈,-,剪枝,不完美的實(shí)時(shí)決策,隨機(jī)博弈,部分可觀察的博弈,發(fā)展現(xiàn)狀,博弈,競(jìng)爭(zhēng)環(huán)境中多個(gè),agent,之間的目標(biāo)是有沖突的,稱為,對(duì)抗搜索問題,,也稱為,博弈,博弈,有完整信息的,確定的,輪流行動(dòng)的,兩個(gè)游戲者的零和游戲,如國際象棋,難于求解,注重時(shí)間效率,兩個(gè)人之間的游戲,游戲表示成搜索問題,S,0,初始狀態(tài),Player(s)

2、,誰行動(dòng),Action(s),狀態(tài)下的合法移動(dòng)集合,Result(s,a),轉(zhuǎn)移模型,Terminal-test(s):,終止測(cè)試,Utility(s,p):,效用函數(shù),博弈樹,零和游戲,葉子結(jié)點(diǎn)表示結(jié)果,贏,:1,輸,:-1,和,:0,博弈中的優(yōu)化決策,博弈樹的最優(yōu)策略通過檢查每個(gè)結(jié)點(diǎn)的極大極小值來決定:,minimax(n),Max,喜歡移動(dòng)到有極大值的狀態(tài),,min,喜歡移動(dòng)到有極小值的狀態(tài),極小極大算法,極小極大算法,3,極小極大算法,完備性?,最優(yōu)性?,時(shí)間復(fù)雜度?,空間復(fù)雜度?,多人博弈,與兩人博弈的不同,用向量值取代單一值,通常選擇使自己效用值最大的行為,聯(lián)盟與破壞聯(lián)盟,-,剪枝

3、,游戲狀態(tài)數(shù)目的增長(zhǎng)是指數(shù)級(jí)的,通過剪枝來消除對(duì)部分分支的搜索,且被剪掉的分支不影響最終的決策,-,剪枝,-,剪枝,-,剪枝,-,剪枝,-,剪枝的效率很大程度上依賴于檢查后繼狀態(tài)的順序,最佳剪枝情況下可以將時(shí)間復(fù)雜度從極大極小算法的,O(b,m,),減少到,O(b,m/2,),,采用隨機(jī)順序檢查的總結(jié)點(diǎn)數(shù)大約是,O(b,3m/4,),資源限制,當(dāng)遇到大的問題的時(shí)候搜索空間是非常大的,解決問題的方法:,截?cái)鄿y(cè)試,限制搜索深度或搜索時(shí)間,評(píng)估函數(shù),評(píng)估當(dāng)前位置的有效性值,評(píng)估函數(shù),評(píng)估函數(shù)的定義準(zhǔn)則:,對(duì)于終止?fàn)顟B(tài)的排序應(yīng)該和效用函數(shù)一致,計(jì)算時(shí)間不能太長(zhǎng),對(duì)于非終止?fàn)顟B(tài)應(yīng)該和取勝幾率相關(guān),評(píng)估函

4、數(shù),評(píng)估函數(shù)的效率值可能被映射到多個(gè)終止?fàn)顟B(tài),用終止?fàn)顟B(tài)的概率值來表示當(dāng)前狀態(tài)的期望值,0.72*1+0.2*0+0.08*(-1)=0.76,評(píng)估函數(shù),對(duì)于國際象棋問題,典型的評(píng)估函數(shù)是線性加權(quán)評(píng)估:,Eval(s)=w,1,f,1,(s)+w,2,f,2,(s)+w,n,f,n,(s),Eg.w,1,=9,f,1,=(,白棋皇后數(shù)量,)-(,黑棋皇后數(shù)量,),線性評(píng)估假定特征之間是獨(dú)立的,然而實(shí)際中特征之間具有關(guān)聯(lián)性,比如國際象棋在殘局中,2,個(gè)象比單個(gè)象的價(jià)值要高出,2,倍,截?cái)嗨阉?Environment:Patient,hospital,staff,Actuators:Screen

5、display(questions,tests,diagnoses,treatments,referrals),Sensors:Keyboard(entry of symptoms,findings,patients answers),在,-,剪枝算法中,Terminal-test,被替換程,cutoff-test(state,depth),Utility,被替換程,eval(state),cutoff-test(state,depth),截?cái)嗖呗裕?當(dāng)大于固定深度是返回,True,根據(jù)游戲允許的時(shí)間來決定深度,截?cái)嗨阉?評(píng)估函數(shù)的近似性會(huì)使截?cái)嗨阉骺赡軐?dǎo)致錯(cuò)誤,評(píng)估函數(shù)只適應(yīng)于靜態(tài)棋局,即不

6、會(huì)很快出現(xiàn)大搖擺的棋局,地平線效應(yīng),22,對(duì)方招數(shù)導(dǎo)致我方嚴(yán)重?fù)p失并且理論上基本無法避免,黑棋行棋后,黑象命運(yùn)已定,但是黑方可以通過檢查白王和兵,迫使王吃兵。這樣就將象拉出了地平線,被犧牲掉的兵被搜索算法視為好棋招,前向剪枝,23,無需考慮直接剪枝一些子結(jié)點(diǎn),柱搜索,每一層只考慮最好的,n,步棋,可能導(dǎo)致最佳的行棋被剪掉,Probcut,算法,使用先驗(yàn)的統(tǒng)計(jì)信息在一定程度上保護(hù)最佳行棋不被剪枝掉,首先淺層搜索計(jì)算結(jié)點(diǎn)的,v,值,再根據(jù)經(jīng)驗(yàn)來估計(jì)深度,d,上的值是否在,(,),范圍外,搜索與查表,開局時(shí)的行棋大多依賴于人類的專業(yè)知識(shí),接近尾聲的棋局可能性有限,在開局和尾聲階段可以通過查表的方式來

7、進(jìn)行行棋,隨機(jī)博弈,25,許多博弈存在不確定性的隨機(jī)因素,如擲骰子,我們稱為隨機(jī)博弈,如西洋雙陸棋,結(jié)合了運(yùn)氣和技巧,通過擲骰子決定合法行動(dòng),白方擲骰子,(6-5),將有,4,中合法移動(dòng),隨機(jī)博弈,西洋雙陸棋的博弈樹除了,max,和,min,結(jié)點(diǎn)之外還必須包括隨機(jī)結(jié)點(diǎn),沒有明確的極大極小值,而是期望值,隨機(jī)博弈,27,期望極大極小值,機(jī)會(huì)博弈的評(píng)估函數(shù),評(píng)估函數(shù)應(yīng)該與棋局獲勝的概率成線性變換,時(shí)間復(fù)雜度,(b,m,n,m,),部分可觀察的博弈,軍旗,棋子可以移動(dòng)但對(duì)方看不見棋子是什么,使用信念狀態(tài),牌類,隨機(jī)部分可觀察,需要概率推算來制定決策,發(fā)展現(xiàn)狀,30,國際象棋:深藍(lán)打敗世界冠軍。深藍(lán)在,30,個(gè),IBM RS/6000,處理器并行計(jì)算機(jī)上運(yùn)行,-,剪枝。,西洋跳棋:,Chinook,程序,1990,年戰(zhàn)勝了世界冠軍,奧賽羅:也叫翻轉(zhuǎn)棋,,1997,年,6,比,0,擊敗人類世界冠軍,西洋雙陸棋:,1992,年,Gerry Teasuro,使用強(qiáng)化學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)訓(xùn)練的評(píng)估函數(shù)性能良好。,總結(jié),博弈,-,剪枝,不完美的實(shí)時(shí)決策,隨機(jī)博弈,部分可觀察的博弈,發(fā)展現(xiàn)狀,Qa,?,

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!

五月丁香婷婷狠狠色,亚洲日韩欧美精品久久久不卡,欧美日韩国产黄片三级,手机在线观看成人国产亚洲