-
>
決戰(zhàn)行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調(diào)優(yōu)實踐之路
-
>
第一行代碼Android
-
>
深度學(xué)習(xí)
-
>
Unreal Engine 4藍圖完全學(xué)習(xí)教程
-
>
深入理解計算機系統(tǒng)-原書第3版
-
>
Word/Excel PPT 2013辦公應(yīng)用從入門到精通-(附贈1DVD.含語音視頻教學(xué)+辦公模板+PDF電子書)
強化學(xué)習(xí)的數(shù)學(xué)原理(英文版) 版權(quán)信息
- ISBN:9787302658528
- 條形碼:9787302658528 ; 978-7-302-65852-8
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
強化學(xué)習(xí)的數(shù)學(xué)原理(英文版) 本書特色
·從零開始到透徹理解,知其然并知其所以然; ·本書在GitHub收獲2000 星; ·課程視頻全網(wǎng)播放超過80萬; ·國內(nèi)外讀者反饋口碑爆棚; ·教材、視頻、課件三位一體。
強化學(xué)習(xí)的數(shù)學(xué)原理(英文版) 內(nèi)容簡介
本書從強化學(xué)習(xí)*基本的概念開始介紹, 將介紹基礎(chǔ)的分析工具, 包括貝爾曼公式和貝爾曼* 優(yōu)公式, 然后推廣到基于模型的和無模型的強化學(xué)習(xí)算法, *后推廣到基于函數(shù)逼近的強化學(xué)習(xí)方 法。本書強調(diào)從數(shù)學(xué)的角度引入概念、分析問題、分析算法, 并不強調(diào)算法的編程實現(xiàn)。本書不要求 讀者具備任何關(guān)于強化學(xué)習(xí)的知識背景, 僅要求讀者具備一定的概率論和線性代數(shù)的知識。如果讀者 已經(jīng)具備強化學(xué)習(xí)的學(xué)習(xí)基礎(chǔ), 本書可以幫助讀者更深入地理解一些問題并提供新的視角。 本書面向?qū)娀瘜W(xué)習(xí)感興趣的本科生、研究生、研究人員和企業(yè)或研究所的從業(yè)者。
強化學(xué)習(xí)的數(shù)學(xué)原理(英文版) 目錄
強化學(xué)習(xí)的數(shù)學(xué)原理(英文版) 作者簡介
趙世鈺,西湖大學(xué)工學(xué)院AI分支特聘研究員,智能無人系統(tǒng)實驗室負(fù)責(zé)人,國家海外高層次人才引進計劃青年項目獲得者;本碩畢業(yè)于北京航空航天大學(xué),博士畢業(yè)于新加坡國立大學(xué),曾任英國謝菲爾德大學(xué)自動控制與系統(tǒng)工程系Lecturer;致力于研發(fā)有趣、有用、有挑戰(zhàn)性的下一代機器人系統(tǒng),重點關(guān)注多機器人系統(tǒng)中的控制、決策與感知等問題。
- >
中國歷史的瞬間
- >
羅庸西南聯(lián)大授課錄
- >
有舍有得是人生
- >
龍榆生:詞曲概論/大家小書
- >
我與地壇
- >
名家?guī)阕x魯迅:故事新編
- >
巴金-再思錄
- >
新文學(xué)天穹兩巨星--魯迅與胡適/紅燭學(xué)術(shù)叢書(紅燭學(xué)術(shù)叢書)