中圖網(wǎng)

>

人工智能

深度學(xué)習(xí)視頻理解

作者：張皓

出版社：電子工業(yè)出版社出版時間：2021-10-01

開本： 16開 頁數(shù)： 324

本類榜單：計算機/網(wǎng)絡(luò)銷量榜

中圖價:¥80.6(6.3折) 定價 ~~¥128.0~~ 登錄后可看到會員價

加入購物車收藏

運費6元，滿39元免運費

?新疆、西藏除外

本類五星書更多>

>
決戰(zhàn)行測5000題(言語理解與表達)

決戰(zhàn)行測5000題(言語理解與表達)

¥38.8¥88
>
軟件性能測試.分析與調(diào)優(yōu)實踐之路

軟件性能測試.分析與調(diào)優(yōu)實踐之路

¥49.3¥69
>
第一行代碼Android

第一行代碼Android

¥58.4¥99
>
深度學(xué)習(xí)

深度學(xué)習(xí)

¥92.4¥168
>
Unreal Engine 4藍圖完全學(xué)習(xí)教程

Unreal Engine 4藍圖完全學(xué)習(xí)教程

¥72.2¥168
>
深入理解計算機系統(tǒng)-原書第3版

深入理解計算機系統(tǒng)-原書第3版

¥104.3¥139
>
Word/Excel PPT 2013辦公應(yīng)用從入門到精通-(附贈1DVD.含語音視頻教學(xué)+辦公模板+PDF電子書)

Word/Excel PPT 2013辦公應(yīng)用從入門到精通-(附贈1DVD.含語音視頻教學(xué)+辦公模板+PDF電子書)

¥21¥49.9

商品詳情
商品評論(0條)

中圖價:¥80.6 加入購物車

版權(quán)信息
本書特色
內(nèi)容簡介
目錄
作者簡介

深度學(xué)習(xí)視頻理解版權(quán)信息

ISBN：9787121419805
條形碼：9787121419805 ; 978-7-121-41980-5
裝幀：一般膠版紙
冊數(shù)：暫無
重量：暫無
所屬分類：
計算機/網(wǎng)絡(luò)
>
人工智能

深度學(xué)習(xí)視頻理解本書特色

《深度學(xué)習(xí)視頻理解》是一本綜合介紹新的基于深度學(xué)習(xí)的視頻理解算法的參考書，通過理論與實踐相結(jié)合的形式詳細介紹了視頻理解中的識別、定位、特征表示等諸多重點任務(wù)和方法。對該領(lǐng)域的研究者和從業(yè)者都非常實用。作者張皓畢業(yè)于著名的南京大學(xué)LAMDA研究所，現(xiàn)任騰訊在線視頻研究員。在視頻理解領(lǐng)域深入研究多年。

深度學(xué)習(xí)視頻理解內(nèi)容簡介

視頻理解是計算機視覺和深度學(xué)習(xí)的一個重要分支。本書對視頻理解的3個重要領(lǐng)域進行介紹，對于每個領(lǐng)域，本書不僅解釋了相關(guān)算法的原理，還梳理了算法演進的脈絡(luò)。全書共分6章，第1章簡要介紹視頻行業(yè)的發(fā)展歷程；第2章回顧經(jīng)典圖像分類模型和RNN；第3章和第4章介紹動作識別的重要算法；第5章介紹時序動作定位的重要算法；第6章介紹視頻Embedding的重要算法。*后總結(jié)了常用的一些視頻處理工具。本書既適合高等院校人工智能相關(guān)專業(yè)的本科生和研究生閱讀，也可供視頻理解、推薦系統(tǒng)、搜索引擎和計算廣告等領(lǐng)域的研究人員和從業(yè)者參考。

深度學(xué)習(xí)視頻理解目錄

第1章緒論 1

1.1 引言 1

1.2 本書內(nèi)容 5

1.3 本章小結(jié) 15

第2章經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)回顧 16

2.1 經(jīng)典圖像分類網(wǎng)絡(luò) 16

2.1.1 LetNet-5 16

2.1.2 AlexNet 18

2.1.3 VGGNet 22

2.1.4 GoogLeNet 24

2.1.5 Inception V2/V3 27

2.1.6 ResNet 28

2.1.7 preResNet 31

2.1.8 WRN 32

2.1.9 隨機深度網(wǎng)絡(luò) 33

2.1.10 DenseNet 35

2.1.11 ResNeXt 36

2.1.12 SENet 39

2.1.13 MobileNet 41

2.1.14 MobileNet V2/V3 44

2.1.15 ShuffleNet 46

2.1.16 ShuffleNet V2 49

2.2 RNN、LSTM和GRU 51

第3章基于2D卷積的動作識別 62

3.1 平均匯合 62

3.2 NetVLAD和NeXtVLAD 64

3.3 利用RNN融合各幀特征 77

3.4 利用3D卷積融合各幀特征 81

3.5 雙流法 87

3.6 時序稀疏采樣 95

3.7 利用iDT軌跡 104

第4章基于3D卷積的動作識別 110

4.1 3D卷積基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu) 110

4.2 I3D 118

4.4 TSM 135

4.5 3D卷積 + RNN 137

4.6 ARTNet 139

4.7 Non-Local 141

4.8 SlowFast 148

4.9 3D卷積神經(jīng)網(wǎng)絡(luò)超參數(shù)設(shè)計 152

第5章時序動作定位 159

5.1 基于滑動窗的算法 160

5.2 基于候選時序區(qū)間的算法 171

5.3 自底向上的時序動作定位算法 183

5.4 對時序結(jié)構(gòu)信息建模的算法 197

5.5 逐幀預(yù)測的算法 202

5.6 單階段算法 208

第6章視頻Embedding 219

6.1 基于視頻內(nèi)容的無監(jiān)督 Embedding 220

6.2 Word2Vec 229

6.2.1 CBOW和Skip-Gram 229

6.2.2 分層 Softmax 234

6.2.3 負采樣 239

6.3 Item2Vec 247

6.3.1 Item2Vec 基本形式 247

6.3.2 Item2Vec的改進 249

6.4 基于圖的隨機游走 252

6.5 結(jié)合一二階相似度 257

6.6 基于圖的鄰居結(jié)點 265

6.7 基于多種信息學(xué)習(xí)視頻Embedding 274

附錄A 視頻處理常用工具 281

參考文獻 296

展開全部

深度學(xué)習(xí)視頻理解作者簡介

張皓，畢業(yè)于南京大學(xué)計算機系周志華教授領(lǐng)導(dǎo)的機器學(xué)習(xí)與數(shù)據(jù)挖掘研究所（LAMDA），導(dǎo)師為吳建鑫教授，研究方向為深度學(xué)習(xí)和計算機視覺，曾獲國家獎學(xué)金、江蘇省三好學(xué)生等榮譽。發(fā)表論文累計被引超過 190 次，合譯《模式識別》一書，曾獲 2016 年ECCV視頻表象性格分析競賽世界冠軍。現(xiàn)任騰訊在線視頻研究員，專注于騰訊視頻等場景下的相關(guān)視頻理解任務(wù)。曾任騰訊優(yōu)圖實驗室研究員，為“微信看一看”等場景提供相關(guān)視頻理解能力。知乎號“張皓”，擔(dān)任多個自媒體作者或?qū)谧髡摺?

商品評論(0條)

寫書評賺書幣

暫無評論……

書友推薦

>
上帝之肋:男人的真實旅程
上帝之肋:男人的真實旅程
[美] 羅伯特·布萊著，田國力/盧文戈譯
¥19.3~~¥35.0~~
>
月亮與六便士
月亮與六便士
毛姆
¥18.1~~¥42.0~~
>
羅庸西南聯(lián)大授課錄
羅庸西南聯(lián)大授課錄
羅庸
¥13.8~~¥32.0~~
>
我從未如此眷戀人間
我從未如此眷戀人間
史鐵生/汪曾祺
¥24.9~~¥49.8~~
>
中國人在烏蘇里邊疆區(qū):歷史與人類學(xué)概述
中國人在烏蘇里邊疆區(qū):歷史與人類學(xué)概述
[蘇]阿爾謝尼耶夫著，劉宇譯
¥36.0~~¥48.0~~
>
伯納黛特,你要去哪(2021新版)
伯納黛特,你要去哪(2021新版)
[美] 瑪利亞·森普爾著，何雨珈譯
¥25.4~~¥49.8~~
>
名家?guī)阕x魯迅:朝花夕拾
名家?guī)阕x魯迅:朝花夕拾
魯迅著，陳漱渝主編
¥10.5~~¥21.0~~
>
詩經(jīng)-先民的歌唱
詩經(jīng)-先民的歌唱
裴溥言
¥13.5~~¥39.8~~