總金額: 會員:NT$ 0 非會員:NT$ 0 
(此金額尚未加上運費)
電子電信技術 電腦技術 自動化基礎理論
 
 
 
 
深度學習:語音識別技術實踐
 作  者: 柳若邊
 出版單位: 清華大學
 出版日期: 2019.04
 進貨日期: 2019/4/29
 ISBN: 9787302516927
 開  本: 16 開    
 定  價: 668
 售  價: 534
  會 員 價: 490
推到Facebook 推到Plurk 推到Twitter
前往新書區 書籍介紹 購物流程  
 
編輯推薦:

讀者對象
《深度學習:語音辨識技術實踐》一書既適合需要具體實現語音辨識的程式師使用,也適合有一定機器學習或語音辨識基礎的學生、研究者或從業者閱讀。
★★業內流行的Kaldi語音辨識技術實踐。
★★獵兔搜索技術團隊語音辨識技術總結,引領語音辨識技術升級。
★★IBM資深軟體架構師丁朝傑重磅推薦。


內容簡介:

語音辨識已經逐漸進入人們的日常生活。語音辨識技術是涉及語言、電腦、數學等領域的交叉學科。《深度學習:語音辨識技術實踐》介紹了包括C#、Perl、Python、Java在內的多種程式設計語言實踐,開源語音辨識工具包Kaldi的使用與代碼分析,深度學習的開發環境搭建,卷積神經網路,以及語音辨識中常見的語言模型——N元模型和依存模型等,讓讀者快速瞭解語音辨識基礎,掌握開發語音辨識程式的演算法。 《深度學習:語音辨識技術實踐》從語音辨識的基礎開始講起,並輔以翔實的案例,既適合需要具體實現語音辨識的程式師使用,也適合有一定機器學習或語音辨識基礎的學生、研究者或從業者閱讀。


作者簡介:

柳若邊

獵兔搜索團隊核心成員,曾供職于中國萬網、三星等多家業內知名公司,現任某教育培訓機構專業講師。獵兔搜索創立於2004年,專注于自然語言處理等人工智慧領域的技術開發與實現。在北京和上海等地均有獵兔培訓的學員,獵兔搜索出版的相關技術圖書讀者遍及全國各省(市、區)及海外華人圈。


圖書目錄:

第1章 語音辨識技術 1
1.1 總體結構 1
1.2 Linux基礎 2
1.3 安裝Micro編輯器 4
1.4 安裝Kaldi 5
1.5 yesno例子 6
1.5.1 數據準備 7
1.5.2 詞典準備 8
1.6 構建一個簡單的ASR 12
1.7 Voxforge例子 21
1.8 資料準備 23
1.9 加權有限狀態轉換 34
1.9.1 FSA 35
1.9.2 FST 35
1.9.3 WFST 37
1.9.4 Kaldi對OpenFst的改進 38
1.10 語音辨識語料庫 39
1.10.1 TIMIT語料庫 39
1.10.2 LibriSpeech語料庫 40
1.10.3 中文語料庫 40
1.11 Linux shell腳本基礎 40
1.11.1 Bash 41
1.11.2 AWK 44
第2章 C#開發語音辨識 46
2.1 準備開發環境 46
2.2 計算卷積 47
2.3 記錄語音 48
2.4 讀入語音信號 52
2.5 離散傅裡葉變換 53
2.6 移除靜音 54
第3章 Perl開發語音辨識 58
3.1 變數 58
3.1.1 數字 58
3.1.2 字串 59
3.1.3 陣列 60
3.1.4 散列表 60
3.2 多維陣列 62
3.3 常量 62
3.4 操作符 63
3.5 控制流 66
3.6 檔與目錄 67
3.7 常式 68
3.8 執行命令 69
3.9 規則運算式 69
3.9.1 基本類型 69
3.9.2 規則運算式模式 70
3.10 命令列參數 72

第4章 Python開發語音辨識 73
4.1 Windows作業系統下安裝Python 73
4.2 Linux作業系統下安裝Python 75
4.3 選擇版本 76
4.4 開發環境 76
4.5 注釋 77
4.6 變數 77
4.6.1 數值 77
4.6.2 字串 79
4.7 陣列 80
4.8 列表 80
4.9 元組 80
4.10 字典 81
4.11 控制流 81
4.11.1 條件判斷 81
4.11.2 迴圈 82
4.12 模組 83
4.13 函數 84
4.14 讀寫檔 86
4.15 物件導向程式設計 87
4.16 命令列參數 88
4.17 資料庫 90
4.18 日誌記錄 90
4.19 異常處理 92
4.20 測試 92
4.21 語音活動檢測 93
4.22 使用numpy 93
第5章 Java開發語音辨識 94
5.1 實現卷積 95
5.2 KaldiJava 96
5.2.1 使用Ant 97
5.2.2 使用Maven 99
5.2.3 使用Gradle 100
5.2.4 概率分佈函數 102
5.3 TensorFlow的Java介面 104
5.3.1 在Windows作業系統下使用TensorFlow 104
5.3.2 在Linux作業系統下使用TensorFlow 106
第6章 語音信號處理 109
6.1 使用FFmpeg 109
6.2 標注語音 110
6.3 時間序列 112
6.4 端點檢測 113
6.5 動態時間規整 114
6.6 傅裡葉變換 117
6.6.1 離散傅裡葉變換 117
6.6.2 快速傅裡葉變換 120
6.7 MFCC特徵 124
6.8 說話者識別 125
6.9 解碼 125
第7章 深度學習 132
7.1 神經網路基礎 132
7.1.1 實現多層感知器 135
7.1.2 計算過程 143
7.2 卷積神經網路 150
7.3 搭建深度學習開發環境 156
7.3.1 使用Cygwin模擬環境 156
7.3.2 使用CMake 157
7.3.3 使用Keras 158
7.3.4 安裝TensorFlow 161
7.3.5 安裝TensorFlow的Docker容器 162
7.3.6 使用TensorFlow 164
7.3.7 一維卷積 208
7.3.8 二維卷積 210
7.3.9 擴張卷積 213
7.3.10 TensorFlow實現簡單的語音辨識 214
7.4 nnet3實現代碼 216
7.4.1 資料類型 217
7.4.2 基本資料結構 219
7.5 編譯Kaldi 230
7.6 端到端深度學習 232
7.7 Dropout解決過度擬合問題 232
7.8 矩陣運算 235
第8章 語言模型 238
8.1 概率語言模型 238
8.1.1 一元模型 240
8.1.2 資料基礎 240
8.1.3 改進一元模型 249
8.1.4 二元詞典 251
8.1.5 完全二叉樹陣列 257
8.1.6 三元詞典 261
8.1.7 N元模型 262
8.1.8 生成語言模型 264
8.1.9 評估語言模型 265
8.1.10 平滑演算法 266
8.2 KenLM語言模型工具包 271
8.3 ARPA檔案格式 275
8.4 依存語言模型 278


章節試讀:

前 言




作為人工智慧技術的重要組成部分,語音辨識旨在研究電腦如何聽懂人的講話。來源於人工神經網路的深度學習促進了語音辨識技術的發展。本書從使用開源的語音辨識構建系統Kaldi開始講起,引導讀者親自實現語音辨識系統,使用了C#、Perl、Python、Java等多種程式設計工具。第1章介紹語音辨識的基本原理和Kaldi的基本使用方法,以及使用Kaldi開發語音辨識系統應用到的Linux shell腳本基礎;第2章介紹使用C#開發語音辨識系統;第3章介紹Perl語言開發基礎;第4章介紹開發語音辨識系統所需要的Python基礎;第5章介紹使用Java開發語音辨識系統;第6章介紹傅裡葉變換、MFCC特徵等常用的語音信號處理方法;第7章介紹基本的神經網路和深度學習方法及訓練神經網路的反向傳播方法;第8章介紹語音辨識解碼階段用到的語言模型,以及語言模型工具包——KenLM。
本書適合需要具體實現語音辨識的程式師使用,對機器學習等相關領域的研究人員也有一定的參考價值。獵兔搜索技術團隊已經開發出以本書為基礎的專門培訓課程和商務軟體。
本書由柳若邊編著,羅剛、沙芸、張子憲、許想嬌、石天盈、張繼紅、羅庭亮、王全軍、劉宇、張天津也參與了本書的部分編創工作。本書相關的參考軟體和代碼在讀者QQ群(378025857)的附件中可以找到。Kaldi及其底層依賴的軟體,其複雜程度已經超越了一個人所能掌握的程度。此外,一些具體的細節也可以在讀者QQ群討論。在此,感謝早期合著者、合作夥伴、員工、學員、讀者的支持,他們為本書的編創提供了良好的工作基礎。技術的融合與創新永無止境,就如同在玻璃容器中水培植物一樣,這是一個持久的工作。

編著者
2018年12月


圖片預覽:

 
  步驟一.
依據網路上的圖書,挑選你所需要的書籍,根據以下步驟進行訂購
選擇產品及數量 結 帳 輸入基本資料 取貨與付款方式
┌───────────────────────────────────────────────────┘
資料確定 確認結帳 訂單編號    

步驟二.
完成付款的程序後,若採用貨到付款等宅配方式,3~7天內 ( 例假日將延期一至兩天 ) 您即可收到圖書。若至分店門市取貨,一週內聯絡取書。

步驟三.
完成購書程序者,可利用 訂單查詢 得知訂單進度。

注意事項.
● 付款方式若為網路刷卡必須等" 2 ~ 3 個工作天"確認款項已收到,才會出貨.如有更改書籍數量請記得按更新購物車,謝謝。

● 大陸出版品封面老舊、磨痕、凹痕等均屬常態,除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。

● 至2018年起,因中國大陸環保政策,部分書籍配件以QR CODE取代光盤音頻mp3或dvd,已無提供實體光盤。如需使用學習配件,請掃描QR CODE 連結至當地網站註冊並通過驗證程序,方可下載使用。造成不便,敬請見諒。

● 我們將保留所有商品出貨權利,如遇缺書情形,訂單未達免運門檻運費需自行負擔。

預訂海外庫存.
商品到貨時間須4週,訂單書籍備齊後方能出貨,如果您有急用書籍,建議與【預訂海外庫存】商品分開訂購。