總金額: 會員:NT$ 0 非會員:NT$ 0 
(此金額尚未加上運費)
電子電信技術 電腦技術 計算技術、計算機技術
 
 
 
 
智能搜索:大數據搜索引擎原理及算法解析
 叢書名稱: 人工智能與大數據系列
 作  者: 沙芸
 出版單位: 清華大學
 出版日期: 2019.11
 進貨日期: 2019/11/29
 ISBN: 9787302535508
 開  本: 16 開    
 定  價: 524
 售  價: 419
  會 員 價: 384
推到Facebook 推到Plurk 推到Twitter
前往新書區 書籍介紹 購物流程  
 
編輯推薦:

讀者對象:

《智能搜索:大資料搜尋引擎原理及演算法解析》適合作為高等院校電腦、軟體工程專業本科生、研究生的參考用書,對於對人工智慧領域感興趣的人士也有一定的參考價值。

本書特點

《智慧搜索:大資料搜尋引擎原理及演算法解析》從搭建搜索集群框架基礎開始,結合操作案例的演示,引導讀者從零


開始,一步步掌握分散式檢索的原理和全過程。


內容簡介:

《智能搜索:大資料搜尋引擎原理及演算法解析》介紹大資料分散式搜尋引擎開發原理與技術實現,主要內容包括多種語言的文本處理、分散式演算法與代碼實現、Elasticsearch的使用與原理等,通過一個醫藥領域垂直搜尋引擎和電商搜索來說明如何開發實際的大資料智慧搜尋引擎。《智能搜索:大資料搜尋引擎原理及演算法解析》共分6章,第1章著重介紹開發智慧搜尋引擎可以採用的軟硬體環境;第2∼5章著重討論構建分散式智慧搜尋引擎可能需要的多種語言文本處理方法,例如Kaldi語音辨識實現和基於Raft共識協議的分散式運算平臺實現


作者簡介:

沙芸,北京石油化工學院資訊工程學院電腦系副主任,工學博士,副教授,碩士生導師,IEEE會員,北京市拔尖人才。多年從事影像處理、模式識別、資料採擷等領域的研究,主持北京市教委項目,參與多項國家自然基金等縱向課題,作為骨幹參與多項橫向課題。發表論文多篇,其中EI檢索15篇,軟體著作權一部。


圖書目錄:

第1章 智慧搜尋引擎開發 1

1.1 人工智慧與智慧搜尋引擎 1

1.2 Linux作業系統基礎 2

1.2.1 SSH遠端登入 2

1.2.2 Micro文字編輯器 4

1.2.3 Linux Shell腳本基礎 4

1.2.4 Shell腳本 5

1.2.5 AWK 8

1.3 Java基礎 8

1.3.1 使用Ant 9

1.3.2 使用Maven 11

1.3.3 使用Gradle 13

1.3.4 使用Groovy Shell 16

1.3.5 使用JShell 17

1.4 Python基礎 17

1.4.1 Windows下安裝Python 17

1.4.2 Linux下安裝Python 17

1.4.3 開發環境 18

1.5 C#基礎 19

1.6 硬體基礎 21

1.7 本章小結 22

第2章 搜尋引擎理解語義 23

2.1 處理文本 23

2.2 基於文法的語言模型 24

2.3 規則運算式查找文本 25

2.4 中文詞語切分與詞性標注 27

2.4.1 使用中文分詞 28

2.4.2 正向最大長度匹配法 30

2.4.3 未登錄串識別 31

2.4.4 基本的N元模型 34

2.5 隱瑪律可夫模型 43

2.5.1 資料基礎 43

2.5.2 維特比演算法 44

2.6 英文文本切分與標注 48

2.6.1 句子切分 48

2.6.2 標注詞性 50

2.7 命名實體識別 52

2.7.1 人名識別 52

2.7.2 人名識別規則 53

2.8 文本歸一化 61

2.9 依存樹模型 62

2.10 情感分析 63

2.11 本章小結 66

第3章 搜尋引擎聽懂語音 67

3.1 語音辨識總體結構 67

3.2 Kaldi快速入門 68

3.2.1 安裝Kaldi 69

3.2.2 yesno例子 69

3.2.3 數據準備 70

3.2.4 詞典準備 71

3.2.5 構建一個簡單的ASR 74

3.3 使用FFmpeg提取音訊 82

3.4 時間序列 82

3.5 動態時間規整 84

3.6 傅裡葉變換 86

3.6.1 離散傅裡葉變換 86

3.6.2 快速傅裡葉變換 89

3.7 MFCC特徵 92

3.8 線上解碼 93

3.8.1 使用現成的模型 93

3.8.2 使用Alex-ASR 94

3.9 加權有限狀態轉換 95

3.9.1 FSA 96

3.9.2 FST 97

3.9.3 WFST 98

3.10 語音辨識語料庫 99

3.10.1 TIMIT語音庫 99

3.10.2 中文語音庫 99

3.11 本章小結 100

第4章 Elasticsearch分散式搜尋引擎 101

4.1 搭建Elasticsearch集群 101

4.2 索引資料 103

4.3 實現搜索介面 107

4.4 搜索介面開發 108

4.4.1 使用Spring Boot開發搜索介面 109

4.4.2 使用.NET開發搜索介面 132

4.5 檢索模型 142

4.5.1 使用BM25檢索模型 146

4.5.2 參數調優 146

4.6 搜索中文優化 147

4.7 Elasticsearch原始程式碼分析 152

4.7.1 導入原始程式碼到Eclipse 152

4.7.2 Guice框架 152

4.7.3 Netty非同步IO框架 154

4.7.4 分散式設計與實現 155

4.7.5 使用Lucene 156

4.8 本章小結 159

第5章 分散式運算平臺 160

5.1 Atomix框架 160

5.1.1 Raft協定 160

5.1.2 使用Atomix 162

5.2 gRPC框架 164

5.3 本章小結 167

第6章 智慧搜索案例分析 168

6.1 醫藥垂直搜尋引擎 168

6.1.1 網路爬蟲 169

6.1.2 抓取PubMed 177

6.1.3 MVC搜索介面開發 179

6.1.4 構建知識庫 183

6.1.5 自動問答 185

6.2 電商搜索 188

6.2.1 電商爬蟲 188

6.2.2 商品搜索 192

6.2.3 線上客服 195

6.3 本章小結 198

參考文獻 199


章節試讀:

智慧生物與機器集群構建的搜索系統已進化成為強大的智慧系統。搜尋引擎服務早已成為人們生活中不可或缺的一部分。

搜尋引擎技術有著悠久的發展歷史。1990年以來,搜尋引擎經歷了從Archie那樣的FTP檔搜索服務到穀歌網頁搜索服務的轉變。強化學習、深度學習等技術的發展為搜尋引擎技術持續不斷地注入新的活力。

本書共分6章:第1章介紹開發智慧搜尋引擎可以採用的軟體和硬體基礎;第2章介紹搜尋引擎理解文本語義的一些方法;第3章介紹通過開發語音辨識技術來索引音訊資訊的一種方法;第4章介紹使用Elasticsearch

 
  步驟一.
依據網路上的圖書,挑選你所需要的書籍,根據以下步驟進行訂購
選擇產品及數量 結 帳 輸入基本資料 取貨與付款方式
┌───────────────────────────────────────────────────┘
資料確定 確認結帳 訂單編號    

步驟二.
完成付款的程序後,若採用貨到付款等宅配方式,3~7天內 ( 例假日將延期一至兩天 ) 您即可收到圖書。若至分店門市取貨,一週內聯絡取書。

步驟三.
完成購書程序者,可利用 訂單查詢 得知訂單進度。

注意事項.
● 付款方式若為網路刷卡必須等" 2 ~ 3 個工作天"確認款項已收到,才會出貨.如有更改書籍數量請記得按更新購物車,謝謝。

● 大陸出版品封面老舊、磨痕、凹痕等均屬常態,除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。

● 至2018年起,因中國大陸環保政策,部分書籍配件以QR CODE取代光盤音頻mp3或dvd,已無提供實體光盤。如需使用學習配件,請掃描QR CODE 連結至當地網站註冊並通過驗證程序,方可下載使用。造成不便,敬請見諒。

● 我們將保留所有商品出貨權利,如遇缺書情形,訂單未達免運門檻運費需自行負擔。

預訂海外庫存.
商品到貨時間須4週,訂單書籍備齊後方能出貨,如果您有急用書籍,建議與【預訂海外庫存】商品分開訂購。