總金額: 會員:NT$ 0 非會員:NT$ 0 
(此金額尚未加上運費)
電子電信技術 電腦技術 自動化基礎理論
 
 
 
 
特徵工程入門與實踐(配件另行下載)
 叢書名稱: 圖靈程序設計叢書
 作  者: (土)錫南•厄茲代米爾/(土耳其)迪夫婭•蘇薩拉
 出版單位: 人民郵電
 出版日期: 2019.06
 進貨日期: 2019/9/5
 ISBN: 9787115511645
 開  本: 16 開    
 定  價: 443
 售  價: 354
  會 員 價: 325

目前無補書計畫

推到Facebook 推到Plurk 推到Twitter
前往新書區 書籍介紹 購物流程  
 
編輯推薦:

特徵工程是資料科學和機器學習流水線上的重要一環,包括識別、清洗、構建和發掘資料的特徵,為進一步解釋資料並進行預測性分析做準備。

本書囊括了特徵工程的全流程,從資料檢查到視覺化,再到轉換和進一步處理等,並給出了大量數學工具,?明讀者掌握如何將資料處理、轉換成適當的形式,以便送入電腦和機器學習流水線中進行處理。後半部分的特徵工程實踐用Python作為示例語言,循序漸進,通俗易懂。

- 識別和利用不同類型的特徵
- 清洗資料中的特徵,提升預測能力
- 為何、如何進行特徵選擇和模型誤差分析
- 利用領域知識構建新特徵
- 基於數學知識交付特徵
- 使用機器學習演算法構建特徵
- 掌握特徵工程與特徵優化
- 在現實應用中利用特徵工程


內容簡介:

本書將帶你瞭解特徵工程的完整過程,使機器學習更加系統、高效。你會從理解資料開始學習,機器學習模型的成功正是取決於如何利用不同類型的特徵,例如連續特徵、分類特徵等。你將瞭解何時納入一項特徵、何時忽略一項特徵,以及其中的原因。你還會學習如何將問題陳述轉換為有用的新特徵,如何提供由商業需求和數學見解驅動的特徵,以及如何在自己的機器上進行機器學習,從而自動學習資料中的特徵。


作者簡介:

錫南·厄茲代米爾(Sinan Ozdemir)

資料科學家、數學家、約翰·霍普金斯大學講師,Kylie.ai公司聯合創始人、CTO,在應用資料採擷、功能分析和演算法開發做出基於資料和知識的決策方面擁有豐富的經驗。

迪夫婭·蘇薩拉(Divya Susarla)

在利用資料方面經驗豐富,在包括投資管理、社會企業諮詢和紅9行銷的各個產業和領域裡實現並應用過相應的策略。Kylie.ai公司產品經理,目前專注于自然語言處理和生成技術。


圖書目錄:

第 1章 特徵工程簡介  1
1.1 激動人心的例子:AI驅動的聊天 1
1.2 特徵工程的重要性 2
1.3 特徵工程是什麼 5
1.4 機器學習演算法和特徵工程的評估 9
1.4.1 特徵工程的例子:真的有人能預測天氣嗎 10
1.4.2 特徵工程的評估步驟 10
1.4.3 評估監督學習演算法 11
1.4.4 評估無監督學習演算法 11
1.5 特徵理解:我的資料集裡有什麼 12
1.6 特徵增強:清洗資料 13
1.7 特徵選擇:對壞屬性說不 14
1.8 特徵構建:能生成新特徵嗎 14
1.9 特徵轉換:數學顯神通 15
1.10 特徵學習:以AI促AI 16
1.11 小結 17
第 2章 特徵理解:我的資料集裡有什麼 19
2.1 資料結構的有無 19
2.2 定量資料和定性資料 20
2.3 資料的4個等級 25
2.3.1 定類等級 26
2.3.2 定序等級 27
2.3.3 定距等級 30
2.3.4 定比等級 36
2.4 資料等級總結 38
2.5 小結 40
第3章 特徵增強:清洗資料 41
3.1 識別資料中的缺失值 41
3.1.1 皮馬印第安人糖尿病預測資料集 42
3.1.2 探索性資料分析 42
3.2 處理資料集中的缺失值 48
3.2.1 刪除有害的行 50
3.2.2 填充缺失值 54
3.2.3 在機器學習流水線中填充值 57
3.3 標準化和歸一化 61
3.3.1 z分數標準化 63
3.3.2 min-max標準化 67
3.3.3 行歸一化 68
3.3.4 整合起來 69
3.4 小結 70
第4章 特徵構建:我能生成新特徵嗎 71
4.2 填充分類特徵 72
4.2.1 自訂填充器 74
4.2.2 自訂分類填充器 74
4.2.3 自訂定量填充器 76
4.3 編碼分類變數 77
4.3.1 定類等級的編碼 77
4.3.2 定序等級的編碼 79
4.3.3 將連續特徵分箱 80
4.3.4 創建流水線 82
4.4 擴展數值特徵 83
4.4.1 根據胸部加速度計識別動作的資料集 83
4.4.2 多項式特徵 86
4.5 針對文本的特徵構建 89
4.5.1 詞袋法 89
4.5.2 CountVectorizer 90
4.5.3 TF-IDF向量化器 94
4.5.4 在機器學習流水線中使用文本 95
4.6 小結 97
第5章 特徵選擇:對壞屬性說不 98
5.1 在特徵工程中實現更好的性能 99
5.2 創建基準機器學習流水線 103
5.3 特徵選擇的類型 106
5.3.1 基於統計的特徵選擇 106
5.3.2 基於模型的特徵選擇 117
5.4 選用正確的特徵選擇方法 125
5.5 小結 125
第6章 特徵轉換:數學顯神通 127
6.1 維度縮減:特徵轉換、特徵選擇與特徵構建 129
6.2 主成分分析 130
6.2.1 PCA的工作原理 131
6.2.2 鳶尾花資料集的PCA——手動處理 131
6.2.3 scikit-learn的PCA 137
6.2.4 中心化和縮放對PCA的影響 144
6.3 線性判別分析 148
6.3.1 LDA的工作原理 149
6.3.2 在scikit-learn中使用LDA 152
6.4 LDA與PCA:使用鳶尾花資料集 157
6.5 小結 160
第7章 特徵學習:以AI促AI 161
7.1 資料的參數假設 161
7.1.1 非參數謬誤 163
7.1.2 本章的演算法 163
7.2 受限玻爾茲曼機 163
7.2.1 不一定降維 164
7.2.2 受限玻爾茲曼機的圖 164
7.2.3 玻爾茲曼機的限制 166
7.2.4 資料重建 166
7.2.5 MNIST資料集 167
7.3 伯努利受限玻爾茲曼機 169
7.3.1 從MNIST中提取PCA主成分 170
7.3.2 從MNIST中提取RBM特徵 177
7.4.1 對原始圖元值應用線性模型 178
7.4.3 對提取的RBM特徵應用線性模型 179
7.5 學習文本特徵:詞向量 180
7.5.1 詞嵌入 180
7.5.2 兩種詞嵌入方法:Word2vec和GloVe 182
7.5.3 Word2vec:另一個淺層神經網路 182
7.5.4 創建Word2vec詞嵌入的gensim包 183
7.5.5 詞嵌入的應用:資訊檢索 186
7.6 小結 190
第8章 案例分析 191
8.1 案例1:面部識別 191
8.1.1 面部識別的應用 191
8.1.2 資料 192
8.1.3 資料探索 193
8.1.4 應用面部識別 195
8.2 案例2:預測酒店評論資料的主題 200
8.2.1 文本聚類的應用 200
8.2.2 酒店評論資料 200
8.2.3 資料探索 201
8.2.4 聚類模型 203
8.2.5 SVD與PCA主成分 204
8.2.6 潛在語義分析 206
8.3 小結 210

 
  步驟一.
依據網路上的圖書,挑選你所需要的書籍,根據以下步驟進行訂購
選擇產品及數量 結 帳 輸入基本資料 取貨與付款方式
┌───────────────────────────────────────────────────┘
資料確定 確認結帳 訂單編號    

步驟二.
完成付款的程序後,若採用貨到付款等宅配方式,3~7天內 ( 例假日將延期一至兩天 ) 您即可收到圖書。若至分店門市取貨,一週內聯絡取書。

步驟三.
完成購書程序者,可利用 訂單查詢 得知訂單進度。

注意事項.
● 付款方式若為網路刷卡必須等" 2 ~ 3 個工作天"確認款項已收到,才會出貨.如有更改書籍數量請記得按更新購物車,謝謝。

● 大陸出版品封面老舊、磨痕、凹痕等均屬常態,除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。

● 至2018年起,因中國大陸環保政策,部分書籍配件以QR CODE取代光盤音頻mp3或dvd,已無提供實體光盤。如需使用學習配件,請掃描QR CODE 連結至當地網站註冊並通過驗證程序,方可下載使用。造成不便,敬請見諒。

● 我們將保留所有商品出貨權利,如遇缺書情形,訂單未達免運門檻運費需自行負擔。

預訂海外庫存.
商品到貨時間須4週,訂單書籍備齊後方能出貨,如果您有急用書籍,建議與【預訂海外庫存】商品分開訂購。