總金額: 會員:NT$ 0 非會員:NT$ 0 
(此金額尚未加上運費)
電子電信技術 電腦技術 計算技術、計算機技術
 
 
 
 
Python自然語言處理與開發
 叢書名稱: 人工智能與大數據系列
 作  者: 葉虎
 出版單位: 清華大學
 出版日期: 2020.01
 進貨日期: 2020/4/17
 ISBN: 9787302543428
 開  本: 16 開    
 定  價: 668
 售  價: 534
  會 員 價: 490

目前無補書計畫

推到Facebook 推到Plurk 推到Twitter
前往新書區 書籍介紹 購物流程  
 
編輯推薦:

本書是獵兔搜索技術在Python自然語言處理領域的實際應用。
本書適用於對實際開發自然語言處理技術感興趣的讀者。


內容簡介:

自然?言?理技?在构建智能社?中??越?越重要的作用。《Python自然?言?理与??/人工智能与大?据系列》介?如何??和使用流行的Python?程?言??自然?言?理?用。主要?容包括面向自然?言?理??的Python?程?言入?,使用Python??中文分?,??Word文?自?校?基?,文本相似度?算和排重的原理与??,文本摘要的原理与??,?答式聊天机器人算法与代???、机器翻?技?及其??与??。《Python自然?言?理与??/人工智能与大?据系列》是?兔搜索技?在Python自然?言?理?域的???用。


圖書目錄:

第1章 Python自然語言處理技術基礎
1.1 體驗自然語言處理技術
1.2 Linux基礎
1.2.1 常用命令
1.2.2 Micro編輯器
1.3 開發環境
1.4 變量
1.5 注釋
1.6 簡單數據類型
1.6.1 數值
1.6.2 字符串
1.6.3 數組
1.7 字面值
1.8 控制流
1.8.1 if語句
1.8.2 循環
1.9 列表
1.10 元組
1.11 集合
1.12 字典
1.13 位數組
1.14 模塊
1.15 函數
1.15.1 print函數
1.15.2 定義函數
1.16 面向對象編程
1.17 文件操作
1.17.1 讀寫文件
1.17.2 重命名文件
1.17.3 遍歷文件
1.18 迭代器
1.18.1 zip函數
1.18.2 itertools模塊
1.19 數據庫
1.20 讀取Excel文件
1.21 pytest單元測試
1.22 異常處理
1.23 日誌
1.24 Flask Web框架
1.25 本章小結

第2章 中文分詞原理與實現
2.1 切分方案
2.2 查找詞典算法
2.2.1 標準檢索樹
2.2.2 三叉檢索樹
2.3 最長匹配中文分詞
2.3.1 正向最大長度匹配法
2.3.2 逆向最大長度匹配法
2.4 概率語言模型的分詞方法
2.4.1 一元模型
2.4.2 數據基礎
2.4.3 二元詞典
2.4.4 用二元連接改進一元模型
2.4.5 N元模型
2.4.6 N元分詞
2.4.7 生成語言模型
2.4.8 評估語言模型
2.4.9 有限狀態機識別未登錄串
2.4.10 概率分詞的流程與結構
2.5 詞性標注
2.5.1 數據基礎
2.5.2 隱馬爾可夫模型
2.5.3 存儲數據
2.5.4 整合切分與詞性標注
2.5.5 基於轉換的錯誤學習方法
2.6 詞類模型
2.7 命名實體識別
2.7.1 人名識別
2.7.2 地名識別
2.8 地名切分
2.8.1 識別未登錄地名
2.8.2 整體流程
2.9 結果評測
2.10 本章小結

第3章 文檔分析
3.1 自動校對
3.1.1 讀取Word文檔
3.1.2 ARPA文件格式
3.1.3 使用KenLM語言模型工具包
3.1.4 拼寫糾錯
3.1.5 模糊匹配問題
3.1.6 正確詞表
3.1.7 英文拼寫檢查
3.1.8 中文拼寫檢查
3.2 句子結構分析
3.2.1 句法分析樹
3.2.2 依存文法
3.2.3 中文依存文法
3.2.4 英文依存文法
3.2.5 機器學習的方法
3.3 本章小結

第4章 文檔排重
4.1 相似度計算
4.1.1 夾角餘弦
4.1.2 最長公共子串
4.1.3 同義詞替換
4.2 SimHash文檔排重
4.3 本章小結

第5章 信息提取
5.1 指代消解
5.2 關鍵詞提取
5.2.1 關鍵詞提取的TF-IDF算法
5.2.2 textrank算法
5.2.3 從網頁中提取關鍵詞
5.3 從互聯網提取信息
5.4 從日期字符串提取信息
5.5 本章小結

第6章 自動摘要
6.1 自動摘要技術
6.1.1 英文文本摘要
6.1.2 中文文本摘要
6.1.3 基於篇章結構的自動摘要
6.1.4 句子壓縮
6.2 評測
6.3 本章小結

第7章 文本分類
7.1 樸素貝葉斯
7.2 TensorFlow實現文本分類
7.3 本章小結

第8章 情感分析
8.1 情感詞
8.1.1 確定詞語的褒貶傾向
8.1.2 匹配情感詞
8.2 情感識別
8.3 本章小結

第9章 語音識別
9.1 語音信號處理
9.1.1 WAV文件格式
9.1.2 語音活動檢測
9.2 JSGF語言模型
9.3 DeepSpeech語音識別引擎
9.4 強制對齊
9.5 本章小結

第10章 開發聊天機器人
10.1 問答系統
10.1.1 問句類型
10.1.2 答案提取
10.2 AIML聊天機器人
10.3 意圖
10.4 使用DeepPavlov構建對話系統
10.5 本章小結

第11章 機器翻譯
11.1 語言檢測
11.2 信道模型
11.3 詞表
11.4 詞義消歧
11.5 詞對齊
11.6 神經網絡機器翻譯
11.7 機器翻譯的評價
11.8 本章小結
後記
參考文獻
參考網址


章節試讀:

自然語言處理(Natural Language Processing,NLP)指用計算機對自然語言信息進行處理的方法和技術。
NLP技術的典型應用包括自動語音識別(Automatic Speech Recognition)、機器翻譯(Machine Translation)、自動摘要(Text Summarization)、信息抽取(Information Extraction)、情感分析(Sentiment Analysis)、聊天機器人(Chatter Bot)等。
在包括自動語音識別、文本校對、機器翻譯在內的一些自然語言處理應用中,出現越來越多的開源Python代碼。
結合獵兔搜索在自然語言處理相關領域10多年的研發、實踐和教學經驗,本書嘗試用易懂的方式介紹使用Python編程語言解決NLP相關問題。
本書第1章介紹開發自然語言處理應用可以採用的Python開發環境及其相關技術基礎;第2章介紹中文分詞原理與命名實體識別;第3章介紹文檔分析及自動校對方法;第4章介紹文本相似度計算與文檔排重;第5章介紹信息提取及關鍵詞提取;第6章介紹自動摘要與評測;第7章介紹文本分類;第8章介紹情感分析;第9章介紹語音識別應用開發;第10章介紹聊天機器人開發;第11章介紹機器翻譯及自動評價。
本書中的一些內容和現有的一些開源項目spaCy等共同成長和發展。本書相關的參考軟件和代碼在讀者QQ群777171593的附件中可以找到。一些具體的細節也可以在讀者QQ群或者微信群討論。由於作者水平有限,錯漏之處敬請直接和作者聯繫。
感謝早期合著者、合作夥伴、員工、學員、讀者的支持,給我們提供了良好的工作基礎。就像玻璃容器中的水培植物一樣,這是一個持久可用的成長基礎。技術的融合與創新無止境。歡迎一起探索。
隨著可獲得語音和文本數據的日益增多,自然語言處理技術在生產和生活中發揮越來越重要的作用。
本書適合需要具體實現自然語言處理應用的開發人員或者對人工智能等相關領域感興趣的讀者參考,同時獵兔搜索技術團隊已經開發出本書配套的培訓課程和商業軟件。

編者

 
  步驟一.
依據網路上的圖書,挑選你所需要的書籍,根據以下步驟進行訂購
選擇產品及數量 結 帳 輸入基本資料 取貨與付款方式
┌───────────────────────────────────────────────────┘
資料確定 確認結帳 訂單編號    

步驟二.
完成付款的程序後,若採用貨到付款等宅配方式,3~7天內 ( 例假日將延期一至兩天 ) 您即可收到圖書。若至分店門市取貨,一週內聯絡取書。

步驟三.
完成購書程序者,可利用 訂單查詢 得知訂單進度。

注意事項.
● 付款方式若為網路刷卡必須等" 2 ~ 3 個工作天"確認款項已收到,才會出貨.如有更改書籍數量請記得按更新購物車,謝謝。

● 大陸出版品封面老舊、磨痕、凹痕等均屬常態,除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。

● 至2018年起,因中國大陸環保政策,部分書籍配件以QR CODE取代光盤音頻mp3或dvd,已無提供實體光盤。如需使用學習配件,請掃描QR CODE 連結至當地網站註冊並通過驗證程序,方可下載使用。造成不便,敬請見諒。

● 我們將保留所有商品出貨權利,如遇缺書情形,訂單未達免運門檻運費需自行負擔。

預訂海外庫存.
商品到貨時間須4週,訂單書籍備齊後方能出貨,如果您有急用書籍,建議與【預訂海外庫存】商品分開訂購。