總金額: 會員:NT$ 0 非會員:NT$ 0 
(此金額尚未加上運費)
電子電信技術 電腦技術 計算技術、計算機技術
 
 
 
 
Python網絡爬蟲開發從入門到精通(配件另行下載)
 作  者: 劉延林
 出版單位: 北京大學
 出版日期: 2019.12
 進貨日期: 2020/1/23
 ISBN: 9787301309094
 開  本: 16 開    
 定  價: 593
 售  價: 474
  會 員 價: 435
推到Facebook 推到Plurk 推到Twitter
前往新書區 書籍介紹 購物流程  
 
編輯推薦:

《Python網絡爬蟲開發從入門到精通》堅持以實例為主,理論為輔的路線,從 Python 基礎、爬蟲開發常用網絡請求庫,到爬蟲框架使用和分布式爬蟲設計,以及最後的數據存儲、分析、實戰訓練等,覆蓋了爬蟲項目開發階段的整個生命週期。
  (1)沒有高深的理論,每一章都是以實例為主,讀者參考源碼,修改實例,就能得到自己想要的結果。目的是讓讀者看得懂、學得會、做得出。
  (2)實訓與問答,10多章章節實訓與問答,目的是讓讀者看完之後,能做到舉一反三,學以致用。
  (3)內容系統,實戰性強。本書從零開始講解,然後逐步深入相關爬蟲技能,從而達到從入門到精通的學習效果。
  (4)配套資源豐富。案例源碼,Python 常見面試題精選(50 道),“微信高手技巧隨身查”“QQ 高手技巧隨身查”“手機辦公 10 招就夠”3 本電子書,“5 分鐘學會番茄工作法”視頻教程““10 招精通超級時間整理術”視頻教程。


內容簡介:

本書共分 3 篇,針對 Python 爬蟲初學者,從零開始,系統地講解了如何利用 Python 進行常見的網絡爬蟲的程序開發。
第 1 篇快速入門篇(第 1 章 ~ 第 9 章):本篇主要介紹了 Python 環境的搭建和一些 Python 的基礎語法知識等、Python爬蟲入門知識及基本的使用方法、Ajax 數據的分析和抓取、動態渲染頁面數據的爬取、網站代理的設置與使用、驗證碼的識別與破解,以及 App 數據抓取、數據的存儲方法等內容。
第 2 篇技能進階篇(第 10 章 ~ 第 12 章):本篇主要介紹了 PySpider 和 Scrapy 兩個常用爬蟲框架的基本使用方法、分布式爬蟲的實現思路,以及數據分析、數據清洗常用庫的使用方法。
第 3 篇項目實戰篇(第 13 章):本篇通過 6 個綜合實戰項目,詳細地講解了 Python 數據爬蟲開始與實戰應用。本篇對全書內容進行了總結回顧,強化讀者的實操水平。
本書案例豐富,注重實戰,既適合 Python 程序員和爬蟲愛好者閱讀學習,也適合作為廣大職業院校相關專業的教學用書。


作者簡介:

劉延林,知名論壇Python爬蟲專題管理員,擅長Python爬蟲技術,並對Python數據分析與挖掘有深入研究。在CSDN等多個知名博客網站發表多篇技術文章,深受讀者的喜愛。


圖書目錄:

第1篇快速入門篇
第1章Python基礎 2
1.1Python環境搭建 3
1.2Python編程入門 16
1.3新手實訓 33
1.4新手問答 35
本章小結 35
第2章Python爬蟲入門 36
2.1爬蟲的分類 37
2.2爬蟲的基本結構和工作流程 38
2.3爬蟲策略 39
2.4HTTP的基本原理 40
2.5網頁基礎 45
2.6Session和Cookie 49
2.7新手實訓 51
2.8新手問答 54
本章小結 55
第3章基本庫的使用 56
3.1urllib 57
3.2requests 64
3.3re正則使用 69
3.4XPath 75
3.5新手實訓 78
3.6新手問答 81
本章小結 82
第4章Ajax數據抓取 83
4.1Ajax簡介 84
4.2使用Python模擬Ajax請求數據 91
4.3新手實訓 93
4.4新手問答 96
本章小結 96
第5章動態渲染頁面爬取 97
5.1Selenium的使用 98
5.2Splash的基本使用 115
5.3新手實訓 127
5.4新手問答 131
本章小結 132
第6章代理的設置與使用 133
6.1代理設置 134
6.2代理池構建 136
6.3付費代理的使用 140
6.4ADSL撥號代理的搭建 145
6.5新手問答 155
本章小結 156
第7章驗證碼的識別與破解 157
7.1普通圖形驗證碼的識別 158
7.2極驗滑動驗證碼的破解 164
7.3極驗滑動拼圖驗證碼破解 168
7.4新手問答 174
本章小結 175
第8章App數據抓取 176
8.1Fiddler的基本使用 177
8.2Charles的基本使用 182
8.3Appium的基本使用 196
8.4新手問答 217
本章小結 217
第9章數據存儲 218
9.1文件存儲 219
9.2數據庫存儲 224
9.3新手實訓 236
9.4新手問答 239
本章小結 240

第2篇技能進階篇
第10章常用爬蟲框架 242
10.1PySpider框架 243
10.2Scrapy框架 252
10.3Scrapy-Splash的使用 262
10.4新手實訓 266
10.5新手問答 269
本章小結 269
第11章部署爬蟲 270
11.1Linux系統下安裝Python 3 271
11.2Docker的使用 273
11.3Docker安裝Python 274
11.4Docker安裝MySQL 277
本章小結 278

第12章數據分析 279
12.1NumPy的使用 280
12.2Pandas的使用 296
12.3pyecharts的使用 311
12.4新手實訓 315
12.5新手問答 316
本章小結 316

第3篇項目實戰篇
第13章爬蟲項目實戰 318
13.1實戰一:Selenium XPath爬取簡書 319
13.2實戰二:使用requests爬取騰訊人口遷徙數據 326
13.3實戰三:Scrapy爬取豆瓣電影 330
13.4實戰四:使用Selenium多線程異步爬取同城旅遊網機票價格信息 334
13.5實戰五:數據分析Dessert Apples下12種蘋果全年最高、最低和平均銷量 343
13.6實戰六:中國南方航空機票信息爬取 346
本章小結 352

附錄 Python常見面試題精選 353


圖片預覽:

 
  步驟一.
依據網路上的圖書,挑選你所需要的書籍,根據以下步驟進行訂購
選擇產品及數量 結 帳 輸入基本資料 取貨與付款方式
┌───────────────────────────────────────────────────┘
資料確定 確認結帳 訂單編號    

步驟二.
完成付款的程序後,若採用貨到付款等宅配方式,3~7天內 ( 例假日將延期一至兩天 ) 您即可收到圖書。若至分店門市取貨,一週內聯絡取書。

步驟三.
完成購書程序者,可利用 訂單查詢 得知訂單進度。

注意事項.
● 付款方式若為網路刷卡必須等" 2 ~ 3 個工作天"確認款項已收到,才會出貨.如有更改書籍數量請記得按更新購物車,謝謝。

● 大陸出版品封面老舊、磨痕、凹痕等均屬常態,除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。

● 至2018年起,因中國大陸環保政策,部分書籍配件以QR CODE取代光盤音頻mp3或dvd,已無提供實體光盤。如需使用學習配件,請掃描QR CODE 連結至當地網站註冊並通過驗證程序,方可下載使用。造成不便,敬請見諒。

● 我們將保留所有商品出貨權利,如遇缺書情形,訂單未達免運門檻運費需自行負擔。

預訂海外庫存.
商品到貨時間須4週,訂單書籍備齊後方能出貨,如果您有急用書籍,建議與【預訂海外庫存】商品分開訂購。