總金額: 會員:NT$ 0 非會員:NT$ 0 
(此金額尚未加上運費)
電子電信技術 電腦技術 計算技術、計算機技術
 
 
 
 
Python數據分析與大數據處理從入門到精通(配件另行下載)
 作  者: 朱春旭
 出版單位: 北京大學
 出版日期: 2019.11
 進貨日期: 2019/12/6
 ISBN: 9787301307656
 開  本: 16 開    
 定  價: 668
 售  價: 534
  會 員 價: 490
推到Facebook 推到Plurk 推到Twitter
前往新書區 書籍介紹 購物流程  
 
編輯推薦:

(1)全面:數據分析與大數據處理所需的所有技術,包含基礎理論、核心概念、實施流程,從編程語言準備、數據採集與清洗、數據分析與可視化,到大型數據的分布式存儲與分布式計算等。
(2)深入:一本書講透1種編程語言和14種數據分析與大處理工具,以及大數據分析技術及項目開發方法。
(3)豐富:包含45個“新手問答”、17個章節的“實訓”、3個項目綜合實戰、50道Python面試題精選。


內容簡介:

《Python數據分析與大數據處理從入門到精通》主要講解數據分析與大數據處理所需的技術、基礎設施、核心概念、實施流程。從編程語言準備、數據採集與清洗、數據分析與可視化,到大型數據的分布式存儲與分布式計算,貫穿了整個大數據項目開發流程。本書輕理論、重實踐,目的是讓讀者快速上手。1篇首先介紹了Python的基本語法、面向對象開發、模塊化設計等,掌握Python的編程方式。然後介紹了多線程、多進程及其相互間的通信,讓讀者對分布式程序有個基本的認識。第2篇介紹了網絡數據採集、數據清洗、數據存儲等技術。第3篇介紹了Python常用的數據分析工具,擴展了更多的數據清洗、插值方法,為最終的數據可視化奠定基礎。第4篇是大數據分析的重點。首先介紹了Hadoop的框架原理、調度原理,MapReduce原理與編程模型、環境搭建,接著介紹了Spark框架原理、環境搭建方式,以及如何與Hive等第三方工具進行交互,還介紹了新的結構化流式處理技術。第5篇通過三個項目實例,綜合介紹了如何分析網頁、如何搭建分布式爬蟲、如何應對常見的反爬蟲、如何設計數據模型、如何設計架構模型、如何在實踐中綜合運用前四篇涉及的技術。本書既適合非計算機專業的編程“小白”,也適合剛畢業或即將畢業走向工作崗位的廣大畢業生,以及已經有編程經驗,但想轉行做大數據分析的專業人士。同時,還可以作為廣大職業院校、電腦培訓班的教學參考用書。


作者簡介:

朱春旭,高級軟件工程師,長期對企業、軟件開發公司、政府機構培訓大數據開發與應用課程,對Python大數據處理與分析相關應用有深入研究,並編寫有《極客內參-大數據開發實戰》教程45篇,總共30000+字。


圖書目錄:

第1篇 Python程序設計
第1章 Python入門 3
1.1 Python概述 4
1.2 搭建Python開發環境 6
1.3 Python開發工具介紹 11
1.4 Python軟件包的管理 13
1.5 實訓:編寫“Hello World” 15
本章小結 16
第2章 Python基礎 17
2.1 變量 18
2.2 標識符 24
2.3 代碼組織 26
2.4 輸入與輸出 28
2.5 運算符與優先級 30
2.6 新手問答 30
2.7 實訓:設計一個簡易計算器 31
本章小結 31
第3章 數據類型與流程控制 32
3.1 數字類型 33
3.2 字符串類型 37
3.3 集合類型 40
3.4 流程控制語句 45
3.5 新手問答 47
3.6 實訓:設計算法,輸出乘法表 49
本章小結 50
第4章 函數、模塊、包 51
4.1 自定義函數 52
4.2 函數參數 55
4.3 函數式編程 58
4.4 模塊與包 63
4.5 新手問答 65
4.6 實訓:設計算法,對列表進行排序 67
本章小結 68
第5章 面向對象的程序設計 69
5.1 面向對象 70
5.2 自定義類 71
5.3 屬性 73
5.4 方法 79
5.5 類的繼承 83
5.6 可調用對象 86
5.7 不可變對象 87
5.8 新手問答 88
5.9 實訓:設計算法,構造一棵二叉樹 90
本章小結 92
第6章 高級主題 93
6.1 生成器 94
6.2 迭代器 96
6.3 異步處理 97
6.4 錯誤、調試 103
6.5 新手問答 108
6.6 實訓:使用多進程技術統計數據並匯總 109
本章小結 110
第2篇 數據採集與數據清洗
第7章 網絡數據採集 113
7.1 HTTP請求概述 114
7.2 XPath網頁解析 114
7.3 Scrapy數據採集入門 119
7.4 Scrapy應對反爬蟲程序 126
7.5 CrawlSpider類 131
7.6 分布式爬蟲 132
7.7 新手問答 136
7.8 實訓:構建百度雲音樂爬蟲 136
本章小結 139
第8章 數據清洗 140
8.1 數據清洗的意義 141
8.2 數據清洗的內容 141
8.3 數據格式與存儲類型 142
8.4 數據清洗的步驟 145
8.5 數據清洗的工具 147
8.6 新手問答 151
8.7 實訓:清洗百度雲音樂數據並儲存到CSV  151
本章小結 152
第3篇 數據分析與可視化
第9章 NumPy數值計算 155
9.1 NumPy基礎 156
9.2 形狀操作 164
9.3 副本、淺拷貝和深拷貝 166
9.4 高級索引 168
9.5 排序統計 171
9.6 新手問答 173
9.7 實訓:銷售額統計  174
本章小結 175
第10章 Matplotlib可視化 176
10.1 圖形的基本要素 177
10.2 繪圖基礎 177
10.3 設置樣式 186
10.4 圖形樣例 189
10.5 新手問答 198
10.6 實訓:營業數據可視化 199
本章小結 201
第11章 Pandas統計分析 202
11.1 Pandas數據結構 203
11.2 基礎功能 210
11.3 統計分析 217
11.4 時間數據 229
11.5 數據整理 231
11.6 高級功能 234
11.7 讀寫MySQL數據庫 236
11.8 新手問答 237
11.9 實訓:成績分析 237
本章小結 239
第12章 Seaborn可視化 240
12.1 Seaborn概述 241
12.2 可視化數據關係 242
12.3 根據數據分類繪圖 246
12.4 單變量與雙變量 251
12.5 線性關係 256
12.6 新手問答 258
12.7 實訓:成績分析可視化 258
本章小結 260
第4篇 大數據存儲與快速分析篇
第13章 Hadoop數據存儲與基本操作 263
13.1 Hadoop概述 264
13.2 Hadoop數據存儲與任務調度原理 268
13.3 Hadoop基礎環境搭建 273
13.4 Hadoop部署模式 294
13.5 Hadoop常用操作命令 298
13.6 新手問答 300
13.7 實訓:動手搭建Hadoop集群環境 301
本章小結 309
第14章 Spark入門 310
14.1 Spark概述 311
14.2 Spark核心原理 312
14.3 Spark基礎環境搭建 315
14.4 Spark運行模式 317
14.5 新手問答 321
14.6 實訓:動手搭建Spark集群 322
本章小結 323
第15章 Spark RDD編程 324
15.1 RDD設計原理 325
15.2 RDD編程 328
15.3 鍵值對RDD 335
15.4 文件讀寫 340
15.5 編程進階 342
15.6 新手問答 347
15.7 實訓:統計海鮮銷售情況 348
本章小結 350
第16章 Spark SQL編程 351
16.1 Spark SQL概述 352
16.2 創建DataFrame對象 360
16.3 DataFrame常用API 364
16.4 保存DataFrame 370
16.5 新手問答 372
16.6 實訓:統計手機銷售情況 373
本章小結 375
第17章 Spark流式計算編程 376
17.1 流計算簡介 377
17.2 Discretized Stream 379
17.3 Structured Streaming 385
17.4 新手問答 397
17.5 實訓:實時統計貸款金額 397
本章小結 398
第5篇 項目實戰篇
第18章 分析電商網站銷售數據 401
18.1 目標分析 402
18.2 數據採集 405
18.3 數據分析 411
本章小結 416
第19章 分析旅遊網站數據 417
19.1 目標分析 418
19.2 數據採集 420
19.3 數據分析 425
本章小結 429
第20章 分析在售二手房數據 430
20.1 目標分析 431
20.2 數據採集 434
20.3 數據分析 440
本章小結 446
附錄:Python常見面試題精選 447
主要參考文獻 450


章節試讀:

Python 的創始人是Guido van Rossum。1991 年,第一個用C 語言開發的Python 編譯器誕生。
1996 年,Python 發行了第一個公開版本1.4。由於其簡單、易用、可以移植等特點,Python 得到了飛速發展。在編寫本書時,最新主要版本已經是3.7 版本。
Python 版本發布進程如下。
1996 年至2000 年,發布的Python 版本是 1.4-1.6。
2000 年至2008 年,發布的Python 版本是 2.0-2.7。
2008 年至2018 年,發布的Python 版本是 3.0-3.7。
請注意,2008 年後,Python 開始同時維護2.X 和3.X 兩個版本。這是因為當時很多系統都不能正常升級到3.0 版本,於是後來開發了2.7 版本作為過渡。
Python 從誕生起就具有類、函數、異常處理、表、字典等核心數據類型,同時支持用“模塊”來擴展功能。在Python 的發展進程中,開發者不斷加入lambda、map、 f ilter 和reduce 等高階函數,極大地豐富了Python 的API。同時引入了垃圾回收器等高級功能,簡化了程序員對內存的手動管理流程。
當前的版本中,Python 已經具備了以下重要的語言特性。
(1)有多種基本數據類型可供選擇:數字(浮點數、複數和無限長整數)、字符串(ASCII和Unicode)、列表和字典。
(2)支持使用類和多繼承的面向對象編程。
(3)代碼可以分為模塊和包。
(4)支持引發和捕獲異常,從而實現更清晰的錯誤處理。
(5)數據類型是強類型和動態類型。混合不兼容的類型(如嘗試添加字符串和數字)會導致異常,從而能夠更快地捕獲錯誤。
(6)包含高級編程功能,如生成器和列表推導。
(7)其自動內存管理功能使用戶不必在代碼中手動分配和釋放內存。


圖片預覽:

 
  步驟一.
依據網路上的圖書,挑選你所需要的書籍,根據以下步驟進行訂購
選擇產品及數量 結 帳 輸入基本資料 取貨與付款方式
┌───────────────────────────────────────────────────┘
資料確定 確認結帳 訂單編號    

步驟二.
完成付款的程序後,若採用貨到付款等宅配方式,3~7天內 ( 例假日將延期一至兩天 ) 您即可收到圖書。若至分店門市取貨,一週內聯絡取書。

步驟三.
完成購書程序者,可利用 訂單查詢 得知訂單進度。

注意事項.
● 付款方式若為網路刷卡必須等" 2 ~ 3 個工作天"確認款項已收到,才會出貨.如有更改書籍數量請記得按更新購物車,謝謝。

● 大陸出版品封面老舊、磨痕、凹痕等均屬常態,除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。

● 至2018年起,因中國大陸環保政策,部分書籍配件以QR CODE取代光盤音頻mp3或dvd,已無提供實體光盤。如需使用學習配件,請掃描QR CODE 連結至當地網站註冊並通過驗證程序,方可下載使用。造成不便,敬請見諒。

● 我們將保留所有商品出貨權利,如遇缺書情形,訂單未達免運門檻運費需自行負擔。

預訂海外庫存.
商品到貨時間須4週,訂單書籍備齊後方能出貨,如果您有急用書籍,建議與【預訂海外庫存】商品分開訂購。