總金額: 會員:NT$ 0 非會員:NT$ 0 
(此金額尚未加上運費)
電子電信技術 電腦技術 計算技術、計算機技術
 
 
 
 
Python極簡講義:一本書入門數據分析與機器學習(配件另行下載)
 作  者: 張玉宏
 出版單位: 電子工業
 出版日期: 2020.05
 進貨日期: 2020/6/4
 ISBN: 9787121387043
 開  本: 16 開    
 定  價: 960
 售  價: 768
  會 員 價: 704
推到Facebook 推到Plurk 推到Twitter
前往新書區 書籍介紹 購物流程  
 
編輯推薦:

1.輕鬆入門:文筆流暢,通俗易懂,從Python基礎、NumPy、Pandas、Matplotlib,到機器學習算法,循序漸進,幫助零基礎讀者快速入門。

2.圖文並茂:一圖勝千言,書中配有精心繪製的近200幅插圖,形象生動,融會一心。

3.實戰相隨:實戰出真知,每章均配備思考與提高環節,習題選自知名公司面試題目,針對性和實用性強,可在AI求職之路上助你一臂之力。


內容簡介:

本書以圖文並茂的方式介紹了Python的基礎內容,並深入淺出地介紹了數據分析和機器學習領域的相關入門知識。

第1章至第5章以極簡方式講解了Python的常用語法和使用技巧,包括數據類型與程序控制結構、自建Python模塊與第三方模塊、Python函數和面向對象程序設計等。

第6章至第8章介紹了數據分析必備技能,如NumPy、Pandas和Matplotlib。

第9章和第10章主要介紹了機器學習的基本概念和機器學習框架sklearn的基本用法。

對人工智能相關領域、數據科學相關領域的讀者而言,本書是一本極簡入門手冊。對於從事人工智能產品研發的工程技術人員,本書亦有一定的參考價值。


作者簡介:

張玉宏,大數據分析師(高級),2012年於電子科技大學獲得博士學位,2009—2011年美國西北大學訪問學者,2019—2020年美國IUPUI高級訪問學者,YOCSEF鄭州2019—2020年度副主席。現執教於河南工業大學,主要研究方向為大數據、機器學習。發表學術論文30余篇,先後撰寫《深度學習之美:AI時代的數據處理與最佳實踐》《品味大數據》等科技圖書7本,參與編寫英文學術專著2部。


圖書目錄:

第1章 初?Python与Jupyter 1
1.1 Python概要 2
1.1.1 ?什么要??Python 2
1.1.2 Python中常用的? 2
1.2 Python的版本之? 4
1.3 安?Anaconda 5
1.3.1 Linux?境下的Anaconda安? 5
1.3.2 conda命令的使用 6
1.3.3 Windows?境下的Anaconda安? 7
1.4 ?行Python 11
1.4.1 ??Python 11
1.4.2 Python版本的Hello World 12
1.4.3 Python的?本文件 13
1.4.4 代??? 15
1.4.5 代?注? 17
1.5 Python中的?置函? 17
1.6 文?化?程—Jupyter 20
1.6.1 Jupyter的由? 20
1.6.2 Jupyter的安? 21
1.6.3 Jupyter的使用 23
1.6.4 Markdown??器 26
1.7 Jupyter中的魔法函? 31
1.7.1 %lsmagic函? 31
1.7.2 %matplotlib inline函? 32
1.7.3 %timeit函? 32
1.7.4 %%writefile函? 33
1.7.5 其他常用的魔法函? 34
1.7.6 在Jupyter中?行shell命令 35
1.8 本章小? 35
1.9 思考与提高 36

第2章 ?据?型与程序控制?构 40
2.1 ?什么需要不同的?据?型 41
2.2 Python中的基本?据?型 42
2.2.1 ?值型(Number) 42
2.2.2 布??型(Boolean) 45
2.2.3 字符串型(String) 45
2.2.4 列表(List) 49
2.2.5 元?(Tuple) 59
2.2.6 字典(Dictionary) 62
2.2.7 集合(Set) 65
2.3 程序控制?构 67
2.3.1 回?那段?忘的?史 67
2.3.2 ?序?构 69
2.3.3 ???构 70
2.3.4 循??构 74
2.4 高效的推?式 80
2.4.1 列表推?式 80
2.4.2 字典推?式 83
2.4.3 集合推?式 83
2.5 本章小? 84
2.6 思考与提高 84

第3章 自建Python模?与第三方模? 90
3.1 ?入Python?准? 91
3.2 ??自己的模? 93
3.3 模?的搜索路? 97
3.4 ?建模?包 100
3.5 常用的?建模? 103
3.5.1 collection模? 103
3.5.2 datetime模? 110
3.5.3 json模? 115
3.5.4 random模? 118
3.6 本章小? 121
3.7 思考与提高 122

第4章 Python函? 124
4.1 Python中的函? 125
4.1.1 函?的定? 125
4.1.2 函?返回多?值 127
4.1.3 函?文?的构建 128
4.2 函???的“花式”?? 132
4.2.1 ??字?? 132
4.2.2 可??? 133
4.2.3 默??? 136
4.2.4 ??序列的打包与解包 138
4.2.5 ?值?是?引用 142
4.3 函?的?? 146
4.3.1 感性???? 146
4.3.2 思?与??思? 148
4.3.3 ???用的函? 149
4.4 函?式?程的高?函? 151
4.4.1 lambda表?式 152
4.4.2 filter()函? 153
4.4.3 map()函? 155
4.4.4 reduce()函? 157
4.4.5 sorted()函? 158
4.5 本章小? 159
4.6 思考与提高 160

第5章 Python高?特性 165
5.1 面向?象程序?? 166
5.1.1 面向?程与面向?象之? 166
5.1.2 ?的定?与使用 169
5.1.3 ?的?承 173
5.2 生成器与迭代器 176
5.2.1 生成器 176
5.2.2 迭代器 183
5.3 文件操作 187
5.3.1 打?文件 187
5.3.2 ?取一行与?取全部行 191
5.3.3 ?入文件 193
5.4 异常?理 193
5.4.1 感性??程序中的异常 194
5.4.2 异常?理的三步走 195
5.5 ???? 197
5.5.1 利用print()?出?察?量 197
5.5.2 assert?言 198
5.6 本章小? 201
5.7 思考与提高 202

第6章 NumPy向量?算 204
6.1 ?何需要NumPy 205
6.2 如何?入NumPy 205
6.3 生成NumPy?? 206
6.3.1 利用序列生成 206
6.3.2 利用特定函?生成 207
6.3.3 Numpy??的其他常用函? 209
6.4 N???的?性 212
6.5 NumPy??中的?算 215
6.5.1 向量?算 216
6.5.2 算??算 216
6.5.3 逐元素?算与?量?乘?算 218
6.6 ?因斯坦求和?定 222
6.6.1 不一?的??法 222
6.6.2 NumPy中的einsum()方法 224
6.7 NumPy中的“?”方向 231
6.8 操作??元素 234
6.8.1 通?索引????元素 234
6.8.2 NumPy中的切片?? 236
6.8.3 二???的?置与展平 238
6.9 NumPy中的?播 239
6.10 NumPy??的高?索引 242
6.10.1 “花式”索引 242
6.10.2 布?索引 247
6.11 ??的堆?操作 249
6.11.1 水平方向堆?hstack() 250
6.11.2 垂直方向堆?vstack() 251
6.11.3 深度方向堆?hstack() 252
6.11.4 列堆?与行堆? 255
6.11.5 ??的分割操作 257
6.12 NumPy中的?机?模? 264
6.13 本章小? 266
6.14 思考与提高 267

第7章 Pandas?据分析 271
7.1 Pandas?介 272
7.2 Pandas的安? 272
7.3 Series?型?据 273
7.3.1 Series的?建 273
7.3.2 Series中的?据?? 277
7.3.3 Series中的向量化操作与布?索引 280
7.3.4 Series中的切片操作 283
7.3.5 Series中的缺失值 284
7.3.6 Series中的?除与添加操作 286
7.3.7 Series中的name?性 288
7.4 DataFrame ?型?据 289
7.4.1 构建DataFrame 289
7.4.2 ??DataFrame中的列与行 293
7.4.3 DataFrame中的?除操作 298
7.4.4 DataFrame中的“?”方向 301
7.4.5 DataFrame中的添加操作 303
7.5 基于Pandas的文件?取与分析 310
7.5.1 利用Pandas?取文件 311
7.5.2 DataFrame中的常用?性 312
7.5.3 DataFrame中的常用方法 314
7.5.4 DataFrame的?件?? 318
7.5.5 DataFrame的切片操作 320
7.5.6 DataFrame的排序操作 323
7.5.7 Pandas的聚合和分??算 325
7.5.8 DataFrame的透?表 334
7.5.9 DataFrame的?SQL操作 339
7.5.10 DataFrame中的?据清洗方法 341
7.6 泰坦尼克幸存者?据??理 342
7.6.1 ?据集?介 342
7.6.2 ?据集的拼接 344
7.6.3 缺失值的?理 350
7.7 本章小? 353
7.8 思考与提高 353

第8章 Matplotlib与Seaborn可?化分析 365
8.1 Matplotlib与?形?制 366
8.2 ?制???形 366
8.3 pyplot的高?功能 371
8.3.1 添加?例与注? 371
8.3.2 ?置?形??及坐?? 374
8.3.3 添加网格? 378
8.3.4 ?制多?子? 380
8.3.5 Axes与Subplot的?? 382
8.4 散?? 388
8.5 ?形?与直方? 392
8.5.1 垂直?形? 392
8.5.2 水平?形? 394
8.5.3 并列?形? 395
8.5.4 ?加?形? 400
8.5.5 直方? 402
8.6 ?? 407
8.7 箱形? 409
8.8 ?差? 411
8.9 ?制三??形 413
8.10 与Pandas?作??—以谷歌流感???据?例 416
8.10.1 谷歌流感???据描述 416
8.10.2 ?入?据与?据??理 417
8.10.3 ?制?序曲?? 421
8.10.4 ??合适的?据可?化表? 423
8.10.5 基于?件判?的?形?制 427
8.10.6 ?制多?子? 430
8.11 惊?的Seaborn 431
8.11.1 pairplot(??) 432
8.11.2 heatmap(?力?) 434
8.11.3 boxplot(箱形?) 436
8.11.4 violin plot(小提琴?) 442
8.11.5 Density Plot(密度?) 446
8.12 本章小? 450
8.13 思考与提高 450

第9章 机器??初步 459
9.1 机器??定? 460
9.1.1 什么是机器?? 460
9.1.2 机器??的三?步? 461
9.1.3 ???程与机器??的差? 464
9.1.4 ?什么机器??不容易 465
9.2 ?督?? 467
9.2.1 感性???督?? 467
9.2.2 ?督??的形式化描述 468
9.2.3 ?失函? 470
9.3 非?督?? 471
9.4 半?督?? 473
9.5 机器??的哲??角 474
9.6 模型性能?估 476
9.6.1 ???差与???差 476
9.6.2 ??合与欠?合 477
9.6.3 模型??与?据?合 479
9.7 性能度量 480
9.7.1 二分?的混淆矩? 480
9.7.2 查全率、查准率与F1分? 481
9.7.3 P-R曲? 484
9.7.4 ROC曲? 485
9.7.5 AUC 489
9.8 本章小? 489
9.9 思考与提高 490

第10章 sklearn与?典机器??算法 492
10.1 机器??的利器—sklearn 493
10.1.1 sklearn?介 494
10.1.3 sklearn的安? 496
10.2 ?性回? 497
10.2.1 ?性回?的概念 497
10.2.2 使用sklearn??波士?房价?? 499
10.3 k-近?算法 516
10.3.1 算法?介 516
10.3.2 k值的?取 518
10.3.3 特征?据的?一化 519
10.3.4 ?居距离的度量 521
10.3.5 分?原?的制定 522
10.3.6 基于sklearn的k-近?算法?? 522
10.4 Logistic回? 527
10.4.1 ?什么需要Logistic回? 527
10.4.2 Logistic源?初探 529
10.4.3 Logistic回??? 532
10.5 神?网???算法 536
10.5.1 人工神?网?的定? 537
10.5.2 神?网?中的“??”本? 537
10.5.3 神?网??构的?? 540
10.5.4 利用sklearn搭建多?神?网? 541
10.6 非?督??的代表—k均值聚? 550
10.6.1 聚?的基本概念 551
10.6.2 簇的划分 552
10.6.3 k均值聚?算法核心 552
10.6.4 k均值聚?算法优缺? 554
10.6.5 基于sklearn的k均值聚?算法?? 555
10.7 本章小? 561


章節試讀:

前言



為什麼寫此書

我們正處於一個數據科技(Data Technology,DT)時代。在這個時代,我們的一舉一動都能在數據空間留下電子印記,於是海量的社交、電商、科研大數據撲面而來。然而,太多的數據給人們帶來的,可能並不是更多的洞察,反而是迷失。

因為僅就數據本身而言,它們是“一無所知”的。數據的價值,在於形成信息,變成知識,乃至升華為智慧。也就是說,這些數據如果不能進一步被“深加工”,即使數據量再“大”,也意義甚小。

於是,就派生出這麼一個問題:這些數據,由誰來深加工?其實,早在2012年,《哈佛商業評論》就刊登了一篇文章並給出了答案,進行數據深加工的人就是“數據科學家”。文章還斷言,數據科學家是21世紀非常“性感”的職業。

但如何成為一名數據科學家呢?尤其是一名“性感”的數據科學家?作為一個有點文藝范兒的理工男,我喜歡讀書,從書中獲得啟迪。

我曾讀過埃裡克·萊斯(Eric Ries)寫的一本有關創業的書,書名是《精益創業》(The Lean Startup)。在閱讀這本書時,有一個概念深入我心,那就是“極小可行產品”(Minimum Viable Product,MVP)。圍繞這個概念,創業者在創業初期不可貪多求全,而應該先做出一個可用產品,拿到市場上去檢驗,然後根據反饋反覆迭代,打磨升級,後續做出比較完善、比較成功的產品。

後來,我看到有人提出了類似的概念——極簡必要知識(Minimal Actionable Knowledge and Experience,MAKE)。這個概念點醒了我,我覺得自己大概找到了“如何成為一名數據科學家”這個問題的答案:You can MAKE it!

先來說說什麼是MAKE。它指的是入門某個新領域切實可行的極小知識集合。MAKE說起來好像比較高級,但實際上,它背後有一個支撐它的樸素原則——Pareto原則(亦稱80-20原則),即80%的工作問題可以通過掌握20%的知識來解決。

同樣,想成為一名“性感”的數據科學家,一條路自然是按部就班地學習所有技能——十年磨一劍,但這樣做的風險在於,當你“攜劍下山”時,別人可能已經用上了飛機、大炮。這樣的對壘,你勝算幾何?

其實還有另一條備選之路,那就是走一走MAKE之道。在學習某項技能(如Python、數據分析、機器學習)時,我們要想辦法在極短的時間內,摸索清楚這項技能的“極簡必要知識”。一方面,它已然可以幫我們解決工作中的大部分問題;另一方面,入門之後,技能的提升通道可以在實踐中尋得,缺啥補啥。有明確的任務導向,學習就會有如神助,這也是當前時代的快節奏學習法。

說到這裡,本書的寫作初衷就呼之欲出了。是的,這本書的定位就是,為初學者提供關於數據科學的“極簡必要知識”,從而讓你獲得那份“性感”的工作。這些知識包含了成為數據科學家所需要掌握的基礎內容——Python編程、數據分析、機器學習。


本書內容

本書主要介紹Python的基礎知識、數據分析的必備技能,以及機器學習相關內容。全書共分10章,每章的內容簡介如下。

第1章 初識Python與Jupyter

Python是最具人氣的編程語言之一,Jupyter是人氣與口碑俱佳的Python開發平台。本章將介紹Python和Jupyter的基本內容,包括Python的安裝與運行,以及文學化編程利器Jupyter的使用方法。

第2章 數據類型與程序控制結構

本章將介紹Python的基礎語法及常見的數據類型,包括數值型、布爾類型、字符串型、列表、元組、字典、集合等。此外,本章還將介紹三種程序控制結構(順序結構、選擇結構和循環結構)和高效的推導式。

第3章 自建Python模塊與第三方模塊

本章將介紹Python的自定義模塊及常用的第三方模塊,包括collection、datetime、json、random等模塊。

第4章 Python函數

本章將討論Python的函數定義、函數參數(關鍵字參數、可變參數、默認參數等)的“花式”傳遞、函數的遞歸調用,以及函數式編程。

第5章 Python高級特性

本章將介紹Python中的一些高階應用,這些高階應用能讓我們更高效地寫出更專業的Python代碼。本章內容涉及面向對象程序設計思想、生成器與迭代器、文件操作、異常處理及錯誤調試等。

第6章 NumPy向量計算

本章將討論NumPy數組的構建、方法和屬性,介紹NumPy的廣播機制、布爾索引、數組的堆疊,以及愛因斯坦求和約定等。

第7章 Pandas數據分析

Pandas是數據分析的利器,本章將主要介紹Pandas的兩種常用數據處理結構:Series和DataFrame。同時介紹基於Pandas的文件讀取與分析,涉及數據的清洗、條件過濾、聚合與分組等。

第8章 Matplotlib與Seaborn可視化分析

Matplotlib和Seaborn是非常好用的數據可視化包,本章將主要介紹Matplotlib和Seaborn的基本用法,並基於此繪製可視化圖形,包括散點圖、條形圖、直方圖、餅圖等。同時,本章將以谷歌流感趨勢數據為例,結合Pandas進行可視化分析。

第9章 機器學習初步

本章將主要介紹有關機器學習的初步知識,包括機器學習的定義,機器學習的幾個主要流派,並討論機器學習模型的性能評估指標,包括混淆矩陣、查準率、查全率、P-R曲線、ROC曲線等。

第10章 sklearn與經典機器學習算法

本章將主要講解知名機器學習框架sklearn的用法,並介紹幾種經典機器學習算法的原理和實戰,這些算法包括線性回歸、k-近鄰算法、Logistics回歸、神經網絡學習算法、k均值聚類算法等。


圖片預覽:

 
  步驟一.
依據網路上的圖書,挑選你所需要的書籍,根據以下步驟進行訂購
選擇產品及數量 結 帳 輸入基本資料 取貨與付款方式
┌───────────────────────────────────────────────────┘
資料確定 確認結帳 訂單編號    

步驟二.
完成付款的程序後,若採用貨到付款等宅配方式,3~7天內 ( 例假日將延期一至兩天 ) 您即可收到圖書。若至分店門市取貨,一週內聯絡取書。

步驟三.
完成購書程序者,可利用 訂單查詢 得知訂單進度。

注意事項.
● 付款方式若為網路刷卡必須等" 2 ~ 3 個工作天"確認款項已收到,才會出貨.如有更改書籍數量請記得按更新購物車,謝謝。

● 大陸出版品封面老舊、磨痕、凹痕等均屬常態,除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。

● 至2018年起,因中國大陸環保政策,部分書籍配件以QR CODE取代光盤音頻mp3或dvd,已無提供實體光盤。如需使用學習配件,請掃描QR CODE 連結至當地網站註冊並通過驗證程序,方可下載使用。造成不便,敬請見諒。

● 我們將保留所有商品出貨權利,如遇缺書情形,訂單未達免運門檻運費需自行負擔。

預訂海外庫存.
商品到貨時間須4週,訂單書籍備齊後方能出貨,如果您有急用書籍,建議與【預訂海外庫存】商品分開訂購。