前言
致謝
作者簡介
符號和約定
第一部分 數據集的描述
第1章 查看數據的第一個工具 2
1.1 數據集 2
1.2 正在發(fā)生什么?繪制數據的圖形 3
1.2.1 條形圖 5
1.2.2 直方圖 5
1.2.3 如何制作直方圖 6
1.2.4 條件直方圖 7
1.3 匯總一維數據 8
1.3.1 均值 8
1.3.2 標準差 9
1.3.3 在線計算均值和標準差 12
1.3.4 方差 13
1.3.5 中位數 13
1.3.6 四分位距 15
1.3.7 合理使用匯總數據 16
1.4 圖形和總結 16
1.4.1 直方圖的一些性質 17
1.4.2 標準坐標和正態(tài)數據 19
1.4.3 箱形圖 21
1.5 誰的更大?澳大利亞比薩調查 22
問題 26
編程練習 26
第2章 關注關系 28
2.1 二維數據繪圖 28
2.1.1 分類數據、計數和圖表 28
2.1.2 序列 32
2.1.3 空間數據散點圖 33
2.1.4 用散點圖揭示關系 33
2.2 相關 37
2.2.1 相關系數 40
2.2.2 用相關性預測 43
2.2.3 相關性帶來的困惑 46
2.3 野生馬群中的不育公馬 47
問題 49
編程練習 51
第二部分 概率
第3章 概率論基礎 56
3.1 實驗、結果和概率 56
3.2 事件 57
3.2.1 通過計數結果來計算事件概率 58
3.2.2 事件概率 60
3.2.3 通過對集合的推理來計算概率 62
3.3 獨立性 64
3.4 條件概率 68
3.4.1 計算條件概率 69
3.4.2 檢測罕見事件是困難的 71
3.4.3 條件概率和各種獨立形式 73
3.4.4 警示例子:檢察官的謬論 74
3.4.5 警示例子:Monty Hall 問題 75
3.5 更多實例 77
3.5.1 結果和概率 77
3.5.2 事件 78
3.5.3 獨立性 78
3.5.4 條件概率 79
問題 81
第4章 隨機變量與期望 86
4.1 隨機變量 86
4.1.1 隨機變量的聯合概率與條件概率87
4.1.2 只是一個小的連續(xù)概率 90
4.2 期望和期望值 92
4.2.1 期望值 92
4.2.2 均值、方差和協方差 94
4.2.3 期望和統計 96
4.3 弱大數定律 97
4.3.1 獨立同分布樣本 97
4.3.2 兩個不等式 98
4.3.3 不等式的證明 98
4.3.4 弱大數定律的定義 100
4.4 弱大數定律應用 101
4.4.1 你應該接受下注嗎 101
4.4.2 賠率、期望與博彩:文化轉向 102
4.4.3 提前結束比賽 103
4.4.4 用決策樹和期望做決策 104
4.4.5 效用 105
問題 107
編程練習 110
第5章 有用的概率分布 112
5.1 離散分布 112
5.1.1 均勻分布 112
5.1.2 伯努利隨機變量 112
5.1.3 幾何分布 113
5.1.4 二項分布 113
5.1.5 多項分布 115
5.1.6 泊松分布 115
5.2 連續(xù)分布 117
5.2.1 均勻分布 117
5.2.2 貝塔分布 117
5.2.3 伽馬分布 118
5.2.4 指數分布 119
5.3 正態(tài)分布 119
5.3.1 標準正態(tài)分布 120
5.3.2 正態(tài)分布 120
5.3.3 正態(tài)分布的特征 121
5.4 逼近參數為$N$的二項式 122
5.4.1 當$N$取值很大時 124
5.4.2 正態(tài)化 125
5.4.3 二項分布的正態(tài)逼近 127
問題 127
編程