現実の経済指標、株価データ、不動産データを例とし、
第1章 データサイエンスとビジネス
1.1 データサイエンスとファイナンス
1.2 データサイエンスと保険
1.3 データサイエンスとマーケティング
1.4 データ倫理
1.5 データサイエンスと因果関係
1.6 データサイエンスと解釈性
第2章 データを読む
2.1 変数とデータ
2.2 質的変数
2.3 量的変数
2.4 社会で活用されているデータ
2.5 統計情報の正しい理解
2.6 母集団と標本抽出
第3章 データを組み合わせて読む
3.1 表の構成
3.2 質的変数どうしの組み合わせ
3.3 質的変数と量的変数の組み合わせ
3.4 量的変数どうしの組み合わせ
第4章 データを扱う
4.1 表計算アプリケーションExcelとデータサイエンス
4.2 CSVファイルの扱い
4.3 Excelの基本知識
4.4 データの準備
4.5 データの集計
4.6 データの並び替え
4.7 「データ分析」の設定と基本統計量の算出
4.8 機械判読可能なデータの作成・表記方法
第5章 データを説明する
5.1 棒グラフと折れ線グラフ
5.2 ヒストグラム
5.3 円グラフ
5.4 散布図
5.5 箱ひげ図
5.6 ヒートマップ
5.7 3次元棒グラフ
5.8 優れた可視化事例
5.9 不適切なグラフ表現
第6章 データを加工する
6.1 データ型変換処理
6.2 集計処理
6.3 ソート処理
6.4 クレンジング処理
6.5 結合処理
6.6 比率
6.7 時系列データとクロスセクションデータ
6.8 時系列的な変動の分析
6.9 対数変換
6.10 スケーリング
6.11 ダミー変数
6.12 移動平均
6.13 季節調整
6.14 実質化
6.15 期種変換
6.16 DI
第7章 データから推定する
7.1 確率
7.2 条件付き確率と独立
7.3 事象と確率分布
7.4 二項分布と正規分布
7.5 点推定
7.6 区間推定
7.7 標本の大きさと精度
第8章 データサイエンスと最適化
8.1 最適化問題の定式化
8.2 ソルバーによる解法例
8.3 資産配分の最適化
第9章 統計モデル入門
9.1 統計モデルを使う意義
9.2 モデリング
9.3 Rを使うための準備
9.4 Rの実行
9.5 R実行上の注意点
第10章 回帰モデルの基本
10.1 中古マンションデータ
10.2 回帰モデルの考え方
10.3 決定係数
10.4 重回帰モデル
10.5 質的説明変数
10.6 対数線形モデル
第11章 回帰分析の理解を深める
11.1 説明変数の選択
11.2 回帰診断
11.3 診断結果への対処
11.4 多重共線性
第12章 分類の統計モデル
12.1 ロジットモデルの考え方
12.2 為替レートは予測可能か
12.3 ロジットモデルによるデフォルトリスクの分析
第13章 ツリーモデル
13.1 回帰木
13.2 分類木
13.3 付録:ツリーモデルの逐次分岐の手順
第14章 高次元データと正則化
14.1 スタインの逆説
14.2 ベイズ法
14.3 バイアスと分散のトレードオフ
14.4 正則化回帰
14.5 正則化回帰のローンデータへの応用
付録 連続型確率変数
A.1 確率密度関数
A.2 連続型確率変数の期待値
A.3 正規分布
A.4 t分布
A.5 ラプラス分布