実践ワークショップ Excel徹底活用 統計データ分析 改訂新版
概 要
統計学の専門家が、統計解析の基礎から多変量解析まで、Excelを使った統計分析手法をやさしく解説した統計データ分析の入門書です。ビジネス現場で急激に進むコンピュータネットワーク整備により、POSデータや電子受発注データが簡単に手にはいるようになりました。これらのデータに含まれた、顧客の潜在的要望や商品市場の動向などの情報を的確に引き出すための、適切なデータ分析の方法と分析結果の読み方をやさしく詳細に解説します。好評の既刊「実践ワークショップExcel徹底活用 統計データ分析」の全面リニューアル版で、Excel2007/2003/2002対応、サンプルデータのダウンロードサービス付き。
| 著者 | 渡辺美智子、神田智弘 |
| 価格 | 円(税込)(本体2500円) |
| ISBN | 978-4-7980-1932-1 |
| 発売日 | 2008/6/26 |
| 判型 | B5変 |
| 色数 | 2色 |
| ページ数 | 288 |
| CD/DVD | - |
| 対象読者 | 初級 |
| シリーズ | 実践ワークショップ |
目次
第1章 ビジネスデータの特徴をつかむ
1-1 なぜ統計が重要なのか?~ビジネスにおける統計利用~
エビデンスに基づくビジネスの意思決定
取り引きのデータ
変数とケース
1-2 統計分析の視点~どのような観点でデータを見ればよいのか~
統計分析の視点~統計は、『鏡』であり、『羅針盤』であり、『内視鏡』であるとの例えあり~
全体のばらつきを測り、現状の傾向を把握する
層別してグループ間の特徴を比較し、違いを見つける
変数の間の関係を見て、因果構造と要因効果を測る
時点変化に伴うトレンドやパターンの特徴をつかむ
集団を分類する
1-3 統計分析の手法と道具、材料~データのタイプとデータマネジメント~
カテゴリータイプと数量タイプ
データの前処理;データマネジメント
Excelの活用
第2章 統計解析の基礎
2-1 分布~データのばらつきを記述する~
統計分析の目的は分布の把握
データの値に応じた度数分布表を作る
データを区間に分けて度数分布表を作る
度数分布をグラフで視覚化する
重点を明らかにするパレート図
情報を読む2つの視点
2-2 度数分布表とパレート図~重点指向に基づいて分析する~
カテゴリータイプデータのばらつきを分析する
カテゴリータイプのデータを用いた度数分布表を作成する
Excelを使ってパレート図を作成する
松坂投手の重点となる球種を分析する
パレート図を用いてABC分析をする
Column パレートの法則と重点指向
2-3 集団の中心傾向とばらつき~数量タイプのデータのばらつきを記述する~
数量タイプのデータのばらつきを分析する
度数分布表を視覚化するヒストグラム
度数分布表を作成する
ヒストグラムを作成する
ヒストグラムで集団の中の異質性を発見する
ヒストグラムでデータのばらつきを分析する
Column ヒストグラムの階級幅の決め方
2-4 層別ヒストグラム~分けて比べる~
層別ヒストグラム(グループに色分けしたヒストグラム)を作成する
層別ヒストグラムで紙幣の真贋判定の基準を探る
ヒストリカル・ボラティリティを分析する
2-5 基本統計量~代表的な指標で分布の特徴を表す~
Excelの分析ツールを活用する
基本統計量を出力する
関数を使って基本統計量を求める
基本統計量で求められる指標
基本統計量でデータのばらつきの形状や大きさを分析する
2-6 平均値・中央値・最頻値~データの中心傾向を見る~
分布の中心を測る3つの指標
平均値
中央値
最頻値
平均値と中央値の性質の違い
3つの指標と分布の歪みの関係
経済指標を適切に読む指標を探る
2-7 分散・標準偏差・範囲~ばらつきの大きさを測る~
ばらつきの大きさが異なればデータの値の意味も変わる
データの値の位置付けを示す偏差
分散・標準偏差の計算例
分散と標準偏差の一般式
標準偏差を求める
母集団における散らばりを推定する不偏分散(標本分散)と標本標準偏差(nで割るのか?(n-1)で割るのか?)
偏差の大きさは標準偏差と比較して測る
球種別の球速のばらつきの大きさは?
2-8 zスコアと偏差値~統計データの相対位置を測る~
平均からの距離を標準偏差を単位として測る
zスコアを求める
偏差値を求める
2002年度 松井秀喜選手のHR記録50本を偏差値にすると
2-9 1シグマ2シグマ3シグマの法則~標準偏差を活用する~
データのばらつきを把握する1シグマ2シグマ3シグマの法則
法則の根拠は正規分布の理論
法則を利用する
zスコアや偏差値では…
シグマの法則を活用した管理の技法
標準偏差を活用したシックスシグマ活動
2-10 変動係数~相対的なばらつきの大きさを示す~
平均値の大きさに左右される標準偏差の大きさの感覚
変動係数で標準偏差を相対的に考える
変動係数の変化を見る
2-11 歪度・尖度・範囲~分布の非対称性や外れ値の存在を示す~
歪度で分布の非対称性をチェックする
尖度で外れ値の存在をチェックする
歪度と尖度を組み合わせる
範囲で最大値と最小値の差を把握する
標準誤差
2-12 四分位点・四分位範囲・四分位偏差~データが集中する範囲のばらつきを見る~
非対称で歪んだ分布のばらつきを把握する
四分位点・四分位範囲・四分位偏差を求める
Excelで四分位点を求める
パーセント点を求める
2-13 箱ヒゲ図~基本統計量を視覚化する~
ばらつきの中心の位置と大きさを見る
箱ヒゲ図でグループ別の分布を比較する
Excelで箱ヒゲ図を描く
2-14 外れ値と特異値~四分位範囲を活用する~
外れ値や特異値の一般的な基準
2-15 ローレンツ曲線とジニ係数~データから格差を測る~
格差を視覚化・計量化する
ローレンツ曲線を描く
ジニ係数を求める
Excelでローレンツ曲線を描く
ローレンツ曲線で見る銀行含み益格差
公表されている度数分布表から格差を計算する(貯蓄格差の分析)
第3章 時系列データの分析
3-1 時系列プロット~時系列データ分析の基本を知る~
時系列データの特徴
3-2 時系列プロットの作成~時刻データを記述するグラフ~
時系列データ分析の基本はグラフの作成
時系列プロットの作成方法
3-3 時系列プロットの構成要素~時系列データを分解する~
時系列データの構成要素
3-4 加法モデルと乗法モデル~2種類の時系列モデル~
2つのモデルの違い
時系列データの変化のパターンをつかむ
3-5 欠測データの埋め込み~時系列データにおける欠測値の処理~
なぜ欠測データの補完が必要か
欠測データ補完の3つの方法
両側2個のデータの平均値での補完例
3-6 対数目盛プロット
対数目盛とは?
対数目盛の読み方
3-7 指数化~変化のパターンを読む~
基準時点の値との相対関係を比較
複数系列のデータに指数化を適用する
指数系列を計算し時系列プロットを作成
地価を指数化した分析例
規模別株価指数の分析例
鉱工業生産指数の分析例
3-8 伸び率と成長率 115
基準時点からの変化の大きさをみる伸び率(減少率)
変化の勢いをつかむ成長率
季節変動がある場合の成長率~前年同月比・前年同期比~
3-9 成長率の寄与度・寄与率分解~全体売上げの伸びへの寄与を部門別に評価する~
全体売上げの伸びへの寄与は?
寄与度とは?
寄与度の求め方
寄与度グラフの作成
各商品部門の成長率と構成比
構成比率と成長率のプロット
3-10 寄与率と寄与率グラフ~変化の要因を探る~
寄与度から寄与率グラフを作成する
3-11 寄与度・寄与率に関するその他の事例~日本の経済成長の要因は?~
日本の実質国内総生産
寄与度を計算する
寄与度のグラフで分析する
寄与率のグラフで分析する
3-12 移動平均~誤差変動をキャンセルアウトしてパターンをよむ~
平滑化して傾向を把握する
移動平均の例
Excelで移動平均系列を求める方法
Column 分析ツールの移動平均
3-13 中心化移動平均~季節パターンを取り除く~
移動平均によって季節パターンを取り除く
中心化移動平均とは?
中心化した四半期移動平均を求める
平滑化した後の分析
3-14 季節パターン(季節指数)の特定と季節調整~年間の周期性を考慮する~
季節調整とは?
加法モデルの季節調整法
乗法モデルの季節調整法
季節指数の意味
月別売上げデータで季節指数を求め、販売目標を設定しましょう
季節指数の応用
3-15 移動平均乖離率~パターンの変化点をさぐる~
データは移動平均(トレンド)に戻る
移動平均乖離率とは?
第4章 カテゴリータイプのデータ間の関係の強さを測る
4-1 特性要因図を作成する~関係の方向性を把握する~
多変量解析とは?
分析目的を明確にする
分析目的の明確化
特性要因図(魚骨図)を描こう
4-2 データをクロス集計表にまとめる~カテゴリーデータの関係を探る~
クロス集計表とは?
Excelでクロス集計表を作成する
4-3 クロス集計表を読み取る指標~行比率・列比率・セル比率と特化係数~
行比率(行方向の比率)
行比率をグラフ化して分析
特化係数の計算
Excelで特化係数を計算
列比率
特化係数の計算
特化係数に関するその他の事例① 地域と酒類消費の関係
特化係数に関するその他の事例② ランナー状況に応じた松坂投手の球種傾向
セル比率
4-4 連関係数~関係の強さを数値で比べる~
連関係数と期待度数
期待度数の計算
サンプルデータからの計算
4-5 独立性のカイ2乗検定~関係の強さを立証する~
独立性のカイ2乗検定
帰無仮説と対立仮説
χ2分布の下側確率を求める
検定の結論
標本誤差
第5章 数量タイプのデータ間の関係の強さを評価する
5-1 変数間の関係を分析するとは?~数量データ間の関係を探る~
課題データの説明
出荷データ
製薬業界の企業データ
打撃成績データ
5-2 散布図上に現れる関係のパターン~関係を調べるグラフ~
散布図から情報を読み取るポイント
相関関係以外の2変数の関係
外れ値の情報
Excelで散布図を描く方法
出荷データの散布図
製薬業界の企業データの散布図
5-3 相関関係の強さを計る相関係数~数値で関係を知る~
共分散vxy
相関係数rxy
Excelで相関係数を出力するには?
5-4 相関係数の解釈の仕方~相関関係と相関係数~
製薬業界の企業データの相関係数を読む
出荷データの相関係数を読む
打撃成績データの相関係数を読む
相関係数を見る上での注意点①:外れ値
相関係数を見る上での注意点②:傾向の異なるグループの混在
相関係数を見る上での注意点③:直線的な関係以外の関係
5-5 相関係数の検定~データの数によって相関係数の値の信頼性は変わる~
有意に0でないことを確認する
打撃成績データの相関係数の信頼性の検定
第6章 単回帰分析~要因効果の大きさを評価する~
6-1 散布図に傾向線を入れて効果を測る~単回帰分析~
散布図に傾向線を引く
回帰直線の式の意味
切片aを解釈する上でのポイント
単回帰直線とは?
最小2乗法とは?
Excelで回帰直線(傾向線)の式を散布図から求める方法
6-2 R2値(決定係数、寄与率)の意味~回帰直線の説明力を知る~
傾向線の信頼性を測る
決定係数の計算方法
寄与率の使い方
6-3 効果の大きさ(傾き)の信頼区間の求め方~効果の推定~
95%の信頼区間
回帰分析の出力の7つの指標
6-4 企業データの回帰分析~種々の場面での回帰分析を~
製薬業界の企業データの回帰分析
第7章 2つ以上の要因変数の効果を測る ~重回帰分析と数量化Ⅰ類~
7-1 重回帰分析とは?~複数の要因を考慮する~
重回帰分析とは
Excelでの重回帰分析の実行と出力の解釈
計測された回帰式の特定とその説明力の評価
重回帰式(偏回帰係数)の解釈
7-2 重回帰分析におけるモデル選択(説明変数の選択)の基準①~自由度と誤差項の標準偏差~
自由度と誤差項の標準偏差
残差の自由度には、特別な意味がある
7-3 重回帰分析におけるモデル選択(説明変数の選択)の基準②~自由度修正済みR2値~
自由度修正済みR2値
7-4 説明変数がカテゴリータイプのデータだったら~ダミー変数の導入~
2分類しかない場合は(0,1)データに変換!
(0,1)データに変換して分析
結果の解釈
3分類以上の場合はダミー(0,1)変数をセットで使用!
3分類の分析
出力結果の解釈
数量化Ⅰ類とは?
第8章 重回帰分析を応用した顧客の判別 ~優良顧客の要因を探る~
8-1 目的変数がカテゴリータイプの場合の重回帰分析
判別分析とは?
Excelでの“判別”の方法
結果の解釈
重回帰モデル式に基づく判別ルールの構築
8-2 誤判別率の評価~判別力を評価する~
判別ルールの誤判別率を評価する
第9章 主成分分析~総合指標の作成と情報の縮約~
9-1 主成分分析とは?~総合指標を効果的に作成する方法~
合成変数とは何か?
主成分分析の理論
9-2 主成分分析のExcelでの実行~マクロプログラムの利用~
Dllsa for MA on Excelのインストール
Excelの主成分分析の実行
主成分分析の出力
主成分分析の出力の意味
各主成分の解釈
9-3 対象ケースの弁別とデータ構造の把握、情報の縮約
主成分分析でできること
①対象(ケース)の弁別
Excelを用いたベスト3、ワースト3の求め方
②データ構造の把握
③新指標の作成(主成分を応用して)
④情報の縮約~見るべき変数の次元を減らす
9-4 主成分分析の2つの立場
2つの違いを十分に理解しよう!
9-5 「ソルバー」で主成分分析を実行する
主成分分析の実行手順(もとの変数の分散を生かす立場)
もとのデータを基準化し、相関行列を分析する立場

