データの分布が分かる!Excelで散布図を作る方法

こんにちは、エクセル使いこなし隊 隊長の吉井良平です。

 

今回は、エクセルのグラフのうち、散布図の作り方を紹介します。

棒グラフ、折れ線グラフ、円グラフと比べると、少しなじみのないグラフですが、全体の中でのデータの分布を見たり、数値ごとの関係を考えたりする場合に便利です。

散布図の作り方を覚えて、いろいろなデータの分析に役立てましょう!

散布図とは?

 

散布図とは、2種類のデータの関係を表すグラフです。

魔九郎
は???  

要するに2つの数を、大きさによって一つのグラフの中に散りばめたものです。

(散布図がどんなものか分かってる方は、作り方へ飛んでください)

 

散布図例1

縦軸に総生産、横軸に人口

 

後で例として作るこのグラフは、各都道府県ごとの県内総生産額を、人口の値によって散りばめています。

「だいたい人口と生産額は比例しているな」

「人口が400万人以上になると、結構バラつきがあるな」

「一つだけ、特異な値があるな」

ということが、目に見えて分かりますよね。

 

他のグラフとの違い

 

グラフは、目的にあった使い方をすることが大事です。

散布図の特徴を、棒グラフ、折れ線グラフ、円グラフと比較してみました。

目的 第1軸 第2軸
散布図 ・複数の値の相関関係を知る

・データのバラつきを見る

数値 数値
棒グラフ ・項目ごとの量の大きさを比較する 項目 数値
折れ線グラフ ・時系列での値の推移を比較する 日付

時間

数値
円グラフ 全体の中での割合を表す 比率

 

散布図の使用例

 

散布図は、いろんな数値に相関関係があるかを探る、またはデータの分布を見るために使います。

たとえばこんな形で使用されています。

 

店舗ごとの売場面積と売上高の関係

 

売場面積と売上高は、お互いに関係がある数値ですよね。

お店ごとの売場面積と、売上高を散布していくと、大体の傾向がつかめます。

その中で、傾向から離れているお店があれば、特別に何か上手くいっていることがある、とか、何か問題が発生している、ということが分かってきます。

 

数学の点数と、理科・社会の点数の関係

 

理系・文系という分類があるように、数学が得意な人は理科も得意な傾向があります。反対に、数学が不得意な人は社会が得意な傾向があります。(私のような私立文系タイプ)

これも散布図にしてみると大体の傾向がつかめます。

 

ちなみに私は私立文系で、高校の数学は全くダメですが、事務職で使うエクセルに関してはほぼマスターしています。エクセルと数学の成績は関係ない、というか仕事の大半は数学じゃなくて算数なので、数学が苦手な人も安心してくださいね。

 

その他

 

いろいろ散布図にしてみると面白いデータはあると思います。

・店舗への来店頻度と、購入金額の関係

・ルート営業マンの訪問回数と、販売金額の関係(気の合う訪問先ばっかりに行ってないか^^)

・有給休暇の取得率と、営業成績に相関関係があるか

・年収と幸福感に相関関係があるか (以前読んだ本では、年収700万ぐらいまでは相関関係があるようです)

等々。

興味がある方は、統計の本を読んで見ると、また一歩進んだ世界がありますよ。

 

散布図の作り方

 

では、実際に散布図を作っていきましょう。

今回使うデータは、日本の各都道府県の人口と県内総生産です。

(データ元:内閣府

 

まずはグラフの挿入

 

まずは、データ範囲を選択した状態で、「挿入」タブの「グラフ」グループから、散布図を選択します。

散布図の作り方1

グラフの挿入

 

この時は、まだ項目名(この場合は都道府県名)は、範囲指定しません。

すると、すぐに散布図ができます。

 

散布図の作り方2

散布図ができた

 

グラフの見栄えを調整する

 

このままでも、個人で見る分には十分使えます。

 

散布図の見方

散布図から読み取れる傾向

 

右上にポツンとある一つの点は、東京都です。やっぱり東京は他の都道府県と全然違うんだな、ということが良く分かりますよね。

その次の3つの点は、神奈川、大阪、愛知です。この3県(大阪は府ですが)も、他の県とは違うレベルにあることが分かります。

次の集団は、埼玉、千葉、兵庫、北海道、福岡です。埼玉と愛知は、人口はそんなに変わらないのに、生産額に大きな差があることが分かります。人口が増えても、県内生産額はあまり増えていないことから、埼玉、千葉、兵庫は特に、住んでいる場所と生産の場所が違うということが分かります。

それ以下の集団は、人口と県内総生産が、ほぼ比例していますね。

 

元データを知っていて、個人で使う分には十分ですが、このままだと会議資料やプレゼン資料などにはできません。何のデータかも、これではちょっと良く分かりませんよね。

見やすい表にするために、いろいろと調整をしていきましょう。

 

タイトルを変更する

 

そのままのグラフだと、タイトルが系列名(県内総生産)になっています。

これでも間違いではないですが、もう少し分かりやすいタイトルにしていきましょう。

タイトル欄をクリックすると、タイトル名を変更できます。

散布図の作り方4

タイトルの変更方法

 

軸ラベルを追加する

 

縦軸と横軸が、それぞれ何を表しているのか、を表示させます。

グラフをクリックすると、右側に「+」マークが出ますので、そこから軸ラベルにチェックを入れます。

散布図の作り方5

軸ラベルの追加

 

すると、軸ラベルが出てきます。軸ラベルをクリックして、名前を変更しましょう。

 

散布図の作り方6

軸ラベルを編集

 

そのままの状態だと、縦軸の軸ラベルが横書きになっています。縦書きになるように変更します。

 

散布図の作り方7

縦軸の軸ラベルを、縦書きに

 

これで軸ラベルが挿入できましたね^^

 

データラベルを表示させる

 

それぞれの点が、どの都道府県を表しているかを表示させてみましょう。

グラフをクリックすると、「+」マークが出るので、クリックします。

「データラベル」の右側の三角ボタンを押して、「その他のオプション」を選択してください。

散布図の作り方8

データラベルの追加

 

データラベルの書式設定で、グラフのボタンを押して、ラベルオプションの「セルの値」をクリックします。

 

散布図の作り方9

データラベルの書式設定

 

すると、表示する値の範囲を聞いてきますので、範囲を設定します。(この場合は、都道府県名ですね)

 

散布図の作り方10

範囲の指定

 

そうすると、都道府県名が表示されるようになりました。

 

散布図の作り方11

Y値を取る

 

魔九郎
ゴチャゴチャしてるな・・・  

そうですよね、とりあえず値を消してみましょう。データラベルの書式設定から、Y値のチェックを外してみます。

 

 

散布図の作り方12

都道府県を表示させた

 

少し見やすくなりましたが、まだヒドイ有様ですね。

ただ、データの数が少ない場合はこれで充分、資料として提出できるものになっているはずです。

(こんなにデータが多い場合は、散布図にラベルを表示させるのは無理なのですが、例として作っていますので)

フォントの大きさなどは、適宜変更していってください。

 

近似線を表示させる

 

データの数が多いと見えにくいので、47都道府県を3分割して、人口順で17位~32位の県だけを表示させてみました。

 

散布図の作り方13

17位~32位のみの散布図

 

この場合はデータの分布を見るので、グラフの開始が0である必要はありません。人口の始まりを120万人から、県内総生産額の始まりを2兆円からにしてみましょう。

 

グラフの目盛変更方法

目盛の変更の仕方

 

だいぶ分かりやすくなりましたよね。

 

散布図作成例1

目盛を変更した

 

項目名が重なっているところは、ドラッグして見やすくしていきます。

 

散布図使用例2

重なりを移動させた

 

こうして見ていくと、基本的には人口と県内総生産には相関関係がある、人口が増えると県内総生産額も上がる傾向があるといっても、結構バラつきがあるということが分かります。

各県のデータが、全体の傾向より上の水準なのか、下の水準なのか、を分かりやすくするために、近似曲線を引いてみます。

 

グラフを選択して、「+」マークから「近似曲線」をクリックしてみて下さい。

 

近似曲線の挿入

近似曲線の挿入

 

こうしてみると、全体の傾向との比較ができるようになります。

近似曲線より上側の県は人口と比較して県内総生産額が多い県、下側の県は人口と比較して県内総生産額が少ない県です。

なぜこのような結果になっているのか、いろいろ考えたくなりますよね。

 

散布図の使用例2

 

人口と県内総生産との関係は、かなり相関関係が高いデータでした。

あまり相関関係の無いデータもみていきます。

 

この「デスクワークラボ」の各記事のPV数(閲覧回数)とページ滞在時間を散布図にしてみました。

 

散布図使用例3

PV数と滞在時間

 

左下の方に点が集まっていて、後はばらついています。

あまり相関関係がない場合は、自分で線を引っ張って4つのカテゴリーに分けてみると、頭が整理される場合があります。

 

散布図の使い方例1

線を引いてみた

 

左下: PV数も少なく、滞在時間も短い

左上: PV数は少ないが、滞在時間は長い

右下: PV数は多いが、滞在時間は短い

右上: PV数も多く、滞在時間も長い

 

こんな感じで商品毎に、満足度と売上の関係とか見ていくのも面白いですよね。

 

ちなみに、同じデータを偏差値を計算して散布図にすると、こうなります。

(偏差値の出し方は、「偏差値をビジネスで応用する:知って得する活用方法」記事をご覧下さい)

 

偏差値で散布図

偏差値で出した

 

散布図の結果は変わりませんが、絶対値ではなく相対的な値が知りたい場合は、偏差値で見た方が良い場合もあります。

 

まとめ

 

・散布図は、データの相関関係や分布を見るために使います。

・作り方は、一回覚えたらそんなに難しくありません。

・近似曲線を引いたり、自分で補助線を引いたりすると、データの分布が良く分かります。

 

エクセルでの分析に幅が広がりますので、ぜひ使ってくださいね。

 

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

ABOUTこの記事をかいた人

昭和48年広島県生まれ。現在も広島に住んでいます。 趣味は音楽鑑賞(邦楽、洋楽問わず、クラシック、童謡も)、マンガです。エクセルを効率的に使う方法を紹介して、あなたのお役に立ちたいと思っています。