みなさん、こんにちは!今日は「相関分析」について紹介していくよ〜!
この授業が終わる頃には、みなさんも「相関」の達人になっているかもね!
準備はいいですか?では、まずは相関分析から始めよう!
相関分析とは
相関分析とは、2つの事柄がどの程度関連しているか、関係性を数値化して分析する統計学的な方法のこと!
簡単に言えば、「筋トレした時間と、減量できた体重は関係があるのかな?」というような疑問に答えてくれる魔法のような分析!
ただし、この魔法はいつも正しいわけではないので、後でその理由を見ていきましょう。
因果とは
「因果」とは、原因と結果の関係のこと!
例えば、「ダイエットをしなかったから体重が減らない」という場合、「ダイエットをしなかったこと」が原因で、「体重が減らない」のが結果です。
類似相関とは
「類似相関」とは、2つの変数が関連しているように見えても、実際には別の要因がその背景にある場合を指します。
例えば、「ダイエットをする時間が増えると、男性にナンパされる回数が増える」というデータがあったとしても、これはダイエットがナンパを引き起こしているわけではないよ!
スタイルがいい女性というのが共通の要因で、スタイルがいい女性にはダイエットの時間もナンパされる回数も増える、というわけ!
スタイルいいはずなのに彼氏ができないのは、なんで!?😂
メリットとデメリット
メリット
データの中に隠れたパターンや関係性を発見できる!
デメリット
相関関係を見つけ出しても、それが原因と結果の関係を示すわけではないという点
つまり、「因果関係の証明」には至らない
相関分析に関するITパスポート試験の練習問題!
Q:A社では、顧客の行動パターン、天候の変化、そして各販売店のロケーションといった様々な項目から成る大量のデータを収集しています。これらのデータから、販売数量とこれらの項目との間にどのような関係があるかを明らかにするために分析を行いたいと考えています。具体的には、販売数量と他の項目との間に統計的な関連性が存在するかどうかを調べたいとしています。この目的に最も適した分析方法は何でしょうか。
答え:エ
ア:ABC分析
イ:クラスター分析
ウ:主成分分析
エ:相関分析
正解は『相関分析』
「相関分析」は、2つの要素間にある関係性を分析する統計手法です。ある要素が増加したとき、他方の要素がどのように変化するかを調べることができ、結果は−1から+1までの値をとる相関係数として表されます。
旦那の年収が多くなると奥さんの小言が少なくなるみたいな感じ。ただ、どれだけ年収が多くなっても、誉めることはしてくれないと言うのは、また別の問題。
「主成分分析」とは、複数の要因が相互に関連している場合に、その特性を決定づけている主な要因を合成変数として求める手法。データセットの相関性を利用し、複数のパラメータを結合した”主成分”という新たな変数に情報を集約することで行うよ!
つまり、国語数学理科社会の9科目の得意不得意で年収を調べるより、ざっくり理系と文系で年収の違いを分けるといった感じなの。
「ABC分析」は、パレート図を使って分析する要素・項目群を大きい順に並べて、上位70%を占める要素群をA、約20%の要素群をB、それ以外の10%の要素群をCとしてグルーピングすることで重要性要素を明らかにする手法。
「クラスター分析」は、複数の変数(項目、属性、次元数)を持つデータを利用し、その変数間の関係性を把握するために使われる統計的手法。
複数の異なる性質のものが混ざり合っている対象の中から、類似したものを集めてグルーピングするために使うのよ。
寿司ネタでいうと、赤身・白身・青魚で分けるのがクラスター分析!
ITパスポート試験をスマホで手軽に勉強!
「えろ勉」も戦略的に開発&運営しております。この記事が勉強になった!ためになったよ〜って思ったら、なんかアクションをお願い!!「えろの力で勉強するゲーム:えろ勉」
さて、相関分析についてのお話はいかがでしたか?「相関」と「因果」の違いを理解することは、統計学を使う上でとても大切よ!