1
/
5

【データ分析入門】知識ゼロから始めるためのデータ分析ガイド

データ分析と言われても、「何からやればいいんだろう」「次にやることがわからない」と悩んでいませんか?今ではデータから異常検知やシミュレーションをするようになった私も、学び初めの頃は同じ悩みを抱えていました。

しかし実は、データ分析にも王道のステップがあります。そのステップを意識しておくことで、迷わず詰まらず分析を進められるようになります。

そこで本記事では、データ分析に必要なステップを、初学者向けにわかりやすく解説します。この記事を読むことで、データ分析全体の流れをつかむことができ、データ分析初学者でも分析を始められるようになるはずです。


目次

1.データ分析には6つのステップが必要である
2.データ分析は「食べログを使ったお店決め」に例えるとすぐに理解できる
ステップ1:分析の目的を明確にする(お店探しの始まり)
ステップ2:分析の計画を立てる(お店を探す計画・戦略を立てる)
ステップ3:データを収集する(いろんなお店のデータを集める)
ステップ4:データを加工する
ステップ5:2.2つのポイントを意識して分析の質をさらに上げる
分析の実行にはデータ・分析手法・ツールの3つが必要である
代表的な分析手法
代表的なデータ分析ツール
ステップ6:洞察を述べる(最適なお店を決定する)
3.2つのポイントを意識して分析の質をさらに上げる
➀6ステップは一方通行ではなく往復するものである
➁実務では「行動」と「効果測定・フィードバック」を意識する
4.とにかく一度手を動かしやり切ることが、最も身につく学習法である
まとめ


1.データ分析には6つのステップが必要である

データ分析は何も難しい統計の話だけではありません。6つのプロセスを経て初めて、意味のある分析になります。以下がその6つのステップです。

データ分析をするための6ステップ

  • ステップ1:分析の目的を明確にする
  • ステップ2:分析の計画を立てる
  • ステップ3:データを収集する
  • ステップ4:データを加工する
  • ステップ5:分析を実行する
  • ステップ6:洞察を述べる

よくイメージされる数学的な処理のほかにも、実際には他に多くの作業がデータ分析には存在します。なのでまずこれら6ステップの全体像を念頭に置いてデータ分析を始めることが肝要です。

2.データ分析は「食べログを使ったお店決め」に例えるとすぐに理解できる

実は、私たちが目的に合わせたレストラン決めをする(=お店決め)までの過程とデータ分析のプロセスは、とても似ています。

例えば「友達や恋人の誕生日を祝うときためのお店を選ぶ」ときは、まさしくデータ分析を行っています。「誕生日に適したお店を見つける」という目標を立て、まずは決めるまでの期限や方法を決めます。そして食べログ等のアプリで様々なお店を精査し、最終的に一つのお店に決定します。


データ分析もまさに同じプロセスを踏みます。したがって、私たちが普段行ってるお店決めのプロセスを意識することで、データ分析をスムーズに行うことができます。

以下、各ステップの内容を見ていきます。

ステップ1:分析の目的を明確にする(お店探しの始まり)

データ分析の最初のステップは、「何のために分析をするのか、何を成し遂げたいのか」を明確にすることです。目的が明確になっていないと、何を進めれば良いか路頭に迷ったり、本来全く必要ない分析に時間を溶かしてしまいます。


お店を決めるときも、まずは「最適なレストランを見つけるぞ」といった目的意識を持ってから食べログ等を見始めますよね。ただ食べログをぼーっと見ていても何も生まれません。

データ分析にとって、この目的を明確にするステップが最も大事なステップであると私は感じています。なぜなら、最初に設定した目的が固定点となり、その後のステップで本筋からそれることを防いでくれるからです。

そのため、目的の言語化は慎重に行います。よくない例として、目的を「製品Aは儲かっているのかを確認する」としてみます。こうすると後に「儲かっているって具体的にどういうことなんだ…?」となって手が止まってしまいそうですよね。この目的を例えば「製品Aは売上・利益・数量の面で昨年同時期を上回っているのか確認する」としてみたら、どの指標をどのように確認すればよいのかが明確になることがわかります。

「目的を定めるなんて当たり前じゃん」と思われるかもしれません。しかし慣れないうちは後のデータ加工やツールの操作に気を取られ、目的がないがしろにされがちです。そのため、最初はかなり意識して取り組む必要があります。まずは目的を紙に書いて言語化するところから始めるのがオススメです。

ステップ2:分析の計画を立てる(お店を探す計画・戦略を立てる)

目的が定まったら、次は分析の計画を立てます。分析の計画を立てることで、目的を達成するために必要な時間やコスト、技術的な課題などが明らかになります。


分析の計画を立てる時には、例えば以下の7つの項目について検討します。

分析計画の例

  • 分析方法を定める(レビューをひたすら見まくり比較する)
  • 収集すべきデータが何か決める(レストランのレビュー)
  • データの収集方法を決める(食べログ)
  • 能力・時間・コストが見合っているか確認する(誕生日1週間前までに決める)
  • 評価軸を設定する(ポジティブなレビューの数)
  • 達成軸を設定する(お店が一軒に絞れたら)

この中で初学者が忘れがちなのが、評価軸と達成軸の設定です。この2つの軸を忘れると、何を持って分析が成功/失敗かがわからなくなり、データ分析に終わりが見えなくなります。食べログでお店を探すときも、全ての情報に目を通していたら、何の情報を頼りにしてお店を絞り込んでいけばいいかわからないですよね。

分析の計画も紙に書きながら整理してみましょう。特に目的を書いた紙に計画も一緒に書くと良いです。目的が曖昧だと計画の設定が上手くいかない場合が多いので、再度目的を見直すときに役立ちます。

ステップ3:データを収集する(いろんなお店のデータを集める)

データは闇雲にとっても無駄になることが多いです。そのため、分析の計画にしっかりと則り、分析に必要なデータを収集していきます。


データの収集方法はたくさんあります。以下はその一例です。

データ収集の例

  • 自社の販売管理システムにアクセスする
  • 自社のデータベースにアクセスしてSQL等で抜き出す
  • webページ上の株価データをスクレイピングして抽出する
  • web APIを使用して「いいね数」などを一括で取得する
  • アンケートを取る
  • データを買う
  • 手入力する

これからデータ分析の勉強を始めようとする方は、ぜひSQLとスクレイピングも合わせて勉強することをオススメします。自分で直接データを抽出する技術があれば、データの種類や量が増え、様々な切り口から分析を行えるようになります。

※SQL:データベースのデータを操作し、抽出するための言語のこと。

※(Web)スクレイピング:Web上にあるデータを収集し、分析に使用できる形にデータを加工・格納する技術のこと。

ステップ4:データを加工する

このステップはデータ分析に特徴的な工程です。集めたデータをそのまま分析に使用するとは限りません。集めた生のデータには、いわゆる不純物が混じっていたり、そのまま分析には使えない形になっているものがよくあります。そのため、そうした不純物を取り除いたり、データを分析に使える形に変換する作業が必要となります。


例えば、データの世界では「幡ヶ谷」と「幡ケ谷」は別物として認識されます。しかし私たちは両者を同じものとみなします。この場合、全角の「ケ」を半角の「ヶ」に置き換えるなどして表記を統一する作業が生まれます。


またデータを取り除いたり変換する以外にも、データ加工作業はたくさんあります。実際データ加工は、データ分析にかかる時間全体の8割を占めると言われることもあります。

そのため、初心者が抱きがちなデータ分析のイメージとは反対に、データ加工はかなり泥臭く地道な作業です。しかもこの過程をないがしろにすると、誤った計算結果を出すことにつながります。そのため丁寧さと根気強さがこのデータ加工には求められます。

Excelにもデータの加工を行う機能が豊富に含まれているので、初学者はまずExcelを使って加工のイメージを養ってみると良いです。

また以下の記事の中盤に、データ加工についてイラスト付きで具体的に解説をしております。初めてデータ加工に触れる前に参考にしてみてください。

https://data-viz-lab.com/data-integration

ステップ5:分析を実行する(各店舗の情報を精査する)

以上の4ステップを通じて、ようやくデータの分析を実行することができます。お店を決める例では、レストランのレビューを見まくり、各レストランの良し悪しを決めるフェーズになります。


分析の実行にはデータ・分析手法・ツールの3つが必要である

分析を実行し分析結果を得るには、データ・分析手法・ツールの3つが必要です。データをツールに入れ、分析手法を設定し、結果を算出するのが分析実行の大まかな手順です

この手順のイメージとしては、電子レンジで食材を温めるのが近いです。食材(データ)を電子レンジ(ツール)に入れて、あたため/解凍(分析手法)を設定して温める(結果を出力する)イメージです。


データを分析すると聞くと、何やら難しい数式をたくさん解いているイメージがあります。確かにそうした小難しい数学の要素は、計算上用いられます。しかし実際分析を行うときは、そうした計算はツールが行ってくれるため、私たちが計算を行う必要はありません。私がすることは、データをツールに入れ、適切な分析手法を設定してあげることです。

もちろん数学的な知識もあることに越しません。適切な分析手法を選択し解釈するときや、自動化されていない計算を行うときは数学的なスキルは必要です。しかし数学的な知識は後からでも十分習得可能なので、学び初めのうちはツールの恩恵に預かり、まずデータ分析のプロセスに慣れることをオススメします。

代表的な分析手法

分析手法の引き出しを増やしておくと、データを見たときに「何がわかりそうか」というデータへの切り口がたくさん見えてきます。そのため、まずいくつかの分析手法を知識として持っておくと良いです。

以下の記事に25つの代表的なデータ分析手法をまとめています。イラストを多用して解説をしているので、最初にイメージをつかむために参考にしていただければと思います。

https://data-viz-lab.com/analyticalmethod-list

代表的なデータ分析ツール

データ分析のツールと言っても、収集に特化したツール、加工に特化したツール、加工も分析実行もできるツールなど、多岐にわたります。以下の5つは、分析の実行において代表的なツールです。

ツール名 特徴 Excel 最も使用されるツールで、基礎的な分析機能が豊富に搭載されています。学習リソースも豊富で、初心者が一番手に取りやすいツールです。 Tableau(BIツール) データの可視化をシンプルな操作で高速に行うことができます。基本有料ですが、制限されたバージョンや学生は無料で使用することができます。 SPSS コーディング不要で高度な分析が可能なため、統計やプログラミングが苦手なユーザーに向いています。ただし導入コストが非常に高いです。 R 統計解析に特化したプログラミング言語で、データ分析に関することは全般行えます。Pythonと比較するとアカデミックのシーンでよく使用されています。 Python データ分析だけでなく、アプリケーション開発にも使用できる汎用性の高い言語です。機械学習や深層学習を行うのにスタンダードな言語であり、近年最も人気のある言語です。

どのツールにも一長一短があるので、どれがベストかは使用する人や場面によって異なります。私はTableauから始めて、今はPythonに触れています。もしデータに触れた経験があまりなければ、とっつきやすいExcelやTableauから始めて、次のステップとしてRやPythonを勉強してみてはいかがでしょうか。

Pythonの学習法について、以下の記事で初心者向けに説明しています。Pythonの勉強を始める前に読んでおくとよりスムーズに学習を進められると思います。

https://data-viz-lab.com/learn-python-data

ステップ6:洞察を述べる(最適なお店を決定する)

分析の実行が終了したら、最初に設定した目的に対し、解答を作る必要があります。分析結果を目的に結び付けて始めて、分析結果に意味が生まれます。


お店を決める場合では、分析の結果、レストランXが最も「ポジティブなレビューの数」の多いレストランだったとします。このことから、レストランXははずれの無い最適な店、すなわち行くべき店であると判断できます。このように「ポジティブなレビュー数が最大」というのを「目的にあった最適なお店」と言い換えることで、始めて目的が達成され、「レストランXにお店を決定する」という意思決定に繋がります。

分析の結果を出しただけだと、その次何をしていいか見えてきません。洞察を述べて初めてデータ分析の目的が達成されます。「目的を達成するためにデータ分析を行っているんだ」という意識を常に持っておくことが、データ分析のコツです。

3.2つのポイントを意識して分析の質をさらに上げる

上記の6ステップがデータ分析の基本ステップですが、特に実務において以下の2点を念頭に置いておくと、データ分析の質をあげることができます。入門として上の6ステップの感覚をまずつかみ、そのあとに以下2点も意識して分析に取り組んでみてください。

➀6ステップは一方通行ではなく往復するものである

分析の計画をしているときに再度目的を考え直すことがあるように、これら6ステップは何度も行き来するものです。全てのステップを一発で終えることは、よほど慣れている分析以外ではほとんどありません。

なぜ往復する必要があるかというと、ステップが進んで始めてわかるものがあるからです。私の経験だと、例えば以下のような往復を経験しました。

  • 分析の計画をして初めて目的が曖昧であったことに気づく
  • 当初の予定通りデータが集まらなくて、手法を再決定する必要がでてきた
  • データをいじってたら、別の視点で分析を進める必要があるとわかった
  • 分析結果を出したが値に違和感があり、調べてたらデータの加工が不十分だった。

各ステップの往復を繰り返すことで、意義深い目的の設定や適切な手法の選択などにつながります。そのため分析を行う際は、複数回の往復を見込んだ分析計画を立て、早めに手を動かすことを意識すると良いでしょう。

➁実務では「行動」と「効果測定・フィードバック」を意識する

実務においては上記の6ステップに加え、「行動に移す」、「効果測定とフィードバックを行う」という2つのステップを行うことが多いです。

まず、洞察を述べたら、その洞察に従って行動に移します。お店が決まったならお店に行く。売上が昨年より落ち込んでるなら、その原因を探りつつ売上向上の策を実施する。もちろん、分析の結果、現状維持という選択もありえます。分析結果とその洞察が行動に結び付くことで、分析のビジネス的な価値が出てきます。

次に、「効果測定とフィードバックを行う」必要があります。データ分析の業務は全く同じでないにせよ、同じような作業を繰り返し行うことはよくあります。そのため、分析の結果実施された施策の良し悪しを把握し、データ分析全体のプロセスを踏まえてさらなる改善を測ることで、次回以降のより良い分析へと繋がります。

4.とにかく一度手を動かしやり切ることが、最も身につく学習法である

スポーツと同じように、データ分析作業においても実際に手を動かして初めてわかるものがたくさんあります。上記のプロセスを読んでいるだけでは分析のスキルは決して身につきません。プロセスを読むだけというのは、スポーツでは試合だけ見ているのと同じです。

よく初学者にありがちなのが、「基礎をしっかり固めきってからじゃないと手を動かせないパターン」です。実際私も元々そのパターンでした。しかし実際には、手を動かしてからの方が何倍も基礎の身につきが良かったです。手を動かすことで自分のわからないところが浮き彫りになり、強制的に補強されていくので、結果としてデータ分析の基礎的な知識を満遍なく得ることができたと思います。

まとめ

本稿では、データ分析に必要な6ステップをご紹介しました。これらを念頭に置くことで、迷いなく分析を進めることができるようになるはずです。そしてさらに、「次に自分が何をすればいいか」ということも、実際に手を動かすことで見えてくるはずです。

やればやるだけ身につくのがデータ分析です。ぜひ今回ご紹介した6ステップを参考に、データ分析への第一歩を踏み出してみてください。

データビズラボ株式会社からお誘い
この話題に共感したら、メンバーと話してみませんか?
データビズラボ株式会社では一緒に働く仲間を募集しています

同じタグの記事

今週のランキング

データビズラボ株式会社 採用担当さんにいいねを伝えよう
データビズラボ株式会社 採用担当さんや会社があなたに興味を持つかも