【初心者】機械学習と統計学の違い

スポンサーリンク
機械学習

データ解析をするなら、機械学習と統計学は避けては通れません。

機械学習と統計学はなんとなく、違いが分かるかもしれませんが、詳しくは説明できない人がいるかもしれません。
今回は、機械学習と統計学の違いを知り、ケースバイケースで使い分けすることで、データ解析の幅を広げていけると思います。

対象者

超初心者:機械学習と統計学の違いが全く分からない
初心者:なんとなく違いことは分かるけど説明できない

効能効果

超初心者に「機械学習と統計学の違い」を説明できる
データ解析の幅を広げて、ケースによってどちらを使うべきかが分かる

機械学習と統計学の違い

簡単に結論をいうと、
機械学習は、予測精度至上主義
統計学は、説明至上主義

つまり、機械学習は「なんでかは分からないが、このモデルは予測精度が高い」
統計学は「このモデルでは、結果に対するこの因子の影響が大きい」
つまり、「この因子を変化できれば、結果も改善できる」
と解釈することができます。もう少し詳しくみていきましょう。

機械学習は、予測精度至上主義

機械学習は詳細は分からないが、こんな結果になる、という精度は非常に高いです。
たとえば、
「こんな企業では、営業が取りやすくなる」
という結果が得られたのなら、
といあえず、「結果が得られた企業に営業をかけよう」という行動に繋がります。
それにより、営業生成の向上や、業務の効率化ができるかもしれません。

しかし、機会学習の結果は精度が高いですが、どの因子の影響が大きいかなどの、データ解析の解釈はできません

統計学は説明至上主義

統計学は予測精度は高くないが、なぜこんな結果になるかの説明が得意です。
つまり、結果からこの因子の影響が大きいと分かる。そうすると、その因子を変化させることで、結果も改善することができる可能性があります。
たとえば、
「こんな企業では、営業が取りやすくなる」
という結果が得られたのなら、
なぜ、こんな企業では営業が取りやすいのか、営業を取りやすい企業の特徴はなにか、などと結果が解釈することができます。

この考え方は問題解決に繋がりやすいですよね。わたしは大好きです。なんせ、解決方法を教えてくれていますからね。
上の例では、ITに力を入れている企業は営業が取りやすい、などの因子が分かります。すると、ITに力を入れている企業に対して営業すると、会社の営業利益につながる可能性が出てきます。
結果を変えるための行動指針が分かるため、非常に有用です。
しかし、統計学に用いたデータのなかでの解釈なので、汎用性(一般的なデータやこれからの未来のデータ)は高くないことが大きな欠点です。

 

しかし、機械学習と統計学のどちらがいいかという話ではありません。それぞれに得意不得意があるということです。
ですので、それぞれの特徴を知って、問題の目的を応じた方法を選択することが重要です。

また、機械学習と統計学は基本的にはデータをつかって、新たな結果を導くための方法です。共通点は多く、統計学の上に機械学習の概念があるイメージです。やはり、統計学はデータ解析の基本と言えます。数式としての統計学は理解しなくても良いと思いますが、統計学の考え方は理解しておいたほうがいいことは間違いないです。

まとめ

機械学習と統計学の違いは、「目的が違う」
予測精度を求めるなら、機会学習
解釈や説明を求めるなら、統計学

共通点は、データを解析して結果を求めることです。

  • 自分や会社が抱えている問題はなにか
  • その問題解決のためにはどんな方法がより良いか

これらを考えて、機械学習と統計学を使い分けて、問題解決に繋げて下さい。

コメント

タイトルとURLをコピーしました