初心者が知りたい統計学と機械学習の特徴や違いは?

スポンサーリンク
Python
ゼロ知識の初心者がデータサイエンスを完全無料で学習する方法5選
データサイエンスの知識や技術、またはPythonについて学びたい。でも「大学に行くほど本気度がない」、「スクールに行くほどお金がない」、なんせ「時間がない」という方も多いはずです。というよりほとんどの方がそうだと思います(当然わたし...
初心者に人気のプログラミング言語Pythonは独学可能か?
Pythonは非常に人気のあるプログラミング言語で、まったくの初心者でも独学が可能と言われています。 Pythonはさまざまな目的に使える、汎用性のあるプログラミング言語です。 プログラミングは「独学が難しい」と言われていま...

統計学と機械学習の違いは色々なところで説明されています。しかし、何かしっくりこないですね。
なぜしっくりこないかといえば、統計学と機械学習はほとんど同じだからです。

あえて違いを出すとしたら、実際の現場ではどちらを使うことが多いか、などを元に、両者の違いを解説していきます。

統計学とは


手元にあるデータの解釈を行っています。また、その手元にあるデータから母集団を推定することを目的としています。

ウソ情報にだまされない、研究と因果関係から読み解く情報の取捨選択
ビジネス書やビジネスYouTuberなどは、ビジネスに役立つ情報を発信しています。これらは、ビジネスパーソンにとって、自分を成長させるための有用なツールになっている。 たとえば、優秀な社員が行っている行動や考え方、ダメな社員が行ってい...

たとえば、顧客のデータから一部を取り出して、顧客全体の傾向をつかむといったものです。
データの解釈とは、結果に与える原因をすることができます。たとえば、顧客満足度に影響が大きい因子は店内の清潔さと従業員の接客態度である、という新しい知見を知ることができます。
この結果から、満足度を上げるためには、店内を清潔に保つことと、従業員の接客態度をよくすれば良いという解釈につながります。

このように、データの解釈が可能になると、問題解決への指針になる可能性が高いです。つまり、結果に影響する原因を変えることで、結果を良い方法へ変化させることができます。

AIや機械学習が台頭してからは、統計学の存在は薄れてきていますが、統計学を上手く使えばビジネスにとって有効になることが多いです。

ビジネスでも業務改善や売り上げ向上のために、研究や実験をすることも多いと思います。ABテストなどが有益な情報をもたらしてくれますね。その場合のデータ解析は統計学が使われることが多いです。統計学は実験方法も含めて学習する必要があるため、実験のデータ解析に強くなります。

統計学を使った実験のデータ解析は、科学的根拠の根幹になっています。新型コロナワクチンの有効性も統計学を使って検討されています。

新型コロナワクチン(ファイザー)の効果と副反応を論文で確認してみた
新型コロナウイルスに対する有効な手段がないまま1年以上が経過し、健康的・経済的に大きな被害が出ています。 安全で有効なワクチンが期待されるところです。 日本でも2021年2月中旬から新型コロナに対するワクチン接種が開始される予定です。(...

データを扱う上では、データの解釈に特化した統計学は必須のスキルと言えます。全然オワコンではありません。

【2021年】ゼロから統計学を独学したい人が読むべき書籍10冊
データサイエンスについて興味があり、統計学を学びたいけど、どんな学習方法がいいか分からない 統計学を独学するために必要な書籍が知りたい 統計...

機械学習とは


最近は落ち着きましたが、AIやディープラーニングと並んでバズワードになっていました。

【初心者】機械学習を使って、予測モデルを作成するまでの手順
機械学習を使って、予測モデルを作成する手順を紹介します。Pyhonで機械学習のコードを書いてても、「自分が何をしているのか」、「大きなプロジェクトのどの部分を担っているのか」、「どうなったら成功といえるのか」などが分かっていないと面白くないですし、効率も悪くなります。 そこで、予測モデルの作成の大枠を初心者に向けて、説明していきます。

機械学習、AI、ディープラーニングはほとんど同じ意味です。時期によって言葉の意味が変わっています。少し前は、機械学習は決定木やサポートベクタマシンで、ディープラーニングは別になっていることが多かったです。今では、機械学習はほぼディープラーニングのことを指しています。予測精度のみに目的があるなら、予測精度が低いモデルは使う意味がありません。機械学習をするデータはディープラーニングが予測精度が高いですからね。

機械学習とは、機械(コンピューター)が大量のデータを学習し、分類や予測などを行うことです。
統計学はデータの解釈でしたが、機械学習は結果が目的です。つまり、予測精度をより高くすることが目的で、なんでそんな予測になったかは分かりません。

顧客満足度が高い店舗の予測はできますが、どうすれば満足度を上げることができるかの解釈は分かりません。

予測結果だけ知りたい場合は、機械学習は有用です。たとえば、店舗の出店を考えていて、どの場所が集客に有利かを機械学習で予測します。その結果で出店場所を決定します。
この場合は、データを解釈して、出店するために店舗の周辺環境を変える、といった現実的ではない問題解決方法は選ばないでしょう。

機械学習が実際に使われる場面は、画像や音声、言語処理などより複雑なデータを扱う場合がほとんどです。

また、機械学習は教師なし学習や強化学習といった、統計学にはない概念で、新たな情報を与えてくれます。

【おすすめ】Pythonの独学で必要な書籍
わたしは、底辺サラリーマンで、Pyhton学習歴は半年、R(フリーの統計解析ソフト)学習歴半年、学習方法は独学です。 ここでの独学とは、体系的な学習カリキュラムがなく、強制力がない学習方法のことを指します。...

統計学と機械学習の違い

【初心者】機械学習と統計学の違い
データ解析をするなら、機械学習と統計学は避けては通れません。 機械学習と統計学はなんとなく、違いが分かるかもしれませんが、詳しくは説明できない人がいるかもしれません。 今回は、機械学習と統計学の違いを知り、ケースバイケースで使い分け...

統計学はデータの解釈が目的。どうすれば結果を変えることができるのか、結果に影響が大きい因子はなにか、などが知りたい場合に使います。

機械学習は分類や予測などの結果の精度が目的。動画から万引きしそうな動きかどうかを判断する、商品の売れ行きとそのれに伴う仕入れ量を予測し、廃棄商品を最小限にする、などが知りたい場合に使います。

どちらを使うかは、解決すべき目的によります。よって目的を具体的に設定すれば、統計学か機械学習かどちらを使えばいいか迷うことはないでしょう。

少しでもデータを扱う仕事をするのであれば、どちらか1つを勉強するより、どちらも知っておくべき知識であり、技術です。

ちなみに、統計学を使うならRがおすすめです。Pythonでも統計学はできますが、Rの方がライブラリが豊富です。

M1 macでRとR Studioをインストールする方法 データ分析や統計学に必須のソフト
Rは無料の統計ソフトです、R Studioで実行すれば、使いやすくなります。 Rはアカデミック(研究分野の大学で論文など)で多く使われていますが、データ分析や機械学習、AI開発でも力を発揮します。 今回は、R と R の実行...

機械学習ならPythonですね。Rでも簡単な機械学習は可能ですが、機械学習ならPython一択ですね。

【初心者必見】プログラミング言語Pythonでできること5選
プログラミング言語の一つであるPythonはコードが理解しやすく、いろんな用途に使える汎用性があります。ですので、全くの初心者にもおすすめしているサイトが多いです。 ここで改めて、Pythonを勉強したい人やデータ分析、AI開発をして...

まとめ

結局どちらも必要、しかし、統計学の中に機械学習があるということ、データを扱うには統計学の基礎知識が必要です。

科学的根拠を仮説検証して求める場合は統計学が有用です。学術的な場面でなくとも同じです。

大量のデータを扱っている会社であれば、機械学習の方が有用な場合が多いです。



コメント

タイトルとURLをコピーしました