2020-12

Python

【初心者】新型コロナを自分で分析する

新型コロナウイルスはいまだに収まる気配をみせていません。新型コロナウイルスの感染者や重症度などもデータ化されて、蓄積されています。なので、新型コロナウイルスのデータを自分で分析することも、当然可能です。 そこで、今...
統計学

記述統計(平均・中央値・四分位範囲)

はじめに 記述統計とは、自分の手元にあるデータについて理解を深めるためのものである。 【初心者】機械学習と統計学の違い データサイエンスで最初に行われるのは、探索的データ分析です。この探索的データ分析をするため...
Python

複数の機械学習モデルの性能を比較する

機械学習の目的は、高い予測精度のモデルを作成することです。高い予測精度のモデルの作成方法はいくつかありますが、一般的な方法を説明していきます。複数の機械学習モデルを比較して、最良もモデルを選択し、最良のモデルのハイパーパラメータを選択します。このような手順で最良のモデルを決定します。
Python

Pythonをインストールしたら最初にしてみること

Anacondaをインスト―ルしたら、Jupyter LabでPythonを使ってみましょう。Pythonをはじめ、プログラミング言語には、基本的なルールがあります。Python言語の超基本的なルールを確認しつつ、最初に書くコードを一緒に確認、解説していきます。
Python

【初心者】機械学習を使って、予測モデルを作成するまでの手順

機械学習を使って、予測モデルを作成する手順を紹介します。Pyhonで機械学習のコードを書いてても、「自分が何をしているのか」、「大きなプロジェクトのどの部分を担っているのか」、「どうなったら成功といえるのか」などが分かっていないと面白くないですし、効率も悪くなります。 そこで、予測モデルの作成の大枠を初心者に向けて、説明していきます。
Python

【超基礎編】データをpythonのpanndasで分析する(データの前処理_2)

データの扱い方(前処理)はデータサイエンスの仕事の80%といわれています。つまり、データを自由自在に扱うことが、データ分析、データサイエンティストに必須のスキルです。scikit-learnにあるデータセットを使った、pandasでのデータの整理を解説していきます。
Python

探索的データ解析(回帰問題)

探索的データ解析(Exploratory data analysis:EDA)とはデータの確認作業です。回帰問題は値の量や程度を予測する問題です。そこで、scikit-learnにあるbostonデータセットを用いてEDAを確認していきましょう。
統計学

【入門編】変数の種類

データの数値は変数ともいい、いくつかの種類があります。変数の種類を理解することは、分析の精度に大きく影響します。 変数の種類を間違うと、分析精度の低下のみならず、不利益をもたらすかもしれません。 初心者に向けて、難しい数式などはなしで感覚的に分かりやすいように、変数の種類について解説していきます。
Python

初心者のための回帰問題の評価指標

回帰問題の評価指標で、よく使われていて比較的分かりやすいものを、数式を使わず解説していきます。 「統計やデータ分析の初心者」から、何度かデータを触ったことがあるけど「回帰問題の評価指標を説明しろといわれれば自信がないといった方」は、これを見ると、回帰問題の評価指標を説明できるようになります。
Python

【超基礎編】データをpythonのpanndasで分析する(データの前処理)

前回はpandasでcvsファイルを読み込みました。 そのデータを使って、簡単なデータの前処理を行ってきましょう。 前処理とは、データ分析するためにデータの形や数値を整えることです。 具体的なコ...
スポンサーリンク
タイトルとURLをコピーしました