【Python初心者】データの読み込み、書き出し

スポンサーリンク
Python
初心者に人気のプログラミング言語Pythonは独学可能か?
Pythonは非常に人気のあるプログラミング言語で、まったくの初心者でも独学が可能と言われています。 Pythonはさまざまな目的に使える、汎用性のあるプログラミング言語です。 プログラミングは「独学が難しい」と言われていま...
ゼロ知識の初心者がデータサイエンスを完全無料で学習する方法5選
データサイエンスの知識や技術、またはPythonについて学びたい。でも「大学に行くほど本気度がない」、「スクールに行くほどお金がない」、なんせ「時間がない」という方も多いはずです。というよりほとんどの方がそうだと思います(当然わたし...

自分のデータを使って、データ分析するときはデータをPythonに読み込む必要があります。

データは、エクセルやcsvファイルで保存していることが多いと思います。データの形はこちらを参照して下さい。

Pythonの勉強は、自分のデータを使って分析してみるのが一番の勉強になります。興味のあるデータに対して、分析し、その結果が分かるため、分析が楽しくなります。また、その結果が仕事に生かすことができれば、キャリアアップにつながるかもしれません。

そこで今回は、初心者が意外と躓きやすい、データの読み込みと書き出し方法について解説していきます。Anacondaをインストールして、Jupyter Labを開きましょう。

M1 mac でanacondaをインストールし、Pythonを動作確認

【2021年最新】Anacondaのインストール方法(Windows編)

読み込みたいデータ

csvファイルの読み込み

import pandas as pd
df = pd.read_csv("healthcare-dataset-stroke-data.csv")

このコードは、

pd   :pandasの
read_csv:csvファイルを読み込む
(””)内:拡張子(.csv)を含むファイル名を指定
df=   :上のファイルを「df」という名前にする

という意味です。

Pythonを実行しているファイル内にあるcsvの名前をそのまま指定します。

データをみてみましょう。

df

出力:

ちゃんとデータが読み込めていますね。

データに日本語がある場合は、以下のコードを追加する必要があります。

df = pd.read_csv("healthcare-dataset-stroke-data.csv", encoding="cp932")

または、

df = pd.read_csv("healthcare-dataset-stroke-data.csv", encoding="SHIFT-JIS")

csvファイルの書き出し

df.to_csv("healthcare.csv")

出力:

新しいcsvファイルが書き出されていますね。

エクセル(Excel)ファイルの書き出し

df.to_excel("healthcare.xlsx")

出力:

新しいエクセルファイルが書き出されています。

エクセルファイルの読み込み

df_excel = pd.read_excel("healthcare.xlsx")

csvファイルの時とほぼ同じです、excelや拡張子(.xlsx)になっているだけです。
簡単ですね。

データの読み込みでは、pandasでするのが一番簡単ですね。

データを読み込んだら、以下の記事を参考にしてデータ分析をしてみて下さい。

Pythonをインストールしたら最初にしてみること

探索的データ解析(回帰問題)

探索的データ解析(分類問題)

【初心者】プログラミング学習、独学かスクールか問題

コメント

タイトルとURLをコピーしました