サイトアイコン アマチュア無線局JS2IIU

【Pandas】.plot.histでヒストグラムを作成する

こんにちは、JS2IIUです。

Pandasは、Pythonでデータ分析を行うための強力なライブラリです。その中でも、.plotメソッドは、データフレームから簡単にグラフを作成できる便利な機能です。今回は、.plot.histメソッドを使って、ヒストグラムを作成する方法を解説します。

ヒストグラムとは?

ヒストグラムは、データの分布を視覚的に表現するグラフです。データをいくつかの区間に分け、各区間に入るデータの個数を棒グラフで表します。これにより、データの範囲、集中度、偏りなどを把握することができます。

.plot.histメソッドのシグネチャ

Python
DataFrame.plot.hist(by=None, bins=10, **kwargs)

パラメータ:

kwargsでよく使うパラメータ:

プログラム例

Python
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

# サンプルデータの作成
np.random.seed(0)
data = {
    'Results': np.random.normal(75, 10, 100)
}
df = pd.DataFrame(data)

# ヒストグラムの作成
df['Results'].plot.hist(bins=10, figsize=(8, 6), title='Exam Result Histgram')
plt.xlabel('Points')
plt.ylabel('Count')
plt.show()

解説:

  1. pandasmatplotlib.pyplotnumpyをインポートします。
  2. 乱数を用いてサンプルデータを作成し、DataFrameに格納します。
  3. df['試験結果'].plot.hist()メソッドでヒストグラムを作成します。
    • bins=10でビンの数を10に指定します。
    • figsize=(8, 6)でグラフのサイズを指定します。
    • title='試験結果のヒストグラム'でグラフのタイトルを指定します。
  4. plt.xlabel()でx軸のラベルを指定します。
  5. plt.ylabel()でy軸のラベルを指定します。
  6. plt.show()でグラフを表示します。

カスタマイズ例

Python
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

# サンプルデータの作成
np.random.seed(0)
data = {
    'Results': np.random.normal(75, 10, 100)
}
df = pd.DataFrame(data)

# ヒストグラムの作成
df['Results'].plot.hist(bins=20,  # ビンの数を20に変更
                         figsize=(8, 6), 
                         title='Exam Result Histgram',
                         alpha=0.7,  # 透明度を0.7に設定
                         grid=True,  # グリッド線を表示
                         orientation='horizontal'  # 水平方向のヒストグラム
                        )
plt.ylabel('Points')
plt.xlabel('Count')
plt.show()

解説:

このように、kwargsで様々なパラメータを指定することで、グラフをカスタマイズすることができます。

参考になるWEBサイト

次回:

次回は、.plot.kdeメソッドを使ってKDEプロットを作成する方法を解説します。お楽しみに!

今回も少しだけPRです。

Pandasについて詳しく知りたいかた、もっと使いこなしたい方におすすめの本です。数年前に購入しましたが、今も手元に置いて時々見返しています。

「pandasクックブック Pythonによるデータ処理のレシピ」Theodore Petrou著、黒川利明訳。

最後まで読んでいただきありがとうございます。73

モバイルバージョンを終了