【Pandas】Numpy配列をDataFrameに変換する

こんにちは、JS2IIUです。

Pandasは、さまざまなデータ形式を扱うための便利なツールを提供します。特に、Pythonの科学計算ライブラリであるNumpyと連携することが非常に簡単です。この記事では、Numpy配列からPandasのDataFrameを作成する方法を、具体的なサンプルコードを交えながら解説します。

Numpy配列をDataFrameに変換する基本的な方法
1. 実行結果
2. 解説
インデックスやカラム名を指定してDataFrameを作成する
1. 実行結果
2. 解説
Numpy配列の型に注意
1. 実行結果
2. 解説
まとめ
参考リンク

Numpy配列をDataFrameに変換する基本的な方法

Numpy配列をDataFrameに変換するには、Pandasのpd.DataFrame()関数を使用します。この関数を使うことで、Numpy配列のデータを簡単にPandasのDataFrame形式に変換できます。

以下は、基本的な変換方法の例です。

Python

import numpy as np
import pandas as pd

# サンプルのNumpy配列を作成
data = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

# DataFrameを作成
df = pd.DataFrame(data)

# 結果を表示
print(df)

基本的な考え方はリストからDataFrameを作る時と同じです。こちらの記事も参考にしてみて下さい。

実行結果

Plaintext

解説

Numpy配列dataの各行がDataFrameの各行として変換されます。
デフォルトでは、インデックスとカラム名が整数（0, 1, 2, …）として自動的に付与されます。

インデックスやカラム名を指定してDataFrameを作成する

Numpy配列をDataFrameに変換する際に、インデックス（行ラベル）やカラム名をカスタマイズすることも可能です。以下の例では、カラム名とインデックスを指定しています。

Python

# カラム名とインデックスを指定してDataFrameを作成
columns = ['A', 'B', 'C']
index = ['Row1', 'Row2', 'Row3']

df_with_labels = pd.DataFrame(data, columns=columns, index=index)

# 結果を表示
print(df_with_labels)

実行結果

Plaintext

       A  B  C
Row1   1  2  3
Row2   4  5  6
Row3   7  8  9

解説

columns引数: DataFrameの列名をリストで指定します。
index引数: DataFrameの行名をリストで指定します。
これにより、よりわかりやすいDataFrameを作成することができます。

Numpy配列の型に注意

Numpy配列をDataFrameに変換する際には、配列のデータ型（dtype）がそのままDataFrameに引き継がれます。たとえば、以下のように異なる型のデータを持つ配列を作成することも可能です。

Python

# 異なる型のNumpy配列
mixed_data = np.array([[1, 'A', 3.0], [4, 'B', 6.5], [7, 'C', 9.1]])

# DataFrameを作成
df_mixed = pd.DataFrame(mixed_data, columns=['Number', 'Letter', 'Decimal'])

# 結果を表示
print(df_mixed)

実行結果

Plaintext

  Number Letter Decimal
0      1      A     3.0
1      4      B     6.5
2      7      C     9.1

解説

Numpy配列の各要素が文字列に変換される場合があります。この例では、すべてのデータが文字列型（object型）として扱われています。

まとめ

この記事では、Numpy配列をPandasのDataFrameに変換する方法を解説しました。重要なポイントは以下の通りです。

pd.DataFrame()関数を使えば、Numpy配列を簡単にDataFrame形式に変換できます。
インデックスやカラム名を指定することで、より意味のあるDataFrameを作成できます。
配列のデータ型に注意して、期待通りのデータ形式で扱いましょう。

PandasとNumpyを組み合わせることで、柔軟で強力なデータ操作が可能になります。ぜひ試してみてください！

参考リンク

少しだけPRです。

Pandasについて詳しく知りたいかた、もっと使いこなしたい方におすすめの本です。数年前に購入しましたが、今も手元に置いて時々見返しています。「pandasクックブック Pythonによるデータ処理のレシピ」Theodore Petrou著、黒川利明訳。

最後まで読んでいただきありがとうございます。73

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31