Pandas

Pandas

【Pandas】MultiIndexを持つDataFrameの作り方

こんにちは、JS2IIUです。PandasのMultiIndexは、行や列に複数のインデックスを持つDataFrameを作成する機能で、大規模で階層的なデータを効率的に管理・操作する際に役立ちます。本記事では、MultiIndexの概要やメリットについて詳しく解説し、いくつかの具体的な作成方法を紹介...
Pandas

【Pandas】カラムへの効率的な関数適用方法

こんにちは、JS2IIUです。Pandas の apply メソッドは、データフレームの列や行に関数を適用する際に便利です。しかし、データ量が増えるとパフォーマンスが問題になることがあります。この記事では、apply メソッドを使わずに、カラムに対して関数を適用して効率的に計算する方法を解説します。...
Pandas

【Pandas】apply メソッドの使い方

こんにちは、JS2IIUです、Pandas の apply メソッドは、データフレームの列や行に対して関数を適用する際に非常に便利な機能です。この記事では、apply メソッドを使用した具体的なサンプルプログラムを解説し、その応用方法について説明します。今回もよろしくお願いします。サンプルプログラム...
Pandas

【Pandas】複数の列を元に新しい列を生成する方法13選

こんにちは、JS2IIUです。Pandasは、データ分析や前処理の分野で非常に強力なPythonライブラリです。データを操作する中で、複数の列を基に新しい列を生成する必要が出てくる場面は多いです。本記事では、Pandasを使った新しい列の生成方法を13種類に分けて解説します。それぞれの方法にサンプル...
Pandas

【Pandas】value_counts()でデータの頻度を調べる

こんにちは、JS2IIUです。データ分析では、各値の出現頻度を把握することが重要です。Pandasでは、value_counts()メソッドを使用して簡単に頻度を調べることができます。本記事では、DataFrameを使ったvalue_counts()の使い方や、割合を計算するための便利なオプションに...
Pandas

【Pandas】describeメソッドでパーセンタイルを細かく計算する

Pandasのdescribeメソッドは、統計的な要約情報を簡単に取得できる便利な機能です。この記事では、describeメソッドの基本的な使い方から、percentilesパラメータを活用して任意のパーセンタイル(百分位数)を計算する方法について解説します。パーセンタイルとは?パーセンタイル(Pe...
Pandas

【Pandas】DataFrameのデータを辞書に変換する

こんにちは、JS2IIUです。Pandasのデータフレームの一部を抜き出してdictに変換したい場面で使えるテクニックを紹介します。今回もよろしくお願いします。はじめにPandasは、Pythonでのデータ処理を効率化するための強力なライブラリです。特にDataFrameは、データを表形式で扱える便...
Pandas

【Pandas】DataFrameの要素数をカウントする方法

こんにちは、JS2IIUです。ファイルなどから読み込んだDataFrameの大きさを確認する場面は多いと思います。要素数をカウントする方法はいくつかありますが、それぞれ特徴が異なります。うまく使い分けしていきましょう。今回もよろしくお願いします。メソッド/属性用途戻り値欠損値の扱い使い所.size全...
Pandas

【Pandas】時系列データで移動平均を計算する方法

こんにちは、JS2IIUです。今回は時系列データの処理に欠かせない移動平均の計算です。Pandasを使えば簡単に計算することができます。今回もよろしくお願いします。# 単純移動平均(5日間)df = df.rolling(window=5).mean()はじめに時系列データを扱う際、データの変動を平...
Pandas

【Pandas】DataFrameの要素へアクセスする方法

こんにちは、JS2IIUです。DataFrameの一部分要素を取り出して操作することはPandasを使うにあたって必要となってきます。使い方を把握して、使いこなせるようにしていきましょう。今回もよろしくお願いします。はじめにPandasは、Pythonでデータ分析や処理を行う際の必須ライブラリです。...