PandasにおけるDataFrameで特定の列が存在するかどうかを確認してみます。
■Python
今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)
■DataFrameを作成する
DataFrameで特定の列が存在するかどうかを確認する前に、DataFrameを作成します。
■コード
import pandas as pd data = { 'A':[10,20,30,40,50], 'B':['Yellow','Blue','Black','White','Red'], 'C':[80,81,82,83,84], 'D':['D1','D2','D3','D4','D5'] } df = pd.DataFrame(data) print(df)
インポートでPandasモジュールを呼び出します。dataという変数を作成し、その中に、今回は「A」,「B」,「C」,「D」という4つの行を追加し格納します。
格納後、dfという変数を作成し、pd.DataFrame()と記述し、格納したDataを元にDataFrameを作成。作成後、dfという変数に格納します。
■実行
このスクリプトを実行すると、作成したDataFrameが出力されます。
■DataFrameで特定の列が存在するかどうかを確認する
DataFrameが用意できましたので、特定の列が存在するかどうかを確認するスクリプトを書いていきます。
■「B」という列が存在するかどうかを確認
■コード
import pandas as pd data = { 'A':[10,20,30,40,50], 'B':['Yellow','Blue','Black','White','Red'], 'C':[80,81,82,83,84], 'D':['D1','D2','D3','D4','D5'] } df = pd.DataFrame(data) print(df) if 'B' in df.columns : print('「B」という列は存在します') else: print('「B」という列は存在しません')
特定の列が存在するかどうかを確認する場合は、if文での条件分岐を使います。「B」という列が、今回作成したDataFrame内に存在するか、df.columnsと記述して確認します。存在しない場合は、「「B」という列は存在しません」とprint関数で出力されるようにしています。
■実行
このスクリプトを「df_Conf_exist_2.py」という名前で保存し、コマンドプロンプトから実行してみます。
実行してみると、今回作成したDataFrame内に「B」という列が存在しますので、確認が行われ、print関数で文字列が出力できました。
■存在しない列を確認する
では、次に今回作成したDataFrame内に存在しない列を確認してみます。
■コード
import pandas as pd data = { 'A':[10,20,30,40,50], 'B':['Yellow','Blue','Black','White','Red'], 'C':[80,81,82,83,84], 'D':['D1','D2','D3','D4','D5'] } df = pd.DataFrame(data) print(df) if 'G' in df.columns : print('「G」という列は存在します') else: print('「G」という列は存在しません')
if文での条件分岐を使い、DataFrame内に存在しない「G」という列を指定します。
■実行
このスクリプトを「df_Conf_exist_3.py」という名前で保存し、コマンドプロンプトから実行してみます。
実行してみると、今回作成したDataFrame内には「G」という列は存在しませんので、「「G」という列は存在しません」と出力されました。
コメント