PandasにおけるDataFrameでデータ型を確認する

PandasにおけるDataFrameでデータ型を確認してみます。

■Python

今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)

■DataFrameを作成する

PandasにおけるDataFrameでデータ型を確認する前に、DataFrameを作成します。

■コード

import pandas as pd

Data = {'Name':['Apple','Banana','Peach','Strawberry','Grape'],
        'Number':['10','20','30','40','50']}

df = pd.DataFrame(Data)

print(df)

インポートでPandasモジュールを呼び出します。Dataという変数を作成し、その中に2つの行を追加し格納します。

格納後、dfという変数を作成し、pd.DataFrame()と記述し、格納したDataを元にDataFrameを作成。作成後、dfという変数に格納します。

■実行

このスクリプトを実行すると、作成したDataFrameが出力されます。

■PandasにおけるDataFrameでデータ型を確認する

DataFrameの用意ができましたので、PandasにおけるDataFrameでデータ型を確認するスクリプトを書いていきます。

■コード

import pandas as pd

Data = {'Name':['Apple','Banana','Peach','Strawberry','Grape'],
        'Number':['10','20','30','40','50']}

df = pd.DataFrame(Data)

print(df.dtypes)

dfという変数を作成し、pd.DataFrame()と記述し、格納したDataを元にDataFrameを作成。作成後、dfという変数に格納。

格納した後に、print関数でデータ型を確認するために、df.dtypesと記述します。これでデータ型の確認をすることができます。

■実行

このスクリプトを「df_test02.py」という名前で保存し、コマンドプロンプトから実行してみます。

実行してみると、「Name object」、「Number object」と出力されました。今回用意したDataFrame内の2つの列が、object(オブジェクト)の型であることが確認できました。

■object(オブジェクト)の型からデータ型に変更し実行してみる

では、次にobject(オブジェクト)の型からデータ型に変更し、スクリプトを実行してみます。

■コード

import pandas as pd

Data = {'Name':['Apple','Banana','Peach','Strawberry','Grape'],
        'Number':[10,20,30,40,50]}

df = pd.DataFrame(Data)

print(df.dtypes)

Dataという変数を作成し、その中に2つの行を追加する際に、1つの行のみを変更し格納します。

その後、格納したDataを元にDataFrameを作成。作成したDataFrameを確認してみます。

■実行

このスクリプトを「df_test03.py」という名前で保存し、コマンドプロンプトから実行してみます。

実行してみると、「Name object」、「Number int64」と出力されました。1つの列をobject(オブジェクト)の型から変更したので、それが確認されてデータ型(int64 (64ビット整数型))であることが出力できました。

■DataFrameの特定の列のデータ型を確認する

では、次にDataFrameの特定の列のデータ型を確認してみます。

■コード

import pandas as pd

Data = {'Name':['Apple','Banana','Peach','Strawberry','Grape'],
        'Number':[10,20,30,40,50]}

df = pd.DataFrame(Data)

print(df['Number'].dtypes)

Dataという変数を作成し、その中に2つの行を追加する際に、1つの行のみをデータ型に変更し格納します。

その後、格納したDataを元にDataFrameを作成。作成したDataFrameの特定の列のデータ型を確認するために、「df[‘Number’].dtypes」と記述します。これで確認することができます。今回は「Number」の列でデータ型の確認を行ってみます。

■実行

このスクリプトを「df_test04.py」という名前で保存し、コマンドプロンプトから実行してみます。

実行してみると、「int64」と出力されました。今回指定した列がデータ型(int64 (64ビット整数型))であることが出力できました。

コメント

タイトルとURLをコピーしました