PandasにおけるDataFrameでデータ型を確認してみます。
■Python
今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)
■DataFrameを作成する
PandasにおけるDataFrameでデータ型を確認する前に、DataFrameを作成します。
■コード
import pandas as pd Data = {'Name':['Apple','Banana','Peach','Strawberry','Grape'], 'Number':['10','20','30','40','50']} df = pd.DataFrame(Data) print(df)
インポートでPandasモジュールを呼び出します。Dataという変数を作成し、その中に2つの行を追加し格納します。
格納後、dfという変数を作成し、pd.DataFrame()と記述し、格納したDataを元にDataFrameを作成。作成後、dfという変数に格納します。
■実行
このスクリプトを実行すると、作成したDataFrameが出力されます。
■PandasにおけるDataFrameでデータ型を確認する
DataFrameの用意ができましたので、PandasにおけるDataFrameでデータ型を確認するスクリプトを書いていきます。
■コード
import pandas as pd Data = {'Name':['Apple','Banana','Peach','Strawberry','Grape'], 'Number':['10','20','30','40','50']} df = pd.DataFrame(Data) print(df.dtypes)
dfという変数を作成し、pd.DataFrame()と記述し、格納したDataを元にDataFrameを作成。作成後、dfという変数に格納。
格納した後に、print関数でデータ型を確認するために、df.dtypesと記述します。これでデータ型の確認をすることができます。
■実行
このスクリプトを「df_test02.py」という名前で保存し、コマンドプロンプトから実行してみます。
実行してみると、「Name object」、「Number object」と出力されました。今回用意したDataFrame内の2つの列が、object(オブジェクト)の型であることが確認できました。
■object(オブジェクト)の型からデータ型に変更し実行してみる
では、次にobject(オブジェクト)の型からデータ型に変更し、スクリプトを実行してみます。
■コード
import pandas as pd Data = {'Name':['Apple','Banana','Peach','Strawberry','Grape'], 'Number':[10,20,30,40,50]} df = pd.DataFrame(Data) print(df.dtypes)
Dataという変数を作成し、その中に2つの行を追加する際に、1つの行のみを変更し格納します。
その後、格納したDataを元にDataFrameを作成。作成したDataFrameを確認してみます。
■実行
このスクリプトを「df_test03.py」という名前で保存し、コマンドプロンプトから実行してみます。
実行してみると、「Name object」、「Number int64」と出力されました。1つの列をobject(オブジェクト)の型から変更したので、それが確認されてデータ型(int64 (64ビット整数型))であることが出力できました。
■DataFrameの特定の列のデータ型を確認する
では、次にDataFrameの特定の列のデータ型を確認してみます。
■コード
import pandas as pd Data = {'Name':['Apple','Banana','Peach','Strawberry','Grape'], 'Number':[10,20,30,40,50]} df = pd.DataFrame(Data) print(df['Number'].dtypes)
Dataという変数を作成し、その中に2つの行を追加する際に、1つの行のみをデータ型に変更し格納します。
その後、格納したDataを元にDataFrameを作成。作成したDataFrameの特定の列のデータ型を確認するために、「df[‘Number’].dtypes」と記述します。これで確認することができます。今回は「Number」の列でデータ型の確認を行ってみます。
■実行
このスクリプトを「df_test04.py」という名前で保存し、コマンドプロンプトから実行してみます。
実行してみると、「int64」と出力されました。今回指定した列がデータ型(int64 (64ビット整数型))であることが出力できました。
コメント