PandasにおけるDataFrameの行をシャッフルする

Python【初歩から現場実務的なもの】

2021.03.27

PandasにおけるDataFrameの行をシャッフルしてみます。

■Python
■DataFrameを作成する
1. ■コード
2. ■実行
■DataFrameの行をシャッフルする
1. ■コード
2. ■実行

■Python

今回のPythonのバージョンは、「3.8.5」を使用しています。（Windows10）（pythonランチャーでの確認）

■DataFrameを作成する

DataFrameの行をシャッフルする前に、DataFrameを作成します。

■コード

import pandas as pd

data = {
    '名前':['鈴木','山田','吉岡','松本','杉田'],
    '出身':['山口','愛知','長崎','鹿児島','東京'],
    '職業':['税理士','エンジニア','パイロット','運転手','弁護士']
}

df = pd.DataFrame(data)

print(df)

インポートでPandasモジュールを呼び出します。dataという変数を作成し、その中に、今回は「名前」,「出身」,「職業」という3つの行を追加し格納します。

格納後、dfという変数を作成し、pd.DataFrame()と記述し、格納したdataを元にDataFrameを作成。作成後、dfという変数に格納します。

■実行

このスクリプトを実行すると、作成したDataFrameが出力されます。

■DataFrameの行をシャッフルする

DataFrameの用意ができましたので、DataFrameの行をシャッフルするスクリプトを書いていきます。

■コード

import pandas as pd

data = {
    '名前':['鈴木','山田','吉岡','松本','杉田'],
    '出身':['山口','愛知','長崎','鹿児島','東京'],
    '職業':['税理士','エンジニア','パイロット','運転手','弁護士']
}

df = pd.DataFrame(data)

print(df)

df = df.sample(frac =1)

print(df)

DataFrameの行をシャッフルする場合は、dfという変数を作成し、格納したdataを元にDataFrameを作成。その後に、dfという変数に対して、sample()を使用します。sample()は、リストからランダムに要素を抽出することができるものです。sample()の括弧内に「frac =1」と記述することで、DataFrame内の行をランダムに並び替えることができます。並び替えた後に、dfという変数に格納します。

格納後、print関数でdf変数の情報を出力します。

■実行

このスクリプトを「df_rows_shuf_2.py」という名前で保存し、コマンドプロンプトから実行してみます。

実行してみると、DataFrameの行がシャッフルされて出力されました。