PandasにおけるDataFrameの行をシャッフルしてみます。
■Python
今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)
■DataFrameを作成する
DataFrameの行をシャッフルする前に、DataFrameを作成します。
■コード
import pandas as pd data = { '名前':['鈴木','山田','吉岡','松本','杉田'], '出身':['山口','愛知','長崎','鹿児島','東京'], '職業':['税理士','エンジニア','パイロット','運転手','弁護士'] } df = pd.DataFrame(data) print(df)
インポートでPandasモジュールを呼び出します。dataという変数を作成し、その中に、今回は「名前」,「出身」,「職業」という3つの行を追加し格納します。
格納後、dfという変数を作成し、pd.DataFrame()と記述し、格納したdataを元にDataFrameを作成。作成後、dfという変数に格納します。
■実行
このスクリプトを実行すると、作成したDataFrameが出力されます。
■DataFrameの行をシャッフルする
DataFrameの用意ができましたので、DataFrameの行をシャッフルするスクリプトを書いていきます。
■コード
import pandas as pd data = { '名前':['鈴木','山田','吉岡','松本','杉田'], '出身':['山口','愛知','長崎','鹿児島','東京'], '職業':['税理士','エンジニア','パイロット','運転手','弁護士'] } df = pd.DataFrame(data) print(df) df = df.sample(frac =1) print(df)
DataFrameの行をシャッフルする場合は、dfという変数を作成し、格納したdataを元にDataFrameを作成。その後に、dfという変数に対して、sample()を使用します。sample()は、リストからランダムに要素を抽出することができるものです。sample()の括弧内に「frac =1」と記述することで、DataFrame内の行をランダムに並び替えることができます。並び替えた後に、dfという変数に格納します。
格納後、print関数でdf変数の情報を出力します。
■実行
このスクリプトを「df_rows_shuf_2.py」という名前で保存し、コマンドプロンプトから実行してみます。
実行してみると、DataFrameの行がシャッフルされて出力されました。
コメント