GoogleColaboratoryにCSVファイルをインポートする

GoogleColaboratoryにCSVファイルをインポートしてみます。

■PC環境

Windows10

■GoogleColaboratoryにアクセス

まずは、「Colaboratory – Google Colab(https://colab.research.google.com/notebooks/welcome.ipynb?hl=ja)」にアクセスします。アクセスする前に事前にGoogleアカウントを取得しておく必要があります。

アクセスすると、上部メニューに「ファイル」という項目がありますので、こちらをクリックします。クリック後、プルダウンメニューが表示されますので、メニューの中から「ノートブックを新規作成」をクリックします。

クリックすると、Webブラウザで新しいウインドウが表示され、新しいノートブックが表示されます。

■CSVファイルを用意する

ノートブックを作成した後は、インポートするCSVファイルを用意します。

今回は上記のようなサンプルのCSVファイルを用意しました。

ローカル上でファイルが保存されている場所は「C:\Users\user\test(フォルダパス)」になります。

■ローカルからCSVファイルのデータをロードする

from google.colab import files

uploaded = files.upload()

CSVファイルが用意できた後に、ノートブックに上記のコードを追加します。

追加後、ノートブックの左側の「再生」ボタンをクリックします。

クリックすると、「ファイル選択」と「Cancel upload」というボタンが表示されますので、「ファイル選択」ボタンをクリックします。

クリックすると、ウインドウが表示されますので、今回用意したCSVファイルを選択し、「開く」ボタンをクリックします。

クリックすると、「Saving sample_01.csv to sample_01.csv」といったメッセージが表示されます。これでCSVファイルのデータのロードは完了となります。

■pandasでロードしたcsvファイルをデータフレームとして読み込む

データのロードは完了しましたので、次にPythonのpandasモジュールでロードしたcsvファイルをデータフレームとして読み込んでみます。なお、pandasモジュールは事前にインストールする必要はありません。

■コード

import pandas as pd
import io

df = pd.read_csv(io.BytesIO(uploaded['sample_01.csv']))
print(df)

ロードしたcsvファイルをデータフレームとして読み込む際は、上記のコードをノートブックに追加します。

追加した後に「再生」ボタンをクリックします。

クリックすると、今回ロードしたCSVファイルのデータが、データフレームとして読み込まれ表示されることが確認できました。

■GithubからCSVファイルをインポートする

次にGithubからCSVファイルをインポートしてみます。

事前にGithubにリポジトリを作成し、CSVファイルをアップロードしておきます。今回アップロードしたものは、先ほどのサンプルのCSVファイルとなります。

アップロードしたCSVファイルをクリックします。

クリックすると、CSVファイルの詳細ページとなりますので、ページ内の「Raw」ボタンをクリックします。

クリックすると、Rawファイルが表示され、WebブラウザのアドレスバーではRawファイル用のURLが表示されますので、このURLをコピーします。

■コード

import pandas as pd

url = 'Rawファイル用のURL'
df = pd.read_csv(url)
print(df)

コピー後、GoogleColaboratoryで新しいノートブックを作成し、上記のコードを追加します。

追加後、「再生」ボタンをクリックします。

クリックすると、Github上にアップロードしたCSVファイルのデータが、データフレームとして読み込まれ表示されることが確認できました。

コメント

タイトルとURLをコピーしました