GoogleColaboratoryにCSVファイルをインポートしてみます。
■PC環境
Windows10
■GoogleColaboratoryにアクセス
まずは、「Colaboratory – Google Colab(https://colab.research.google.com/notebooks/welcome.ipynb?hl=ja)」にアクセスします。アクセスする前に事前にGoogleアカウントを取得しておく必要があります。
アクセスすると、上部メニューに「ファイル」という項目がありますので、こちらをクリックします。クリック後、プルダウンメニューが表示されますので、メニューの中から「ノートブックを新規作成」をクリックします。
クリックすると、Webブラウザで新しいウインドウが表示され、新しいノートブックが表示されます。
■CSVファイルを用意する
ノートブックを作成した後は、インポートするCSVファイルを用意します。
今回は上記のようなサンプルのCSVファイルを用意しました。
ローカル上でファイルが保存されている場所は「C:\Users\user\test(フォルダパス)」になります。
■ローカルからCSVファイルのデータをロードする
from google.colab import files uploaded = files.upload()
CSVファイルが用意できた後に、ノートブックに上記のコードを追加します。
追加後、ノートブックの左側の「再生」ボタンをクリックします。
クリックすると、「ファイル選択」と「Cancel upload」というボタンが表示されますので、「ファイル選択」ボタンをクリックします。
クリックすると、ウインドウが表示されますので、今回用意したCSVファイルを選択し、「開く」ボタンをクリックします。
クリックすると、「Saving sample_01.csv to sample_01.csv」といったメッセージが表示されます。これでCSVファイルのデータのロードは完了となります。
■pandasでロードしたcsvファイルをデータフレームとして読み込む
データのロードは完了しましたので、次にPythonのpandasモジュールでロードしたcsvファイルをデータフレームとして読み込んでみます。なお、pandasモジュールは事前にインストールする必要はありません。
■コード
import pandas as pd import io df = pd.read_csv(io.BytesIO(uploaded['sample_01.csv'])) print(df)
ロードしたcsvファイルをデータフレームとして読み込む際は、上記のコードをノートブックに追加します。
追加した後に「再生」ボタンをクリックします。
クリックすると、今回ロードしたCSVファイルのデータが、データフレームとして読み込まれ表示されることが確認できました。
■GithubからCSVファイルをインポートする
次にGithubからCSVファイルをインポートしてみます。
事前にGithubにリポジトリを作成し、CSVファイルをアップロードしておきます。今回アップロードしたものは、先ほどのサンプルのCSVファイルとなります。
アップロードしたCSVファイルをクリックします。
クリックすると、CSVファイルの詳細ページとなりますので、ページ内の「Raw」ボタンをクリックします。
クリックすると、Rawファイルが表示され、WebブラウザのアドレスバーではRawファイル用のURLが表示されますので、このURLをコピーします。
■コード
import pandas as pd url = 'Rawファイル用のURL' df = pd.read_csv(url) print(df)
コピー後、GoogleColaboratoryで新しいノートブックを作成し、上記のコードを追加します。
追加後、「再生」ボタンをクリックします。
クリックすると、Github上にアップロードしたCSVファイルのデータが、データフレームとして読み込まれ表示されることが確認できました。
コメント