Pythonで改行コード”\n”を含む文字列から改行を取り除いて数値に変換してみます。
「\n」は改行コード(または改行文字)と呼ばれ、文字列の中で改行を表現するために使われます。一般的に、テキストファイル内の各行の末尾に改行コードが挿入されます。この改行コードは、異なるオペレーティングシステムやプログラミング言語によって異なる場合があります。Pythonでは、標準的な改行コードとして「\n」が使われます。
■今回の環境(Python)
Google Colaboratory(Google Colab),記事作成時点ではPython 3.9.16が用いられる。
■改行コード”\n”を含む文字列から改行を取り除いて数値に変換する
では、早速改行コード”\n”を含む文字列から改行を取り除いて数値に変換するコードを書いていきます。
■コード
text = '10\n20\n30\n' numbers = [int(line.strip()) for line in text.split()] print(numbers)
今回はtextという変数を定義し、その中に「10\n20\n30\n」という改行コード”\n”を含む文字列を格納します。格納後、numbers変数を定義し、その中でtext変数に対して、split()メソッドを用いて、改行文字を区切り文字として文字列を分割します。分割されたものは、for文を用いた繰り返し処理でline変数に順番に格納されます。その後、line変数内の分割された各要素に対して、strip() メソッドを用いて改行文字を取り除きます。そして、int()メソッドを使って数値に変換します。なお、split()メソッドに引数を指定しない場合、デフォルトでは空白文字(スペース、タブ、改行など)を区切り文字として文字列を分割する。つまり、文字列内にスペースや改行などの区切り文字がある場合、それが自動的に区切り文字として認識され、分割される。一方、区切り文字が含まれない場合は、文字列全体が1つの要素としてリストに格納されます。このとき、カンマは挿入されない。ただし、今回のように改行を取り除いて数値に変換する際は、数値の間にカンマが挿入されるため、カンマが含まれるように見える場合がある。
最後にprint()でnumbers変数内の情報を出力します。
■実行・検証
このコード(セル)を保存し、Google Colaboratory上で、セルを実行してみます。
実行してみると、改行コード”\n”を含む文字列から改行を取り除き、数値に変換。変換後、数値を出力させることができました。
コメント