Pythonでlangidを用いて言語識別をする

Pythonでlangidを用いて言語識別をしてみます。

今回はlangidを用います。このライブラリ・モジュールはPythonの標準ライブラリではありませんので、事前にインストールする必要があります。

■Python

今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)

■langidを用いて言語識別をする

では、早速langidを用いて言語識別をするスクリプトを書いていきます。

■コード

import langid

print(langid.classify("你好"))
print(langid.classify("This is a test"))
print(langid.classify("これはテストです。"))

今回はimportでlangidを呼び出します。その後、langid.classify()を用います。括弧内には引数,パラメータとして、識別したい言語を渡します。これで言語が識別され結果が返されます。

返された結果をprint()で出力します。

■実行・検証

このスクリプトを「lang_test01.py」という名前で、Pythonが実行されている作業ディレクトリ(カレントディレクトリ)に保存し、コマンドプロンプトから実行してみます。

実行してみると、今回指定した言語が識別されて結果を出力させることができました。左からISO 639-1 コード(国際標準化機構が発行するISO 639(言語の名称の略号を規定した国際規格)言語コードの第一部で、各言語を2文字のアルファベットで表すコード),確率値となります。

コメント

タイトルとURLをコピーしました