Pythonでlangdetectを用いてテキストの言語を検出してみます。
今回はlangdetectを用います。このライブラリ・モジュールは、Pythonの標準ライブラリではありませんので、事前にインストールする必要があります。
■Python
今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)
■langdetectを用いてテキストの言語を検出する
では、早速langdetectを用いてテキストの言語を検出するスクリプトを書いていきます。
■コード
from langdetect import detect print(detect("こんにちは、私の名前は田中一三四郎です"))
「from import」でlangdetectのdetectを呼び出します。その後、detect()を用います。括弧内には引数,パラメータとして、テキストを渡します。今回は日本語のテキスト(文字列)を渡します。これで言語が検出されます。検出された結果が返されますので、print()を用いて出力します。
■実行・検証
このスクリプトを「lang_test.py」という名前で、Pythonが実行されている作業ディレクトリ(カレントディレクトリ)に保存し、コマンドプロンプトから実行してみます。
実行してみると、今回引数,パラメータとして渡したテキストの言語が「ja(日本語)」であることが検出され、print()で出力させることができました。
コメント