Pythonでlangdetectを用いてテキストの言語を検出する

Pythonでlangdetectを用いてテキストの言語を検出してみます。

今回はlangdetectを用います。このライブラリ・モジュールは、Pythonの標準ライブラリではありませんので、事前にインストールする必要があります。

■Python

今回のPythonのバージョンは、「3.8.5」を使用しています。(Windows10)(pythonランチャーでの確認)

■langdetectを用いてテキストの言語を検出する

では、早速langdetectを用いてテキストの言語を検出するスクリプトを書いていきます。

■コード

from langdetect import detect

print(detect("こんにちは、私の名前は田中一三四郎です"))

「from import」でlangdetectのdetectを呼び出します。その後、detect()を用います。括弧内には引数,パラメータとして、テキストを渡します。今回は日本語のテキスト(文字列)を渡します。これで言語が検出されます。検出された結果が返されますので、print()を用いて出力します。

■実行・検証

このスクリプトを「lang_test.py」という名前で、Pythonが実行されている作業ディレクトリ(カレントディレクトリ)に保存し、コマンドプロンプトから実行してみます。

実行してみると、今回引数,パラメータとして渡したテキストの言語が「ja(日本語)」であることが検出され、print()で出力させることができました。

コメント

タイトルとURLをコピーしました