【自動化】Power Automate DesktopでPDFファイルからテキスト抽出しテキストファイルに保存してみます。
■PC環境
Windows 10 Pro
■PDFファイルの用意
Power Automate DesktopでPDFファイルからテキスト抽出を行う前に、PDFファイルを用意します。
今回は、売上計画書という仮のPDFファイル(test.pdf)を用意しました。
なお、ファイルが保存されている場所は「C:\Users\user\test」となっています。
■Power Automate Desktopで新しいフローを作成する
まずは、Power Automate Desktopを起動します。起動すると画面の上部に「新しいフロー」と表示された十字ボタンがありますので、こちらをクリックします。
クリックすると、「フローを作成する」というウインドウが表示されます。ウインドウ内の「フロー名」の入力欄がありますので、今回は「PDFファイルのテキスト抽出」と入力します。
入力後、「作成」ボタンをクリックします。
クリックすると、フローが作成されて、アクションの設定を行う画面が表示されました。この画面で、PDFファイルからテキスト抽出し、テキストファイルへ抽出したテキストを保存するまでの設定を行っていきます。
まずは画面の左側にある「アクション」のメニューから「PDF」をクリックします。クリックするとプルダウンメニューが表示されます。このメニュー内から「PDFからテキストを抽出」というアクションをクリックします。
クリックすると、「PDFからテキストを抽出」というウインドウが表示されます。ウインドウ内の「パラメーターの選択」で「全般」から「PDFファイル」の右側にあるアイコンをクリックします。
クリックすると、「ファイルの選択」というウインドウが表示されます。ウインドウ内で、今回用意したPDFファイルが保存されている場所へ移動し、PDFファイルを選択し、「開く」ボタンをクリックします。
クリックすると、「パラメーターの選択」で「全般」の「PDFファイル」に、PDFファイルを保存されている場所が指定されます。指定後、「抽出するページ」は、今回は「すべて」を選択します。
選択後、「生成された変数」の名前を確認しておきます。確認後、「保存」ボタンをクリックします。
クリックすると、フローのアクションの設定画面の「Main」に、設定したアクションが追加されます。
追加後、次のアクションを設定します。
画面の左側にある「アクション」のメニューから「ファイル」をクリックします。クリックするとプルダウンメニューが表示されます。このメニュー内から「テキストをファイルに書き込みます」というアクションをクリックします。
クリックすると、「テキストをファイルに書き込みます」というウインドウが表示されます。ウインドウの「パラメーターの選択」の「全般」の「ファイルパス」の右側にあるアイコンをクリックします。
クリックすると、「ファイルの選択」というウインドウが表示されます。ウインドウ内で、テキストファイルを選択し、「開く」ボタンをクリックします。なお、今回は「C:\Users\user\test(フォルダパス)」に「test.txt」というテキストファイルを事前に作成しています。
クリックすると、「パラメーターの選択」の「全般」の「ファイルパス」に、作成しておいたテキストファイルが指定されます。
指定後、「書き込むテキスト」で、「PDFからテキストを抽出」の設定で「生成された変数(フロー変数)」を記述します。記述する際は「%(パーセント)」で変数名をはさみます。
記述後、「パラメーターの選択」の「新しい行を追加する」の設定はそのままで、「ファイルが存在する場所」も設定はそのままで、エンコードの「Unicode」をクリックします。クリックするとプルダウンメニューが表示されますので、「UTF-8」を選択します。
選択後、「保存」ボタンをクリックします。
クリックすると、フローのアクションの設定画面の「Main」に、設定したアクションが追加されます。これで、PDFファイルからテキスト抽出しテキストファイルに保存するまでが自動化できました。
■フロー(PDFファイルからテキスト抽出しテキストファイルに保存する)の実行と検証
フローは完成しましたので、PDFファイルからテキスト抽出しテキストファイルに保存するまでを実行してみます。
実行する際は、フローのアクションの設定画面の上部にある「実行」ボタンをクリックします。
クリックするとフローが実行されます。
実行してみると、今回用意したPDFファイルからテキスト抽出し、テキストファイルに抽出したテキストが書き込まれたことが確認できました。
コメント