docx2pdfを使用しPythonでDOCXファイルをPDFファイルに変換してみます。
DOCXファイルをPDFファイルに変換するためには、docx2pdfモジュールが必要となります。docx2pdfモジュールは、Pythonの標準ライブラリではありませんので、事前にインストールする必要があります。また、Microsoft Wordをインストールしておく必要があります。
■Python
今回のPythonのバージョンは、「3.8.5」を使用しています。(macOS High Sierra 10.13.6)
■docx2pdfをインストールする
docx2pdfモジュールのインストールを行いますが、今回はpipを経由してインストールを行うので、まずmacOSのターミナルを起動します。
pip install docx2pdf
起動後、上記のコマンドを入力し、Enterキーを押します。
Collecting docx2pdf
Downloading docx2pdf-0.1.7-py3-none-any.whl (6.6 kB)
Collecting tqdm<5.0.0,>=4.41.0
Downloading tqdm-4.53.0-py2.py3-none-any.whl (70 kB)
|████████████████████████████████| 70 kB 1.1 MB/s
Collecting appscript<2.0.0,>=1.1.0; sys_platform == “darwin”
Downloading appscript-1.1.1-cp38-cp38-macosx_10_6_x86_64.whl (83 kB)
|████████████████████████████████| 83 kB 1.8 MB/s
Installing collected packages: tqdm, appscript, docx2pdf
Successfully installed appscript-1.1.1 docx2pdf-0.1.7 tqdm-4.53.0
Enterキーを押すと、インストールが開始され、「Successfully installed」と表示されます。これが表示されれば、正常にインストールは完了となります。
■DOCXファイルを用意する
docx2pdfのインストールは完了となりましたので、次に変換を行うDOCXファイルを用意します。
今回は、DOCX形式の「売り上げ報告書」ファイルを用意しました。
ファイルが保存されている場所は「../../Desktop/test1(フォルダパス)」になります。
■docx2pdfを使用しDOCXをPDFに変換する
DOCXファイルの用意ができましたので、docx2pdfを使用しDOCXをPDFに変換するスクリプトを書いていきます。
■コード
from docx2pdf import convert convert("../../Desktop/test1/test.docx") convert("test1/test.docx", "test1/test.pdf") convert("test1/")
インポートでdocx2pdfのconvertを呼び出し、convert()で今回用意したDOCX形式のファイルを指定します。
次に、今回用意したDOCX形式のファイルと、変換するPDF形式のファイル名と保存先を指定します。今回はDOCX形式のファイルと同じ保存先を指定しています。
このようにすることで、変換が実行されます。
■実行
今回のスクリプトを「docx-pdf.py」という名前で保存し、ターミナルから実行してみます。
実行してみると、「Microsoft Word」が自動で起動し、PDFファイルに変換が行われることを確認できました。
コメント