caj格式转pdf

CAJ 是中国知网的一种文献格式,要求安装CAJViewer 才能阅读。我偏爱pdf格式。所以不想在自己的机器上安装CAJViewer。下载到的caj 格式(比如学位论文只提供caj格式),需要一种第三方的工具来实现caj 到pdf 的转换。caj2pdf 正是这样的工具。

  • 下载caj2pdf

从其github 官网(https://github.com/JeziL/caj2pdf)打包下载zip文件,解压缩到目标目录。

  • 确定默认python版为 3.3 以上

因为caj2pdf 要求 python 3.3以上,所以请确定默认的python版本。打开cmd,敲入:

> python --version
  • 安装PyPDF2

从其github上下载pypdf2 (下载为zip文件),解压缩,进入其目录,在cmd 里执行以下命令

> python setup.py install

完装完成后,此目录可以安装删除。

  • 下载mupdf

从其官网(https://mupdf.com/index.html)下载最新版本,如当前版本:https://mupdf.com/downloads/archive/mupdf-1.19.0-windows.zip。 将其解压缩到 caj2pdf 目录下,确保存在mutool.exe文件。

  • 使用

比如下载到 a.caj(如果是中文文件名,最好改名为短英文,转换完成后再改回来并不麻烦),将之copy 到caj2pdf 目录下。打开cmd,执行:

> python caj2pdf convert -o a.pdf a.caj

其中-o 后指定了输出文件名,a.caj 是输入文件名。在当前目录会生成 a.pdf,这是转换后的文件。如果caj 有目录,目录也会被提取,这时可能生成多个文件,最终结果可能是在a_toc.pdf 里。pdf里生成的是图片,而不是文字,可能后期需要 acrobat 之类的工具进行文字识别。

caj2pdf目录文件

Leave a Reply

Your email address will not be published. Required fields are marked *