MarkdownファイルからPDFにして欲しいという話は良く聞きます。この時便利なのがPandocなどのツールであったり、Markdownエディタによっては標準でサポートしている場合もあります。macOSであれば印刷機能でPDFにする手もあります。 今回はその逆です。PDF To MarkdownはなんとPDFを読み込んでMarkdownに変換するソフトウェアです。

PDF To Markdownの使い方

一例です。こんなPDFがあります。

Markdownへの変換結果です。なんと日本語が通ります。

別な例です。文章は大抵リストになってしまうようです。

PDF To Markdownは文章の整形などはあまり期待できません。殆どリストで書き出すだけのようです。しかし、そもそもテキストデータがちゃんと読み出せている点が素晴らしいです。PDFから情報を読み取る際に役立つソフトウェアです。

PDF To MarkdownはPython製のソフトウェア(ソースコードは公開されていますがライセンスは明記されていません)です。

johnlinp/pdf-to-markdown: Convert PDF files into markdown files