OpenOffice.orgからはじまったOpenDocumentフォーマットはMS OfficeやGoogleドキュメントをはじめとして様々なオフィススイートでサポートされています。マクロなどを使わないシンプルなファイルであればOpenDocumentを使うのが一番安心かも知れません。 そんなOpenDocumentの新しい使い方として注目したいのがODT-HTML5です。OpenDocumentを解析し、HTML5にて表示するソフトウェアです。

ODT-HTML5の使い方

一例です。JavaScriptで解析するのかと思ったのですが、実際にはPHPでした。

元ファイル。テーブルは表現できていませんがそれ以外は十分です。

日本語も扱えます。

画像も表示できています。

ODT-HTML5はPHP版の他、Python版も提供されています。OpenDocumentを解析してそこからデータをピックアップできるのであれば、システムで情報を抽出したり連携したりするのに使えるかも知れませんね。

ODT-HTML5はPHP/Python製のオープンソース・ソフトウェア(BSD License)です。

ODT-HTML5 - Gitorious