File Juicer
File Juicer は PDF, Word, PowerPointなど各種書類からテキスト・画像・動画を抽出してくれるシェアウェア(€9.95)だ。
仕事でホームページの更新・作成を行うときに大いに力を発揮してくれる。
よくあることで、原稿をワードファイルやPDFで頂くことがある。
このときに書類に含まれている画像もページにアップして欲しいといわれる。
基本的には「その元の画像を下さい」とお願いするわけだが
原稿を作った人と窓口の人が異なっていると、簡単にはいかない場合がある。
窓口の人がよく分かっていなかったり、原稿作った人がまた別の会社だったりと、色々と大人の事情が出てくるわけである。
そういうときにはこの File Juicerだ。
もう手放せません。
操作は簡単で、「ここにファイルをドラッグ」と言うところにファイルをドラッグするだけ。
こうすることで、大体次のようにフォルダごとに抽出した画像・テキストなどを分類してくれるのだ。
(シェアウェア未登録時はたしか “File Juicer” の文字が入る画像などが全てにではないが入る)
自分の場合は、PDFからの抽出を大なうことが多い。
画像・テキストの抽出が主な目的。
ただ毎回注意しなければいけないことがあって
ここがどうにかならないかなーと常々思っている。
●全角スペースと半角スペース
PDFからの抽出しか試していないのだけど、全角スペースで入力されたものがテキスト抽出すると半角になっている。
これはMacのプレビューでファイルを開いてテキストをコピペしても半角になっているので、なんらか変換処理が入っているのか、Macの仕様なのか・・・よく分かりません。
素直に Acrobat Reader(全角スペースは全角スペースのままなのです)を使えと言うことか?
●日本語文字コード(UNICODE正規化)
まあ、これも Acrobat Readerからテキストコピペすればいいのだけど、File Juicerから抽出してテキストをたとえば、DreamWeaverにコピペをすると、濁点・半濁点などが1文字としてペーストされることがある。
なわけで、毎回 Cot Editor(この変換してくれるエディタはこれくらいだった)で UNICODE正規化ってのをやってからコピペしている。
ま、いずれも、つい最近までプレビューでPDFファイル見れるし・・・・などという理由で Adebe Acrobat Readerを入れていなかったからおきた事柄ですがね・・・
Comments
Leave a Reply