Hatena::ブログ(Diary)

名もないテクノ手 このページをアンテナに追加 RSSフィード Twitter

EPUB版『InDesign者のための正規表現入門』

InDesignのTips一覧

2010-12-03

[][][][]InDesignから書き出されたPDFは、InDesignの操作履歴をもっている。時には大量に。

ExifToolを触っていたらへんなことに気がついてしまった。InDesignから書き出されたPDFは、XMPの中にInDesignの操作履歴をもってるみたい。

$ exiftool A.pdf
ExifTool Version Number         : 7.52
File Name                       : A.pdf
Directory                       : .
File Size                       : 422 kB
File Modification Date/Time     : 2010:12:03 11:26:54+09:00
File Type                       : PDF
MIME Type                       : application/pdf
PDF Version                     : 1.3
XMP Toolkit                     : Image::ExifTool 7.52
Format                          : application/pdf
Doc Change Count                : 107
Creator Tool                    : Adobe InDesign CS5_J (7.0.3)
Metadata Date                   : 2010:12:03 11:19:16+09:00
Document ID                     : xmp.did:FD7F117407206811A961D08B23C087A9
History Action                  : created, saved, saved, saved, saved, saved, saved, saved, saved, saved, saved, saved, saved, saved, saved
History Instance ID             : xmp.iid:FD7F117407206811A961D08B23C087A9, xmp.iid:FE7F117407206811A961D08B23C087A9, xmp.iid:FF7F117407206811A961D08B23C087A9, xmp.iid:0080117407206811A961D08B23C087A9, xmp.iid:27CA6B9219206811A961D08B23C087A9, xmp.iid:28CA6B9219206811A961D08B23C087A9, xmp.iid:2FCA6B9219206811A961D08B23C087A9, xmp.iid:30CA6B9219206811A961D08B23C087A9, xmp.iid:086F72D11A206811A961D08B23C087A9, xmp.iid:FC7F1174072068118C14F973A1F0976C, xmp.iid:FD7F1174072068118C14F973A1F0976C, xmp.iid:FE7F1174072068118C14F973A1F0976C, xmp.iid:FF7F1174072068118C14F973A1F0976C, xmp.iid:00801174072068118C14F973A1F0976C, xmp.iid:B4A18584072068118C14F973A1F0976C
History Software Agent          : Adobe InDesign 6.0, Adobe InDesign 6.0, Adobe InDesign 6.0, Adobe InDesign 6.0, Adobe InDesign 6.0, Adobe InDesign 6.0, Adobe InDesign 6.0, Adobe InDesign 6.0, Adobe InDesign 6.0, Adobe InDesign 7.0, Adobe InDesign 7.0, Adobe InDesign 7.0, Adobe InDesign 7.0, Adobe InDesign 7.0, Adobe InDesign 7.0
History When                    : 2010:07:03 15:08:01+09:00, 2010:07:03 15:08:49+09:00, 2010:07:03 15:08:49+09:00, 2010:07:03 15:15:34+09:00, 2010:07:03 15:21:50+09:00, 2010:07:03 15:22:03+09:00, 2010:07:03 15:28:18+09:00, 2010:07:03 15:28:43+09:00, 2010:07:03 15:29:51+09:00, 2010:12:03 11:18:39+09:00, 2010:12:03 11:18:39+09:00, 2010:12:03 11:18:41+09:00, 2010:12:03 11:18:43+09:00, 2010:12:03 11:18:46+09:00, 2010:12:03 11:18:47+09:00
History Changed                 : /, /metadata, /, /, /, /, /, /, /;/metadata, /metadata, /;/metadata, /;/metadata, /;/metadata, /;/metadata
Instance ID                     : uuid:6288af79-e6ab-d343-8d4f-cbd97649a750
Original Document ID            : xmp.did:FD7F117407206811A961D08B23C087A9
Rendition Class                 : proof:pdf
Version ID                      : 1
Page Count                      : 20
Create Date                     : 2010:12:03 11:19:15+09:00
Creator                         : Adobe InDesign CS5_J (7.0.3)
GTS PDFX Conformance            : PDF/X-1a:2001
GTS PDFX Version                : PDF/X-1:2001
Modify Date                     : 2010:12:03 11:19:16+09:00
Producer                        : Adobe PDF Library 9.9
Title                           : A
Trapped                         : False

「History Action」「History Instance ID」「History Software Agent」「History When」「History Changed」などの項目だ。これらはBridgeからも参照できる。

f:id:seuzo:20101203115209p:image

まあ、この程度だったらまあ許せる範囲なんだけど、操作履歴だからこれがものすごくたくさん残っていることがある。この部分だけで何十KBにもなることがある。あれ、バイナリ開いちゃった? くらいの勢いになる。なぜPDFがInDesignのヒストリを持っている必要があるのかはわからない。「PDFよ、何故親の過去を背負う?」。まあ消しちゃっていいかな? いいとも! ということで消してみました。

# coding: utf-8
#require 'rubygems'
require 'mini_exiftool'

ARGV.each do |my_file|
	tmp_f = MiniExiftool.new(my_file)
	tmp_f['HistoryAction'] = ''
	tmp_f['HistoryChanged'] = ''
	tmp_f['HistoryInstanceID'] = ''
	tmp_f['HistorySoftwareAgent'] = ''
	tmp_f['HistoryWhen'] = ''
	tmp_f.save
end

(追記:2010-12-03T13:00:53+0900)@pictexさんにもご指摘いただきましたが、Rubyを使わなくてもAcrobat Proの最適化を使えば、ユーザーのメタデータは破棄できます。「ユーザーデータの破棄」-「文書情報とメタデータを破棄」です。バッチ処理にも組み込めます。ただし、特定の要素だけを破棄(変更)するには上記のような方法も有効です。

ニヤリニヤリ 2010/12/03 14:31 いつも楽しく拝見しております。
通りすがり的な書き込みで失礼します。

>操作履歴
プログラマさん的には『○○に使うかな〜と思って』とか
理由があるんでしょうね。
でも
特殊な形式のデータでファイルに埋め込まれるより良いですね
XMPだと『文字』で見れますから
メタデータは無くても大丈夫だけど
上手につき合えば....良い事ある『はず』ですから
XMPとは、上手く付合いたいと思う今日この頃です。
フレミングの左手も、とても参考になりました。 NICE!です

seuzoseuzo 2010/12/03 14:37 >上手につき合えば....良い事ある『はず』ですから

そうですね。Bridgeを介しての条件付けも可能ですし、なにかしらの手がかりとしていろいろ使えますし。
twitpicなどの写真投稿サイトなどを見ておりますと、けっこう位置情報とか入っていて「いいんかな〜」と思うこともあります。

通りすがりの素人通りすがりの素人 2013/01/25 11:08 InDesignからPDFを作成すると、サイズが大きくなって困っていて、ここにたどり着きました。

Acrobat Proの最適化の「ユーザーデータの破棄」-「文書情報とメタデータを破棄」でサイズダウンすることは分かったのですが、XMPが読み解けないもので、本当に消しちゃっていいの!?という不安があります。

印刷用とWEB用と2種類作るのですが、
WEB用でのセキュリティ関係や検索性が特に心配です。

それらのものはInDesginから引き継いでいるわけではなく、あとでAcrobat Proを使用して、PDFのプロパティに自分で設定すればいいものなのでしょうか?

まさに通りすがりの書き込み&質問で大変恐縮ですが、ご教授いただけると幸いです。

seuzoseuzo 2013/01/25 12:21 通りすがりの素人さん、こんにちは。
通りすがりの素人さんのご懸念が、具体的にどのあたりにあるのか、ちょっとわからない部分もありますので、経験則や一般的なことに始終してしまうかもしれません。

PDFのメタデータを消した印刷用、またはWEB用PDFで、特にクレームをいただいたことはありませんでした。
ただし、JDFジョブチケットなどを使うPDFワークフローですと支障が発生する可能性があります。これらについては、次工程の方にお尋ねください。

何が必要なメタデータで、なにが不必要なのかということですが、
メタデータ自体は単なる仕組みですので、必要かどうかはワークフローが決めることだと思います。
なにかしらの要請なり、やりたいことがあってはじめて「必要なメタ情報」が決まるわけです。
ですから、必要だと思われるものは、要請に応じて後で付加すればよいのではないでしょうか。

よろしくお願いいたします。

通りすがりの素人通りすがりの素人 2013/01/29 16:19 ご回答どうもありがとうございました!!

何を心配しているかが漠然としていてすみません。
このAcrobat Proの最適化で200MBのPDFが5MBになってしまったので、そんなに何消しちゃったの!?・・という不安がありましたもので。。

経験のお話でも大変助かりました。ありがとうございました。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

トラックバック - http://d.hatena.ne.jp/seuzo/20101203/1291345091