4. PDF内の画像の分割と圧縮
PDFが生成される際、画像はそのピクセルデータとカラーデータに「分割」され、最大限の効率性をもって圧縮されるようになります。JPEG画像はしばしばJPEG圧縮形式(DCTDecodeやJPXDecodeとして知られる)で格納されますが、これには色情報を適用する作業が必要な場合もあります。
5. PDF開発のための基本的なリソース - PDFリファレンスガイド
Adobe社からはPDF 1.7の詳細な仕様が提供され、無料でダウンロード可能です。また、PDF AssociationはPDF 2.0の仕様書も無料で提供しています。これらの資料は内容が豊富で、多くの情報を含んでいます。理想的には、初心者はファイルフォーマットの基本的な概要や、理解する必要のある特定のセクションから学び始めるべきです。
PDF仕様書は、その内容に関して非常に詳細な情報を提供していますが、必ずしもあなたが必要とする視点から書かれているわけではありません。また、Adobe社は仕様に対する解釈の幅を広げています。例が豊富にありますが、使用するツールによっては異なるアプローチが可能です。
これらの仕様書は辞書のように活用するのが最適です。つまり、それらは事項の意味を提供しますが、必要な言語や、その使用方法については説明がありません。
PDFリファレンスガイド
PDF Reference, version 1.7
https://opensource.adobe.com/dc-acrobat-sdk-docs/pdfstandards/pdfreference1.7old.pdf
PDF 2.0 Document
https://pdfa.org/resource/iso-32000-pdf/
6. PDFの基本的な属性と多様性
理想的には、PDFファイルは.pdfのファイル拡張子を持ち、そのデータの最後の1024バイトにはxref(クロスリファレンス)ポインタが含まれ、ファイルの最初の行はバージョン番号であるべきです。しかし、実際にはPDFが許容する範囲やその有用性にはかなりの幅があります。PDFファイルには、フォントや編集可能なテキストが含まれている場合もあれば、単に画像に囲まれた生の原稿であることもあります。結局のところ、Acrobatで開くことができれば、それはPDFとして認められます。したがって、あなたは、その取り扱いに注意が必要になるでしょう。
7. PDFは多様な技術の集合体
PDFファイル形式の内部には、圧縮アルゴリズム、暗号化、フォント技術、JavaScriptなど、様々な技術が組み込まれています。これらの技術の理解は、PDFの内部動作を把握する上で重要ですが、それにより全体の理解がより複雑になることもあります。