กลับไปหน้าบทความ

อ่าน 26 นาที

พีดี

รูปแบบเอกสารพกพา ( PDF ) ซึ่งกำหนดมาตรฐานเป็น ISO 32000 เป็น รูปแบบไฟล์ ที่พัฒนาโดย Adobe ในปี 1993 ใช้สำหรับนำเสนอเอกสาร รวมถึงการจัดรูปแบบข้อความและรูปภาพ ในลักษณะที่ไม่ขึ้นกับ...

พีดี

ตรวจสอบแล้ว
หน้านี้ได้รับการป้องกันเนื่องจากมีการเปลี่ยนแปลงที่รอดำเนินการ

รูปแบบเอกสารพกพา
ไอคอน Adobe PDF
นามสกุลไฟล์.pdf
สื่อประเภทอินเทอร์เน็ต
  • application/pdf[ 1 ]
  • application/x-pdf
  • application/x-bzpdf
  • application/x-gzpdf
รหัสประเภทPDF [ 1 ] (รวมถึงช่องว่างท้ายหนึ่งช่อง)
ตัวระบุประเภทมาตรฐาน (UTI)com.adobe.pdf
เลขมหัศจรรย์%PDF
พัฒนาโดยบริษัท Adobe Inc. (1991–2008) ISO (2008–)
การเผยแพร่ครั้งแรก15 มิถุนายน 2536 ( 15 มิถุนายน 1993 )
รุ่นล่าสุด
2.0
ขยายไปยังPDF/A , PDF/E , PDF/UA , PDF/VT , PDF/X
มาตรฐานISO 32000-2
รูปแบบเปิด ?ใช่
เว็บไซต์iso.org/standard/75839.html

รูปแบบเอกสารพกพา ( PDF ) ซึ่งกำหนดมาตรฐานเป็นISO 32000เป็นรูปแบบไฟล์ที่พัฒนาโดยAdobeในปี 1993 ใช้สำหรับนำเสนอเอกสาร รวมถึงการจัดรูปแบบข้อความและรูปภาพ ในลักษณะที่ไม่ขึ้นกับซอฟต์แวร์แอปพลิเคชันฮาร์ดแวร์และระบบปฏิบัติการ[ 2 ] [ 3 ] ไฟล์ PDF ซึ่งใช้ ภาษา PostScriptจะรวบรวมคำอธิบายที่สมบูรณ์ของเอกสารที่มีเค้าโครงคงที่ รวมถึงข้อความแบบอักษรกราฟิกเวกเตอร์รูปภาพแรสเตอร์และข้อมูลอื่นๆ ที่จำเป็นในการแสดงผล

PDF มีต้นกำเนิดมาจาก "โครงการ Camelot" ซึ่งริเริ่มโดยJohn Warnock ผู้ร่วมก่อตั้ง Adobe ในปี 1991 [ 4 ] PDF ได้รับการกำหนดมาตรฐานเป็น ISO 32000 ในปี 2008 [ 5 ]โดยได้รับการดูแลโดย ISO TC 171 SC 2 WG8 ซึ่งสมาคม PDFเป็นผู้จัดการคณะกรรมการ[ 6 ]ฉบับล่าสุดคือ ISO 32000-2:2020 ได้รับการเผยแพร่ในเดือนธันวาคม 2020 [ 7 ]

ไฟล์ PDF อาจมีเนื้อหาหลากหลายนอกเหนือจากข้อความและกราฟิกแบบธรรมดา รวมถึงองค์ประกอบโครงสร้างเชิงตรรกะ องค์ประกอบแบบโต้ตอบ เช่น คำอธิบายประกอบและช่องกรอกข้อมูล เลเยอร์สื่อมัลติมีเดีย(รวมถึงเนื้อหาวิดีโอ) วัตถุสามมิติโดยใช้U3DหรือPRCและรูปแบบข้อมูล อื่นๆ อีกมากมาย ข้อกำหนดของ PDF ยังรองรับการเข้ารหัสและลายเซ็นดิจิทัลการแนบไฟล์ และเมตาเดตาเพื่อรองรับเวิร์กโฟลว์ที่ต้องการคุณสมบัติเหล่านี้

ประวัติศาสตร์

การพัฒนา PDF เริ่มขึ้นในปี 1991 เมื่อJohn Warnockเขียนบทความสำหรับโครงการที่มีชื่อรหัสว่า Camelot ซึ่งเขาเสนอให้สร้าง PostScript เวอร์ชันที่เรียบง่ายกว่าที่เรียกว่า Interchange PostScript (IPS) [ 8 ]แตกต่างจาก PostScript แบบดั้งเดิมซึ่งเน้นการแสดงผลงานพิมพ์ไปยังอุปกรณ์เอาต์พุต IPS จะได้รับการปรับให้เหมาะสมสำหรับการแสดงหน้าต่างๆ บนหน้าจอและแพลตฟอร์มใดๆ ก็ได้[ 8 ]

Adobe ได้เผยแพร่ข้อกำหนด PDF ให้ใช้งานได้ฟรีในปี 1993 [ 9 ]ในช่วงแรก PDF ได้รับความนิยมส่วนใหญ่ใน เวิร์กโฟลว์ การจัดพิมพ์บนเดสก์ท็ อป และแข่งขันกับรูปแบบอื่นๆ อีกหลายรูปแบบ รวมถึงDjVu , Envoy , Common Ground Digital Paper, Farallon Replica และแม้แต่รูปแบบ PostScript ของ Adobe เอง

PDF เป็นรูปแบบที่เป็นกรรมสิทธิ์ซึ่งควบคุมโดย Adobe จนกระทั่งได้รับการเผยแพร่เป็นมาตรฐานเปิดเมื่อวันที่ 1 กรกฎาคม พ.ศ. 2551 และเผยแพร่โดยองค์การมาตรฐานสากลในชื่อ ISO 32000-1:2008 [ 10 ] [ 11 ]ซึ่งในขณะนั้นการควบคุมข้อกำหนดได้ส่งต่อไปยังคณะกรรมการ ISO ที่ประกอบด้วยผู้เชี่ยวชาญในอุตสาหกรรมที่เป็นอาสาสมัคร ในปี พ.ศ. 2551 Adobe ได้เผยแพร่ใบอนุญาตสิทธิบัตรสาธารณะสำหรับ ISO 32000-1 ซึ่งให้สิทธิ์การใช้งานสิทธิบัตรทั้งหมดที่ Adobe เป็นเจ้าของโดยไม่เสียค่าลิขสิทธิ์ ซึ่งจำเป็นต่อการผลิต การใช้งาน การขาย และการแจกจ่ายการใช้งานที่สอดคล้องกับ PDF [ 12 ]

PDF 1.7 ซึ่งเป็นฉบับที่หกของข้อกำหนด PDF ที่กลายเป็น ISO 32000-1 ประกอบด้วยเทคโนโลยีที่เป็นกรรมสิทธิ์บางอย่างที่กำหนดโดย Adobe เช่นAdobe XML Forms Architecture (XFA) และ ส่วนขยาย JavaScriptสำหรับ Acrobat ซึ่ง ISO 32000-1 อ้างอิงว่าเป็นมาตรฐานและขาดไม่ได้สำหรับการใช้งานข้อกำหนด ISO 32000-1 อย่างสมบูรณ์[ 13 ]เทคโนโลยีที่เป็นกรรมสิทธิ์เหล่านี้ไม่ได้ถูกกำหนดมาตรฐาน และข้อกำหนดของเทคโนโลยีเหล่านี้เผยแพร่เฉพาะบนเว็บไซต์ของ Adobe เท่านั้น[ 14 ] [ 15 ] [ 16 ]หลายเทคโนโลยีเหล่านี้ไม่ได้รับการสนับสนุนโดยการใช้งาน PDF ของบุคคลที่สาม

ISO ได้เผยแพร่ PDF เวอร์ชัน 2.0, ISO 32000-2 ในปี 2017 โดยแทนที่ข้อกำหนดที่ Adobe จัดทำไว้[ 17 ]ในเดือนธันวาคม 2020 ได้มีการเผยแพร่ PDF 2.0 ฉบับที่สอง, ISO 32000-2:2020 ซึ่งมีการชี้แจง แก้ไข และปรับปรุงข้อมูลอ้างอิงมาตรฐานที่สำคัญ[ 18 ] ISO 32000-2 ไม่ได้รวมเทคโนโลยีที่เป็นกรรมสิทธิ์ใดๆ ไว้เป็นข้อมูลอ้างอิงมาตรฐาน[ 19 ]ในเดือนเมษายน 2023 สมาคม PDF ได้เปิดให้ดาวน์โหลด ISO 32000-2 ได้ฟรี[ 17 ]

รายละเอียดทางเทคนิค

ไฟล์ PDF มักเป็นการผสมผสานระหว่างกราฟิกแบบเวกเตอร์ข้อความ และกราฟิกแบบบิตแมปประเภทของเนื้อหาพื้นฐานในไฟล์ PDF ได้แก่:

  • ข้อความที่จัดพิมพ์แล้วจะถูกจัดเก็บในรูปแบบสตรีมเนื้อหา (กล่าวคือ ไม่ได้เข้ารหัสในรูปแบบข้อความธรรมดา )
  • กราฟิกเวกเตอร์สำหรับภาพประกอบและการออกแบบที่ประกอบด้วยรูปทรงและเส้น
  • กราฟิกแรสเตอร์สำหรับภาพถ่ายและภาพประเภทอื่นๆ และ
  • วัตถุมัลติมีเดียอื่นๆ

ในเวอร์ชัน PDF รุ่นต่อมา เอกสาร PDF ยังสามารถรองรับลิงก์ (ภายในเอกสารหรือหน้าเว็บ) ฟอร์มJavaScript (ซึ่งในเบื้องต้นมีให้ใช้งานเป็นปลั๊กอินสำหรับ Acrobat 3.0) หรือเนื้อหาฝังตัวประเภทอื่นๆ ที่สามารถจัดการได้โดยใช้ปลั๊กอินได้อีกด้วย

ไฟล์ PDF ผสานรวมเทคโนโลยีสามอย่างเข้าด้วยกัน:

  • เป็นส่วนย่อยที่เทียบเท่ากับภาษาการเขียนโปรแกรมอธิบายหน้า PostScript แต่ในรูปแบบประกาศ สำหรับการสร้างเค้าโครงและกราฟิก
  • ระบบฝัง /แทนที่ฟอนต์เพื่อให้สามารถพกพาฟอนต์ไปพร้อมกับเอกสารได้
  • ระบบจัดเก็บข้อมูลที่มีโครงสร้างเพื่อรวบรวมองค์ประกอบเหล่านี้และเนื้อหาที่เกี่ยวข้องทั้งหมดไว้ในไฟล์เดียว โดยมีการบีบอัดข้อมูลในกรณีที่เหมาะสม

ภาษาโพสต์สคริปต์

PostScriptเป็นภาษาอธิบายหน้าซึ่งทำงานในตัวแปลเพื่อสร้างภาพ[ 8 ]สามารถจัดการกราฟิกได้และมีคุณสมบัติมาตรฐานของภาษาโปรแกรมเช่นการแตกแขนงและการวนซ้ำ [ 8 ] PDFเป็นส่วนย่อยของ PostScript ที่ถูกทำให้ง่ายขึ้นเพื่อลบ คุณสมบัติ การควบคุมการไหล บางอย่างออกไป ในขณะที่คำสั่งกราฟิกยังคงอยู่[ 8 ]

PostScript เดิมทีได้รับการออกแบบมาสำหรับกรณีการใช้งานที่แตกต่างกันอย่างสิ้นเชิง นั่นคือ การส่งงานพิมพ์เชิงเส้นแบบทางเดียว โดยที่ตัวแปล PostScript จะรวบรวมชุดคำสั่งจนกว่าจะพบshowpageคำสั่งที่ต้องการ จากนั้นจึงดำเนินการคำสั่งทั้งหมดเพื่อแสดงผลหน้าเป็นภาพแรสเตอร์ไปยังอุปกรณ์การพิมพ์[ 20 ] PostScript ไม่ได้มีไว้สำหรับการจัดเก็บระยะยาวและการแสดงผลเอกสารอิเล็กทรอนิกส์แบบโต้ตอบแบบเรียลไทม์บนจอภาพคอมพิวเตอร์ ดังนั้นจึงไม่จำเป็นต้องรองรับสิ่งอื่นใดนอกจากการแสดงผลหน้าอย่างต่อเนื่อง[ 20 ]หากมีข้อผิดพลาดในผลลัพธ์การพิมพ์ขั้นสุดท้าย ผู้ใช้จะแก้ไขที่ระดับแอปพลิเคชันและส่งงานพิมพ์ใหม่ในรูปแบบของไฟล์ PostScript ใหม่ทั้งหมด ดังนั้น หน้าใด ๆ ในไฟล์ PostScript จึงสามารถแสดงผลได้อย่างถูกต้องเฉพาะผลลัพธ์สะสมของการดำเนินการคำสั่งก่อนหน้าทั้งหมดเพื่อวาดหน้าก่อนหน้าทั้งหมด ซึ่งคำสั่งใด ๆ ก็ตามอาจส่งผลกระทบต่อหน้าถัดไปรวมถึงคำสั่งในการวาดหน้านั้น ๆ และไม่มีวิธีง่าย ๆ ในการข้ามกระบวนการนั้นเพื่อไปยังหน้าต่าง ๆ[ 20 ]

ตามธรรมเนียมแล้ว การแปลงจาก PostScript เป็น PDF จะใช้ไฟล์ PostScript ต้นฉบับ (นั่นคือ โปรแกรมที่สามารถเรียกใช้งานได้) เป็นพื้นฐานในการสร้างโค้ด PDF ที่คล้ายกับ PostScript (ดูตัวอย่างเช่นAdobe Distiller ) โดยทำผ่านการใช้เทคนิคคอมไพเลอร์มาตรฐาน เช่นการคลายลูป การอินไลน์และการลบสาขาที่ไม่ได้ใช้ ทำให้ได้โค้ดที่เป็นแบบประกาศและคงที่[ 20 ]จากนั้นผลลัพธ์จะถูกบรรจุลงในรูปแบบคอนเทนเนอร์พร้อมกับส่วนประกอบที่จำเป็นทั้งหมดสำหรับการแสดงผลที่ถูกต้อง (ไฟล์ภายนอก กราฟิก หรือฟอนต์ที่เอกสารอ้างถึง) และบีบอัด

ในฐานะรูปแบบเอกสาร PDF มีข้อดีหลายประการเหนือกว่า PostScript:

  • PDF ประกอบด้วยโค้ด PostScript แบบประกาศคงที่เท่านั้นซึ่งสามารถประมวลผลเป็นข้อมูลได้ และไม่จำเป็นต้องใช้ตัวแปล โปรแกรม หรือคอมไพเลอร์ แบบเต็มรูปแบบ [ 20 ]ซึ่งช่วยหลีกเลี่ยงความซับซ้อนและความเสี่ยงด้านความปลอดภัยของเอนจิ้นที่มีระดับความซับซ้อนสูงเช่นนี้
  • เช่นเดียวกับDisplay PostScript , PDF รองรับกราฟิกโปร่งใสมาตั้งแต่เวอร์ชัน 1.4 ในขณะที่ PostScript มาตรฐานไม่รองรับ
  • PDF บังคับใช้กฎที่ว่าโค้ดสำหรับหน้าใดหน้าหนึ่งโดยเฉพาะไม่สามารถส่งผลกระทบต่อหน้าอื่นได้[ 20 ]กฎดังกล่าวได้รับการแนะนำอย่างยิ่งสำหรับโค้ด PostScript เช่นกัน แต่ต้องนำไปใช้อย่างชัดเจน (ดูตัวอย่างเช่นข้อกำหนดโครงสร้างเอกสาร ) เนื่องจาก PostScript เป็นภาษาโปรแกรมเต็มรูปแบบที่อนุญาตให้มีความยืดหยุ่นมากขึ้นและไม่จำกัดเฉพาะแนวคิดของหน้าและเอกสาร
  • ข้อมูลทั้งหมดที่จำเป็นสำหรับการเรนเดอร์จะรวมอยู่ในไฟล์นั้นเอง ซึ่งช่วยเพิ่มความสามารถในการพกพา[ 21 ]

ข้อเสียของมันคือ:

  • สภาพแวดล้อมเดสก์ท็อปมาตรฐานบางครั้งขาดซอฟต์แวร์สำหรับสร้างไฟล์ PDF ในขณะที่แอปพลิเคชันใดๆ ที่สามารถพิมพ์เอกสารได้ก็สามารถบันทึกเป็นไฟล์ PostScript ได้[ 22 ]
  • ไม่ใช่ภาษาโปรแกรมเต็มรูปแบบ และข้อจำกัดใดๆ ที่เกี่ยวข้องกับเรื่องนั้น[ 22 ]
  • ขนาดไฟล์ที่ใหญ่กว่า (บางครั้ง) [ 23 ]

PDF ตั้งแต่เวอร์ชัน 1.6 รองรับการฝังเอกสาร 3 มิติแบบโต้ตอบได้: สามารถฝังภาพวาด 3 มิติโดยใช้U3DหรือPRCและรูปแบบข้อมูลอื่นๆ ได้หลากหลาย[ 24 ] [ 25 ] [ 26 ]

รูปแบบไฟล์

ไฟล์ PDF จะถูกจัดระเบียบโดยใช้ ตัวอักขระ ASCIIยกเว้นองค์ประกอบบางอย่างที่อาจมีเนื้อหาไบนารี[ 27 ]

ไฟล์เริ่มต้นด้วยส่วนหัวที่มีหมายเลขวิเศษ (ในรูปแบบสตริงที่อ่านได้) และเวอร์ชันของรูปแบบ เช่น%PDF-1.7รูปแบบนี้เป็นส่วนย่อยของรูปแบบ COS ("Carousel" Object Structure) [ 28 ]ไฟล์ต้นไม้ COS ประกอบด้วยวัตถุ เป็นหลัก ซึ่งมีอยู่เก้าประเภท: [ 19 ]

  • ค่าบูลีน ซึ่งแทนค่า จริงหรือเท็จ
  • ตัวเลขจริง
  • จำนวนเต็ม
  • สตริงที่อยู่ในวงเล็บ ( (...)) หรือแสดงเป็นเลขฐานสิบหกภายในวงเล็บเหลี่ยมเดี่ยว ( <...>) สตริงอาจมีอักขระ 8 บิต
  • ชื่อที่ขึ้นต้นด้วยเครื่องหมายทับ ( /)
  • อาร์เรย์คือ ชุดของวัตถุที่เรียงลำดับซึ่งอยู่ในวงเล็บเหลี่ยม ( [...])
  • พจนานุกรมคือ ชุดของวัตถุที่จัดทำดัชนีโดยชื่อที่อยู่ภายในวงเล็บเหลี่ยมคู่ ( <<...>>)
  • สตรีม ซึ่งโดยปกติจะประกอบด้วยข้อมูลไบนารีที่บีบอัดได้จำนวนมาก โดยมีพจนานุกรมนำหน้า และอยู่ระหว่างคำหลัก ` streamand` และ ` or`endstream
  • วัตถุว่างเปล่า

%สามารถแทรก ความคิดเห็นโดยใช้ตัวอักษร 8 บิตที่ขึ้นต้นด้วยเครื่องหมายเปอร์เซ็นต์ ( ) ได้

อ็อบเจ็กต์อาจเป็นแบบตรง (ฝังอยู่ในอ็อบเจ็กต์อื่น) หรือแบบไม่ตรงอ็อบเจ็กต์แบบไม่ตรงจะมีหมายเลขกำกับและหมายเลขรุ่นและกำหนดไว้ระหว่าง คำหลัก <object>และ<object> หากอยู่ในรูทของเอกสาร ตั้งแต่ PDF เวอร์ชัน 1.5 เป็นต้นไป อ็อบเจ็กต์แบบไม่ตรง (ยกเว้นสตรีมอื่นๆ) อาจอยู่ในสตรีมพิเศษที่เรียกว่าสตรีมอ็อบเจ็กต์ (มีเครื่องหมาย <object> ) เทคนิคนี้ช่วยให้สามารถใช้ตัวกรองสตรีมมาตรฐานกับอ็อบเจ็กต์ที่ไม่ใช่สตรีมได้ ลดขนาดไฟล์ที่มีอ็อบเจ็กต์แบบไม่ตรงขนาดเล็กจำนวนมาก และมีประโยชน์อย่างยิ่งสำหรับPDF ที่มีแท็ก สตรี มอ็อบเจ็กต์ไม่รองรับการระบุ หมายเลขรุ่นของอ็อบเจ็กต์(นอกเหนือจาก 0) objendobj/Type /ObjStm

ตารางดัชนี หรือที่เรียกว่าตารางอ้างอิงไขว้ จะอยู่ใกล้กับส่วนท้ายของไฟล์ และให้ค่าออฟเซ็ตไบต์ของแต่ละออบเจ็กต์ทางอ้อมจากจุดเริ่มต้นของไฟล์[ 29 ]การออกแบบนี้ช่วยให้สามารถเข้าถึงออบเจ็กต์ในไฟล์ได้อย่างมีประสิทธิภาพแบบสุ่มและยังช่วยให้สามารถทำการเปลี่ยนแปลงเล็กน้อยได้โดยไม่ต้องเขียนไฟล์ใหม่ทั้งหมด ( การอัปเดตแบบเพิ่มทีละน้อย ) ก่อน PDF เวอร์ชัน 1.5 ตารางจะอยู่ในรูปแบบ ASCII พิเศษเสมอ ทำเครื่องหมายด้วยxrefคำหลัก และตามหลังเนื้อหาหลักที่ประกอบด้วยออบเจ็กต์ทางอ้อม เวอร์ชัน 1.5 ได้แนะนำสตรีมอ้างอิงไขว้ แบบเลือกได้ ซึ่งมีรูปแบบเป็นออบเจ็กต์สตรีมมาตรฐาน อาจมีการใช้ตัวกรอง สตรีมดังกล่าวอาจใช้แทนตารางอ้างอิงไขว้ ASCII และมีค่าออฟเซ็ตและข้อมูลอื่นๆ ในรูปแบบไบนารี รูปแบบนี้มีความยืดหยุ่นตรงที่อนุญาตให้ระบุความกว้างเป็นจำนวนเต็ม (โดยใช้/Wอาร์เรย์) ดังนั้น ตัวอย่างเช่น เอกสาร  ที่มีขนาด ไม่เกิน 64 KiB อาจใช้เพียง 2 ไบต์สำหรับค่าออฟเซ็ตของออบเจ็กต์ เพื่อให้มั่นใจถึงความเข้ากันได้กับเวอร์ชันก่อนหน้า ไฟล์ PDF อ้างอิงแบบไฮบริดอาจมีทั้งตารางอ้างอิงไขว้แบบดั้งเดิมและสตรีมอ้างอิงไขว้ ทำให้โปรแกรมประมวลผล PDF รุ่นเก่าสามารถอ่านไฟล์ได้ ในขณะเดียวกันก็ยังคงใช้ประโยชน์จากคุณสมบัติใหม่ที่นำเสนอในเวอร์ชัน 1.5 ได้[ 30 ]

ส่วนท้ายของไฟล์ PDF จะมีข้อมูลดังต่อไปนี้

  • คำstartxrefหลัก ตามด้วยค่าออฟเซ็ตไปยังจุดเริ่มต้นของตารางอ้างอิงไขว้ (เริ่มต้นด้วยxrefคำหลัก) หรือออบเจ็กต์สตรีมอ้างอิงไขว้ ตามด้วย
  • เครื่องหมายสิ้นสุด%%EOFไฟล์

หากไม่ได้ใช้สตรีมอ้างอิงไขว้ ส่วนท้ายจะนำหน้าด้วยtrailerคำหลัก ตามด้วยพจนานุกรมที่มีข้อมูลที่โดยปกติแล้วจะอยู่ในพจนานุกรมของออบเจ็กต์สตรีมอ้างอิงไขว้:

  • การอ้างอิงถึงวัตถุรากของโครงสร้างต้นไม้ หรือที่รู้จักกันในชื่อแคตตาล็อก ( /Root)
  • จำนวนวัตถุทางอ้อมในตารางอ้างอิงไขว้ ( /Size)
  • ข้อมูลเพิ่มเติมอื่นๆ (ไม่บังคับ)

ภายในแต่ละหน้าจะมีสตรีมเนื้อหาหนึ่งหรือหลายสตรีมที่อธิบายข้อความ เวกเตอร์ และรูปภาพที่วาดบนหน้านั้น สตรีมเนื้อหาเป็นแบบเรียงซ้อนคล้ายกับ PostScript [ 31 ]

ไฟล์ PDF มีสองรูปแบบ ได้แก่ แบบไม่เชิงเส้น (ไม่ใช่ "แบบปรับให้เหมาะสม") และแบบเชิงเส้น ("แบบปรับให้เหมาะสม") ไฟล์ PDF แบบไม่เชิงเส้นอาจมีขนาดเล็กกว่าไฟล์แบบเชิงเส้น แต่จะเข้าถึงได้ช้ากว่าเนื่องจากส่วนของข้อมูลที่จำเป็นในการประกอบหน้าเอกสารกระจัดกระจายอยู่ทั่วไฟล์ PDF ไฟล์ PDF แบบเชิงเส้น (เรียกอีกอย่างว่าไฟล์ PDF แบบ "ปรับให้เหมาะสม" หรือ "ปรับให้เหมาะสมสำหรับเว็บ") ถูกสร้างขึ้นในลักษณะที่ทำให้สามารถอ่านได้ในปลั๊กอินของเว็บเบราว์เซอร์โดยไม่ต้องรอให้ดาวน์โหลดไฟล์ทั้งหมด เนื่องจากวัตถุทั้งหมดที่จำเป็นสำหรับการแสดงหน้าแรกได้รับการจัดระเบียบอย่างเหมาะสมที่จุดเริ่มต้นของไฟล์[ 32 ]ไฟล์ PDF อาจได้รับการปรับให้เหมาะสมโดยใช้ซอฟต์แวร์Adobe Acrobatหรือ QPDF

ขนาดหน้ากระดาษไม่ได้ถูกจำกัดด้วยรูปแบบเอง อย่างไรก็ตาม Adobe Acrobat กำหนดขีดจำกัดไว้ที่ 15 ล้านคูณ 15 ล้านนิ้ว หรือ 225,000,000,000,000 ตารางนิ้ว (145,161 ตารางกิโลเมตร; 56,047 ตารางไมล์) [ 2 ] : 1129

แบบจำลองการถ่ายภาพ

รูปแบบพื้นฐานของการแสดงผลกราฟิกในไฟล์ PDF นั้นคล้ายคลึงกับ PostScript มาก ยกเว้นการใช้งานความโปร่งใส ซึ่งถูกเพิ่มเข้ามาใน PDF เวอร์ชัน 1.4

กราฟิกในไฟล์ PDF ใช้ระบบพิกัดคาร์ทีเซียนที่ไม่ขึ้นกับอุปกรณ์ ในการอธิบายพื้นผิวของหน้ากระดาษ คำอธิบายหน้ากระดาษในไฟล์ PDF สามารถใช้เมทริกซ์ในการปรับขนาดหมุนหรือบิดเบี้ยว องค์ประกอบกราฟิก ได้แนวคิดสำคัญในไฟล์ PDF คือ สถานะของกราฟิกซึ่งเป็นชุดของพารามิเตอร์กราฟิกที่สามารถเปลี่ยนแปลง บันทึก และเรียกคืนได้โดยคำอธิบายหน้ากระดาษไฟล์ PDF มีคุณสมบัติสถานะของกราฟิก (ณ เวอร์ชัน 2.0) จำนวน 25 รายการ ซึ่งบางส่วนที่สำคัญที่สุด ได้แก่:

กราฟิกเวกเตอร์

เช่นเดียวกับใน PostScript กราฟิกเวกเตอร์ใน PDF สร้างขึ้นด้วยเส้นทางเส้นทางมักประกอบด้วยเส้นตรงและเส้นโค้ง Bézier แบบลูกบาศก์ แต่ก็สามารถสร้างจากโครงร่างของข้อความได้เช่นกัน แตกต่างจาก PostScript ตรงที่ PDF ไม่อนุญาตให้เส้นทางเดียวผสมโครงร่างข้อความกับเส้นตรงและเส้นโค้ง เส้นทางสามารถวาดเส้นขอบ เติมสี เติมสีแล้ววาดเส้นขอบ หรือใช้สำหรับการตัดได้เส้นขอบและการเติมสีสามารถใช้สีใดก็ได้ที่กำหนดไว้ในสถานะกราฟิก รวมถึงลวดลาย PDF รองรับลวดลายหลายประเภท ลวดลายที่ง่ายที่สุดคือลวดลายแบบเรียงต่อกัน ซึ่งระบุชิ้นงานศิลปะที่จะวาดซ้ำๆ อาจเป็นลวดลายแบบเรียงต่อกันที่มีสีโดยระบุสีไว้ในวัตถุลวดลาย หรือลวดลายแบบเรียงต่อกันที่ไม่มีสีซึ่งจะกำหนดสีเมื่อวาดลวดลายเสร็จแล้ว ตั้งแต่ PDF เวอร์ชัน 1.3 เป็นต้นไป ยังมีลวดลายการแรเงาซึ่งจะวาดสีที่เปลี่ยนแปลงอย่างต่อเนื่อง มีลวดลายการแรเงาเจ็ดประเภท ซึ่งประเภทที่ง่ายที่สุดคือการแรเงาตามแกน (ประเภทที่ 2) และการแรเงาตามรัศมี (ประเภทที่ 3)

ภาพแรสเตอร์

ภาพแรสเตอร์ในไฟล์ PDF (เรียกว่าImage XObjects ) จะถูกแสดงด้วยพจนานุกรมที่มีสตรีมที่เกี่ยวข้อง พจนานุกรมจะอธิบายคุณสมบัติของภาพ และสตรีมจะประกอบด้วยข้อมูลภาพ (ในบางกรณี ภาพแรสเตอร์ขนาดเล็กอาจถูกฝังโดยตรงในคำอธิบายหน้าเป็นภาพแบบอินไลน์ ) โดยทั่วไปแล้ว ภาพจะถูกกรองเพื่อวัตถุประสงค์ในการบีบอัด ตัวกรองภาพที่รองรับใน PDF ได้แก่ ตัวกรองอเนกประสงค์ต่อไปนี้:

  • ASCII85Decodeเป็นตัวกรองที่ใช้แปลงสตรีมให้เป็น ASCII 7 บิต
  • ASCIIHexDecodeคล้ายกับ ASCII85Decode แต่มีขนาดกะทัดรัดน้อยกว่า
  • FlateDecodeเป็นตัวกรองที่ใช้กันทั่วไปโดยอิงตาม อัลกอริทึม deflateที่กำหนดไว้ในRFC  1951 (deflate ยังใช้ใน รูปแบบไฟล์ gzip , PNGและzipเป็นต้น) ซึ่งถูกนำมาใช้ใน PDF 1.2 โดยสามารถใช้ฟังก์ชันตัวทำนายสองกลุ่มสำหรับการบีบอัด zlib/deflate ที่กระชับยิ่งขึ้น ได้แก่ตัวทำนาย 2จาก ข้อกำหนด TIFF 6.0 และตัวทำนาย (ตัวกรอง) จาก ข้อกำหนด PNG ( RFC 2083 ) 
  • LZWDecodeเป็นตัวกรองที่ใช้ การบีบอัดแบบ LZWโดยสามารถใช้ฟังก์ชันตัวทำนายได้สองกลุ่มสำหรับการบีบอัด LZW ที่กระชับยิ่งขึ้น ได้แก่ตัวทำนาย 2จากข้อกำหนด TIFF 6.0 และตัวทำนาย (ตัวกรอง) จากข้อกำหนด PNG
  • RunLengthDecodeเป็นวิธีการบีบอัดข้อมูลแบบง่ายสำหรับสตรีมที่มีข้อมูลซ้ำซ้อน โดยใช้ อัลกอริธึม การเข้ารหัสแบบ Run-Lengthและตัวกรองเฉพาะสำหรับแต่ละภาพ
  • DCTDecodeเป็น ตัวกรอง แบบสูญเสียข้อมูลที่ใช้มาตรฐานJPEG เป็นพื้นฐาน
  • CCITTFaxDecode เป็นตัวกรอง แบบสองระดับ (ขาวดำ) ที่ไม่สูญเสียข้อมูล โดยอิงตามมาตรฐานการบีบ อัดแฟกซ์CCITT (ITU-T) กลุ่ม 3 หรือ กลุ่ม 4 ที่กำหนดไว้ใน ITU-T T.4และ T.6
  • JBIG2Decodeเป็นตัวกรองแบบสองระดับ (ขาวดำ) ที่มีการสูญเสียข้อมูลหรือไม่สูญเสียข้อมูล โดยอิงตามมาตรฐาน JBIG2ซึ่งถูกนำมาใช้ใน PDF 1.4 และ
  • JPXDecodeเป็นตัวกรองแบบสูญเสียข้อมูลหรือไม่สูญเสียข้อมูลโดยอิงตาม มาตรฐาน JPEG 2000ซึ่งถูกนำมาใช้ใน PDF 1.5

โดยปกติแล้ว เนื้อหาภาพทั้งหมดในไฟล์ PDF จะถูกฝังอยู่ในไฟล์ แต่ PDF อนุญาตให้จัดเก็บข้อมูลภาพไว้ในไฟล์ภายนอกได้โดยใช้สตรีมภายนอกหรือภาพทางเลือก (Alternate Images ) อย่างไรก็ตาม มาตรฐานย่อยของ PDF เช่นPDF/AและPDF/Xห้ามใช้คุณสมบัติเหล่านี้

ข้อความ

ข้อความในไฟล์ PDF จะถูกแสดงด้วยองค์ประกอบข้อความในสตรีมเนื้อหาของหน้า องค์ประกอบข้อความจะระบุว่าควรวาดอักขระ ที่ตำแหน่งใด อักขระเหล่านั้นจะถูกระบุโดยใช้ การเข้ารหัสของทรัพยากรฟอนต์ที่ เลือกไว้

อ็อบเจ็กต์ฟอนต์ในไฟล์ PDF คือคำอธิบายของแบบอักษร ดิจิทัล อาจเป็นการอธิบายลักษณะเฉพาะของแบบอักษร หรืออาจมีไฟล์ฟอนต์ ฝังอยู่ กรณีหลังเรียกว่าฟอนต์ฝังตัวส่วนกรณีแรกเรียกว่าฟอนต์ไม่ฝังตัวไฟล์ฟอนต์ที่สามารถฝังได้นั้นอิงตามรูปแบบฟอนต์ดิจิทัลมาตรฐานที่ใช้กันอย่างแพร่หลาย ได้แก่Type 1 (และรูปแบบบีบอัด CFF), TrueTypeและ (เริ่มตั้งแต่ PDF 1.6) OpenTypeนอกจากนี้ PDF ยังรองรับรูปแบบ Type 3 ซึ่งส่วนประกอบของฟอนต์จะถูกอธิบายโดยตัวดำเนินการกราฟิกของ PDF

แบบอักษร 14 แบบ ซึ่งรู้จักกันในชื่อแบบอักษรมาตรฐาน 14 แบบหรือแบบอักษรพื้นฐาน 14 แบบ [ 33 ]มีความสำคัญเป็นพิเศษในเอกสาร PDF:

แบบอักษรเหล่านี้ หรือแบบอักษรทดแทนที่เหมาะสมที่มีเมตริกเดียวกัน ควรมีอยู่ในโปรแกรมอ่าน PDF ส่วนใหญ่ แต่ไม่รับประกันว่าจะมีอยู่ในโปรแกรมอ่าน และอาจแสดงผลได้อย่างถูกต้องก็ต่อเมื่อระบบมีการติดตั้งแบบอักษรเหล่านั้นไว้[ 34 ]อาจมีการแทนที่แบบอักษรหากไม่ได้ฝังอยู่ใน PDF

ภายในสตริงข้อความ อักขระจะแสดงโดยใช้รหัสอักขระ (จำนวนเต็ม) ที่แมปกับสัญลักษณ์ในฟอนต์ปัจจุบันโดยใช้การเข้ารหัสมีการเข้ารหัสที่กำหนดไว้ล่วงหน้าหลายแบบ รวมถึงWinAnsi , MacRomanและการเข้ารหัสมากมายสำหรับภาษาเอเชียตะวันออก และฟอนต์สามารถมีการเข้ารหัสในตัวของตัวเองได้ (แม้ว่าการเข้ารหัส WinAnsi และ MacRoman จะได้มาจากคุณสมบัติทางประวัติศาสตร์ของ ระบบปฏิบัติการ WindowsและMacintoshแต่ฟอนต์ที่ใช้การเข้ารหัสเหล่านี้ก็ทำงานได้ดีเท่าเทียมกันบนทุกแพลตฟอร์ม) PDF สามารถระบุการเข้ารหัสที่กำหนดไว้ล่วงหน้าที่จะใช้ การเข้ารหัสในตัวของฟอนต์ หรือจัดเตรียมตารางค้นหาความแตกต่างกับการเข้ารหัสที่กำหนดไว้ล่วงหน้าหรือการเข้ารหัสในตัว (ไม่แนะนำสำหรับฟอนต์ TrueType) [ 2 ]กลไกการเข้ารหัสใน PDF ได้รับการออกแบบมาสำหรับฟอนต์ Type 1 และกฎสำหรับการนำไปใช้กับฟอนต์ TrueType นั้นซับซ้อน

สำหรับแบบอักษรขนาดใหญ่หรือแบบอักษรที่มีสัญลักษณ์ที่ไม่เป็นมาตรฐาน จะใช้การเข้ารหัสพิเศษIdentity-H (สำหรับการเขียนแนวนอน) และIdentity-V (สำหรับการเขียนแนวตั้ง) ในกรณีที่ต้องการรักษาข้อมูลความหมายเกี่ยวกับตัวอักษร ไว้ จำเป็นต้องมี ตาราง ToUnicode ด้วย

เอกสารข้อความที่ถูกสแกนเป็นไฟล์ PDF โดยที่ข้อความนั้นไม่ได้รับการจดจำด้วยระบบรู้จำอักษรด้วยแสง (OCR) จะได้มาเป็นเพียงรูปภาพที่ไม่มีแบบอักษรหรือคุณสมบัติของข้อความใดๆ

ความโปร่งใส

รูปแบบการสร้างภาพดั้งเดิมของ PDF นั้นทึบแสงคล้ายกับ PostScript ซึ่งวัตถุแต่ละชิ้นที่วาดลงบนหน้ากระดาษจะแทนที่วัตถุใดๆ ที่ถูกทำเครื่องหมายไว้ก่อนหน้านี้ในตำแหน่งเดียวกันโดยสมบูรณ์ ใน PDF 1.4 รูปแบบการสร้างภาพได้รับการขยายให้สามารถแสดงความโปร่งใสได้ เมื่อใช้ความโปร่งใส วัตถุใหม่จะโต้ตอบกับวัตถุที่ถูกทำเครื่องหมายไว้ก่อนหน้านี้เพื่อสร้างเอฟเฟกต์การผสมผสาน การเพิ่มความโปร่งใสให้กับ PDF ทำได้โดยใช้ส่วนขยายใหม่ที่ออกแบบมาให้ถูกละเลยในผลิตภัณฑ์ที่เขียนตามข้อกำหนด PDF 1.3 และรุ่นก่อนหน้า ส่งผลให้ไฟล์ที่ใช้ความโปร่งใสเพียงเล็กน้อยอาจแสดงผลได้อย่างถูกต้องโดยโปรแกรมดูไฟล์รุ่นเก่า แต่ไฟล์ที่ใช้ความโปร่งใสอย่างกว้างขวางอาจแสดงผลไม่ถูกต้องโดยโปรแกรมดูไฟล์รุ่นเก่า

ส่วนขยายความโปร่งใสมีพื้นฐานมาจากแนวคิดหลักของกลุ่มความโปร่งใสโหมดการผสมรูปร่างและอัลฟาโมเดลนี้สอดคล้องกับคุณสมบัติของAdobe Illustratorเวอร์ชัน 9 อย่างใกล้ชิด โหมดการผสมมีพื้นฐานมาจากโหมดที่Adobe Photoshop ใช้ ในขณะนั้น เมื่อมีการเผยแพร่ข้อกำหนด PDF 1.4 สูตรสำหรับการคำนวณโหมดการผสมถูกเก็บเป็นความลับโดย Adobe แต่ต่อมาได้มีการเผยแพร่แล้ว[ 35 ]

แนวคิดเรื่องกลุ่มความโปร่งใสในข้อกำหนดของไฟล์ PDF นั้นเป็นอิสระจากแนวคิดเรื่อง "กลุ่ม" หรือ "เลเยอร์" ที่มีอยู่แล้วในแอปพลิเคชันต่างๆ เช่น Adobe Illustrator การจัดกลุ่มเหล่านั้นสะท้อนถึงความสัมพันธ์เชิงตรรกะระหว่างวัตถุต่างๆ ซึ่งมีความหมายเมื่อทำการแก้ไขวัตถุเหล่านั้น แต่ไม่ได้เป็นส่วนหนึ่งของแบบจำลองการสร้างภาพ

คุณสมบัติเพิ่มเติม

โครงสร้างเชิงตรรกะและการเข้าถึง

PDF ที่มีแท็ก (ดูข้อ 14.8 ใน ISO 32000) ประกอบด้วยข้อมูลโครงสร้างเอกสารและข้อมูลความหมายเพื่อให้สามารถแยกข้อความและเข้าถึงได้อย่าง น่าเชื่อถือ [ 36 ]ในทางเทคนิคแล้ว PDF ที่มีแท็กเป็นการใช้งานรูปแบบที่มีสไตล์ซึ่งสร้างขึ้นจากกรอบโครงสร้างเชิงตรรกะที่แนะนำใน PDF 1.3 PDF ที่มีแท็กกำหนดชุดของประเภทโครงสร้างมาตรฐานและคุณลักษณะที่อนุญาตให้แยกเนื้อหาหน้า (ข้อความ กราฟิก และรูปภาพ) และนำกลับมาใช้ใหม่เพื่อวัตถุประสงค์อื่นได้[ 37 ]

ไม่จำเป็นต้องใช้ PDF ที่มีแท็กในกรณีที่ไฟล์ PDF มีไว้สำหรับการพิมพ์เท่านั้น เนื่องจากคุณสมบัตินี้เป็นทางเลือก และเนื่องจากกฎสำหรับ PDF ที่มีแท็กค่อนข้างคลุมเครือใน ISO 32000-1 การสนับสนุน PDF ที่มีแท็กในอุปกรณ์ที่ใช้งาน รวมถึงเทคโนโลยีช่วยเหลือ (AT) จึงไม่สม่ำเสมอ ณ ปี 2021 [ 38 ]อย่างไรก็ตาม ISO 32000-2 มีการอภิปรายเกี่ยวกับ PDF ที่มีแท็กที่ดีขึ้น ซึ่งคาดว่าจะช่วยอำนวยความสะดวกในการนำไปใช้มากขึ้น

PDF/UAซึ่งเป็นรูปแบบย่อยของ PDF ที่ได้รับการกำหนดมาตรฐานโดย ISO และมุ่งเน้นด้านการเข้าถึงโดยเฉพาะ ได้รับการเผยแพร่ครั้งแรกในปี 2012

กลุ่มเนื้อหาเสริม (เลเยอร์)

การเปิดตัว PDF เวอร์ชัน 1.5 (ปี 2003) นำมาซึ่งแนวคิดเรื่องเลเยอร์ เลเยอร์ หรือที่เรียกอย่างเป็นทางการว่า กลุ่มเนื้อหาเสริม (Optional Content Groups หรือ OCGs) หมายถึงส่วนของเนื้อหาในเอกสาร PDF ที่ผู้สร้างหรือผู้ดูเอกสารสามารถเลือกดูหรือซ่อนได้ ความสามารถนี้มีประโยชน์ในแบบร่าง CAD งานศิลปะแบบหลายเลเยอร์ แผนที่ เอกสารหลายภาษา เป็นต้น

โดยพื้นฐานแล้ว ประกอบด้วยพจนานุกรมคุณสมบัติเนื้อหาเสริม (Optional Content Properties Dictionary) ที่เพิ่มเข้าไปในรูทของเอกสาร พจนานุกรมนี้มีอาร์เรย์ของกลุ่มเนื้อหาเสริม (Optional Content Groups หรือ OCGs) แต่ละกลุ่มอธิบายชุดข้อมูล และแต่ละกลุ่มสามารถแสดงหรือซ่อนได้ นอกจากนี้ยังมีชุดพจนานุกรมการกำหนดค่าเนื้อหาเสริม (Optional Content Configuration Dictionaries) ซึ่งระบุสถานะ (แสดงหรือซ่อน) ของ OCGs ที่กำหนดไว้

การเข้ารหัสและลายเซ็น

ไฟล์ PDF อาจถูกเข้ารหัสเพื่อความปลอดภัย ซึ่งในกรณีนี้จำเป็นต้องใช้รหัสผ่านเพื่อดูหรือแก้ไขเนื้อหา PDF 2.0 กำหนดให้การเข้ารหัส AES 256 บิต เป็นมาตรฐานสำหรับไฟล์ PDF 2.0 นอกจากนี้ เอกสารอ้างอิง PDF ยังกำหนดวิธีการที่บุคคลที่สามสามารถกำหนดระบบการเข้ารหัสของตนเองสำหรับไฟล์ PDF ได้อีกด้วย

ไฟล์ PDF อาจมีการลงลายมือชื่อดิจิทัล เพื่อให้การตรวจสอบความถูกต้องมีความปลอดภัย รายละเอียดทั้งหมดเกี่ยวกับการใช้งานลายมือชื่อดิจิทัลในไฟล์ PDF มีอยู่ในมาตรฐาน ISO 32000-2

ไฟล์ PDF อาจมี ข้อจำกัด DRM ฝังอยู่ภายใน ซึ่งให้การควบคุมเพิ่มเติมเพื่อจำกัดการคัดลอก การแก้ไข หรือการพิมพ์ ข้อจำกัดเหล่านี้ขึ้นอยู่กับซอฟต์แวร์ที่ใช้อ่านไฟล์ว่าจะปฏิบัติตามหรือไม่ ดังนั้นความปลอดภัยที่ได้รับจึงมีจำกัด

ระบบรักษาความปลอดภัยมาตรฐานที่ PDF จัดให้ประกอบด้วยสองวิธีที่แตกต่างกันและรหัสผ่านสองแบบ: รหัสผ่านผู้ใช้ซึ่งเข้ารหัสไฟล์และป้องกันการเปิด และรหัสผ่านเจ้าของซึ่งระบุการดำเนินการที่ควรถูกจำกัดแม้เมื่อถอดรหัสเอกสารแล้ว ซึ่งอาจรวมถึงการแก้ไข การพิมพ์ หรือการคัดลอกข้อความและกราฟิกออกจากเอกสาร หรือการเพิ่มหรือแก้ไขบันทึกข้อความและ ฟิลด์ AcroFormรหัสผ่านผู้ใช้จะเข้ารหัสไฟล์ ในขณะที่รหัสผ่านเจ้าของไม่ได้เข้ารหัสไฟล์ แต่จะขึ้นอยู่กับซอฟต์แวร์ไคลเอ็นต์ในการเคารพข้อจำกัดเหล่านี้ รหัสผ่านเจ้าของสามารถลบออกได้ง่ายโดยซอฟต์แวร์ รวมถึงบริการออนไลน์ฟรีบางอย่าง[ 39 ]ดังนั้น ข้อจำกัดการใช้งานที่ผู้เขียนเอกสารกำหนดไว้ในเอกสาร PDF จึงไม่ปลอดภัย และไม่สามารถรับประกันได้เมื่อไฟล์ถูกเผยแพร่ คำเตือนนี้จะแสดงขึ้นเมื่อใช้ข้อจำกัดดังกล่าวโดยใช้ซอฟต์แวร์ Adobe Acrobat เพื่อสร้างหรือแก้ไขไฟล์ PDF

แม้ว่าจะไม่ได้ลบรหัสผ่านออก โปรแกรมอ่าน PDF ฟรีแวร์หรือโอเพนซอร์สส่วนใหญ่จะไม่สนใจ "การป้องกัน" สิทธิ์อนุญาต และอนุญาตให้ผู้ใช้พิมพ์หรือทำสำเนาข้อความบางส่วนได้ราวกับว่าเอกสารนั้นไม่ได้ถูกจำกัดด้วยการป้องกันด้วยรหัสผ่าน[ 40 ] [ 41 ] [ 42 ]

ตั้งแต่ PDF 1.5 เป็นต้นไป ลายเซ็นสิทธิ์การใช้งาน (UR) จะถูกใช้เพื่อเปิดใช้งานคุณสมบัติเชิงโต้ตอบเพิ่มเติมที่ไม่มีให้ใช้งานโดยค่าเริ่มต้นในแอปพลิเคชันดู PDF เฉพาะ ลายเซ็นนี้ใช้เพื่อตรวจสอบว่าได้รับอนุญาตจาก หน่วยงานที่ให้ สิทธิ์โดยสุจริตตัวอย่างเช่น สามารถใช้เพื่ออนุญาตให้ผู้ใช้: [ 43 ]

  • เพื่อบันทึกเอกสาร PDF พร้อมกับแบบฟอร์มที่แก้ไขแล้วหรือข้อมูลคำอธิบายประกอบ
  • นำเข้าไฟล์ข้อมูลแบบฟอร์มในรูปแบบ FDF, XFDF และข้อความ (CSV/TSV)
  • ส่งออกไฟล์ข้อมูลแบบฟอร์มในรูปแบบ FDF และ XFDF
  • ส่งข้อมูลแบบฟอร์ม
  • สร้างหน้าเว็บใหม่จากเทมเพลตหน้าเว็บที่กำหนดชื่อไว้
  • ใช้ลายเซ็นดิจิทัลกับช่องกรอกลายเซ็นดิจิทัลที่มีอยู่แล้ว
  • สร้าง ลบ แก้ไข คัดลอก นำเข้า และส่งออกคำอธิบายประกอบ

ตัวอย่างเช่น Adobe Systems อนุญาตให้เปิดใช้งานคุณสมบัติเพิ่มเติมใน Adobe Reader โดยใช้การเข้ารหัสแบบกุญแจสาธารณะ Adobe Reader ตรวจสอบว่าลายเซ็นใช้ใบรับรองจากหน่วยงานออกใบรับรองที่ได้รับอนุญาตจาก Adobe แอปพลิเคชัน PDF ใดๆ ก็สามารถใช้กลไกเดียวกันนี้เพื่อวัตถุประสงค์ของตนเองได้[ 43 ]

ภายใต้สถานการณ์เฉพาะ รวมถึงระบบของผู้รับที่ไม่ได้แก้ไขข้อมูลที่ผู้รับ เอกสาร ที่ลงนามแบบดิจิทัลเห็นอาจถูกผู้ส่งจัดการหลังจากที่ผู้ลงนามได้ลงนามในเอกสารแล้ว[ 44 ]

PAdES ( PDF Advanced Electronic Signatures ) คือชุดข้อจำกัดและส่วนขยายสำหรับ PDF และ ISO 32000-1 [ 45 ]ทำให้เหมาะสมสำหรับลายเซ็นอิเล็กทรอนิกส์ขั้นสูงETSIได้เผยแพร่สิ่งนี้เป็น TS 102 778 [ 46 ]

ไฟล์แนบ

ไฟล์ PDF สามารถมีไฟล์แนบซึ่งโปรเซสเซอร์สามารถเข้าถึงและเปิดหรือบันทึกไปยังระบบไฟล์ในเครื่องได้[ 47 ]

เมตาเดตา

ไฟล์ PDF สามารถมีข้อมูลเมตาได้สองประเภท[ 2 ]ประเภทแรกคือพจนานุกรมข้อมูลเอกสาร ซึ่งเป็นชุดฟิลด์คีย์/ค่า เช่น ผู้เขียน ชื่อเรื่อง หัวข้อ วันที่สร้างและวันที่อัปเดต ข้อมูลนี้เป็นทางเลือกและอ้างอิงจากInfoคีย์ในส่วนท้ายของไฟล์ มีการกำหนดฟิลด์จำนวนเล็กน้อยและสามารถขยายด้วยค่าข้อความเพิ่มเติมได้หากจำเป็น วิธีนี้ถูกยกเลิกใน PDF 2.0

ใน PDF 1.4 ได้เพิ่มการรองรับ Metadata Streams โดยใช้Extensible Metadata Platform (XMP) เพื่อเพิ่มเมตาเดตาแบบขยายได้ตามมาตรฐาน XML เช่นเดียวกับที่ใช้ในรูปแบบไฟล์อื่นๆ ส่วน PDF 2.0 อนุญาตให้แนบเมตาเดตาเข้ากับวัตถุใดๆ ในเอกสารได้ เช่น ข้อมูลเกี่ยวกับภาพประกอบ ฟอนต์ และรูปภาพที่ฝังอยู่ รวมถึงเอกสารทั้งหมด (โดยแนบไปกับแคตตาล็อกเอกสาร) โดยใช้สคีมาแบบขยายได้

เอกสาร PDF ยังสามารถมีการตั้งค่าการแสดงผล รวมถึงเค้าโครงหน้าและการซูมในออบเจ็กต์การตั้งค่าโปรแกรมดู Adobe Reader ใช้การตั้งค่าเหล่านี้เพื่อแทนที่การตั้งค่าเริ่มต้นของผู้ใช้เมื่อเปิดเอกสาร[ 48 ] Adobe Reader เวอร์ชันฟรีไม่สามารถลบการตั้งค่าเหล่านี้ได้

การเข้าถึง

ไฟล์ PDF สามารถสร้างขึ้นโดยเฉพาะเพื่อให้ผู้พิการสามารถเข้าถึงได้[ 49 ] [ 50 ] [ 51 ] [ 52 ] [ 53 ]รูปแบบไฟล์ PDF ที่ใช้ในปี 2014 สามารถรวมแท็ก ข้อความเทียบเท่า คำบรรยาย คำอธิบายเสียง และอื่นๆ ได้ ซอฟต์แวร์บางตัวสามารถสร้างPDF ที่มีแท็ก โดยอัตโนมัติ แต่คุณสมบัตินี้ไม่ได้เปิดใช้งานโดยค่าเริ่มต้นเสมอไป[ 54 ] [ 55 ]โปรแกรมอ่านหน้าจอชั้นนำเช่นJAWS , Window-Eyes , Hal และKurzweil 1000 และ 3000สามารถอ่าน PDF ที่มีแท็กได้[ 56 ] [ 57 ]นอกจากนี้ PDF ที่มีแท็กยังสามารถจัดเรียงใหม่และขยายขนาดสำหรับผู้อ่านที่มีความบกพร่องทางสายตา การเพิ่มแท็กให้กับ PDF เก่าและ PDF ที่สร้างจากเอกสารที่สแกนอาจก่อให้เกิดความท้าทายบางประการ

หนึ่งในความท้าทายที่สำคัญเกี่ยวกับการเข้าถึงไฟล์ PDF คือ เอกสาร PDF มีมุมมองที่แตกต่างกันสามแบบ ซึ่งอาจไม่สอดคล้องกัน ขึ้นอยู่กับการสร้างเอกสาร มุมมองทั้งสามแบบ ได้แก่ (i) มุมมองทางกายภาพ (ii) มุมมองแท็ก และ (iii) มุมมองเนื้อหา มุมมองทางกายภาพคือมุมมองที่แสดงและพิมพ์ (สิ่งที่คนส่วนใหญ่คิดว่าเป็นเอกสาร PDF) มุมมองแท็กคือสิ่งที่โปรแกรมอ่านหน้าจอและเทคโนโลยีช่วยเหลืออื่นๆ ใช้เพื่อให้การนำทางและประสบการณ์การอ่านที่มีคุณภาพสูงแก่ผู้ใช้ที่มีความพิการ มุมมองเนื้อหาขึ้นอยู่กับลำดับทางกายภาพของวัตถุภายในกระแสเนื้อหาของ PDF และอาจแสดงผลโดยซอฟต์แวร์ที่ไม่รองรับมุมมองแท็กอย่างเต็มที่ เช่น คุณสมบัติ Reflow ใน Adobe Reader

PDF/UAซึ่งเป็นมาตรฐานสากลสำหรับ PDF ที่เข้าถึงได้โดยอิงตาม ISO 32000-1 ได้รับการเผยแพร่ครั้งแรกในชื่อ ISO 14289–1 ในปี 2012 และกำหนดภาษาเชิงบรรทัดฐานสำหรับเทคโนโลยี PDF ที่เข้าถึงได้ PDF/UA กล่าวถึงการเข้าถึงได้ของรูปแบบ PDF โดยนำแนวคิดเบื้องหลัง WCAG 2.0 มาใช้เพื่อกำหนดกฎการเข้าถึงเฉพาะสำหรับ PDF [ 58 ]

มัลติมีเดีย

ไฟล์ PDF ที่มีเนื้อหาแบบโต้ตอบ (Rich Media PDF)คือไฟล์ PDF ที่มีเนื้อหาแบบโต้ตอบซึ่งสามารถฝังหรือเชื่อมโยงภายในไฟล์ได้ เช่น รูปภาพ เสียง วิดีโอ หรือปุ่มต่างๆ ตัวอย่างเช่น หากไฟล์ PDF แบบโต้ตอบนี้เป็นแคตตาล็อกดิจิทัลสำหรับธุรกิจอีคอมเมิร์ซ ก็สามารถแสดงรายการสินค้าในหน้า PDF และเพิ่มรูปภาพ ลิงก์ไปยังเว็บไซต์ และปุ่มสั่งซื้อโดยตรงจากเอกสารได้

แบบฟอร์ม

แบบฟอร์มเชิงโต้ตอบเป็นกลไกในการเพิ่มแบบฟอร์มลงในไฟล์ PDF ปัจจุบัน PDF รองรับวิธีการสองวิธีที่แตกต่างกันในการผสานรวมข้อมูลและแบบฟอร์ม PDF ทั้งสองรูปแบบนี้มีอยู่ร่วมกันในข้อกำหนด PDF ในปัจจุบัน: [ 43 ] [ 59 ] [ 60 ] [ 61 ]

  • AcroForms (หรือที่รู้จักกันในชื่อแบบฟอร์ม Acrobat) ถูกนำมาใช้ในข้อกำหนดรูปแบบ PDF 1.2 และรวมอยู่ในข้อกำหนด PDF รุ่นต่อๆ มาทั้งหมด
  • ฟอร์ม XML Forms Architecture (XFA) ถูกนำมาใช้ในข้อกำหนดรูปแบบ PDF 1.5 ฟอร์ม Adobe XFA ไม่สามารถใช้งานร่วมกับ AcroForms ได้[ 62 ] XFA ถูกยกเลิกการใช้งานใน PDF ตั้งแต่ PDF 2.0

AcroForms ถูกนำมาใช้ในรูปแบบ PDF 1.2 AcroForms อนุญาตให้ใช้วัตถุ ( เช่นกล่องข้อความปุ่มวิทยุฯลฯ) และโค้ดบางส่วน ( เช่นJavaScript ) นอกเหนือจากประเภทการดำเนินการ PDF มาตรฐานแล้ว แบบฟอร์มโต้ตอบ (AcroForms) ยังรองรับการส่ง การรีเซ็ต และการนำเข้าข้อมูล การดำเนินการ "ส่ง" จะส่งชื่อและค่าของฟิลด์แบบฟอร์มโต้ตอบที่เลือกไปยังตัวระบุทรัพยากรสากล (URL) ที่ระบุ ชื่อและค่าของฟิลด์แบบฟอร์มโต้ตอบสามารถส่งได้ในรูปแบบใดรูปแบบหนึ่งต่อไปนี้ (ขึ้นอยู่กับการตั้งค่าของแฟล็ก ExportFormat, SubmitPDF และ XFDF ของการดำเนินการ): [ 43 ]

รูปแบบฟอร์ม HTML
ข้อกำหนด HTML 4.01 ตั้งแต่ PDF 1.5; HTML 2.0 ตั้งแต่ 1.2
รูปแบบข้อมูลแบบฟอร์ม (FDF)
รูปแบบข้อมูลแบบฟอร์ม (FDF) มีพื้นฐานมาจาก PDF ใช้ไวยากรณ์เดียวกันและมีโครงสร้างไฟล์พื้นฐานเหมือนกัน แต่เรียบง่ายกว่า PDF มาก เนื่องจากส่วนเนื้อหาของเอกสาร FDF ประกอบด้วยวัตถุที่จำเป็นเพียงหนึ่งเดียวเท่านั้น รูปแบบข้อมูลแบบฟอร์มถูกกำหนดไว้ในข้อกำหนดของ PDF (ตั้งแต่ PDF 1.2) สามารถใช้รูปแบบข้อมูลแบบฟอร์มเมื่อส่งข้อมูลแบบฟอร์มไปยังเซิร์ฟเวอร์ รับการตอบกลับ และรวมเข้ากับแบบฟอร์มแบบโต้ตอบ นอกจากนี้ยังสามารถใช้เพื่อส่งออกข้อมูลแบบฟอร์มไปยังไฟล์แบบสแตนด์อะโลนซึ่งสามารถนำเข้ากลับเข้าไปในแบบฟอร์มแบบโต้ตอบ PDF ที่เกี่ยวข้องได้ FDF ถูกกำหนดขึ้นครั้งแรกในปี 1996 โดยเป็นส่วนหนึ่งของ ISO 32000-2:2017
รูปแบบข้อมูลแบบฟอร์ม XML (XFDF)
(ข้อกำหนดรูปแบบข้อมูลแบบฟอร์ม XML ภายนอก เวอร์ชัน 2.0; รองรับตั้งแต่ PDF 1.5; แทนที่รูปแบบการส่งแบบฟอร์ม "XML" ที่กำหนดไว้ใน PDF 1.4) เวอร์ชัน XML ของรูปแบบข้อมูลแบบฟอร์ม แต่ XFDF ใช้เพียงส่วนย่อยของ FDF ที่มีแบบฟอร์มและคำอธิบายประกอบ รายการบางรายการในพจนานุกรม FDF ไม่มีรายการเทียบเท่าใน XFDF เช่น สถานะ การเข้ารหัส JavaScript คีย์ของหน้า EmbeddedFDF ความแตกต่าง และเป้าหมาย นอกจากนี้ XFDF ไม่อนุญาตให้สร้างหรือเพิ่มหน้าใหม่ตามข้อมูลที่กำหนด เช่นเดียวกับที่สามารถทำได้เมื่อใช้ไฟล์ FDF ข้อกำหนด XFDF ถูกอ้างอิง (แต่ไม่ได้รวมอยู่ด้วย) ในข้อกำหนด PDF 1.5 (และในเวอร์ชันต่อมา) มีการอธิบายแยกต่างหากในข้อกำหนดรูปแบบข้อมูลแบบฟอร์ม XML [ 63 ] ข้อกำหนด PDF 1.4 อนุญาตให้ส่งแบบฟอร์มในรูปแบบ XML แต่ถูกแทนที่ด้วยการส่งในรูปแบบ XFDF ในข้อกำหนด PDF 1.5 XFDF สอดคล้องกับมาตรฐาน XML XFDF สามารถใช้งานได้ในลักษณะเดียวกับ FDF เช่น ส่งข้อมูลแบบฟอร์มไปยังเซิร์ฟเวอร์ ทำการแก้ไข จากนั้นส่งกลับ และนำเข้าข้อมูลแบบฟอร์มใหม่ในแบบฟอร์มโต้ตอบ นอกจากนี้ยังสามารถใช้เพื่อส่งออกข้อมูลแบบฟอร์มไปยังไฟล์แบบสแตนด์อะโลนซึ่งสามารถนำเข้ากลับเข้าไปในแบบฟอร์มโต้ตอบ PDF ที่เกี่ยวข้องได้ ณ เดือนสิงหาคม 2019 XFDF 3.0 เป็นมาตรฐาน ISO/IEC ภายใต้ชื่ออย่างเป็นทางการISO 19444-1:2019 - การจัดการเอกสาร — รูปแบบข้อมูลแบบฟอร์ม XML — ส่วนที่ 1: การใช้ ISO 32000-2 (XFDF 3.0) [ 64 ] มาตรฐานนี้เป็นเอกสารอ้างอิงเชิงบรรทัดฐานของ ISO 32000-2
พีดี

สามารถส่งเอกสารทั้งหมดได้ แทนที่จะส่งเฉพาะแต่ละช่องและค่าต่างๆ เหมือนที่กำหนดไว้ใน PDF 1.4

AcroForms สามารถเก็บค่าฟิลด์แบบฟอร์มไว้ในไฟล์ภายนอกแบบสแตนด์อะโลนที่มีคู่คีย์-ค่าได้ ไฟล์ภายนอกอาจใช้ไฟล์ Forms Data Format (FDF) และ XML Forms Data Format (XFDF) [ 65 ] [ 63 ] [ 66 ]ลายเซ็นสิทธิ์การใช้งาน (UR) กำหนดสิทธิ์สำหรับการนำเข้าไฟล์ข้อมูลแบบฟอร์มในรูปแบบ FDF, XFDF และข้อความ ( CSV / TSV ) และการส่งออกไฟล์ข้อมูลแบบฟอร์มในรูปแบบ FDF และ XFDF [ 43 ]

ใน PDF 1.5 นั้น Adobe Systems ได้นำรูปแบบเฉพาะสำหรับแบบฟอร์มมาใช้ นั่นคือAdobe XML Forms Architecture (XFA) แบบฟอร์ม Adobe XFA ไม่สามารถใช้งานร่วมกับคุณสมบัติ AcroForms ของ ISO 32000 ได้ และโปรแกรมประมวลผล PDF ส่วนใหญ่ก็ไม่รองรับเนื้อหา XFA ข้อกำหนด XFA ถูกอ้างอิงจาก ISO 32000-1/PDF 1.7 ในฐานะข้อกำหนดเฉพาะภายนอก และถูกยกเลิกการใช้งานโดยสิ้นเชิงจาก PDF ใน ISO 32000-2 (PDF 2.0)

การออกใบอนุญาต

ใครๆ ก็สามารถสร้างแอปพลิเคชันที่สามารถอ่านและเขียนไฟล์ PDF ได้โดยไม่ต้องจ่ายค่าลิขสิทธิ์ให้กับ Adobe Systems Adobe ถือสิทธิบัตร PDF แต่ให้สิทธิ์ใช้งานโดยไม่เสียค่าลิขสิทธิ์ในการพัฒนาซอฟต์แวร์ที่สอดคล้องกับข้อกำหนด PDF ของตน[ 67 ]

ความปลอดภัย

การเปลี่ยนแปลงเนื้อหา

ในเดือนพฤศจิกายน 2019 นักวิจัยจากมหาวิทยาลัย Ruhr University Bochumและ Hackmanit GmbH ได้เผยแพร่การโจมตี PDF ที่ลงนามแบบดิจิทัล[ 68 ]พวกเขาแสดงให้เห็นวิธีการเปลี่ยนแปลงเนื้อหาที่มองเห็นได้ใน PDF ที่ลงนามโดยไม่ต้องทำให้ลายเซ็นเป็นโมฆะในโปรแกรมดู PDF บนเดสก์ท็อป 21 จาก 22 โปรแกรม และบริการตรวจสอบความถูกต้องออนไลน์ 6 จาก 8 บริการ โดยการใช้ประโยชน์จากข้อบกพร่องในการใช้งาน ในการประชุมเดียวกัน พวกเขายังแสดงให้เห็นเพิ่มเติมถึงวิธีการดึงข้อความธรรมดาของเนื้อหาที่เข้ารหัสใน PDF [ 69 ]ในปี 2021 พวกเขาแสดงให้เห็นการโจมตีแบบใหม่ที่เรียกว่าการโจมตีเงาบน PDF ซึ่งใช้ประโยชน์จากความยืดหยุ่นของฟีเจอร์ที่ให้ไว้ในข้อกำหนด[ 70 ] Jens Müller ได้นำเสนอภาพรวมของปัญหาด้านความปลอดภัยใน PDF เกี่ยวกับการปฏิเสธการให้บริการการเปิดเผยข้อมูลการจัดการข้อมูลและ การโจมตี การเรียกใช้โค้ด โดยพลการ [ 71 ] [ 72 ]

ช่องโหว่มัลแวร์

โปรแกรมอ่าน PDF ยอดนิยมบางโปรแกรมมีประวัติช่องโหว่ด้านความปลอดภัยที่ทำให้ไฟล์ PDF ที่ติดไวรัส โทรจัน และมัลแวร์อื่นๆ สามารถสร้างความเสียหายได้ ไฟล์ PDF ดังกล่าวอาจมีโค้ด JavaScript ที่ซ่อนอยู่ซึ่งอาจใช้ประโยชน์จากช่องโหว่ในโปรแกรมอ่าน PDF วัตถุที่ซ่อนอยู่ซึ่งจะถูกเรียกใช้เมื่อเปิดไฟล์ที่ซ่อนวัตถุเหล่านั้น และที่พบได้น้อยกว่าคือ PDF ที่เป็นอันตรายอาจเรียกใช้มัลแวร์ได้[ 73 ]

ไฟล์แนบ PDF ที่มีไวรัสถูกค้นพบครั้งแรกในปี 2544 ไวรัสที่ชื่อว่าOUTLOOK.PDFWormหรือPeachyใช้Microsoft Outlookในการส่งตัวเองเป็นไฟล์แนบ Adobe PDF โดยเปิดใช้งานด้วย Adobe Acrobat แต่ไม่สามารถเปิดใช้งานด้วย Acrobat Reader ได้[ 74 ]

ตลอดหลายปีที่ผ่านมา มีการค้นพบช่องโหว่หลายประการใน Adobe Reader เวอร์ชันต่างๆ[ 75 ]ซึ่งกระตุ้นให้บริษัทออกการแก้ไขด้านความปลอดภัย ช่องโหว่ยังถูกค้นพบในโปรแกรมอ่าน PDF อื่นๆ อีกด้วย ปัจจัยหนึ่งที่ทำให้สถานการณ์แย่ลงคือ โปรแกรมอ่าน PDF สามารถตั้งค่าให้เริ่มต้นโดยอัตโนมัติหากหน้าเว็บมีไฟล์ PDF ฝังอยู่ ซึ่งเป็นช่องทางสำหรับการโจมตี หากหน้าเว็บที่เป็นอันตรายมีไฟล์ PDF ที่ติดไวรัสซึ่งใช้ประโยชน์จากช่องโหว่ในโปรแกรมอ่าน PDF ระบบอาจถูกบุกรุกได้แม้ว่าเบราว์เซอร์จะปลอดภัยก็ตาม ช่องโหว่เหล่านี้บางส่วนเป็นผลมาจากโปรแกรมอ่าน PDF ที่เขียนไม่ดีซึ่งจัดการ JavaScript ที่ฝังอยู่ในไฟล์ PDF ไม่ถูกต้อง การปิดใช้งานการทำงานของ JavaScript ในโปรแกรมอ่าน PDF สามารถช่วยลดการโจมตีในอนาคตได้ แม้ว่าจะไม่สามารถป้องกันการโจมตีในส่วนอื่นๆ ของซอฟต์แวร์ดู PDF ได้ก็ตาม ผู้เชี่ยวชาญด้านความปลอดภัยบางคนกล่าวว่า JavaScript ไม่จำเป็นสำหรับโปรแกรมอ่าน PDF และประโยชน์ด้านความปลอดภัยที่ได้จากการปิดใช้งาน JavaScript นั้นมีมากกว่าปัญหาความเข้ากันได้ที่เกิดขึ้น[ 76 ]วิธีหนึ่งในการหลีกเลี่ยงการโจมตีไฟล์ PDF คือการใช้บริการภายในหรือเว็บในการแปลงไฟล์เป็นรูปแบบอื่นก่อนดู

เมื่อวันที่ 30 มีนาคม 2553 นักวิจัยด้านความปลอดภัย Didier Stevens รายงานช่องโหว่ของ Adobe Reader และ Foxit Reader ที่เรียกใช้ไฟล์ปฏิบัติการที่เป็นอันตรายหากผู้ใช้ยินยอมให้เรียกใช้เมื่อถูกถาม[ 77 ]

ซิปบอมบ์

สตรีม PDF สามารถมีตัวกรองแบบซ้อนกันได้ ซึ่งทำให้สามารถสร้างไฟล์ขนาด 5 กิโลไบต์ที่แตกไฟล์เป็น 1 เพตาไบต์ใน RAM ได้ สิ่งนี้สามารถใช้เพื่อทำให้เกิดการปฏิเสธการให้บริการได้กับระบบที่ไม่ได้ป้องกันสิ่งนี้ เช่นเดียวกับกรณีของpypdf ที่มี CVE-2025-55197 [ 78 ] [ 79 ]

ซอฟต์แวร์

ผู้ชมและบรรณาธิการ

มีโปรแกรมดูไฟล์ PDF มากมายให้บริการฟรีจากแหล่งต่างๆ นอกจากนี้ยังมีโปรแกรมสำหรับจัดการและแก้ไขไฟล์ PDF ซึ่งมักจะต้องซื้อ ยิ่งไปกว่านั้น เว็บเบราว์เซอร์สมัยใหม่ส่วนใหญ่ รวมถึงChrome , FirefoxและSafariก็มีฟังก์ชันการดูไฟล์ PDF ซึ่งมาแทนที่ปลั๊กอินของเบราว์เซอร์ที่เคยสร้างขึ้นเพื่อจุดประสงค์ดังกล่าว[ 80 ]

มีซอฟต์แวร์หลายตัวที่ใช้สร้างไฟล์ PDF รวมถึงความสามารถในการพิมพ์ PDF ที่มีอยู่ในmacOS, iOS [ 81 ] และระบบปฏิบัติการLinuxส่วนใหญ่ซอฟต์แวร์ประมวลผลเอกสารหลายตัว เช่นLibreOffice , Microsoft Office 2007 (หากอัปเดตเป็นSP2 ) และเวอร์ชันที่ใหม่กว่า[ 82 ] WordPerfect 9 และScribusสามารถส่งออกเอกสารเป็น PDF ได้ มีไดรเวอร์การพิมพ์ PDF หลายตัวสำหรับ Microsoft Windows, ระบบเรียงพิมพ์pdfTeX , เครื่องมือ PDF ของ DocBook , แอปพลิเคชันที่พัฒนาขึ้นโดยใช้ GhostscriptและAdobe Acrobatเอง รวมถึงAdobe InDesign , Adobe FrameMaker , Adobe Illustrator, Adobe Photoshop ที่อนุญาตให้ตั้งค่า "เครื่องพิมพ์ PDF" ซึ่งเมื่อเลือกแล้วจะส่งเอาต์พุตไปยังไฟล์ PDF แทนที่จะเป็นเครื่องพิมพ์จริงชุดโปรแกรมสำนักงานออนไลน์ของGoogle อย่าง Google Docsอนุญาตให้ทำการอัปโหลดและบันทึกเป็น PDF แอปพลิเคชันบนเว็บบางตัวมีเครื่องมือแก้ไขและใส่คำอธิบายประกอบ PDF ฟรี

มูลนิธิซอฟต์แวร์เสรีได้ "พัฒนาชุดไลบรารีและโปรแกรมที่มีคุณภาพสูงและใช้งานได้เต็มรูปแบบซึ่งใช้รูปแบบไฟล์ PDF และเทคโนโลยีที่เกี่ยวข้องตามมาตรฐาน ISO 32000" ซึ่งเป็นหนึ่งในโครงการที่มีความสำคัญสูง[ 83 ] [ 84 ] อย่างไรก็ตามในปี 2011 โครงการ GNU PDF ถูกถอดออกจากรายการ "โครงการที่มีความสำคัญสูง" เนื่องจากไลบรารีPoppler [ 85 ] มีความสมบูรณ์ มากขึ้นและได้รับการใช้งานอย่างแพร่หลายในแอปพลิเคชันต่างๆ เช่นEvinceที่ใช้ สภาพแวดล้อมเดสก์ท็อป GNOME Poppler ใช้ โค้ดเบส Xpdf [ 86 ] [ 87 ] เป็นพื้นฐาน นอกจากนี้ยังมีไลบรารีการ พัฒนาเชิงพาณิชย์ให้เลือกใช้ตามรายการซอฟต์แวร์ PDF

โครงการApache PDFBoxของApache Software Foundationเป็นไลบรารี Java โอเพนซอร์สที่ได้รับอนุญาตภายใต้Apache Licenseสำหรับการทำงานกับเอกสาร PDF [ 88 ]

การพิมพ์

ตัวประมวลผลภาพแรสเตอร์ (RIPs) ใช้ในการแปลงไฟล์ PDF ให้เป็นรูปแบบแรสเตอร์ที่เหมาะสมสำหรับการสร้างภาพลงบนกระดาษและสื่ออื่นๆ ในเครื่องพิมพ์ เครื่องพิมพ์ดิจิทัล และการเตรียมงานพิมพ์ในกระบวนการที่เรียกว่าการสร้างภาพแรสเตอร์ RIPs ที่สามารถประมวลผล PDF ได้โดยตรง ได้แก่ Adobe PDF Print Engine [ 89 ]จาก Adobe Systems และ Jaws [ 90 ]และ Harlequin RIP จากGlobal Graphics

ในปี พ.ศ. 2536 โปรแกรมประมวลผลภาพแรสเตอร์ Jaws จาก Global Graphics กลายเป็น RIP สำหรับการเตรียมพิมพ์ที่วางจำหน่ายเป็นครั้งแรกที่สามารถตีความ PDF ได้โดยตรงโดยไม่ต้องแปลงเป็นรูปแบบอื่น บริษัทได้ออกเวอร์ชันอัปเกรดของ RIP Harlequin ที่มีความสามารถเดียวกันในปี พ.ศ. 2540 [ 91 ]

ในปี 1997 Agfa-Gevaert ได้เปิดตัวและจัดส่ง Apogee ซึ่งเป็นระบบเวิร์กโฟลว์ก่อนพิมพ์ระบบแรกที่ใช้ไฟล์ PDF เป็นพื้นฐาน

โรงพิมพ์ออฟเซ็ตเชิงพาณิชย์หลายแห่งยอมรับการส่งไฟล์ PDF ที่พร้อมพิมพ์เป็นแหล่งข้อมูลการพิมพ์ โดยเฉพาะชุดย่อย PDF/X-1a และรูปแบบต่างๆ ของชุดเดียวกัน[ 92 ]การส่งไฟล์ PDF ที่พร้อมพิมพ์เป็นการทดแทนความจำเป็นที่ยุ่งยากในการรับไฟล์งานต้นฉบับที่รวบรวมไว้

ในปี พ.ศ. 2549 PDF ได้รับการยอมรับอย่างกว้างขวางให้เป็นรูปแบบงานพิมพ์มาตรฐานในการประชุมสุดยอดการพิมพ์ของห้องปฏิบัติการพัฒนาโอเพนซอร์ส โดยได้รับการสนับสนุนให้เป็นรูปแบบงานพิมพ์โดย ระบบการพิมพ์ทั่วไปของ Unixและโครงการแอปพลิเคชันเดสก์ท็อป เช่น GNOME, KDE , Firefox , Thunderbird , LibreOffice และOpenOfficeได้เปลี่ยนมาใช้รูปแบบ PDF ในการส่งงานพิมพ์[ 93 ]

เครื่องพิมพ์ตั้งโต๊ะบางรุ่นรองรับการพิมพ์ PDF โดยตรง ซึ่งสามารถตีความข้อมูล PDF ได้โดยไม่ต้องอาศัยความช่วยเหลือจากภายนอก

โมเดลแสดงผลดั้งเดิม

PDF ได้รับเลือกให้เป็น รูปแบบ เมตาไฟล์ "ดั้งเดิม" สำหรับmacOS (เดิมเรียกว่า Mac OS X) แทนที่ รูปแบบ PICTของMac OS รุ่นคลาสสิก ก่อนหน้านี้ โมเดล การสร้างภาพของ เลเยอร์กราฟิก Quartz นั้น อิงตามโมเดลที่ใช้ร่วมกันระหว่างDisplay PostScriptและ PDF ทำให้ได้ชื่อเล่นว่าDisplay PDF แอปพลิเค ชัน Previewสามารถแสดงไฟล์ PDF ได้ เช่นเดียวกับเบราว์เซอร์Safari เวอร์ชัน 2.0 ขึ้นไป [ 94 ] [ 95 ]การสนับสนุน PDF ระดับระบบช่วยให้แอปพลิเคชัน macOS สามารถสร้างเอกสาร PDF ได้โดยอัตโนมัติ หากแอปพลิเคชันนั้นรองรับสถาปัตยกรรมการพิมพ์มาตรฐานของระบบปฏิบัติการ จากนั้นไฟล์จะถูกส่งออกในรูปแบบ PDF 1.3 ตามส่วนหัวของไฟล์ เมื่อถ่ายภาพหน้าจอใน Mac OS X เวอร์ชัน 10.0 ถึง 10.3 ภาพจะถูกบันทึกเป็น PDF ด้วยเช่นกัน เวอร์ชันต่อมาจะบันทึกภาพหน้าจอเป็นไฟล์ PNG แต่สามารถตั้งค่ากลับเป็น PDF ได้หากต้องการ

คำอธิบายประกอบ

Adobe Acrobat เป็นตัวอย่างหนึ่งของซอฟต์แวร์กรรมสิทธิ์ที่อนุญาตให้ผู้ใช้ใส่คำอธิบายประกอบ ไฮไลต์ และเพิ่มบันทึกในไฟล์ PDF ที่สร้างไว้แล้ว โปรแกรม UNIX ที่มีให้ใช้งานฟรี (ภายใต้ ใบ อนุญาต GNU General Public License ) คือPDFeditโปรแกรมฟรีแวร์Foxit Readerซึ่งมีให้ใช้งานสำหรับ Microsoft Windows, macOS และ Linux อนุญาตให้ใส่คำอธิบายประกอบในเอกสารได้โปรแกรม PDF-XChange Viewer ของ Tracker Software อนุญาตให้ใส่คำอธิบายประกอบและทำเครื่องหมายได้โดยไม่มีข้อจำกัดในเวอร์ชันฟรี แวร์ โปรแกรมดู PDF ในตัวของ macOS ของ Appleอย่าง Preview ก็อนุญาตให้ใส่คำอธิบายประกอบได้เช่นกัน เช่นเดียวกับซอฟต์แวร์โอเพนซอร์สSkimซึ่งรองรับการทำงานร่วมกับLaTeX , SyncTeX และ PDFSync และการทำงานร่วมกับซอฟต์แวร์จัดการอ้างอิงBibDesk โปรแกรมฟรีแวร์ Qiqqaสามารถสร้างรายงานคำอธิบายประกอบที่สรุปคำอธิบายประกอบและบันทึกทั้งหมดที่ผู้ใช้ได้ทำไว้ในคลังไฟล์ PDF ของผู้ใช้ เครื่องมือตรวจสอบข้อความ (Text Verification Tool) ส่งออกความแตกต่างในเอกสารเป็นคำอธิบายประกอบและเครื่องหมาย

นอกจากนี้ยังมี ระบบ การใส่คำอธิบายประกอบบนเว็บที่รองรับการใส่คำอธิบายประกอบในไฟล์ PDF และรูปแบบเอกสารอื่นๆ ในกรณีที่คาดว่าไฟล์ PDF จะต้องมีฟังก์ชันการทำงานทั้งหมดเหมือนกับเอกสารกระดาษ การใส่คำอธิบายประกอบด้วยหมึกจึงเป็นสิ่งจำเป็น

การแปลงและการดึงข้อมูล

การเน้นย้ำของ PDF ในการรักษารูปลักษณ์ของเอกสารให้เหมือนเดิมในทุกแพลตฟอร์มซอฟต์แวร์และฮาร์ดแวร์ ทำให้เกิดความท้าทายในการแปลงเอกสาร PDF เป็นรูปแบบไฟล์ อื่น และการดึงข้อมูล เป้าหมาย เช่น ข้อความ รูปภาพ ตารางข้อมูลบรรณานุกรมและเมตาเดตา ของเอกสาร เครื่องมือและไลบรารีซอร์สโค้ดจำนวนมากสนับสนุนงานเหล่านี้ มี ชุดข้อมูล ที่มีการติดป้ายกำกับหลายชุด เพื่อทดสอบการแปลง PDF และเครื่องมือดึงข้อมูล และได้ถูกนำมาใช้ในการประเมินประสิทธิภาพของเครื่องมือ[ 96 ]

ทางเลือกอื่นๆ

Open XML Paper Specificationเป็นรูปแบบคู่แข่งที่ใช้ทั้งเป็นภาษาอธิบายหน้าเอกสารและเป็นรูปแบบตัวจัดการคิวการพิมพ์ดั้งเดิมสำหรับ Microsoft Windows ตั้งแต่Windows Vista เป็นต้น มา

Mixed Object: Document Content Architectureเป็นรูปแบบที่แข่งขันกันอยู่ MO:DCA-P เป็นส่วนหนึ่งของAdvanced Function Presentation

ดูเพิ่มเติม

อ่านเพิ่มเติม

มาตรฐาน ISO
  • PDF 2.0 "ISO 32000-2:2020(en), การจัดการเอกสาร — รูปแบบเอกสารพกพา — ส่วนที่ 2: PDF 2.0"องค์การมาตรฐานสากลสืบค้นเมื่อ16 ธันวาคม 2020
  • PDF 2.0 "ISO 32000-2:2017(en), การจัดการเอกสาร — รูปแบบเอกสารพกพา — ส่วนที่ 2: PDF 2.0"องค์การมาตรฐานสากล 3 สิงหาคม 2560 สืบค้นเมื่อ31 มกราคม 2562
มาตรฐานโอเพนซอร์สของ Adobe
  • PDF 1.7 (ISO 32000-1:2008)
  • ไฟล์ PDF เวอร์ชัน 1.7และเอกสารแก้ไขข้อผิดพลาดของเวอร์ชัน 1.7อยู่ที่Wayback Machine (เก็บถาวรเมื่อวันที่ 6 มีนาคม 2022)
  • PDF 1.6 ( ISBN) 0-321-30474-8) และข้อแก้ไขเพิ่มเติมสำหรับเวอร์ชัน 1.6ที่Wayback Machine (เก็บถาวรเมื่อวันที่ 6 มีนาคม 2022)
  • ไฟล์ PDF เวอร์ชัน 1.5และเอกสารแก้ไขข้อผิดพลาดของเวอร์ชัน 1.5อยู่ที่Wayback Machine (เก็บถาวรเมื่อวันที่ 22 ธันวาคม 2021)
  • PDF 1.4 ( ISBN) 0-201-75839-3) และข้อแก้ไขเพิ่มเติมสำหรับเวอร์ชัน 1.4ที่Wayback Machine (เก็บถาวรเมื่อวันที่ 6 มีนาคม 2022)
  • PDF 1.3 ( ISBN 0-201-61588-6) และข้อแก้ไขเพิ่มเติมสำหรับเวอร์ชัน 1.3ที่Wayback Machine (เก็บถาวรเมื่อวันที่ 6 มีนาคม 2022)
  • PDF 1.2
  • PDF 1.0 ( ISBN) 0-201-62628-4)
เอกสารการประชุม
  • Hardy, MRB; Brailsford, DF (2002). "การแมปและการแสดงผลการแปลงโครงสร้างระหว่าง XML และ PDF" (PDF)รายงานการประชุมสัมมนา ACM ประจำปี 2002 เรื่องวิศวกรรมเอกสาร – DocEng '02หน้า  95–102 . doi : 10.1145/585058.585077 . ISBN 1-58113-594-7S2CID 9371237 เก็บถาวรจากต้นฉบับ(PDF) เมื่อ วันที่ 24 มีนาคม 2017
  • สมาคม PDF – สมาคม PDF เป็นสมาคมอุตสาหกรรมสำหรับนักพัฒนาซอฟต์แวร์ที่สร้างหรือประมวลผลไฟล์ PDF
    • ดัชนีข้อกำหนด PDFที่สมาคม PDF
    • เอกสารสรุปคำสั่ง PDF ฉบับที่ 2โดยสมาคม PDF (ปรับปรุงล่าสุด 29 ตุลาคม 2567)
    • สนับสนุนการเข้าถึงชุดเอกสาร ISO 32000-2 (PDF 2.0) ฟรีซึ่งรวมถึงข้อกำหนดหลัก PDF ฉบับล่าสุด และส่วนขยายมาตรฐาน ISO อีกห้าส่วนสำหรับข้อกำหนดหลัก
  • คำอธิบายรูปแบบของตระกูลไฟล์ PDFได้แก่PDF/AและPDF/Xจากหอสมุดแห่งชาติสหรัฐอเมริกา
หมายเหตุทางเทคนิคจากAdobe
  • Adobe PDF 101: สรุปเกี่ยวกับไฟล์ PDFจากWayback Machine (เก็บถาวรเมื่อ 7 ตุลาคม 2010)
  • Adobe: PostScript กับ PDFที่Wayback Machine (เก็บถาวรเมื่อ 13 เมษายน 2016) – การเปรียบเทียบเบื้องต้นอย่างเป็นทางการระหว่าง PS, EPS กับ PDF
  • เอกสารอ้างอิง PDF และส่วนขยายของ Adobe สำหรับข้อกำหนด PDFที่Wayback Machine (เก็บถาวรเมื่อ 16 มกราคม 2021)
บทความ
  • รูปแบบเอกสารพกพา: บทนำสำหรับโปรแกรมเมอร์ (1999)จาก MacTech – บทนำเกี่ยวกับ PDF เทียบกับ PostScript และกลไกภายในของ PDF (จนถึงเวอร์ชัน 1.3)
  • บทความเรื่อง 'Camelot' ของ John Warnock เป็นสัญญาณบ่งบอกถึงการกำเนิดของ PDF (2002)ที่Wayback Machine (เก็บถาวรเมื่อ 2019-04-22) จาก Planet PDF อธิบายถึงเอกสารที่ John Warnock อธิบายถึงโครงการที่สร้าง PDF ขึ้นมา
วิดีโอ
  • วิดีโอ: ทุกสิ่งที่คุณอยากรู้เกี่ยวกับ PDF แต่ไม่กล้าถาม — บันทึกการบรรยายโดย Leonard Rosenthol ( Adobe Systems ) ในงาน TUG 2007
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=PDF&oldid=1360715734 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ พีดี

รูปแบบเอกสารพกพา ( PDF ) ซึ่งกำหนดมาตรฐานเป็น ISO 32000 เป็น รูปแบบไฟล์ ที่พัฒนาโดย Adobe ในปี 1993 ใช้สำหรับนำเสนอเอกสาร รวมถึงการจัดรูปแบบข้อความและรูปภาพ ในลักษณะที่ไม่ขึ้นกับ...

ประวัติศาสตร์

การพัฒนา PDF เริ่มขึ้นในปี 1991 เมื่อ John Warnock เขียนบทความสำหรับโครงการที่มีชื่อรหัสว่า Camelot ซึ่งเขาเสนอให้สร้าง PostScript เวอร์ชันที่เรียบง่ายกว่าที่เรียกว่า Interchange PostScript (IPS) [ 8 ] แตกต่างจาก PostScript แบบดั้งเดิมซึ่งเน้นการแสดง...

รายละเอียดทางเทคนิค

ไฟล์ PDF มักเป็นการผสมผสานระหว่าง กราฟิกแบบเวกเตอร์ ข้อความ และ กราฟิกแบบบิตแมป ประเภทของเนื้อหาพื้นฐานในไฟล์ PDF ได้แก่:

ภาษาโพสต์สคริปต์

PostScript เป็น ภาษาอธิบายหน้า ซึ่งทำงานใน ตัวแปล เพื่อสร้างภาพ [ 8 ] สามารถจัดการกราฟิกได้และมีคุณสมบัติมาตรฐานของ ภาษาโปรแกรม เช่น การแตกแขนง และ การวนซ้ำ [ 8 ] PDF เป็นส่วนย่อยของ PostScript ที่ถูกทำให้ง่ายขึ้นเพื่อลบ คุณสมบัติ การควบคุมการไหล...