กลับไปหน้าบทความ

อ่าน 4 นาที

การประมวลผลเอกสาร

การประมวลผลเอกสารเป็นสาขาการวิจัยและชุดกระบวนการผลิต ที่มีจุดมุ่งหมายเพื่อแปลง เอกสารอนาล็อกให้เป็นดิจิทัล...

การประมวลผลเอกสาร

การประมวลผลเอกสารเป็นสาขาการวิจัยและชุดกระบวนการผลิต ที่มีจุดมุ่งหมายเพื่อแปลง เอกสารอนาล็อกให้เป็นดิจิทัล การประมวลผลเอกสารไม่ได้มุ่งเน้นเพียงแค่การถ่ายภาพหรือสแกนเอกสารเพื่อให้ได้ภาพดิจิทัลเท่านั้น แต่ยังรวมถึงการทำให้เอกสารนั้นสามารถเข้าใจได้ในรูปแบบดิจิทัลด้วย ซึ่งรวมถึงการดึงโครงสร้างของเอกสารหรือเค้าโครงและเนื้อหา ซึ่งอาจอยู่ในรูปแบบของข้อความหรือรูปภาพ กระบวนการนี้อาจเกี่ยวข้องกับ อัลกอริธึม การมองเห็นด้วยคอมพิวเตอร์ แบบดั้งเดิม เครือข่ายประสาทเทียมแบบคอนโวลูชัน หรือแรงงานคน ปัญหาที่กล่าวถึงนั้นเกี่ยวข้องกับการแบ่งส่วนเชิงความหมายการ ตรวจ จับวัตถุการรู้จำอักขระด้วยแสง (OCR) การรู้จำข้อความที่เขียนด้วยลายมือ (HTR)และโดยทั่วไปแล้วการถอดความไม่ว่าจะเป็นแบบอัตโนมัติหรือไม่ก็ตาม[ 1 ]คำนี้ยังอาจรวมถึงขั้นตอนการแปลงเอกสารให้เป็นดิจิทัลโดยใช้เครื่องสแกนและขั้นตอนการตีความเอกสาร เช่น การใช้การประมวลผลภาษาธรรมชาติ (NLP) หรือ เทคโนโลยี การจำแนกภาพมีการนำไปใช้ในหลายสาขาอุตสาหกรรมและวิทยาศาสตร์เพื่อเพิ่มประสิทธิภาพกระบวนการบริหาร การประมวลผลจดหมาย และการแปลงเอกสาร อนาล็อก และเอกสารทางประวัติศาสตร์ให้เป็นดิจิทัล

พื้นหลัง

การประมวลผลเอกสารในตอนแรกและยังคงเป็นเช่นนั้นในระดับหนึ่ง เป็นงานสายการผลิตประเภทหนึ่งที่เกี่ยวข้องกับการจัดการเอกสารเช่น จดหมายและพัสดุ โดยมีเป้าหมายในการคัดแยก แยก หรือแยกข้อมูลจำนวนมาก งานนี้สามารถดำเนินการภายในองค์กรหรือผ่านการเอาท์ซอร์สกระบวนการทางธุรกิจได้ [ 2 ] [ 3 ] การประมวลผลเอกสารอาจเกี่ยวข้องกับแรงงานคนภายนอกบางประเภท เช่นMechanical Turk

ตัวอย่างเช่น การประมวลผลเอกสารด้วยตนเอง ซึ่งเมื่อไม่นานมานี้ในปี 2550 [ 4 ]การประมวลผลเอกสารสำหรับ "ใบสมัครวีซ่าและสัญชาติหลายล้านฉบับ" นั้นใช้ "พนักงานสัญญาจ้างประมาณ 1,000 คน" เพื่อ "จัดการห้องรับส่งจดหมายและการป้อนข้อมูล "

ในขณะที่การประมวลผลเอกสารเกี่ยวข้องกับการป้อนข้อมูลผ่านแป้นพิมพ์มานานก่อนที่จะมีการใช้เมาส์คอมพิวเตอร์หรือเครื่องสแกนคอมพิวเตอร์บทความในปี 1990 ในThe New York Timesเกี่ยวกับสิ่งที่เรียกว่า " สำนักงานไร้กระดาษ " ระบุว่า "การประมวลผลเอกสารเริ่มต้นด้วยเครื่องสแกน" [ 5 ]ในบริบทนี้ อดีตรองประธานของ Xerox อย่าง Paul Strassmannได้แสดงความคิดเห็นเชิงวิพากษ์ โดยกล่าวว่าคอมพิวเตอร์เพิ่มปริมาณกระดาษในสำนักงานมากกว่าที่จะลดลง[ 5 ]มีการกล่าวว่าเอกสารด้านวิศวกรรมและการบำรุงรักษาสำหรับเครื่องบินมีน้ำหนัก "มากกว่าตัวเครื่องบินเอง"

การประมวลผลเอกสารอัตโนมัติ

เมื่อเทคโนโลยีก้าวหน้าขึ้น การประมวลผลเอกสารจึงเปลี่ยนไปเป็นการจัดการ "ส่วนประกอบของเอกสาร ... ในฐานะเอนทิตีฐานข้อมูล" [ 6 ]

เทคโนโลยีที่เรียกว่าการประมวลผลเอกสารอัตโนมัติ หรือบางครั้งเรียกว่าการประมวลผลเอกสารอัจฉริยะ (IDP) เกิดขึ้นมาในรูปแบบเฉพาะของการทำงานอัตโนมัติของกระบวนการอัจฉริยะ (IPA) โดยผสมผสานปัญญาประดิษฐ์เช่นการเรียนรู้ของเครื่อง (ML) การประมวลผลภาษาธรรมชาติ (NLP) หรือการรู้จำอักขระอัจฉริยะ (ICE) เพื่อดึงข้อมูลจากเอกสารหลายประเภท[ 7 ] [ 8 ]ความก้าวหน้าในการประมวลผลเอกสารอัตโนมัติ หรือที่เรียกว่าการประมวลผลเอกสารอัจฉริยะ ช่วยเพิ่มความสามารถในการประมวลผลข้อมูลที่ไม่มีโครงสร้างโดยมีข้อยกเว้นน้อยลงและมีความเร็วมากขึ้น[ 9 ]

แอปพลิเคชัน

การประมวลผลเอกสารอัตโนมัติใช้ได้กับเอกสารหลากหลายประเภท ไม่ว่าจะเป็นเอกสารที่มีโครงสร้างหรือไม่ก็ตาม ตัวอย่างเช่น ในโลกธุรกิจและการเงิน เทคโนโลยีอาจถูกนำมาใช้ในการประมวลผลใบแจ้งหนี้ แบบฟอร์ม ใบสั่งซื้อ สัญญา และธนบัตรที่เป็นกระดาษ[ 10 ]สถาบันการเงินใช้การประมวลผลเอกสารอัจฉริยะเพื่อประมวลผลแบบฟอร์มจำนวนมาก เช่น แบบฟอร์มตามข้อกำหนดหรือเอกสารสินเชื่อ ID ใช้ AI ในการดึงและจำแนกข้อมูลจากเอกสาร แทนที่การป้อนข้อมูลด้วยตนเอง[ 11 ]

ในทางการแพทย์ วิธีการประมวลผลเอกสารได้รับการพัฒนาขึ้นเพื่ออำนวยความสะดวกในการติดตามผู้ป่วยและปรับปรุงขั้นตอนการบริหารให้คล่องตัว โดยเฉพาะอย่างยิ่งโดยการแปลงรายงานการวิเคราะห์ทางการแพทย์หรือห้องปฏิบัติการให้เป็นดิจิทัล เป้าหมายคือการสร้างมาตรฐานฐานข้อมูลทางการแพทย์[ 12 ]อัลกอริทึมยังถูกนำมาใช้โดยตรงเพื่อช่วยแพทย์ในการวินิจฉัยโรค เช่น โดยการวิเคราะห์ ภาพจากเครื่องสร้าง ภาพด้วยคลื่นแม่เหล็กไฟฟ้า [ 13 ] [ 14 ]หรือภาพจากกล้องจุลทรรศน์[ 15 ]

การประมวลผลเอกสารยังถูกนำมาใช้กันอย่างแพร่หลายในสาขามนุษยศาสตร์และมนุษยศาสตร์ดิจิทัลเพื่อดึงข้อมูลขนาดใหญ่ ทางประวัติศาสตร์ จากคลังเอกสารหรือแหล่งรวบรวมมรดกทางวัฒนธรรม แนวทางเฉพาะได้รับการพัฒนาสำหรับแหล่งข้อมูลต่างๆ รวมถึงเอกสารข้อความ เช่น คลังเอกสารหนังสือพิมพ์[ 16 ]แต่ยังรวมถึงรูปภาพ[ 17 ]หรือแผนที่[ 18 ] [ 19 ] ด้วย

เทคโนโลยี

หากตั้งแต่ทศวรรษ 1980 เป็นต้นมา อัลกอริทึมการมองเห็นด้วยคอมพิวเตอร์แบบดั้งเดิมถูกนำมาใช้กันอย่างแพร่หลายเพื่อแก้ปัญหาการประมวลผลเอกสาร[ 20 ] [ 21 ] อัลกอริทึม เหล่านี้ก็ค่อยๆ ถูกแทนที่ด้วยเทคโนโลยีเครือข่ายประสาทเทียมในช่วงทศวรรษ 2010 [ 22 ]อย่างไรก็ตาม เทคโนโลยีการมองเห็นด้วยคอมพิวเตอร์แบบดั้งเดิมยังคงถูกนำมาใช้ บางครั้งร่วมกับเครือข่ายประสาทเทียม ในบางภาคส่วน

เทคโนโลยีหลายอย่างสนับสนุนการพัฒนาการประมวลผลเอกสาร โดยเฉพาะอย่างยิ่งการรู้จำอักขระด้วยแสง (OCR) และการรู้จำข้อความที่เขียนด้วยลายมือ (HTR) ซึ่งช่วยให้สามารถถอดความข้อความได้โดยอัตโนมัติ ส่วนของข้อความจะถูกระบุโดยใช้ อัลกอริธึม การตรวจจับตัวอย่างหรือวัตถุซึ่งบางครั้งอาจใช้เพื่อตรวจจับโครงสร้างของเอกสารได้ด้วย การแก้ปัญหาในส่วนหลังนี้บางครั้งก็ใช้อัลกอริธึม การแบ่งส่วนเชิงความหมาย เช่นกัน

เทคโนโลยีเหล่านี้มักเป็นแกนหลักของการประมวลผลเอกสาร อย่างไรก็ตาม อาจมีอัลกอริธึมอื่นๆ เข้ามาเกี่ยวข้องก่อนหรือหลังกระบวนการเหล่านี้ ที่จริงแล้ว เทคโนโลยี การแปลง เอกสารเป็น ดิจิทัลก็มีส่วนเกี่ยวข้องด้วย ไม่ว่าจะเป็นในรูปแบบของการสแกนแบบคลาสสิกหรือแบบสามมิติ[ 23 ]การแปลงเอกสาร 3 มิติเป็นดิจิทัลโดยเฉพาะอย่างยิ่งอาจใช้เทคนิคโฟโตแกรมเมตรีบางครั้ง อาจต้องพัฒนาเครื่องสแกน 2 มิติเฉพาะเพื่อปรับให้เข้ากับขนาดของเอกสารหรือด้วยเหตุผลด้านการใช้งานในการสแกน[ 17 ]การประมวลผลเอกสารยังขึ้นอยู่กับการเข้ารหัสเอกสารแบบดิจิทัลในรูปแบบไฟล์ ที่เหมาะสม นอกจากนี้ การประมวลผลฐานข้อมูลที่หลากหลายอาจอาศัยเทคโนโลยี การจำแนกภาพ

อีกด้านหนึ่งของห่วงโซ่คืออัลกอริธึมต่างๆ สำหรับการเติมเต็มภาพ การคาดการณ์ หรือการทำความสะอาดข้อมูล สำหรับเอกสารที่เป็นข้อความ การตีความสามารถใช้ เทคโนโลยี การประมวลผลภาษาธรรมชาติ (NLP) ได้

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Document_processing&oldid=1315804365 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การประมวลผลเอกสาร

การประมวลผลเอกสารเป็นสาขาการวิจัยและชุดกระบวนการผลิต ที่มีจุดมุ่งหมายเพื่อแปลง เอกสารอนาล็อกให้เป็นดิจิทัล...

พื้นหลัง

การประมวลผลเอกสารในตอนแรกและยังคงเป็นเช่นนั้นในระดับหนึ่ง เป็นงานสายการผลิตประเภทหนึ่งที่เกี่ยวข้องกับการจัดการ เอกสาร เช่น จดหมายและพัสดุ โดยมีเป้าหมายในการคัดแยก แยก หรือแยกข้อมูลจำนวนมาก งานนี้สามารถดำเนินการภายในองค์กรหรือผ่าน...

การประมวลผลเอกสารอัตโนมัติ

เมื่อ เทคโนโลยี ก้าวหน้าขึ้น การประมวลผลเอกสารจึงเปลี่ยนไปเป็นการจัดการ "ส่วนประกอบของเอกสาร ... ในฐานะเอนทิตีฐานข้อมูล" [ 6 ]

แอปพลิเคชัน

การประมวลผลเอกสารอัตโนมัติใช้ได้กับเอกสารหลากหลายประเภท ไม่ว่าจะเป็นเอกสารที่มีโครงสร้างหรือไม่ก็ตาม ตัวอย่างเช่น ในโลกธุรกิจและการเงิน เทคโนโลยีอาจถูกนำมาใช้ในการประมวลผลใบแจ้งหนี้ แบบฟอร์ม ใบสั่งซื้อ สัญญา และธนบัตรที่เป็นกระดาษ [ 10 ]...