อ่าน 2 นาที
การแก้ไขข้อมูล
การแก้ไขข้อมูล หมายถึงกระบวนการที่เกี่ยวข้องกับการตรวจสอบและปรับ ข้อมูลสำรวจ ที่รวบรวม ไว้ [ 1 ]...
การแก้ไขข้อมูล
การแก้ไขข้อมูลหมายถึงกระบวนการที่เกี่ยวข้องกับการตรวจสอบและปรับข้อมูลสำรวจ ที่รวบรวม ไว้[ 1 ]การแก้ไขข้อมูลช่วยกำหนดแนวทางที่จะลดอคติที่อาจเกิดขึ้นและรับรองการประมาณค่าที่สอดคล้องกัน ซึ่งนำไปสู่การวิเคราะห์ชุดข้อมูลที่ชัดเจนโดยการแก้ไขข้อมูลที่ไม่สอดคล้องกันโดยใช้วิธีการที่จะกล่าวถึงในบทความนี้[ 2 ]จุดประสงค์คือเพื่อควบคุมคุณภาพของข้อมูลที่รวบรวมไว้[ 3 ]การแก้ไขข้อมูลสามารถทำได้ด้วยตนเอง โดยใช้คอมพิวเตอร์ช่วย หรือทั้งสองอย่างรวมกัน[ 4 ]
วิธีการแก้ไข
วิธีการแก้ไขข้อมูลหมายถึงขั้นตอนและกระบวนการต่างๆ ที่ใช้ในการตรวจจับและจัดการข้อผิดพลาดในข้อมูล การแก้ไขข้อมูลมีจุดประสงค์เพื่อปรับปรุงคุณภาพของข้อมูลทางสถิติที่ผลิตขึ้น การปรับเปลี่ยนเหล่านี้สามารถปรับปรุงคุณภาพของการวิเคราะห์ที่สร้างขึ้นได้อย่างมาก โดยมุ่งเน้นการตรวจจับและแก้ไขข้อผิดพลาด ตัวอย่างของเทคนิคต่างๆ ในการแก้ไขข้อมูล เช่น การแก้ไขระดับจุลภาค การแก้ไขระดับมหภาค การแก้ไขแบบเลือก หรือเครื่องมือต่างๆ ที่ใช้ในการแก้ไขข้อมูล เช่น การแก้ไขด้วยกราฟและการแก้ไขแบบโต้ตอบ
การแก้ไขแบบโต้ตอบ
คำว่า การแก้ไขแบบโต้ตอบ (Interactive editing) มักใช้เรียกการแก้ไขข้อมูลด้วยตนเองโดยใช้คอมพิวเตอร์ช่วยในยุคปัจจุบัน เครื่องมือแก้ไขข้อมูลแบบโต้ตอบส่วนใหญ่ที่ใช้ในสถาบันสถิติแห่งชาติ (NSIs) อนุญาตให้ตรวจสอบการแก้ไขที่ระบุไว้ระหว่างหรือหลังการป้อนข้อมูล และหากจำเป็น สามารถแก้ไขข้อมูลที่ผิดพลาดได้ทันที มีหลายวิธีในการแก้ไขข้อมูลที่ผิดพลาด:
- ติดต่อผู้ตอบแบบสอบถามอีกครั้ง
- เปรียบเทียบข้อมูลของผู้ตอบแบบสอบถามกับข้อมูลของเขาจากปีที่แล้ว
- เปรียบเทียบข้อมูลของผู้ตอบแบบสอบถามรายนี้กับข้อมูลจากผู้ตอบแบบสอบถามที่มีลักษณะคล้ายคลึงกัน
- ใช้ความรู้เฉพาะด้านของบรรณาธิการที่เป็นมนุษย์
การแก้ไขแบบโต้ตอบเป็นวิธีมาตรฐานในการแก้ไขข้อมูล สามารถใช้แก้ไขได้ทั้ง ข้อมูล เชิงหมวดหมู่และข้อมูลต่อเนื่อง[ 5 ]การแก้ไขแบบโต้ตอบช่วยลดระยะเวลาที่จำเป็นในการดำเนินการตามกระบวนการตรวจสอบและปรับเปลี่ยนแบบวนรอบ[ 6 ]การแก้ไขแบบโต้ตอบยังต้องอาศัยความเข้าใจในชุดข้อมูลและผลลัพธ์ที่เป็นไปได้ที่จะได้รับจากการวิเคราะห์ข้อมูลด้วย
การตัดต่อแบบเลือกสรร
การแก้ไขแบบเลือกสรรเป็นคำรวมที่ใช้เรียกวิธีการหลายวิธีในการระบุข้อผิดพลาดที่มีอิทธิพล[หมายเหตุ 1 ]และข้อมูลผิดปกติ [ หมายเหตุ 2 ]เทคนิคการแก้ไขแบบเลือกสรรมีจุดมุ่งหมายเพื่อใช้การแก้ไขแบบโต้ตอบกับชุดย่อยของบันทึกที่เลือกไว้อย่างดี เพื่อให้เวลาและทรัพยากรที่มีจำกัดสำหรับการแก้ไขแบบโต้ตอบถูกจัดสรรให้กับบันทึกเหล่านั้นซึ่งมีผลกระทบมากที่สุดต่อคุณภาพของการประมาณค่าสุดท้ายของตัวเลขที่เผยแพร่ ในการแก้ไขแบบเลือกสรร ข้อมูลจะถูกแบ่งออกเป็นสองส่วน:
- กระแสวิกฤต
- กระแสที่ไม่วิกฤต
กระแสข้อมูลที่สำคัญประกอบด้วยบันทึกที่มีแนวโน้มที่จะมีข้อผิดพลาดที่ส่งผลกระทบ บันทึกที่สำคัญเหล่านี้จะได้รับการแก้ไขในลักษณะโต้ตอบแบบดั้งเดิม บันทึกในกระแสข้อมูลที่ไม่สำคัญซึ่งไม่น่าจะมีข้อผิดพลาดที่ส่งผลกระทบจะไม่ได้รับการแก้ไขในลักษณะที่ใช้คอมพิวเตอร์ช่วย[ 7 ]
เทคนิคการแก้ไขข้อมูล
การแก้ไขข้อมูลสามารถทำได้หลายวิธีและขึ้นอยู่กับชุดข้อมูลที่กำลังสำรวจเป็นหลัก[ 8 ]
ความถูกต้องและความครบถ้วนของข้อมูล
ความถูกต้องของชุดข้อมูลขึ้นอยู่กับความครบถ้วนของคำตอบที่ผู้ตอบแบบสอบถามให้มา วิธีหนึ่งในการตรวจสอบความถูกต้องของข้อมูลคือการตรวจสอบให้แน่ใจว่าคำตอบทั้งหมดครบถ้วนในช่องที่ต้องการคำตอบเป็นตัวเลขหรือไม่ใช่ตัวเลข ดูตัวอย่างด้านล่าง

การป้อนข้อมูลซ้ำซ้อน
การตรวจสอบว่าข้อมูลไม่ซ้ำกันเป็นสิ่งสำคัญในการแก้ไขข้อมูล เพื่อให้แน่ใจว่าข้อมูลทั้งหมดที่ป้อนเข้ามานั้นถูกป้อนเพียงครั้งเดียวเท่านั้น ซึ่งจะช่วยลดโอกาสที่จะมีข้อมูลซ้ำซ้อนที่อาจทำให้ รายงาน การวิเคราะห์ คลาดเคลื่อนได้ ดูตัวอย่างด้านล่าง

ค่าผิดปกติ
เป็นเรื่องปกติที่จะพบค่าผิดปกติในชุดข้อมูล ซึ่งดังที่ได้กล่าวไปแล้วคือค่าที่ไม่สอดคล้องกับแบบจำลองข้อมูล ค่าสุดขั้วเหล่านี้สามารถพบได้จากการกระจายของจุดข้อมูลจากชุดข้อมูลก่อนหน้าหรือชุดข้อมูลคู่ขนานสำหรับชุดข้อมูลเดียวกัน ค่าเหล่านี้อาจถือว่าผิดพลาดและจำเป็นต้องมีการวิเคราะห์เพิ่มเติมเพื่อตรวจสอบและกำหนดความถูกต้องของการตอบสนอง ดูตัวอย่างด้านล่าง

ความไม่สอดคล้องกันทางตรรกะ
ความสอดคล้องเชิงตรรกะหมายถึงการมีอยู่ของความสัมพันธ์เชิงตรรกะและการพึ่งพาซึ่งกันและกันระหว่างตัวแปร การแก้ไขข้อมูลประเภทนี้ต้องอาศัยความเข้าใจเกี่ยวกับชุดข้อมูลและความสามารถในการระบุข้อผิดพลาดในข้อมูลโดยอิงจากรายงานหรือข้อมูลก่อนหน้านี้ การแก้ไขข้อมูลประเภทนี้ใช้เพื่ออธิบายความแตกต่างระหว่างฟิลด์ข้อมูลหรือตัวแปร ดูตัวอย่างด้านล่าง

การแก้ไขมาโคร
มีวิธีการแก้ไขมาโครสองวิธี: [ 7 ]
วิธีการรวมกลุ่ม
วิธีการนี้ถูกนำมาใช้ในหน่วยงานสถิติเกือบทุกแห่งก่อนการเผยแพร่: ตรวจสอบว่าตัวเลขที่จะเผยแพร่ดูสมเหตุสมผลหรือไม่ วิธีนี้ทำได้โดยการเปรียบเทียบปริมาณในตารางที่เผยแพร่กับปริมาณเดียวกันในการเผยแพร่ครั้งก่อน หากพบค่าที่ผิดปกติ จะมีการใช้ขั้นตอนการแก้ไขย่อยกับบันทึกและฟิลด์แต่ละรายการที่ก่อให้เกิดปริมาณที่น่าสงสัย[ 6 ]
วิธีการกระจาย
ข้อมูลที่มีอยู่จะถูกนำมาใช้เพื่อกำหนดลักษณะการกระจายตัวของตัวแปรจากนั้นค่าแต่ละค่าทั้งหมดจะถูกเปรียบเทียบกับการกระจายตัว บันทึกที่มีค่าที่อาจถือว่าผิดปกติ (เมื่อพิจารณาจากการกระจายตัว) จะเป็นผู้สมัครสำหรับการตรวจสอบเพิ่มเติมและอาจต้องแก้ไข[ 9 ]
การแก้ไขอัตโนมัติ
ในการแก้ไขอัตโนมัติ บันทึกจะถูกแก้ไขโดยคอมพิวเตอร์โดยไม่ต้องมีการแทรกแซงจากมนุษย์[ 10 ]ความรู้ก่อนหน้าเกี่ยวกับค่าของตัวแปรเดียวหรือการรวมกันของตัวแปรสามารถกำหนดเป็นชุดของกฎการแก้ไขซึ่งระบุหรือจำกัดค่าที่ยอมรับได้
ปัจจัยกำหนดการแก้ไขข้อมูล
การแก้ไขข้อมูลมีข้อจำกัดในด้านขีดความสามารถและทรัพยากรของการศึกษาใดๆ ปัจจัยกำหนดเหล่านี้อาจส่งผลดีหรือผลเสียต่อการวิเคราะห์ข้อมูลในภายหลัง ปัจจัยกำหนดการแก้ไขข้อมูลมีดังต่อไปนี้[ 8 ]
ทรัพยากรที่มีอยู่: [ 8 ]
- เวลาที่จัดสรรให้กับโครงการ
- ข้อจำกัดด้านเงินและงบประมาณ
ซอฟต์แวร์ที่ใช้งานได้: [ 8 ]
- เครื่องมือที่ใช้ในการวิเคราะห์ข้อมูล
- เครื่องมือที่มีอยู่สำหรับระบุข้อผิดพลาดในชุดข้อมูล
- ความพร้อมใช้งานของซอฟต์แวร์ในทันที ขึ้นอยู่กับวัตถุประสงค์และเป้าหมายของข้อมูล
แหล่งข้อมูล: [ 8 ]
- ข้อจำกัดของผู้ตอบแบบสอบถามในการตอบคำถามให้ตรงตามความคาดหวัง
- ข้อมูลจากผู้ตอบแบบสอบถามที่ขาดหายไปและไม่สามารถหาได้โดยง่าย
- การติดตามผลทำได้ยากในฐานข้อมูลขนาดใหญ่
การประสานงานขั้นตอนการแก้ไขข้อมูล: [ 8 ]
- มุมมองส่วนตัวเกี่ยวกับชุดข้อมูล
- ความไม่ลงรอยกันระหว่างวัตถุประสงค์โดยรวมของข้อมูล
- วิธีการที่ใช้ในการจัดการการแก้ไขข้อมูล
ดูเพิ่มเติม
- การทำความสะอาดข้อมูล
- การประมวลผลข้อมูลเบื้องต้น
- การจัดการข้อมูล
- การปรับสัดส่วนแบบวนซ้ำ
- การวิเคราะห์สามเหลี่ยม (สังคมศาสตร์)
หมายเหตุ
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การแก้ไขข้อมูล
การแก้ไขข้อมูล หมายถึงกระบวนการที่เกี่ยวข้องกับการตรวจสอบและปรับ ข้อมูลสำรวจ ที่รวบรวม ไว้ [ 1 ]...
วิธีการแก้ไข
วิธีการแก้ไขข้อมูลหมายถึงขั้นตอนและกระบวนการต่างๆ ที่ใช้ในการตรวจจับและจัดการข้อผิดพลาดในข้อมูล การแก้ไขข้อมูลมีจุดประสงค์เพื่อปรับปรุงคุณภาพของข้อมูลทางสถิติที่ผลิตขึ้น การปรับเปลี่ยนเหล่านี้สามารถปรับปรุงคุณภาพของการวิเคราะห์ที่สร้างขึ้นได้อย่างมาก...
การแก้ไขแบบโต้ตอบ
คำว่า การแก้ไขแบบโต้ตอบ (Interactive editing) มักใช้เรียกการแก้ไขข้อมูลด้วยตนเองโดยใช้คอมพิวเตอร์ช่วยในยุคปัจจุบัน เครื่องมือแก้ไขข้อมูลแบบโต้ตอบส่วนใหญ่ที่ใช้ในสถาบันสถิติแห่งชาติ (NSIs) อนุญาตให้ตรวจสอบการแก้ไขที่ระบุไว้ระหว่างหรือหลังการป้อนข้อมูล...
การตัดต่อแบบเลือกสรร
การแก้ไขแบบเลือกสรรเป็นคำรวมที่ใช้เรียกวิธีการหลายวิธีในการระบุข้อผิดพลาดที่มีอิทธิพล [ หมายเหตุ 1 ] และ ข้อมูลผิดปกติ [ หมายเหตุ 2 ] เทคนิคการแก้ไขแบบเลือกสรรมีจุดมุ่งหมายเพื่อใช้การแก้ไขแบบโต้ตอบกับชุดย่อยของบันทึกที่เลือกไว้อย่างดี...