กลับไปหน้าบทความ

อ่าน 2 นาที

การแก้ไขข้อมูล

การแก้ไขข้อมูล หมายถึงกระบวนการที่เกี่ยวข้องกับการตรวจสอบและปรับ ข้อมูลสำรวจ ที่รวบรวม ไว้ [ 1 ]...

การแก้ไขข้อมูล

การแก้ไขข้อมูลหมายถึงกระบวนการที่เกี่ยวข้องกับการตรวจสอบและปรับข้อมูลสำรวจ ที่รวบรวม ไว้[ 1 ]การแก้ไขข้อมูลช่วยกำหนดแนวทางที่จะลดอคติที่อาจเกิดขึ้นและรับรองการประมาณค่าที่สอดคล้องกัน ซึ่งนำไปสู่การวิเคราะห์ชุดข้อมูลที่ชัดเจนโดยการแก้ไขข้อมูลที่ไม่สอดคล้องกันโดยใช้วิธีการที่จะกล่าวถึงในบทความนี้[ 2 ]จุดประสงค์คือเพื่อควบคุมคุณภาพของข้อมูลที่รวบรวมไว้[ 3 ]การแก้ไขข้อมูลสามารถทำได้ด้วยตนเอง โดยใช้คอมพิวเตอร์ช่วย หรือทั้งสองอย่างรวมกัน[ 4 ]

วิธีการแก้ไข

วิธีการแก้ไขข้อมูลหมายถึงขั้นตอนและกระบวนการต่างๆ ที่ใช้ในการตรวจจับและจัดการข้อผิดพลาดในข้อมูล การแก้ไขข้อมูลมีจุดประสงค์เพื่อปรับปรุงคุณภาพของข้อมูลทางสถิติที่ผลิตขึ้น การปรับเปลี่ยนเหล่านี้สามารถปรับปรุงคุณภาพของการวิเคราะห์ที่สร้างขึ้นได้อย่างมาก โดยมุ่งเน้นการตรวจจับและแก้ไขข้อผิดพลาด ตัวอย่างของเทคนิคต่างๆ ในการแก้ไขข้อมูล เช่น การแก้ไขระดับจุลภาค การแก้ไขระดับมหภาค การแก้ไขแบบเลือก หรือเครื่องมือต่างๆ ที่ใช้ในการแก้ไขข้อมูล เช่น การแก้ไขด้วยกราฟและการแก้ไขแบบโต้ตอบ

การแก้ไขแบบโต้ตอบ

คำว่า การแก้ไขแบบโต้ตอบ (Interactive editing) มักใช้เรียกการแก้ไขข้อมูลด้วยตนเองโดยใช้คอมพิวเตอร์ช่วยในยุคปัจจุบัน เครื่องมือแก้ไขข้อมูลแบบโต้ตอบส่วนใหญ่ที่ใช้ในสถาบันสถิติแห่งชาติ (NSIs) อนุญาตให้ตรวจสอบการแก้ไขที่ระบุไว้ระหว่างหรือหลังการป้อนข้อมูล และหากจำเป็น สามารถแก้ไขข้อมูลที่ผิดพลาดได้ทันที มีหลายวิธีในการแก้ไขข้อมูลที่ผิดพลาด:

  • ติดต่อผู้ตอบแบบสอบถามอีกครั้ง
  • เปรียบเทียบข้อมูลของผู้ตอบแบบสอบถามกับข้อมูลของเขาจากปีที่แล้ว
  • เปรียบเทียบข้อมูลของผู้ตอบแบบสอบถามรายนี้กับข้อมูลจากผู้ตอบแบบสอบถามที่มีลักษณะคล้ายคลึงกัน
  • ใช้ความรู้เฉพาะด้านของบรรณาธิการที่เป็นมนุษย์

การแก้ไขแบบโต้ตอบเป็นวิธีมาตรฐานในการแก้ไขข้อมูล สามารถใช้แก้ไขได้ทั้ง ข้อมูล เชิงหมวดหมู่และข้อมูลต่อเนื่อง[ 5 ]การแก้ไขแบบโต้ตอบช่วยลดระยะเวลาที่จำเป็นในการดำเนินการตามกระบวนการตรวจสอบและปรับเปลี่ยนแบบวนรอบ[ 6 ]การแก้ไขแบบโต้ตอบยังต้องอาศัยความเข้าใจในชุดข้อมูลและผลลัพธ์ที่เป็นไปได้ที่จะได้รับจากการวิเคราะห์ข้อมูลด้วย

การตัดต่อแบบเลือกสรร

การแก้ไขแบบเลือกสรรเป็นคำรวมที่ใช้เรียกวิธีการหลายวิธีในการระบุข้อผิดพลาดที่มีอิทธิพล[หมายเหตุ 1 ]และข้อมูลผิดปกติ [ หมายเหตุ 2 ]เทคนิคการแก้ไขแบบเลือกสรรมีจุดมุ่งหมายเพื่อใช้การแก้ไขแบบโต้ตอบกับชุดย่อยของบันทึกที่เลือกไว้อย่างดี เพื่อให้เวลาและทรัพยากรที่มีจำกัดสำหรับการแก้ไขแบบโต้ตอบถูกจัดสรรให้กับบันทึกเหล่านั้นซึ่งมีผลกระทบมากที่สุดต่อคุณภาพของการประมาณค่าสุดท้ายของตัวเลขที่เผยแพร่ ในการแก้ไขแบบเลือกสรร ข้อมูลจะถูกแบ่งออกเป็นสองส่วน:

  • กระแสวิกฤต
  • กระแสที่ไม่วิกฤต

กระแสข้อมูลที่สำคัญประกอบด้วยบันทึกที่มีแนวโน้มที่จะมีข้อผิดพลาดที่ส่งผลกระทบ บันทึกที่สำคัญเหล่านี้จะได้รับการแก้ไขในลักษณะโต้ตอบแบบดั้งเดิม บันทึกในกระแสข้อมูลที่ไม่สำคัญซึ่งไม่น่าจะมีข้อผิดพลาดที่ส่งผลกระทบจะไม่ได้รับการแก้ไขในลักษณะที่ใช้คอมพิวเตอร์ช่วย[ 7 ]

เทคนิคการแก้ไขข้อมูล

การแก้ไขข้อมูลสามารถทำได้หลายวิธีและขึ้นอยู่กับชุดข้อมูลที่กำลังสำรวจเป็นหลัก[ 8 ]

ความถูกต้องและความครบถ้วนของข้อมูล

ความถูกต้องของชุดข้อมูลขึ้นอยู่กับความครบถ้วนของคำตอบที่ผู้ตอบแบบสอบถามให้มา วิธีหนึ่งในการตรวจสอบความถูกต้องของข้อมูลคือการตรวจสอบให้แน่ใจว่าคำตอบทั้งหมดครบถ้วนในช่องที่ต้องการคำตอบเป็นตัวเลขหรือไม่ใช่ตัวเลข ดูตัวอย่างด้านล่าง

ตารางด้านบนเป็นตัวอย่างของข้อมูลที่ไม่สมบูรณ์และไม่ถูกต้อง ดูที่คอลัมน์ที่ 1 แถวที่ 2: คำตอบเป็นตัวอักษรและตัวเลข ในขณะที่ส่วนที่เหลือของตารางเป็นตัวเลข ดูที่คอลัมน์ที่ 3 แถวที่ 3: คำตอบไม่สมบูรณ์และมีข้อมูลขาดหายไป

การป้อนข้อมูลซ้ำซ้อน

การตรวจสอบว่าข้อมูลไม่ซ้ำกันเป็นสิ่งสำคัญในการแก้ไขข้อมูล เพื่อให้แน่ใจว่าข้อมูลทั้งหมดที่ป้อนเข้ามานั้นถูกป้อนเพียงครั้งเดียวเท่านั้น ซึ่งจะช่วยลดโอกาสที่จะมีข้อมูลซ้ำซ้อนที่อาจทำให้ รายงาน การวิเคราะห์ คลาดเคลื่อนได้ ดูตัวอย่างด้านล่าง

ตารางด้านบนเป็นตัวอย่างข้อมูลที่มีรายการซ้ำกัน โปรดดูรายการที่ 1 และ 4: ข้อมูลซ้ำกันสำหรับสองรายการที่แตกต่างกัน โดยมีดัชนี (หมายเลขดัชนี) ที่แตกต่างกัน

ค่าผิดปกติ

เป็นเรื่องปกติที่จะพบค่าผิดปกติในชุดข้อมูล ซึ่งดังที่ได้กล่าวไปแล้วคือค่าที่ไม่สอดคล้องกับแบบจำลองข้อมูล ค่าสุดขั้วเหล่านี้สามารถพบได้จากการกระจายของจุดข้อมูลจากชุดข้อมูลก่อนหน้าหรือชุดข้อมูลคู่ขนานสำหรับชุดข้อมูลเดียวกัน ค่าเหล่านี้อาจถือว่าผิดพลาดและจำเป็นต้องมีการวิเคราะห์เพิ่มเติมเพื่อตรวจสอบและกำหนดความถูกต้องของการตอบสนอง ดูตัวอย่างด้านล่าง

ตารางด้านบนเป็นตัวอย่างของค่าสุดขั้วในชุดข้อมูล หรือที่เรียกว่าค่าผิดปกติ ดูที่พนักงานหมายเลข 2 และ 6: ข้อมูลของพวกเขามีความแตกต่างจากข้อมูลส่วนที่เหลือของตารางอย่างเห็นได้ชัด

ความไม่สอดคล้องกันทางตรรกะ

ความสอดคล้องเชิงตรรกะหมายถึงการมีอยู่ของความสัมพันธ์เชิงตรรกะและการพึ่งพาซึ่งกันและกันระหว่างตัวแปร การแก้ไขข้อมูลประเภทนี้ต้องอาศัยความเข้าใจเกี่ยวกับชุดข้อมูลและความสามารถในการระบุข้อผิดพลาดในข้อมูลโดยอิงจากรายงานหรือข้อมูลก่อนหน้านี้ การแก้ไขข้อมูลประเภทนี้ใช้เพื่ออธิบายความแตกต่างระหว่างฟิลด์ข้อมูลหรือตัวแปร ดูตัวอย่างด้านล่าง

ตารางด้านบนเป็นตัวอย่างของความไม่สอดคล้องกันทางตรรกะในชุดข้อมูล ดูที่แถวที่ 2: อายุของซาลิมถูกบันทึกไว้ว่า 55 ซม. ซึ่งไม่สมเหตุสมผลและถือเป็นข้อผิดพลาดในชุดข้อมูล

การแก้ไขมาโคร

มีวิธีการแก้ไขมาโครสองวิธี: [ 7 ]

วิธีการรวมกลุ่ม

วิธีการนี้ถูกนำมาใช้ในหน่วยงานสถิติเกือบทุกแห่งก่อนการเผยแพร่: ตรวจสอบว่าตัวเลขที่จะเผยแพร่ดูสมเหตุสมผลหรือไม่ วิธีนี้ทำได้โดยการเปรียบเทียบปริมาณในตารางที่เผยแพร่กับปริมาณเดียวกันในการเผยแพร่ครั้งก่อน หากพบค่าที่ผิดปกติ จะมีการใช้ขั้นตอนการแก้ไขย่อยกับบันทึกและฟิลด์แต่ละรายการที่ก่อให้เกิดปริมาณที่น่าสงสัย[ 6 ]

วิธีการกระจาย

ข้อมูลที่มีอยู่จะถูกนำมาใช้เพื่อกำหนดลักษณะการกระจายตัวของตัวแปรจากนั้นค่าแต่ละค่าทั้งหมดจะถูกเปรียบเทียบกับการกระจายตัว บันทึกที่มีค่าที่อาจถือว่าผิดปกติ (เมื่อพิจารณาจากการกระจายตัว) จะเป็นผู้สมัครสำหรับการตรวจสอบเพิ่มเติมและอาจต้องแก้ไข[ 9 ]

การแก้ไขอัตโนมัติ

ในการแก้ไขอัตโนมัติ บันทึกจะถูกแก้ไขโดยคอมพิวเตอร์โดยไม่ต้องมีการแทรกแซงจากมนุษย์[ 10 ]ความรู้ก่อนหน้าเกี่ยวกับค่าของตัวแปรเดียวหรือการรวมกันของตัวแปรสามารถกำหนดเป็นชุดของกฎการแก้ไขซึ่งระบุหรือจำกัดค่าที่ยอมรับได้

ปัจจัยกำหนดการแก้ไขข้อมูล

การแก้ไขข้อมูลมีข้อจำกัดในด้านขีดความสามารถและทรัพยากรของการศึกษาใดๆ ปัจจัยกำหนดเหล่านี้อาจส่งผลดีหรือผลเสียต่อการวิเคราะห์ข้อมูลในภายหลัง ปัจจัยกำหนดการแก้ไขข้อมูลมีดังต่อไปนี้[ 8 ]

ทรัพยากรที่มีอยู่: [ 8 ]

  • เวลาที่จัดสรรให้กับโครงการ
  • ข้อจำกัดด้านเงินและงบประมาณ

ซอฟต์แวร์ที่ใช้งานได้: [ 8 ]

  • เครื่องมือที่ใช้ในการวิเคราะห์ข้อมูล
  • เครื่องมือที่มีอยู่สำหรับระบุข้อผิดพลาดในชุดข้อมูล
  • ความพร้อมใช้งานของซอฟต์แวร์ในทันที ขึ้นอยู่กับวัตถุประสงค์และเป้าหมายของข้อมูล

แหล่งข้อมูล: [ 8 ]

  • ข้อจำกัดของผู้ตอบแบบสอบถามในการตอบคำถามให้ตรงตามความคาดหวัง
  • ข้อมูลจากผู้ตอบแบบสอบถามที่ขาดหายไปและไม่สามารถหาได้โดยง่าย
  • การติดตามผลทำได้ยากในฐานข้อมูลขนาดใหญ่

การประสานงานขั้นตอนการแก้ไขข้อมูล: [ 8 ]

  • มุมมองส่วนตัวเกี่ยวกับชุดข้อมูล
  • ความไม่ลงรอยกันระหว่างวัตถุประสงค์โดยรวมของข้อมูล
  • วิธีการที่ใช้ในการจัดการการแก้ไขข้อมูล

ดูเพิ่มเติม

หมายเหตุ

  1. ^ข้อผิดพลาดที่มีผลกระทบอย่างมากต่อตัวเลขการตีพิมพ์
  2. ^ค่าที่ไม่สอดคล้องกับแบบจำลองข้อมูล
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Data_editing&oldid=1315979914 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การแก้ไขข้อมูล

การแก้ไขข้อมูล หมายถึงกระบวนการที่เกี่ยวข้องกับการตรวจสอบและปรับ ข้อมูลสำรวจ ที่รวบรวม ไว้ [ 1 ]...

วิธีการแก้ไข

วิธีการแก้ไขข้อมูลหมายถึงขั้นตอนและกระบวนการต่างๆ ที่ใช้ในการตรวจจับและจัดการข้อผิดพลาดในข้อมูล การแก้ไขข้อมูลมีจุดประสงค์เพื่อปรับปรุงคุณภาพของข้อมูลทางสถิติที่ผลิตขึ้น การปรับเปลี่ยนเหล่านี้สามารถปรับปรุงคุณภาพของการวิเคราะห์ที่สร้างขึ้นได้อย่างมาก...

การแก้ไขแบบโต้ตอบ

คำว่า การแก้ไขแบบโต้ตอบ (Interactive editing) มักใช้เรียกการแก้ไขข้อมูลด้วยตนเองโดยใช้คอมพิวเตอร์ช่วยในยุคปัจจุบัน เครื่องมือแก้ไขข้อมูลแบบโต้ตอบส่วนใหญ่ที่ใช้ในสถาบันสถิติแห่งชาติ (NSIs) อนุญาตให้ตรวจสอบการแก้ไขที่ระบุไว้ระหว่างหรือหลังการป้อนข้อมูล...

การตัดต่อแบบเลือกสรร

การแก้ไขแบบเลือกสรรเป็นคำรวมที่ใช้เรียกวิธีการหลายวิธีในการระบุข้อผิดพลาดที่มีอิทธิพล [ หมายเหตุ 1 ] และ ข้อมูลผิดปกติ [ หมายเหตุ 2 ] เทคนิคการแก้ไขแบบเลือกสรรมีจุดมุ่งหมายเพื่อใช้การแก้ไขแบบโต้ตอบกับชุดย่อยของบันทึกที่เลือกไว้อย่างดี...