อ่าน 2 นาที
ข้อมูลดิบ
ข้อมูลดิบหรือที่เรียกว่าข้อมูลปฐมภูมิคือข้อมูล (เช่น ตัวเลข การอ่านค่าจากเครื่องมือ แผนภูมิ ฯลฯ
ข้อมูลดิบ

ข้อมูลดิบหรือที่เรียกว่าข้อมูลปฐมภูมิคือข้อมูล (เช่น ตัวเลข การอ่านค่าจากเครื่องมือ แผนภูมิ ฯลฯ) ที่รวบรวมมาจากแหล่งข้อมูล ในบริบทของการสอบ ข้อมูลดิบอาจถูกอธิบายว่าเป็นคะแนนดิบ (หลังจากคะแนนสอบ )
หากนักวิทยาศาสตร์ติดตั้งเทอร์โมมิเตอร์ แบบคอมพิวเตอร์ ที่บันทึกอุณหภูมิของสารเคมีผสมในหลอดทดลองทุกนาที รายการค่าอุณหภูมิที่บันทึกในแต่ละนาที ซึ่งพิมพ์ออกมาในสเปรดชีตหรือแสดงบนหน้าจอคอมพิวเตอร์ เรียกว่า "ข้อมูลดิบ" ข้อมูลดิบยังไม่ได้รับการประมวลผล "ทำความสะอาด" โดยนักวิจัยเพื่อกำจัดค่าผิดปกติข้อผิดพลาดในการอ่านค่าเครื่องมือ หรือข้อผิดพลาดในการป้อนข้อมูล หรือการวิเคราะห์ใดๆ (เช่น การหา ค่ากลางเช่น ค่าเฉลี่ยหรือ ค่า มัธยฐาน ) นอกจากนี้ ข้อมูลดิบยังไม่ได้รับการจัดการใดๆ โดยโปรแกรมซอฟต์แวร์หรือนักวิจัย นักวิเคราะห์ หรือช่างเทคนิค ข้อมูลดิบยังถูกเรียกว่า ข้อมูล ปฐมภูมิ ด้วย คำว่า "ข้อมูลดิบ" เป็นคำที่สัมพันธ์กัน (ดูข้อมูล ) เพราะแม้ว่าข้อมูลดิบจะได้รับการ "ทำความสะอาด" และประมวลผลโดยทีมวิจัยหนึ่งแล้ว ทีมวิจัยอื่นอาจพิจารณาว่าข้อมูลที่ประมวลผลแล้วเหล่านี้เป็น "ข้อมูลดิบ" สำหรับขั้นตอนการวิจัยอื่น ข้อมูลดิบสามารถป้อนเข้าสู่โปรแกรมคอมพิวเตอร์หรือใช้ในกระบวนการด้วยตนเอง เช่น การวิเคราะห์สถิติจากแบบสำรวจคำว่า "ข้อมูลดิบ" อาจหมายถึง ข้อมูล ไบนารีบนอุปกรณ์จัดเก็บข้อมูลอิเล็กทรอนิกส์ เช่น ฮาร์ดดิสก์ไดรฟ์ (ซึ่งเรียกอีกอย่างว่า "ข้อมูลระดับต่ำ")
การสร้างข้อมูล
ข้อมูลถูกสร้างขึ้นหรือผลิตได้สองวิธี วิธีแรกเรียกว่า 'ข้อมูลที่รวบรวมได้' [ 1 ]ซึ่งพบได้จากการตรวจสอบหรือวิเคราะห์อย่างมีจุดประสงค์ วิธีที่สองเรียกว่า 'ข้อมูลที่เหลือจากการใช้งาน' [ 1 ]ซึ่งมักจะรวบรวมโดยเครื่องจักรหรือเทอร์มินัลเป็นฟังก์ชันรอง ตัวอย่างเช่น เครื่องคิดเงิน สมาร์ทโฟน และมาตรวัดความเร็วทำหน้าที่หลัก แต่ก็อาจรวบรวมข้อมูลเป็นงานรองได้ ข้อมูลที่เหลือจากการใช้งานมักมีขนาดใหญ่เกินไปหรือมีประโยชน์น้อยที่จะประมวลผลและกลายเป็น 'ข้อมูลชั่วคราว' หรือถูกทิ้งไป[ 1 ]
ตัวอย่าง
ในด้านคอมพิวเตอร์ข้อมูลดิบอาจมีคุณลักษณะดังต่อไปนี้: อาจมีข้อผิดพลาดจากมนุษย์ เครื่องจักร หรือเครื่องมือ อาจยังไม่ได้รับการตรวจสอบความถูกต้อง อาจอยู่ในรูปแบบที่แตกต่างกัน ( ภาษาพูด ) อาจ ไม่มีการเข้ารหัสหรือการจัดรูปแบบ หรือบางรายการอาจ "น่าสงสัย" (เช่นค่าผิดปกติ ) ซึ่งต้องมีการยืนยันหรืออ้างอิงตัวอย่างเช่น แผ่นงานป้อนข้อมูลอาจมีวันที่เป็นข้อมูลดิบในหลายรูปแบบ เช่น "31 มกราคม 1999", "31/01/1999", "31/1/99", "31 ม.ค." หรือ "วันนี้" เมื่อบันทึกแล้ว ข้อมูลดิบนี้อาจถูกประมวลผลและจัดเก็บในรูปแบบมาตรฐาน เช่นวันที่แบบจูเลียนเพื่อให้คอมพิวเตอร์และมนุษย์ตีความได้ง่ายขึ้นในระหว่างการประมวลผลในภายหลัง ข้อมูลดิบ (บางครั้งเรียกกันทั่วไปว่า ข้อมูล "แหล่งที่มา" หรือข้อมูล "ไข่ดิบ" ซึ่งอย่างหลังหมายถึงข้อมูลที่ "ยังไม่สุก" หรือ "ยังไม่ผ่านการประมวลผล" เหมือนไข่ ดิบ ) คือข้อมูลที่ป้อนเข้าสู่กระบวนการประมวลผล มีการแบ่งแยกความแตกต่างระหว่างข้อมูลดิบและสารสนเทศโดยที่สารสนเทศเป็น ผลลัพธ์ สุดท้ายของ การประมวล ผลข้อมูลดิบ ข้อมูลดิบที่ผ่านการประมวลผลแล้วบางครั้งเรียกว่า "ข้อมูลปรุงแต่ง" ในความหมายทั่วไป แม้ว่าข้อมูลดิบจะมีศักยภาพที่จะเปลี่ยนเป็น " สารสนเทศ " ได้ แต่การสกัด การจัดระเบียบ การวิเคราะห์ และการจัดรูปแบบเพื่อการนำเสนอเป็นสิ่งจำเป็นก่อนที่ข้อมูลดิบจะสามารถเปลี่ยนเป็นสารสนเทศที่ใช้งานได้
ตัวอย่างเช่นเครื่องคิดเงิน ณ จุดขาย (POS terminal หรือเครื่องบันทึกเงินสด แบบคอมพิวเตอร์ ) ในซูเปอร์มาร์เก็ตที่พลุกพล่านจะรวบรวมข้อมูลดิบจำนวนมหาศาลเกี่ยวกับการซื้อสินค้าของลูกค้าในแต่ละวัน อย่างไรก็ตาม รายการสินค้า ราคา เวลา และวันที่ซื้อเหล่านี้ ไม่ได้ให้ข้อมูลที่เป็นประโยชน์มากนักจนกว่าจะได้รับการประมวลผล เมื่อได้รับการประมวลผลและวิเคราะห์โดยโปรแกรมซอฟต์แวร์หรือแม้แต่โดยนักวิจัยที่ใช้ปากกา กระดาษ และเครื่องคิดเลขข้อมูลดิบเหล่านี้อาจระบุรายการสินค้าที่ลูกค้าแต่ละรายซื้อ เมื่อใดที่ซื้อ และราคาเท่าใด นอกจากนี้ นักวิเคราะห์หรือผู้จัดการยังสามารถคำนวณยอดขายรวมเฉลี่ยต่อลูกค้า หรือค่าใช้จ่ายเฉลี่ยต่อวันในแต่ละสัปดาห์ต่อชั่วโมงได้ ข้อมูลที่ประมวลผลและวิเคราะห์แล้วนี้จะให้ข้อมูลแก่ผู้จัดการ ซึ่งผู้จัดการสามารถนำไปใช้ในการตัดสินใจ เช่น ควรจ้างพนักงานเก็บเงินกี่คนและในเวลาใดข้อมูล ดังกล่าว สามารถกลายเป็นข้อมูลสำหรับการประมวลผลเพิ่มเติมได้ เช่น เป็นส่วนหนึ่งของ แคมเปญ การตลาดเชิง คาด การณ์ ผลจากการประมวลผล ข้อมูลดิบบางครั้งจะถูกจัดเก็บไว้ในฐานข้อมูลซึ่งทำให้ข้อมูลดิบสามารถเข้าถึงได้สำหรับการประมวลผลและการวิเคราะห์เพิ่มเติมในหลากหลายวิธี
ทิม เบอร์เนอร์ส-ลี (ผู้คิดค้นเวิลด์ไวด์เว็บ ) กล่าวว่า การแบ่งปันข้อมูลดิบมีความสำคัญต่อสังคม เขาได้รับ แรงบันดาลใจจากบทความของรูฟัส พอลล็อกจากมูลนิธิโอเพ่นโคโลเนียลจึงเรียกร้องให้ทุกคน"เปิดเผยข้อมูลดิบเดี๋ยวนี้ " หมายความว่าทุกคนควรเรียกร้องให้รัฐบาลและธุรกิจแบ่งปันข้อมูลที่พวกเขารวบรวมไว้ในรูปแบบข้อมูลดิบ เขาชี้ให้เห็นว่า "ข้อมูลเป็นตัวขับเคลื่อนสิ่งต่างๆ มากมายในชีวิตของเรา...เพราะมีคนนำข้อมูลไปใช้และทำอะไรบางอย่าง" สำหรับเบอร์เนอร์ส-ลี ความก้าวหน้าทางวิทยาศาสตร์จะเกิดขึ้นจากการแบ่งปันข้อมูลดิบนี้เอง ผู้สนับสนุนข้อมูลเปิดกล่าวว่า เมื่อประชาชนและองค์กรภาคประชาสังคมสามารถเข้าถึงข้อมูลจากธุรกิจและรัฐบาลได้แล้ว จะทำให้ประชาชนและองค์กรพัฒนาเอกชนสามารถวิเคราะห์ข้อมูลได้ด้วยตนเอง ซึ่งจะช่วยเพิ่มศักยภาพให้แก่ประชาชนและภาคประชาสังคม ตัวอย่างเช่น รัฐบาลอาจอ้างว่านโยบายของตนช่วยลด อัตราการว่างงานแต่ กลุ่มรณรงค์ลด ความยากจนอาจมีนักเศรษฐศาสตร์ ประจำกลุ่ม ทำการวิเคราะห์ข้อมูลดิบด้วยตนเอง ซึ่งอาจทำให้กลุ่มนี้ได้ข้อสรุปที่แตกต่างกันเกี่ยวกับชุดข้อมูลนั้น
การวิจารณ์ข้อมูลดิบ
นักวิชาการด้าน การศึกษาข้อมูลเชิงวิพากษ์ได้วิพากษ์วิจารณ์คำว่าข้อมูลดิบ[ 2 ] [ 3 ]การวิพากษ์วิจารณ์นี้เกิดจากแนวคิดที่ว่า ข้อมูลไม่สามารถเป็นข้อมูลดิบได้ แต่ข้อมูลนั้นถูกสร้างและกำหนดรูปร่างโดยการตัดสินใจของผู้คนเสมอ นักวิชาการด้านมนุษยศาสตร์โจฮันนา ดรักเกอร์ ได้โต้แย้งว่า ข้อมูลนั้น " ถูกบันทึกรวบรวม และสร้างขึ้น" [ 4 ]ตัวอย่างเช่น เมื่อข้อมูลจากเทอร์โมมิเตอร์หรือเครื่องมืออื่นๆ ถูกสร้างขึ้น ข้อมูลนั้นจะถูกกำหนดรูปร่างโดยการกำหนดค่าเฉพาะของการออกแบบเครื่องมือ
ความแตกต่างระหว่างข้อมูลดิบและข้อมูลที่ผ่านการประมวลผล
ข้อมูลดิบ หรือที่เรียกกันทั่วไปว่าข้อมูลปฐมภูมิคือข้อมูลที่ยังไม่ผ่านการประมวลผลและเป็นรูปแบบดั้งเดิมที่รวบรวมโดยตรงจากแหล่งที่มาหรือเครื่องมือ อาจมีข้อผิดพลาด ความไม่สอดคล้องกัน หรือข้อมูลที่ซ้ำซ้อน และโดยทั่วไปแล้วจำเป็นต้องมีขั้นตอนการประมวลผล เช่น การทำความสะอาด การตรวจสอบความถูกต้อง และการจัดโครงสร้าง เพื่อให้สามารถใช้งานได้ข้อมูลที่ผ่านการประมวลผลแล้วคือผลลัพธ์จากการแปลงข้อมูลดิบให้เป็นรูปแบบที่มีการจัดระเบียบและตีความได้ ทำให้เหมาะสมสำหรับการวิเคราะห์ การแสดงผล และการตัดสินใจ ความยืดหยุ่นและความสมบูรณ์ของข้อมูลดิบช่วยให้สามารถวิเคราะห์ได้อย่างครอบคลุมและหลากหลาย ในขณะที่ข้อมูลที่ผ่านการประมวลผลแล้วทำหน้าที่เป็นพื้นฐานเชิงปฏิบัติสำหรับการสร้างข้อมูลเชิงลึกที่นำไปสู่การปฏิบัติได้ เนื่องจากข้อมูลดิบเก็บรักษาข้อมูลรายละเอียดได้อย่างครบถ้วน จึงมีคุณค่าอย่างยิ่งในการวิจัยทางวิทยาศาสตร์และการเรียนรู้ของเครื่องจักรซึ่งข้อมูลป้อนเข้าคุณภาพสูงมีความสำคัญอย่างยิ่งต่อความถูกต้องของข้อสรุปและการฝึกอบรมแบบจำลอง
ดูเพิ่มเติม
อ่านเพิ่มเติม
- ขอข้อมูลดิบมาให้เรา และส่งให้เราเดี๋ยวนี้ - บทความในบล็อกของรูฟัส พอลล็อก ที่เป็นแรงบันดาลใจให้ทิม เบอร์เนอร์ส-ลี
- ทิม เบอร์เนอร์ส-ลี มอบนิยามใหม่ให้กับเว็บ
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ข้อมูลดิบ
ข้อมูลดิบหรือที่เรียกว่าข้อมูลปฐมภูมิคือข้อมูล (เช่น ตัวเลข การอ่านค่าจากเครื่องมือ แผนภูมิ ฯลฯ
การสร้างข้อมูล
ข้อมูลถูกสร้างขึ้นหรือผลิตได้สองวิธี วิธีแรกเรียกว่า 'ข้อมูลที่รวบรวมได้' [ 1 ] ซึ่งพบได้จากการตรวจสอบหรือวิเคราะห์อย่างมีจุดประสงค์ วิธีที่สองเรียกว่า 'ข้อมูลที่เหลือจากการใช้งาน' [ 1 ] ซึ่งมักจะรวบรวมโดยเครื่องจักรหรือเทอร์มินัลเป็นฟังก์ชันรอง ตัวอย่างเช่น...
ตัวอย่าง
ในด้าน คอมพิวเตอร์ ข้อมูลดิบอาจมีคุณลักษณะดังต่อไปนี้: อาจมีข้อผิดพลาดจากมนุษย์ เครื่องจักร หรือเครื่องมือ อาจยังไม่ได้รับการตรวจสอบความถูกต้อง อาจอยู่ในรูปแบบที่แตกต่างกัน ( ภาษาพูด ) อาจ ไม่มีการเข้ารหัส หรือการจัดรูปแบบ หรือบางรายการอาจ "น่าสงสัย" (เช่น...
การวิจารณ์ข้อมูลดิบ
นักวิชาการด้าน การศึกษาข้อมูลเชิงวิพากษ์ ได้วิพากษ์วิจารณ์คำว่าข้อมูล ดิบ [ 2 ] [ 3 ] การวิพากษ์วิจารณ์นี้เกิดจากแนวคิดที่ว่า ข้อมูลไม่สามารถเป็นข้อมูลดิบได้ แต่ข้อมูลนั้นถูกสร้างและกำหนดรูปร่างโดยการตัดสินใจของผู้คนเสมอ นักวิชาการด้านมนุษยศาสตร์ โจฮันนา...