กลับไปหน้าบทความ

อ่าน 7 นาที

ข้อมูล

ข้อมูล ( / ˈ d eɪ t ə / DAY -tə , ในสหรัฐอเมริกา/ ˈ d æ t ə / DAT -ə , ในอินเดีย : / ˈ d iː t ə / DEE-tə ) คือชุดของค่า ที่ไม่ต่อเนื่องหรือต่อเนื่อง...

ข้อมูล

นี่คือตัวอย่างประเภทข้อมูลต่างๆ: ข้อมูลทางภูมิศาสตร์, ข้อมูลทางวัฒนธรรม, ข้อมูลทางวิทยาศาสตร์, ข้อมูลทางการเงิน, ข้อมูลทางสถิติ, ข้อมูลทางอุตุนิยมวิทยา, ข้อมูลทางธรรมชาติ, ข้อมูลทางการขนส่ง

ข้อมูล ( / ˈ d t ə / DAY -tə , ในสหรัฐอเมริกา/ ˈ d æ t ə / DAT , ในอินเดีย : / ˈ d t ə / DEE-tə ) คือชุดของค่า ที่ไม่ต่อเนื่องหรือต่อเนื่อง ที่สื่อถึงข้อมูลอธิบายปริมาณคุณภาพข้อเท็จจริงสถิติ หน่วย ความหมายพื้นฐานอื่นๆ หรือเพียงแค่ลำดับของสัญลักษณ์ที่อาจตีความได้อย่างเป็นทางการ ต่อ ไปจุดข้อมูลหรือข้อมูลดิบคือค่าแต่ละค่าในชุดข้อมูล ข้อมูลมักถูกจัดระเบียบเป็นโครงสร้างเช่นตารางซึ่งให้บริบทและความหมายเพิ่มเติม และอาจใช้เป็นข้อมูลในโครงสร้างที่ใหญ่กว่าได้ ข้อมูลอาจใช้เป็นตัวแปรในกระบวนการคำนวณ[ 1 ] [ 2 ]ข้อมูลอาจแสดงถึงแนวคิดเชิงนามธรรมหรือการวัดที่เป็นรูปธรรม[ 3 ] ข้อมูลมักใช้ใน การวิจัย ทางวิทยาศาสตร์เศรษฐศาสตร์และกิจกรรมองค์กรของมนุษย์แทบทุกรูปแบบ ตัวอย่างของชุดข้อมูล ได้แก่ ดัชนีราคา (เช่นดัชนีราคาผู้บริโภค ) อัตราการว่างงาน อัตรา การรู้หนังสือและ ข้อมูล สำมะโนประชากรในบริบทนี้ ข้อมูลหมายถึงข้อเท็จจริงและตัวเลขดิบๆ ที่สามารถนำมาวิเคราะห์หาข้อมูลที่เป็นประโยชน์ ได้

ข้อมูลถูกรวบรวมโดยใช้เทคนิคต่างๆ เช่นการวัดการสังเกตการสอบถามหรือการวิเคราะห์และโดยทั่วไปจะแสดงเป็นตัวเลขหรือตัวอักษรที่อาจนำไปประมวลผล เพิ่มเติม ได้ข้อมูลภาคสนามคือข้อมูลที่รวบรวมได้ในสภาพแวดล้อม ที่ไม่สามารถควบคุมได้ ณ สถานที่จริงข้อมูลจากการทดลองคือข้อมูลที่สร้างขึ้นในระหว่าง การทดลอง ทางวิทยาศาสตร์ ที่มีการควบคุม ข้อมูลจะถูกวิเคราะห์โดยใช้เทคนิคต่างๆ เช่นการคำนวณการให้เหตุผล การอภิปรายการนำเสนอ การแสดงภาพหรือการวิเคราะห์หลังการทดลองในรูปแบบอื่นๆ ก่อนการวิเคราะห์ข้อมูลดิบ (หรือข้อมูลที่ยังไม่ผ่านการประมวลผล) มักจะถูกทำความสะอาด: ข้อมูลที่ผิดปกติจะถูกลบออก และข้อผิดพลาดที่เห็นได้ชัดจากเครื่องมือหรือการป้อนข้อมูลจะได้รับการแก้ไข

ข้อมูลสามารถมองได้ว่าเป็นหน่วยที่เล็กที่สุดของข้อมูลข้อเท็จจริงที่สามารถใช้เป็นพื้นฐานสำหรับการคำนวณ การให้เหตุผล หรือการอภิปราย ข้อมูลอาจมีตั้งแต่แนวคิดเชิงนามธรรมไปจนถึงการวัดที่เป็นรูปธรรม รวมถึงแต่ไม่จำกัดเพียงสถิติข้อมูลที่เชื่อมโยงกันตามหัวข้อที่นำเสนอในบริบทที่เกี่ยวข้องสามารถมองได้ว่าเป็นข้อมูลข้อมูลที่มีการเชื่อมโยงกันตามบริบทสามารถอธิบายได้ว่าเป็นข้อมูลเชิงลึกหรือสติปัญญา ข้อมูล เชิงลึกและสติปัญญาที่สะสมมาเรื่อย ๆ ซึ่งเป็นผลมาจากการสังเคราะห์ข้อมูลให้เป็นข้อมูล สามารถอธิบายได้ว่าเป็นความรู้ข้อมูลได้รับการอธิบายว่าเป็น " น้ำมัน ใหม่ ของเศรษฐกิจดิจิทัล " [ 4 ] [ 5 ]โดยทั่วไปแล้ว ข้อมูลหมายถึงข้อเท็จจริงที่ว่าข้อมูลหรือความรู้ ที่มีอยู่บางอย่าง ได้รับการแสดงหรือเข้ารหัสในรูปแบบที่เหมาะสมสำหรับการใช้งานหรือการประมวลผลที่ ดีขึ้น

ความก้าวหน้าในเทคโนโลยีการคำนวณนำไปสู่การเกิดขึ้นของข้อมูลขนาดใหญ่ซึ่งโดยทั่วไปหมายถึงข้อมูลปริมาณมหาศาล โดยปกติจะมีขนาดระดับเพตาไบต์ หากจำกัดอยู่เพียงวิธีการวิเคราะห์ข้อมูลและการคำนวณแบบดั้งเดิม การทำงานกับชุดข้อมูลขนาดใหญ่ (และกำลังเพิ่มขึ้น) เช่นนี้เป็นเรื่องยาก หรืออาจเป็นไปไม่ได้เลย ด้วยเหตุนี้ สาขาวิทยาศาสตร์ข้อมูล ซึ่งเป็นสาขาใหม่ จึงใช้ วิธี การเรียนรู้ของเครื่อง (และปัญญาประดิษฐ์ อื่นๆ ) ที่ช่วยให้สามารถประยุกต์ใช้วิธีการวิเคราะห์กับข้อมูลขนาดใหญ่ได้อย่างมีประสิทธิภาพ

ที่มาของคำและศัพท์เฉพาะ

คำภาษาละตินdataเป็นคำพหูพจน์ของdatumซึ่งหมายถึง "(สิ่ง) ที่ได้รับ" และเป็นคำกริยาช่อง 3 ที่เป็นเพศกลางของdareซึ่งหมายถึง "ให้" [ 6 ]การใช้คำว่า "data" ในภาษาอังกฤษครั้งแรกเกิดขึ้นในช่วงทศวรรษ 1640 คำว่า "data" ถูกใช้ครั้งแรกในความหมายว่า "ข้อมูลคอมพิวเตอร์ที่ส่งผ่านและจัดเก็บได้" ในปี 1946 สำนวน "การประมวลผลข้อมูล" ถูกใช้ครั้งแรกในปี 1954 [ 6 ]

เมื่อคำว่า "data" ถูกใช้ในความหมายทั่วไปว่า "information" จะถือว่าเป็นคำนามนับไม่ได้ในรูปเอกพจน์ การใช้งานแบบนี้พบได้ทั่วไปในภาษาพูดในชีวิตประจำวันและในสาขาเทคนิคและวิทยาศาสตร์ เช่นการพัฒนาซอฟต์แวร์และ วิทยาการ คอมพิวเตอร์ตัวอย่างหนึ่งของการใช้งานแบบนี้คือคำว่า " big data " เมื่อใช้เฉพาะเจาะจงเพื่ออ้างถึงการประมวลผลและการวิเคราะห์ชุดข้อมูล คำนี้จะยังคงอยู่ในรูปพหูพจน์ การใช้งานแบบนี้พบได้ทั่วไปในวิทยาศาสตร์ธรรมชาติ วิทยาศาสตร์ชีวภาพ สังคมศาสตร์ การพัฒนาซอฟต์แวร์ และวิทยาการคอมพิวเตอร์ และได้รับความนิยมมากขึ้นในศตวรรษที่ 20 และ 21 คู่มือการเขียนบางฉบับไม่ยอมรับความหมายที่แตกต่างกันของคำนี้ และแนะนำรูปแบบที่เหมาะสมที่สุดสำหรับกลุ่มเป้าหมายของคู่มือเท่านั้น ตัวอย่างเช่นรูปแบบ APAฉบับที่ 7 กำหนดให้ใช้ "data" ในรูปพหูพจน์[ 7 ]

ความหมาย

"ตารางแสดงขนาดรูรับแสงของเลนส์วัตถุ" โดยAdrien Auzout จาก บทความใน วารสาร Philosophical Transactions ปี 1665

ข้อมูลสารสนเทศความรู้และปัญญาเป็นแนวคิดที่เกี่ยวข้องกันอย่างใกล้ชิด แต่ละอย่างมีบทบาทต่อกัน และแต่ละคำก็มีความหมายของตัวเอง ตามทัศนะทั่วไป ข้อมูลจะถูกรวบรวมและวิเคราะห์ ข้อมูลจะกลายเป็นสารสนเทศที่เหมาะสมสำหรับการตัดสินใจได้ก็ต่อเมื่อได้รับการวิเคราะห์ในรูปแบบใดรูปแบบหนึ่งแล้ว[ 8 ] อาจกล่าวได้ว่าขอบเขตที่ชุดข้อมูลให้ข้อมูลแก่บุคคลใดบุคคลหนึ่งนั้นขึ้นอยู่กับขอบเขตที่บุคคลนั้นไม่คาดคิด ปริมาณสารสนเทศที่มีอยู่ในกระแสข้อมูลอาจมีลักษณะเฉพาะด้วยเอนโทรปีของแชนนอน

ความรู้คือความตระหนักรู้เกี่ยวกับสภาพแวดล้อมที่สิ่งใดสิ่งหนึ่งครอบครองอยู่ ในขณะที่ข้อมูลเป็นเพียงการสื่อสารความรู้นั้น ตัวอย่างเช่น ข้อมูลในฐานข้อมูลที่ระบุความสูงของยอดเขาเอเวอเรสต์เป็นข้อมูลที่สื่อสารค่าที่วัดได้อย่างแม่นยำ การวัดนี้อาจถูกรวมไว้ในหนังสือพร้อมกับข้อมูลอื่นๆ เกี่ยวกับยอดเขาเอเวอเรสต์ เพื่ออธิบายภูเขาในลักษณะที่เป็นประโยชน์สำหรับผู้ที่ต้องการตัดสินใจเลือกวิธีที่ดีที่สุดในการปีนเขา ความตระหนักรู้เกี่ยวกับลักษณะที่แสดงโดยข้อมูลนี้คือความรู้

โดยทั่วไป แล้ว ข้อมูลมักถูกมองว่าเป็นแนวคิดที่เป็นนามธรรมน้อยที่สุด สารสนเทศเป็นรองลงมา และความรู้เป็นนามธรรมมากที่สุด[ 9 ]ในมุมมองนี้ ข้อมูลจะกลายเป็นสารสนเทศได้โดยการตีความ เช่น ความสูงของยอดเขาเอเวอเรสต์โดยทั่วไปถือเป็น "ข้อมูล" หนังสือเกี่ยวกับลักษณะทางธรณีวิทยาของยอดเขาเอเวอเรสต์อาจถือเป็น "สารสนเทศ" และคู่มือสำหรับนักปีนเขาที่มีข้อมูลที่เป็นประโยชน์เกี่ยวกับวิธีที่ดีที่สุดในการไปถึงยอดเขาเอเวอเรสต์อาจถือเป็น "ความรู้" "สารสนเทศ" มีความหมายที่หลากหลาย ตั้งแต่การใช้งานในชีวิตประจำวันไปจนถึงการใช้งานทางเทคนิค อย่างไรก็ตาม มุมมองนี้ยังถูกโต้แย้งว่าข้อมูลเกิดขึ้นจากสารสนเทศ และสารสนเทศเกิดขึ้นจากความรู้ในทางกลับกัน[ 10 ]โดยทั่วไปแล้ว แนวคิดของสารสนเทศมีความเกี่ยวข้องอย่างใกล้ชิดกับแนวคิดเรื่องข้อจำกัด การสื่อสาร การควบคุม ข้อมูล รูปแบบ คำแนะนำ ความรู้ ความหมาย สิ่งกระตุ้นทางจิตรูปแบบการรับรู้ และการเป็นตัวแทน เบย์นอน-เดวีส์ใช้แนวคิดของสัญลักษณ์เพื่อแยกความแตกต่างระหว่างข้อมูลและสารสนเทศ ข้อมูลคือชุดของสัญลักษณ์ ในขณะที่สารสนเทศเกิดขึ้นเมื่อสัญลักษณ์ถูกใช้เพื่ออ้างถึงบางสิ่ง[ 11 ] [ 12 ]

ก่อนการพัฒนาอุปกรณ์และเครื่องจักรคอมพิวเตอร์ ผู้คนต้องรวบรวมข้อมูลด้วยตนเองและกำหนดรูปแบบให้กับข้อมูลเหล่านั้น แต่เมื่อมีการพัฒนาอุปกรณ์และเครื่องจักรคอมพิวเตอร์ อุปกรณ์เหล่านี้ก็สามารถรวบรวมข้อมูลได้เช่นกัน ในช่วงทศวรรษ 2010 คอมพิวเตอร์ถูกนำมาใช้กันอย่างแพร่หลายในหลายสาขาเพื่อรวบรวมข้อมูล จัดเรียง หรือประมวลผลข้อมูล ในหลากหลายสาขา ตั้งแต่การตลาดการวิเคราะห์ การใช้ บริการทางสังคมของประชาชน ไปจนถึงการวิจัยทางวิทยาศาสตร์ รูปแบบในข้อมูลเหล่านี้ถือเป็นข้อมูลที่สามารถนำมาใช้เพื่อเพิ่มพูนความรู้ได้ รูปแบบเหล่านี้อาจถูกตีความว่าเป็น " ความจริง " (แม้ว่า "ความจริง" อาจเป็นแนวคิดที่เป็นอัตวิสัย) และอาจได้รับการยอมรับว่าเป็นเกณฑ์ด้านสุนทรียศาสตร์และจริยธรรมในบางสาขาหรือวัฒนธรรม เหตุการณ์ที่ทิ้งร่องรอยทางกายภาพหรือเสมือนจริงที่สามารถรับรู้ได้ สามารถติดตามย้อนกลับได้ผ่านข้อมูล ร่องรอยจะไม่ถือว่าเป็นข้อมูลอีกต่อไปเมื่อการเชื่อมโยงระหว่างร่องรอยและการสังเกตขาดลง[ 13 ]

อุปกรณ์คำนวณเชิงกลถูกจำแนกตามวิธีการแสดงข้อมูลคอมพิวเตอร์อนาล็อกแสดงข้อมูลเป็นแรงดันไฟฟ้า ระยะทาง ตำแหน่ง หรือปริมาณทางกายภาพอื่นๆคอมพิวเตอร์ดิจิทัลแสดงข้อมูลเป็นลำดับของสัญลักษณ์ที่ดึงมาจากตัวอักษร คง ที่ คอมพิวเตอร์ดิจิทัลที่ใช้กันทั่วไปส่วนใหญ่ใช้ตัวอักษรไบนารี ซึ่งก็คือตัวอักษรสองตัวที่โดยทั่วไปใช้สัญลักษณ์ "0" และ "1" จากนั้นจึงสร้างการแสดงผลที่คุ้นเคยมากกว่า เช่น ตัวเลขหรือตัวอักษร จากตัวอักษรไบนารีนั้น นอกจากนี้ยังมีการแยกแยะข้อมูลบางรูปแบบเป็นพิเศษโปรแกรมคอมพิวเตอร์คือชุดข้อมูลที่สามารถตีความได้ว่าเป็นคำสั่ง ภาษาคอมพิวเตอร์ส่วนใหญ่จะแยกความแตกต่างระหว่างโปรแกรมและข้อมูลอื่นๆ ที่โปรแกรมทำงานด้วย แต่ในบางภาษา โดยเฉพาะอย่างยิ่ง ภาษา Lisp และภาษาที่คล้ายกัน โปรแกรมแทบจะแยกไม่ออกจากข้อมูลอื่นๆ การแยกแยะ เมตาเดตา ซึ่งก็คือคำอธิบายของข้อมูลอื่นๆ ก็มีประโยชน์เช่นกันคำที่คล้ายกันแต่ใช้มาก่อนสำหรับเมตาเดตาคือ "ข้อมูลเสริม" ตัวอย่างต้นแบบของเมตาเดตาคือแคตตาล็อกห้องสมุด ซึ่งเป็นคำอธิบายเนื้อหาของหนังสือ

แหล่งข้อมูล

ในส่วนที่เกี่ยวกับกรรมสิทธิ์ของข้อมูลที่รวบรวมในระหว่างการทำการตลาดหรือการรวบรวมข้อมูลขององค์กรอื่นๆ ข้อมูลจะถูกจำแนกตามฝ่ายต่างๆโดยขึ้นอยู่กับว่าข้อมูลนั้นอยู่ใกล้กับแหล่งที่มามากน้อยเพียงใด หรือถูกสร้างขึ้นผ่านการประมวลผลเพิ่มเติมหรือไม่ “ข้อมูลฝ่ายศูนย์” หมายถึงข้อมูลที่ลูกค้า “แบ่งปันโดยตั้งใจและกระตือรือร้น” [ 14 ]ข้อมูลประเภทนี้สามารถมาจากแหล่งต่างๆ ได้มากมาย รวมถึง: การสมัครสมาชิก ศูนย์การตั้งค่า แบบทดสอบ แบบสำรวจ แบบฟอร์มป๊อปอัพ และประสบการณ์ดิจิทัลแบบโต้ตอบ[ 15 ] “ข้อมูลฝ่ายแรก” อาจถูกรวบรวมโดยบริษัทโดยตรงจากลูกค้า[ 16 ]การแลกเปลี่ยนข้อมูลฝ่ายแรกอย่างปลอดภัยระหว่างบริษัทต่างๆ สามารถทำได้โดยใช้ห้องปลอดข้อมูล[ 17 ] “ข้อมูลฝ่ายที่สอง” หมายถึงข้อมูลที่ได้รับจากองค์กรหรือพันธมิตรอื่นๆ ผ่านการซื้อหรือวิธีการอื่นๆ และได้รับ การอธิบายว่าเป็น “ข้อมูลฝ่ายแรกขององค์กรอื่น” [ 18 ] [ 19 ] “ข้อมูลฝ่ายที่สาม” คือข้อมูลที่รวบรวมโดยองค์กรอื่นๆ และรวบรวมจากแหล่งต่างๆ เว็บไซต์ และแพลตฟอร์มต่างๆ ในภายหลัง[ 18 ]

สรุปแหล่งข้อมูล[ 18 ]
แหล่งข้อมูล เป็นเจ้าของโดย ความแม่นยำ กรณีศึกษา ความเสี่ยงด้านความเป็นส่วนตัว
ฝ่ายแรก ธุรกิจ สูง การปรับแต่งเฉพาะบุคคล การกำหนดเป้าหมายใหม่ ต่ำ
บุคคลที่สอง พันธมิตร ปานกลาง แคมเปญความร่วมมือ ปานกลาง
บุคคลที่สาม หน่วยงานภายนอก ต่ำ การกำหนดเป้าหมายในวงกว้าง สูง

ข้อมูล "ไม่มีพรรค" บางครั้งอาจหมายถึงข้อมูลสังเคราะห์ที่สร้างขึ้นตามรูปแบบจากข้อมูลดั้งเดิม[ 17 ]

เอกสารข้อมูล

เมื่อใดก็ตามที่จำเป็นต้องบันทึกข้อมูล ข้อมูลนั้นจะอยู่ในรูปของเอกสาร ข้อมูล ประเภทของเอกสารข้อมูล ได้แก่:

เอกสารข้อมูลบางส่วน (คลังข้อมูล การศึกษาข้อมูล ชุดข้อมูล และซอฟต์แวร์) จะถูกจัดทำดัชนีในดัชนีการอ้างอิงข้อมูล (Data Citation Indexes ) ในขณะที่บทความข้อมูลจะถูกจัดทำดัชนีในฐานข้อมูลบรรณานุกรมแบบดั้งเดิม เช่นดัชนีการอ้างอิงวิทยาศาสตร์ (Science Citation Index )

การเก็บรวบรวมข้อมูล

การรวบรวมข้อมูลสามารถทำได้ผ่านแหล่งข้อมูลปฐมภูมิ (นักวิจัยเป็นบุคคลแรกที่ได้รับข้อมูล) หรือแหล่งข้อมูลทุติยภูมิ (นักวิจัยได้รับข้อมูลที่รวบรวมไว้แล้วจากแหล่งข้อมูลอื่น เช่น ข้อมูลที่เผยแพร่ในวารสารทางวิทยาศาสตร์) ระเบียบวิธีวิเคราะห์ข้อมูลมีความหลากหลายและรวมถึงการตรวจสอบความถูกต้องของข้อมูลแบบสามเหลี่ยมและการแพร่กระจายข้อมูล[ 20 ]วิธีหลังนี้เสนอวิธีการที่ชัดเจนในการรวบรวม จัดประเภท และวิเคราะห์ข้อมูลโดยใช้มุมมองการวิเคราะห์ที่เป็นไปได้ห้าประการ (อย่างน้อยสามประการ) เพื่อเพิ่มความเป็นกลางของการวิจัยให้สูงสุดและช่วยให้เข้าใจปรากฏการณ์ที่กำลังศึกษาได้อย่างครบถ้วนที่สุด ได้แก่ วิธีการเชิงคุณภาพและเชิงปริมาณ การทบทวนวรรณกรรม (รวมถึงบทความวิชาการ) การสัมภาษณ์ผู้เชี่ยวชาญ และการจำลองด้วยคอมพิวเตอร์ จากนั้นข้อมูลจะถูก "แพร่กระจาย" โดยใช้ขั้นตอนที่กำหนดไว้ล่วงหน้าหลายขั้นตอนเพื่อดึงข้อมูลที่เกี่ยวข้องมากที่สุดออกมา

ความยั่งยืนของข้อมูล การเข้าถึง และความน่าเชื่อถือ

สาขาสำคัญในวิทยาการคอมพิวเตอร์เทคโนโลยี และบรรณารักษศาสตร์คือ ความคงทนของข้อมูล การวิจัยทางวิทยาศาสตร์ก่อให้เกิดข้อมูลจำนวนมหาศาล โดยเฉพาะอย่างยิ่งในด้านจีโนมิกส์และดาราศาสตร์แต่ยังรวมถึงวิทยาศาสตร์การแพทย์เช่นการถ่ายภาพทางการแพทย์ในอดีต ข้อมูลทางวิทยาศาสตร์ได้รับการตีพิมพ์ในบทความและหนังสือ และจัดเก็บไว้ในห้องสมุด แต่ในปัจจุบัน ข้อมูลเกือบทั้งหมดถูกจัดเก็บไว้ในฮาร์ดไดรฟ์หรือแผ่นดิสก์อย่างไรก็ตาม เมื่อเปรียบเทียบกับกระดาษ อุปกรณ์จัดเก็บข้อมูลเหล่านี้อาจอ่านไม่ได้หลังจากผ่านไปไม่กี่ทศวรรษ ผู้จัดพิมพ์และห้องสมุดทางวิทยาศาสตร์ต่างพยายามแก้ไขปัญหานี้มาหลายทศวรรษแล้ว และยังไม่มีวิธีแก้ปัญหาที่น่าพอใจสำหรับการจัดเก็บข้อมูลในระยะยาวเป็นเวลาหลายศตวรรษหรือแม้กระทั่งชั่วนิรันดร์

การเข้าถึงข้อมูลปัญหาอีกประการหนึ่งคือ ข้อมูลทางวิทยาศาสตร์จำนวนมากไม่เคยได้รับการเผยแพร่หรือฝากไว้ในคลังข้อมูล เช่นฐานข้อมูลในการสำรวจล่าสุด มีการขอข้อมูลจากงานวิจัย 516 ชิ้นที่ตีพิมพ์เมื่อ 2 ถึง 22 ปีก่อน แต่มีเพียงไม่ถึงหนึ่งในห้าของงานวิจัยเหล่านี้ที่สามารถหรือเต็มใจที่จะให้ข้อมูลที่ร้องขอ โดยรวมแล้ว โอกาสในการดึงข้อมูลลดลง 17% ในแต่ละปีหลังจากการตีพิมพ์[ 21 ]ในทำนองเดียวกัน การสำรวจชุดข้อมูล 100 ชุดในDryadพบว่ามากกว่าครึ่งหนึ่งขาดรายละเอียดที่จะทำซ้ำผลการวิจัยจากงานวิจัยเหล่านี้ได้[ 22 ]สิ่งนี้แสดงให้เห็นถึงสถานการณ์ที่เลวร้ายของการเข้าถึงข้อมูลทางวิทยาศาสตร์ที่ไม่ได้รับการเผยแพร่หรือไม่มีรายละเอียดเพียงพอที่จะทำซ้ำได้

ความน่าเชื่อถือของข้อมูลปัญหาที่ร้ายแรงกว่าอาจเกิดขึ้นได้เมื่อใช้ข้อมูลโดยสันนิษฐานว่าเป็นข้อมูลจริง มีคุณภาพเพียงพอ หรือได้รับการบันทึกอย่างถูกต้องพร้อมแหล่งที่มาของข้อมูลและเมตาเดตา ที่เหมาะสม คลังข้อมูลแทบจะไม่เคยกำหนดให้มีการรายงานแหล่งที่มาของข้อมูล และข้อมูลที่สร้างขึ้น ข้อมูลสังเคราะห์ หรือข้อมูลที่ผิดจริยธรรมอาจถูกอัปโหลดไปยังคลังข้อมูลโดยไม่ต้องพิจารณาอย่างรอบคอบ ตัวอย่างเช่น ในการวิจัยด้านสุขภาพและการแพทย์ ข้อมูลจากKaggleซึ่งถือว่าไม่น่าเชื่อถือเนื่องจากมีหลักฐานของการสร้างข้อมูลเท็จ ความสัมพันธ์ที่ไม่สามารถอธิบายได้ และไม่มีเอกสารประกอบ ได้ถูกนำมาใช้เพื่อพัฒนาแบบจำลองการทำนายทางคลินิก 125 แบบ [ 23 ]

วิธีแก้ปัญหาเรื่องความสามารถในการทำซ้ำคือการพยายามกำหนดให้ข้อมูลต้องเป็น FAIRซึ่งก็คือข้อมูลที่ค้นหาได้ เข้าถึงได้ ทำงานร่วมกันได้ และนำกลับมาใช้ใหม่ได้ ข้อมูลที่ตรงตามข้อกำหนดเหล่านี้สามารถนำไปใช้ในการวิจัยในภายหลังได้ และด้วยเหตุนี้จึงช่วยพัฒนาวิทยาศาสตร์และเทคโนโลยี[ 24 ]

ในสาขาอื่นๆ

แม้ว่าข้อมูลจะถูกนำมาใช้ในสาขาอื่นๆ มากขึ้นเรื่อยๆ แต่ก็มีข้อเสนอแนะว่าลักษณะการตีความที่สูงของข้อมูลอาจขัดแย้งกับจริยธรรมของข้อมูลในฐานะ "สิ่งที่ได้รับ" ปีเตอร์ เช็คแลนด์ได้แนะนำคำว่าcapta (จากภาษาละตินcapereซึ่งแปลว่า "รับ") เพื่อแยกแยะระหว่างข้อมูลจำนวนมหาศาลที่เป็นไปได้กับชุดย่อยของข้อมูลเหล่านั้น ซึ่งเป็นสิ่งที่ได้รับความสนใจ[ 25 ]โจฮันนา ดรักเกอร์ได้โต้แย้งว่าเนื่องจากมนุษยศาสตร์ยืนยันว่าการผลิตความรู้เป็น "สิ่งที่มีบริบท บางส่วน และเป็นองค์ประกอบ" การใช้ข้อมูลอาจนำไปสู่สมมติฐานที่ไม่ก่อให้เกิดประโยชน์ เช่น ปรากฏการณ์ต่างๆ เป็นแบบแยกส่วนหรือไม่ขึ้นอยู่กับผู้สังเกต[ 26 ]คำว่าcaptaซึ่งเน้นย้ำถึงการกระทำของการสังเกตในฐานะที่เป็นองค์ประกอบ จึงถูกนำเสนอเป็นทางเลือกแทนข้อมูลสำหรับการแสดงภาพในสาขามนุษยศาสตร์

คำว่า"ขับเคลื่อนด้วยข้อมูล"เป็นคำศัพท์ใหม่ที่ใช้กับกิจกรรมที่ขับเคลื่อนด้วยข้อมูลเป็นหลักเหนือปัจจัยอื่นๆ แอปพลิเคชันที่ขับเคลื่อนด้วยข้อมูล ได้แก่การเขียนโปรแกรมที่ขับเคลื่อนด้วยข้อมูลและ การรายงาน ข่าว ที่ขับเคลื่อนด้วยข้อมูล

ดูเพิ่มเติม

  • ข้อมูล (Data) เป็นคำนามเอกพจน์ (เช่น การประเมินอย่างละเอียด)
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Data&oldid=1361089717 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ข้อมูล

ข้อมูล ( / ˈ d eɪ t ə / DAY -tə , ในสหรัฐอเมริกา/ ˈ d æ t ə / DAT -ə , ในอินเดีย : / ˈ d iː t ə / DEE-tə ) คือชุดของค่า ที่ไม่ต่อเนื่องหรือต่อเนื่อง...

ที่มาของคำและศัพท์เฉพาะ

คำภาษา ละติน data เป็นคำพหูพจน์ของ datum ซึ่งหมายถึง "(สิ่ง) ที่ได้รับ" และเป็นคำกริยาช่อง 3 ที่เป็นเพศกลางของ dare ซึ่งหมายถึง "ให้" [ 6 ] การใช้คำว่า "data" ในภาษาอังกฤษครั้งแรกเกิดขึ้นในช่วงทศวรรษ 1640 คำว่า "data" ถูกใช้ครั้งแรกในความหมายว่า...

ความหมาย

ข้อมูล สารสนเทศ ความรู้ และ ปัญญา เป็นแนวคิดที่เกี่ยวข้องกันอย่างใกล้ชิด แต่ละอย่างมีบทบาทต่อกัน และแต่ละคำก็มีความหมายของตัวเอง ตามทัศนะทั่วไป ข้อมูลจะถูกรวบรวมและวิเคราะห์...

แหล่งข้อมูล

ในส่วนที่เกี่ยวกับกรรมสิทธิ์ของข้อมูลที่รวบรวมในระหว่างการทำการตลาดหรือการรวบรวมข้อมูลขององค์กรอื่นๆ ข้อมูลจะถูกจำแนกตาม ฝ่ายต่างๆ โดยขึ้นอยู่กับว่าข้อมูลนั้นอยู่ใกล้กับแหล่งที่มามากน้อยเพียงใด หรือถูกสร้างขึ้นผ่านการประมวลผลเพิ่มเติมหรือไม่ “ข้อมูลฝ่ายศูนย์”...