อ่าน 2 นาที
การผสมผสานข้อมูล
การผสมผสานข้อมูล เป็นกระบวนการที่ ข้อมูลขนาดใหญ่ จากหลายแหล่ง [ 1 ] ถูกรวมเข้าไว้ใน คลังข้อมูล หรือ ชุด ข้อมูลเดียว [ 2 ]
การผสมผสานข้อมูล
การผสมผสานข้อมูลเป็นกระบวนการที่ข้อมูลขนาดใหญ่จากหลายแหล่ง[ 1 ] ถูกรวมเข้าไว้ใน คลังข้อมูลหรือชุดข้อมูลเดียว[ 2 ]
การผสมผสานข้อมูลช่วยให้นักวิเคราะห์ธุรกิจสามารถรับมือกับการขยายตัวของข้อมูลที่จำเป็นต่อการตัดสินใจทางธุรกิจที่สำคัญโดยอาศัยข้อมูลเชิงธุรกิจที่มีคุณภาพดี[ 3 ]การผสมผสานข้อมูลได้รับการอธิบายว่าแตกต่างจากการบูรณาการข้อมูลเนื่องจากความต้องการของนักวิเคราะห์ข้อมูลในการผสานแหล่งข้อมูลอย่างรวดเร็ว ซึ่งเร็วเกินกว่าที่นักวิทยาศาสตร์ข้อมูลจะ สามารถเข้าไปแทรกแซงได้ในทางปฏิบัติ [ 4 ]การศึกษาที่ดำเนินการโดย Forrester Consulting ในปี 2015 พบว่า 52 เปอร์เซ็นต์ของบริษัทต่างๆ กำลังผสมผสานแหล่งข้อมูล 50 แหล่งขึ้นไป และ 12 เปอร์เซ็นต์กำลังผสมผสานแหล่งข้อมูลมากกว่า 1,000 แหล่ง[ 5 ]
ดึงข้อมูล แปลงข้อมูล โหลดข้อมูล
การผสมผสานข้อมูลคล้ายกับการดึงข้อมูล แปลงข้อมูล และโหลดข้อมูล (ETL) ทั้ง ETL และการผสมผสานข้อมูลจะนำข้อมูลจากแหล่งต่างๆ มาผสมผสานกัน อย่างไรก็ตาม ETL ใช้ในการผสานและจัดโครงสร้างข้อมูลลงในฐานข้อมูลเป้าหมาย[ 6 ]ซึ่งมักจะเป็นคลังข้อมูลการผสมผสานข้อมูลจะแตกต่างออกไปเล็กน้อย เนื่องจากเป็นการรวมข้อมูลสำหรับกรณีการใช้งานเฉพาะในเวลาที่กำหนด[ 7 ]ในซอฟต์แวร์บางตัว ข้อมูลไม่ได้ถูกเขียนลงในฐานข้อมูล ซึ่งแตกต่างจาก ETL มาก ตัวอย่างเช่นGoogle Data Studio [ 8 ]
ผลิตภัณฑ์ซอฟต์แวร์
จากการที่นักวิเคราะห์ต้องการรวมแหล่งข้อมูลมากขึ้น บริษัทซอฟต์แวร์หลายแห่งจึงมีการเติบโตอย่างมากและระดมทุนได้หลายล้านดอลลาร์[ 9 ] โดย บริษัทที่เข้าสู่ตลาดในช่วงแรกบางแห่งได้กลายเป็นบริษัทมหาชนไปแล้ว[ 10 ]ตัวอย่างเช่นAWS , Alteryx , Microsoft Power Query [ 11 ] และ Incorta [ 12 ] ซึ่งช่วยให้สามารถรวมข้อมูลจากแหล่งข้อมูลที่แตกต่างกันได้หลายแหล่ง เช่น ไฟล์ข้อความ ฐานข้อมูล XML JSON และข้อมูลที่มีโครงสร้างและกึ่งโครงสร้างในรูปแบบอื่นๆ[ 13 ] [ 14 ] [ 15 ] [ 16 ]
ฉาก
ในซอฟต์แวร์ Tableau การผสมผสานข้อมูลเป็นเทคนิคในการรวมข้อมูลจากแหล่งข้อมูลหลายแหล่งใน การแสดง ภาพข้อมูล[ 17 ]ความแตกต่างที่สำคัญคือระดับความละเอียดของการเชื่อมต่อข้อมูล เมื่อผสมผสานข้อมูลเข้าเป็นชุดข้อมูลเดียว จะใช้การเชื่อมต่อฐานข้อมูล SQLซึ่งโดยปกติจะเชื่อมต่อในระดับที่ละเอียดที่สุด โดยใช้ฟิลด์ ID หากเป็นไปได้[ 18 ]การผสมผสานข้อมูลใน Tableau ควรเกิดขึ้นในระดับที่ละเอียดน้อยที่สุด[ 19 ]
ลุคเกอร์ สตูดิโอ
ใน Looker Studio ของ Google แหล่งข้อมูลจะถูกรวมเข้าด้วยกันโดยการรวมบันทึกของแหล่งข้อมูลหนึ่งเข้ากับบันทึกของแหล่งข้อมูลอื่นได้มากถึง 4 แหล่งข้อมูล คล้ายกับ Tableau การผสมผสานข้อมูลจะเกิดขึ้นเฉพาะในเลเยอร์การรายงานเท่านั้น ข้อมูลที่ผสมผสานแล้วจะไม่ถูกจัดเก็บเป็นแหล่งข้อมูลรวมแยกต่างหาก[ 20 ]
ความท้าทายในการผสานรวมข้อมูล
คำถามเกี่ยวกับเมตาเดต้าแบบกำหนดเองที่พบบ่อยที่สุดคือ: "ชุดข้อมูลนี้สามารถผสมผสานกับ (รวมหรือรวมเข้ากับ) ชุดข้อมูลอื่นของฉันได้อย่างไร" [ 21 ]
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การผสมผสานข้อมูล
การผสมผสานข้อมูล เป็นกระบวนการที่ ข้อมูลขนาดใหญ่ จากหลายแหล่ง [ 1 ] ถูกรวมเข้าไว้ใน คลังข้อมูล หรือ ชุด ข้อมูลเดียว [ 2 ]
ดึงข้อมูล แปลงข้อมูล โหลดข้อมูล
การผสมผสานข้อมูลคล้ายกับ การดึงข้อมูล แปลงข้อมูล และโหลดข้อมูล (ETL) ทั้ง ETL และการผสมผสานข้อมูลจะนำข้อมูลจากแหล่งต่างๆ มาผสมผสานกัน อย่างไรก็ตาม ETL ใช้ในการผสานและจัดโครงสร้างข้อมูลลงในฐานข้อมูลเป้าหมาย [ 6 ] ซึ่งมักจะ เป็นคลังข้อมูล...
ผลิตภัณฑ์ซอฟต์แวร์
จากการที่นักวิเคราะห์ต้องการรวมแหล่งข้อมูลมากขึ้น บริษัทซอฟต์แวร์หลายแห่งจึงมีการเติบโตอย่างมากและระดมทุนได้หลายล้านดอลลาร์ [ 9 ] โดย บริษัทที่เข้าสู่ตลาดในช่วงแรกบางแห่งได้กลายเป็นบริษัทมหาชนไปแล้ว [ 10 ] ตัวอย่างเช่น AWS , Alteryx , Microsoft Power Query [...
ฉาก
ในซอฟต์แวร์ Tableau การผสมผสานข้อมูลเป็นเทคนิคในการรวมข้อมูลจากแหล่งข้อมูลหลายแหล่งใน การแสดง ภาพ ข้อมูล [ 17 ] ความแตกต่างที่สำคัญคือระดับความละเอียดของการเชื่อมต่อข้อมูล เมื่อผสมผสานข้อมูลเข้าเป็นชุดข้อมูลเดียว จะใช้ การเชื่อมต่อฐานข้อมูล SQL...