กลับไปหน้าบทความ

อ่าน 2 นาที

การผสมผสานข้อมูล

การผสมผสานข้อมูล เป็นกระบวนการที่ ข้อมูลขนาดใหญ่ จากหลายแหล่ง [ 1 ] ถูกรวมเข้าไว้ใน คลังข้อมูล หรือ ชุด ข้อมูลเดียว [ 2 ]

การผสมผสานข้อมูล

การผสมผสานข้อมูลเป็นกระบวนการที่ข้อมูลขนาดใหญ่จากหลายแหล่ง[ 1 ] ถูกรวมเข้าไว้ใน คลังข้อมูลหรือชุดข้อมูลเดียว[ 2 ]

การผสมผสานข้อมูลช่วยให้นักวิเคราะห์ธุรกิจสามารถรับมือกับการขยายตัวของข้อมูลที่จำเป็นต่อการตัดสินใจทางธุรกิจที่สำคัญโดยอาศัยข้อมูลเชิงธุรกิจที่มีคุณภาพดี[ 3 ]การผสมผสานข้อมูลได้รับการอธิบายว่าแตกต่างจากการบูรณาการข้อมูลเนื่องจากความต้องการของนักวิเคราะห์ข้อมูลในการผสานแหล่งข้อมูลอย่างรวดเร็ว ซึ่งเร็วเกินกว่าที่นักวิทยาศาสตร์ข้อมูลจะ สามารถเข้าไปแทรกแซงได้ในทางปฏิบัติ [ 4 ]การศึกษาที่ดำเนินการโดย Forrester Consulting ในปี 2015 พบว่า 52 เปอร์เซ็นต์ของบริษัทต่างๆ กำลังผสมผสานแหล่งข้อมูล 50 แหล่งขึ้นไป และ 12 เปอร์เซ็นต์กำลังผสมผสานแหล่งข้อมูลมากกว่า 1,000 แหล่ง[ 5 ]

ดึงข้อมูล แปลงข้อมูล โหลดข้อมูล

การผสมผสานข้อมูลคล้ายกับการดึงข้อมูล แปลงข้อมูล และโหลดข้อมูล (ETL) ทั้ง ETL และการผสมผสานข้อมูลจะนำข้อมูลจากแหล่งต่างๆ มาผสมผสานกัน อย่างไรก็ตาม ETL ใช้ในการผสานและจัดโครงสร้างข้อมูลลงในฐานข้อมูลเป้าหมาย[ 6 ]ซึ่งมักจะเป็นคลังข้อมูลการผสมผสานข้อมูลจะแตกต่างออกไปเล็กน้อย เนื่องจากเป็นการรวมข้อมูลสำหรับกรณีการใช้งานเฉพาะในเวลาที่กำหนด[ 7 ]ในซอฟต์แวร์บางตัว ข้อมูลไม่ได้ถูกเขียนลงในฐานข้อมูล ซึ่งแตกต่างจาก ETL มาก ตัวอย่างเช่นGoogle Data Studio [ 8 ]

ผลิตภัณฑ์ซอฟต์แวร์

จากการที่นักวิเคราะห์ต้องการรวมแหล่งข้อมูลมากขึ้น บริษัทซอฟต์แวร์หลายแห่งจึงมีการเติบโตอย่างมากและระดมทุนได้หลายล้านดอลลาร์[ 9 ] โดย บริษัทที่เข้าสู่ตลาดในช่วงแรกบางแห่งได้กลายเป็นบริษัทมหาชนไปแล้ว[ 10 ]ตัวอย่างเช่นAWS , Alteryx , Microsoft Power Query [ 11 ] และ Incorta [ 12 ] ซึ่งช่วยให้สามารถรวมข้อมูลจากแหล่งข้อมูลที่แตกต่างกันได้หลายแหล่ง เช่น ไฟล์ข้อความ ฐานข้อมูล XML JSON และข้อมูลที่มีโครงสร้างและกึ่งโครงสร้างในรูปแบบอื่นๆ[ 13 ] [ 14 ] [ 15 ] [ 16 ]

ฉาก

ในซอฟต์แวร์ Tableau การผสมผสานข้อมูลเป็นเทคนิคในการรวมข้อมูลจากแหล่งข้อมูลหลายแหล่งใน การแสดง ภาพข้อมูล[ 17 ]ความแตกต่างที่สำคัญคือระดับความละเอียดของการเชื่อมต่อข้อมูล เมื่อผสมผสานข้อมูลเข้าเป็นชุดข้อมูลเดียว จะใช้การเชื่อมต่อฐานข้อมูล SQLซึ่งโดยปกติจะเชื่อมต่อในระดับที่ละเอียดที่สุด โดยใช้ฟิลด์ ID หากเป็นไปได้[ 18 ]การผสมผสานข้อมูลใน Tableau ควรเกิดขึ้นในระดับที่ละเอียดน้อยที่สุด[ 19 ]

ลุคเกอร์ สตูดิโอ

ใน Looker Studio ของ Google แหล่งข้อมูลจะถูกรวมเข้าด้วยกันโดยการรวมบันทึกของแหล่งข้อมูลหนึ่งเข้ากับบันทึกของแหล่งข้อมูลอื่นได้มากถึง 4 แหล่งข้อมูล คล้ายกับ Tableau การผสมผสานข้อมูลจะเกิดขึ้นเฉพาะในเลเยอร์การรายงานเท่านั้น ข้อมูลที่ผสมผสานแล้วจะไม่ถูกจัดเก็บเป็นแหล่งข้อมูลรวมแยกต่างหาก[ 20 ]

ความท้าทายในการผสานรวมข้อมูล

คำถามเกี่ยวกับเมตาเดต้าแบบกำหนดเองที่พบบ่อยที่สุดคือ: "ชุดข้อมูลนี้สามารถผสมผสานกับ (รวมหรือรวมเข้ากับ) ชุดข้อมูลอื่นของฉันได้อย่างไร" [ 21 ]

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Data_blending&oldid=1358666335 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การผสมผสานข้อมูล

การผสมผสานข้อมูล เป็นกระบวนการที่ ข้อมูลขนาดใหญ่ จากหลายแหล่ง [ 1 ] ถูกรวมเข้าไว้ใน คลังข้อมูล หรือ ชุด ข้อมูลเดียว [ 2 ]

ดึงข้อมูล แปลงข้อมูล โหลดข้อมูล

การผสมผสานข้อมูลคล้ายกับ การดึงข้อมูล แปลงข้อมูล และโหลดข้อมูล (ETL) ทั้ง ETL และการผสมผสานข้อมูลจะนำข้อมูลจากแหล่งต่างๆ มาผสมผสานกัน อย่างไรก็ตาม ETL ใช้ในการผสานและจัดโครงสร้างข้อมูลลงในฐานข้อมูลเป้าหมาย [ 6 ] ซึ่งมักจะ เป็นคลังข้อมูล...

ผลิตภัณฑ์ซอฟต์แวร์

จากการที่นักวิเคราะห์ต้องการรวมแหล่งข้อมูลมากขึ้น บริษัทซอฟต์แวร์หลายแห่งจึงมีการเติบโตอย่างมากและระดมทุนได้หลายล้านดอลลาร์ [ 9 ] โดย บริษัทที่เข้าสู่ตลาดในช่วงแรกบางแห่งได้กลายเป็นบริษัทมหาชนไปแล้ว [ 10 ] ตัวอย่างเช่น AWS , Alteryx , Microsoft Power Query [...

ฉาก

ในซอฟต์แวร์ Tableau การผสมผสานข้อมูลเป็นเทคนิคในการรวมข้อมูลจากแหล่งข้อมูลหลายแหล่งใน การแสดง ภาพ ข้อมูล [ 17 ] ความแตกต่างที่สำคัญคือระดับความละเอียดของการเชื่อมต่อข้อมูล เมื่อผสมผสานข้อมูลเข้าเป็นชุดข้อมูลเดียว จะใช้ การเชื่อมต่อฐานข้อมูล SQL...