กลับไปหน้าบทความ

อ่าน 3 นาที

ตารางข้อเท็จจริง

ในระบบคลังข้อมูลตารางข้อเท็จจริง ( Fact Table ) ประกอบด้วยค่าการวัด ตัวชี้วัด หรือข้อเท็จจริงของกระบวนการทางธุรกิจโดยจะอยู่ตรงกลางของโครงสร้างแบบดาว (Star Schema)หรือแบบเกล็ดหิมะ..

ตารางข้อเท็จจริง

ตัวอย่างของสคีมาแบบดาวโดยตารางตรงกลางคือตารางข้อเท็จจริง

ในระบบคลังข้อมูลตารางข้อเท็จจริง ( Fact Table ) ประกอบด้วยค่าการวัด ตัวชี้วัด หรือข้อเท็จจริงของกระบวนการทางธุรกิจโดยจะอยู่ตรงกลางของโครงสร้างแบบดาว (Star Schema)หรือแบบเกล็ดหิมะ (Snowflake Schema)ล้อมรอบด้วยตารางมิติ (Dimension Table) หากมีการใช้ตารางข้อเท็จจริงหลายตาราง จะจัดเรียงเป็นโครงสร้างแบบกลุ่มข้อเท็จจริง (Fact Constellation Schema ) โดยทั่วไป ตารางข้อเท็จจริงจะมีคอลัมน์สองประเภท ได้แก่ คอลัมน์ที่เก็บข้อเท็จจริง และคอลัมน์ที่เป็นคีย์นอก (Foreign Key ) ที่เชื่อมโยงกับตารางมิติ คีย์หลักของตารางข้อเท็จจริงมักจะเป็นคีย์ผสม (Composite Key) ที่ประกอบขึ้นจากคีย์นอกทั้งหมด ตารางข้อเท็จจริงบรรจุเนื้อหาของคลังข้อมูลและจัดเก็บค่าการวัดประเภทต่างๆ เช่น ค่าการวัดแบบบวก ค่าการวัดแบบไม่บวก และค่าการวัดแบบกึ่งบวก

ตารางข้อเท็จจริง (โดยทั่วไป) จะให้ค่าบวกที่ทำหน้าที่เป็นตัวแปรอิสระซึ่งใช้ในการวิเคราะห์คุณลักษณะเชิงมิติ ตารางข้อเท็จจริงมักถูกกำหนดโดยระดับความละเอียดระดับความละเอียดของตารางข้อเท็จจริงแสดงถึงระดับที่เล็กที่สุดที่สามารถกำหนดข้อเท็จจริงได้ ระดับความละเอียดของตารางข้อเท็จจริงด้านการขายอาจระบุเป็น "ปริมาณการขายต่อวัน ตามผลิตภัณฑ์ ตามร้านค้า" ดังนั้นแต่ละระเบียนในตารางข้อเท็จจริงนี้จึงถูกกำหนดอย่างไม่ซ้ำกันโดยวัน ผลิตภัณฑ์ และร้านค้า มิติอื่นๆ อาจเป็นสมาชิกของตารางข้อเท็จจริงนี้ (เช่น สถานที่/ภูมิภาค) แต่สิ่งเหล่านี้ไม่ได้เพิ่มอะไรให้กับความเฉพาะเจาะจงของระเบียนข้อเท็จจริง มิติ "ที่เกี่ยวข้อง" เหล่านี้ช่วยให้สามารถแยกย่อยข้อเท็จจริงอิสระได้มากขึ้น แต่โดยทั่วไปจะให้ข้อมูลเชิงลึกในระดับการรวมกลุ่มที่สูงกว่า (ภูมิภาคหนึ่งมีร้านค้าหลายแห่ง)

ตัวอย่าง

หากกระบวนการทางธุรกิจคือการขาย ตารางข้อเท็จจริงที่เกี่ยวข้องโดยทั่วไปจะมีคอลัมน์ที่แสดงทั้งข้อเท็จจริงดิบและการรวมข้อมูลในแถวต่างๆ เช่น:

  • 12,000 ดอลลาร์สหรัฐฯระบุว่าเป็น "ยอดขายของร้านในนิวยอร์กประจำวันที่ 15 มกราคม 2548"
  • 34,000 ดอลลาร์สหรัฐซึ่งเป็น "ยอดขายของร้านในลอสแอนเจลิส ประจำวันที่ 15 มกราคม 2548"
  • 22,000 ดอลลาร์สหรัฐฯระบุว่าเป็น "ยอดขายของร้านในนิวยอร์กประจำวันที่ 16 มกราคม 2548"
  • 21,000 ดอลลาร์สหรัฐคือ "ยอดขายเฉลี่ยต่อวันของร้านในลอสแอนเจลิส ประจำเดือนมกราคม ปี 2548"
  • 65,000 ดอลลาร์สหรัฐคือ "ยอดขายเฉลี่ยต่อวันของร้านในลอสแอนเจลิสสำหรับเดือนกุมภาพันธ์ ปี 2548"
  • 33,000 ดอลลาร์สหรัฐคือ "ยอดขายเฉลี่ยต่อวันของร้านในลอสแอนเจลิสในปี 2005"

"ยอดขายเฉลี่ยต่อวัน"เป็นค่าที่วัดได้และถูกจัดเก็บไว้ในตารางข้อมูลหลัก (Fact Table) ตารางข้อมูลหลักนี้ยังประกอบด้วยคีย์ต่างประเทศ (Foreign Key)จากตารางมิติ (Dimension Table) ซึ่งเก็บข้อมูล อนุกรมเวลา (เช่น วันที่) และมิติ อื่นๆ (เช่น ที่ตั้งร้านค้า พนักงานขาย ผลิตภัณฑ์)

คีย์ต่างประเทศทั้งหมดระหว่างตารางข้อเท็จจริงและตารางมิติควรเป็นคีย์ทดแทนไม่ใช่คีย์ที่นำกลับมาใช้ใหม่จากข้อมูลการดำเนินงาน

ประเภทการวัด

  • แบบบวก – มาตรวัดที่สามารถบวกกันได้ในทุกมิติ
  • ไม่สามารถบวกกันได้ – ค่าที่วัดได้ซึ่งไม่สามารถนำมาบวกกันได้ในทุกมิติ
  • กึ่งบวก – มาตรวัดที่สามารถบวกกันได้ในบางมิติ

ตารางข้อเท็จจริงอาจประกอบด้วยข้อเท็จจริงระดับรายละเอียดหรือข้อเท็จจริงที่ได้รับการรวบรวมแล้ว (ตารางข้อเท็จจริงที่ประกอบด้วยข้อเท็จจริงที่ได้รับการรวบรวมแล้ว มักเรียกว่าตารางสรุปแทน)

ต้องใช้ความระมัดระวังเป็นพิเศษเมื่อจัดการกับอัตราส่วนและเปอร์เซ็นต์ กฎการออกแบบที่ดีข้อหนึ่ง[ 1 ]คือไม่ควรเก็บเปอร์เซ็นต์หรืออัตราส่วนไว้ในตารางข้อเท็จจริง แต่ให้คำนวณเฉพาะในเครื่องมือเข้าถึงข้อมูลเท่านั้น ดังนั้น ให้เก็บเฉพาะตัวเศษและตัวส่วนไว้ในตารางข้อเท็จจริง จากนั้นจึงสามารถรวมเข้าด้วยกันได้ และค่าที่จัดเก็บไว้ซึ่งรวมเข้าด้วยกันแล้วสามารถใช้ในการคำนวณอัตราส่วนหรือเปอร์เซ็นต์ในเครื่องมือเข้าถึงข้อมูลได้

ในโลกแห่งความเป็นจริง เราสามารถมีตารางข้อเท็จจริงที่ไม่มีตัวชี้วัดหรือข้อเท็จจริงใดๆ ได้เลย ตารางเหล่านี้เรียกว่า "ตารางข้อเท็จจริงที่ไม่มีข้อมูล" หรือ " ตารางเชื่อมโยง "

ตารางข้อเท็จจริงที่ไม่มีข้อเท็จจริงอาจใช้สำหรับการสร้างแบบจำลองความสัมพันธ์แบบหลายต่อหลาย หรือสำหรับการบันทึกเวลาของเหตุการณ์[ 1 ]

ประเภทของตารางข้อเท็จจริง

มีเหตุการณ์การวัดพื้นฐานสี่ประการ ซึ่งเป็นลักษณะเฉพาะของตารางข้อเท็จจริงทั้งหมด[ 2 ]

ธุรกรรม
ตารางข้อมูลธุรกรรมเป็นตารางพื้นฐานที่สุด โดยทั่วไปแล้วระดับความละเอียดของตารางข้อมูลธุรกรรมจะระบุไว้ที่ "หนึ่งแถวต่อหนึ่งบรรทัดในธุรกรรม" เช่น ทุกบรรทัดในใบเสร็จรับเงิน โดยปกติแล้วตารางข้อมูลธุรกรรมจะเก็บข้อมูลในระดับรายละเอียดสูงสุด ทำให้มีมิติข้อมูล จำนวนมาก ที่เกี่ยวข้องกับตารางนี้
ภาพถ่ายเป็นระยะ
ภาพรวมรายคาบ (Periodic snapshot) ตามชื่อที่บ่งบอก คือการ "บันทึกภาพ ณ ช่วงเวลาหนึ่ง" ซึ่งช่วงเวลานั้นอาจเป็นช่วงเวลาที่กำหนดไว้ เช่น สรุปผลการปฏิบัติงานของพนักงานขายในเดือนที่ผ่านมา ตารางภาพรวมรายคาบจะขึ้นอยู่กับตารางธุรกรรม เนื่องจากต้องการข้อมูลโดยละเอียดที่อยู่ในตารางข้อเท็จจริงของธุรกรรม เพื่อให้ได้ผลลัพธ์ด้านประสิทธิภาพที่ต้องการ
การสะสมภาพสแนปช็อต
ตารางข้อเท็จจริงประเภทนี้ใช้เพื่อแสดงกิจกรรมของกระบวนการที่มีจุดเริ่มต้นและจุดสิ้นสุดที่ชัดเจน เช่น การประมวลผลคำสั่งซื้อ คำสั่งซื้อจะเคลื่อนผ่านขั้นตอนเฉพาะจนกว่าจะได้รับการประมวลผลอย่างสมบูรณ์ เมื่อขั้นตอนต่างๆ ในการดำเนินการตามคำสั่งซื้อเสร็จสมบูรณ์ แถวที่เกี่ยวข้องในตารางข้อเท็จจริงจะได้รับการอัปเดต ตารางภาพรวมสะสมมักจะมีคอลัมน์วันที่หลายคอลัมน์ โดยแต่ละคอลัมน์แสดงถึงเหตุการณ์สำคัญในกระบวนการ ดังนั้นจึงเป็นสิ่งสำคัญที่จะต้องมีรายการในมิติข้อมูลวันที่ที่เกี่ยวข้องซึ่งแสดงถึงตัวแทนสำหรับวันที่ที่ไม่ทราบ เนื่องจากวันที่ของเหตุการณ์สำคัญหลายวันไม่ทราบในขณะที่สร้างแถว
ภาพถ่ายตามช่วงเวลา
ด้วยการประยุกต์ใช้ ทฤษฎี ฐานข้อมูลเชิงเวลาและเทคนิคการสร้างแบบจำลอง ตารางข้อเท็จจริงแบบสแนปช็อตเชิงเวลา[ 3 ]ช่วยให้มีสิ่งที่เทียบเท่ากับสแนปช็อตรายวันโดยไม่ต้องมีสแนปช็อตรายวันจริงๆ โดยนำแนวคิดของช่วงเวลามาใช้ในตารางข้อเท็จจริง ทำให้ประหยัดพื้นที่ได้มาก ปรับปรุงประสิทธิภาพ ในขณะเดียวกันก็ช่วยให้ผู้ใช้ปลายทางมีสิ่งที่เทียบเท่าเชิงตรรกะของ "ภาพ ณ ขณะนั้น" ที่พวกเขาสนใจ

ขั้นตอนในการออกแบบตารางข้อเท็จจริง

การออกแบบเชิงมิติของ Kimball ดำเนินการตามขั้นตอนสี่ขั้นตอน: [ 4 ]

  1. เลือกกระบวนการทางธุรกิจเพื่อสร้างแบบจำลอง (เช่น การบันทึกคำสั่งซื้อ การประมวลผลการเรียกร้อง) [ 4 ]
  2. ประกาศเมล็ดพืช – ระบุให้ชัดเจนว่าแต่ละแถวในตารางข้อเท็จจริงแสดงถึงอะไร เมล็ดพืชที่แตกต่างกันจะต้องไม่ผสมกันในตารางเดียว[ 5 ]
  3. ระบุขนาดที่ใช้กับแต่ละแถวในตารางข้อเท็จจริง[ 4 ]
  4. ระบุข้อเท็จจริง (มาตรการ)ที่ตรงกับเมล็ดพืชที่ประกาศไว้[ 6 ]

หลังจากประกาศเมล็ดพืชแล้ว ให้เลือกประเภทตารางข้อเท็จจริงที่เหมาะสม (เช่น ธุรกรรม ภาพรวมเป็นระยะ ภาพรวมสะสม) [ 7 ] การวัดในตารางข้อเท็จจริงโดยทั่วไปจะถูกจำแนกประเภทดังนี้: [ 8 ]

  • แบบบวก – สามารถบวกค่าจากทุกมิติได้ (เช่น ยอดขาย)
  • กึ่งบวก – บวกกันได้ในบางมิติ แต่ไม่ใช่ทุกมิติ (เช่น ยอดคงเหลือในบัญชีไม่สามารถบวกกันได้เมื่อเวลาผ่านไป)
  • ไม่สามารถบวกกันได้ – ไม่สามารถหาผลรวมข้ามมิติใดๆ ได้ (เช่น อัตราส่วน) โดยทั่วไปจะคำนวณในแบบสอบถามมากกว่าที่จะจัดเก็บไว้

ตัวอย่าง (ระดับความละเอียดของธุรกรรม, “หนึ่งแถวต่อรายการสั่งซื้อ”):

SELECT d.calendar_date , SUM ( f.sales_amount ) AS daily_sales FROM fact_sales f JOIN dim_date d ON f.date_key = d.date_key JOIN dim_product p ON f.product_key = p.product_key WHERE p.category = ' Widgets ' GROUP BY d.calendar_date ;

ผลรวมนี้ยังคงใช้ได้เนื่องจากการวัดเป็นแบบบวกและแถวข้อเท็จจริงมีเมล็ดพืชที่ประกาศไว้เพียงเมล็ดเดียว[ 5 ]

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Fact_table&oldid=1325178733 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ตารางข้อเท็จจริง

ในระบบคลังข้อมูลตารางข้อเท็จจริง ( Fact Table ) ประกอบด้วยค่าการวัด ตัวชี้วัด หรือข้อเท็จจริงของกระบวนการทางธุรกิจโดยจะอยู่ตรงกลางของโครงสร้างแบบดาว (Star Schema)หรือแบบเกล็ดหิมะ..

ตัวอย่าง

หาก กระบวนการทางธุรกิจ คือการขาย ตารางข้อเท็จจริงที่เกี่ยวข้องโดยทั่วไปจะมีคอลัมน์ที่แสดงทั้ง ข้อเท็จจริงดิบ และ การรวมข้อมูล ในแถวต่างๆ เช่น:

ประเภทการวัด

ตารางข้อเท็จจริงอาจประกอบด้วยข้อเท็จจริงระดับรายละเอียดหรือข้อเท็จจริงที่ได้รับการรวบรวมแล้ว (ตารางข้อเท็จจริงที่ประกอบด้วยข้อเท็จจริงที่ได้รับการรวบรวมแล้ว มักเรียกว่าตารางสรุปแทน)

ประเภทของตารางข้อเท็จจริง

มีเหตุการณ์การวัดพื้นฐานสี่ประการ ซึ่งเป็นลักษณะเฉพาะของตารางข้อเท็จจริงทั้งหมด [ 2 ]