อ่าน 3 นาที
แผนผังดาว
ในด้าน การคำนวณ สคีมา แบบ ดาว หรือ แบบจำลองดาว เป็นรูป แบบสคีมา ของ ดาต้ามาร์ท ที่ง่ายที่สุด และเป็นแนวทางที่ใช้กันอย่างแพร่หลายที่สุดในการพัฒนาคลังข้อมูลและดาต้ามาร์ทเชิงมิติ [ 1...
แผนผังดาว


ในด้านการคำนวณ สคีมา แบบดาวหรือแบบจำลองดาวเป็นรูปแบบสคีมา ของ ดาต้ามาร์ท ที่ง่ายที่สุด และเป็นแนวทางที่ใช้กันอย่างแพร่หลายที่สุดในการพัฒนาคลังข้อมูลและดาต้ามาร์ทเชิงมิติ[ 1 ]สคีมาแบบดาวประกอบด้วยตารางข้อเท็จจริง หนึ่งตารางขึ้นไปที่อ้างอิงถึง ตารางมิติจำนวนเท่าใดก็ได้สคีมาแบบดาวเป็นกรณีพิเศษที่สำคัญของสคีมาแบบเกล็ดหิมะและมีประสิทธิภาพมากกว่าในการจัดการกับแบบสอบถามที่ง่ายกว่า[ 2 ]
แผนผังดาวได้รับชื่อมาจากความคล้ายคลึงของแบบจำลองทางกายภาพ[ 3 ] ที่มี รูปร่างคล้ายดาวโดยมีตารางข้อเท็จจริงอยู่ตรงกลาง และตารางมิติที่อยู่รอบๆ แสดงถึงจุดของดาว
แบบอย่าง
โครงสร้างข้อมูลแบบสตาร์สคีมาแยกข้อมูลกระบวนการทางธุรกิจออกเป็นข้อเท็จจริง ซึ่งเป็นข้อมูลเชิงปริมาณที่วัดได้เกี่ยวกับธุรกิจ และมิติ ซึ่งเป็นคุณลักษณะเชิงพรรณนาที่เกี่ยวข้องกับข้อมูลข้อเท็จจริง ตัวอย่างของข้อมูลข้อเท็จจริง ได้แก่ ราคาขาย ปริมาณการขาย เวลา ระยะทาง ความเร็ว และการวัดน้ำหนัก ตัวอย่างของคุณลักษณะมิติที่เกี่ยวข้อง ได้แก่ รุ่นสินค้า สีสินค้า ขนาดสินค้า สถานที่ตั้งทางภูมิศาสตร์ และชื่อพนักงานขาย
สคีมาดาวที่มีมิติหลายมิติบางครั้งเรียกว่าสคีมาตะขาบ [ 4 ] การมีมิติที่มีแอตทริบิวต์เพียงไม่กี่ตัว แม้ว่าจะดูแลรักษาง่ายกว่า แต่ส่งผลให้มีการสืบค้นที่มีการเชื่อมต่อตารางจำนวนมาก และทำให้สคีมาดาวใช้งานได้ยากขึ้น
ตารางข้อเท็จจริง
ตารางข้อเท็จจริงบันทึกการวัดหรือตัวชี้วัดสำหรับเหตุการณ์เฉพาะ ตารางข้อเท็จจริงโดยทั่วไปประกอบด้วยค่าตัวเลขและคีย์ต่างประเทศไปยังข้อมูลมิติซึ่งเก็บข้อมูลเชิงพรรณนาไว้[ 4 ] ตารางข้อเท็จจริงได้รับการออกแบบให้มีระดับรายละเอียดที่สม่ำเสมอในระดับต่ำ (เรียกว่า "ความละเอียด" หรือ " ระดับย่อย ") ซึ่งหมายความว่าข้อเท็จจริงสามารถบันทึกเหตุการณ์ได้ในระดับอะตอมมาก ซึ่งอาจส่งผลให้มีการสะสมบันทึกจำนวนมากในตารางข้อเท็จจริงเมื่อเวลาผ่านไป ตารางข้อเท็จจริงถูกกำหนดเป็นหนึ่งในสามประเภท:
- ตารางข้อมูลธุรกรรมจะบันทึกข้อเท็จจริงเกี่ยวกับเหตุการณ์เฉพาะ (เช่น เหตุการณ์การขาย)
- ตารางข้อมูลแบบภาพรวมจะบันทึกข้อมูล ณ จุดเวลาใดเวลาหนึ่ง (เช่น รายละเอียดบัญชี ณ สิ้นเดือน)
- ตารางภาพรวมจะบันทึกข้อมูลโดยรวม ณ จุดเวลาใดเวลาหนึ่ง (เช่น ยอดขายรวมตั้งแต่ต้นเดือนของผลิตภัณฑ์)
โดยทั่วไป ตารางข้อเท็จจริงจะถูกกำหนดคีย์ตัวแทนเพื่อให้มั่นใจได้ว่าแต่ละแถวสามารถระบุได้อย่างไม่ซ้ำกัน คีย์นี้ก็คือคีย์หลักแบบง่ายๆ นั่นเอง
ตารางมิติ
โดยทั่วไปแล้ว ตารางมิติจะมีจำนวนระเบียนค่อนข้างน้อยเมื่อเทียบกับตารางข้อเท็จจริง แต่ละระเบียนอาจมีคุณลักษณะจำนวนมากเพื่ออธิบายข้อมูลข้อเท็จจริง มิติสามารถกำหนดลักษณะเฉพาะได้หลากหลาย แต่คุณลักษณะที่พบบ่อยที่สุดที่กำหนดโดยตารางมิติ ได้แก่:
- ตารางมิติเวลาอธิบายเวลาในระดับความละเอียดของเวลาที่ต่ำที่สุดซึ่งมีการบันทึกเหตุการณ์ไว้ในสคีมาแบบดาว
- ตารางมิติทางภูมิศาสตร์อธิบายข้อมูลตำแหน่งที่ตั้ง เช่น ประเทศ รัฐ หรือเมือง
- ตารางแสดงขนาดผลิตภัณฑ์อธิบายรายละเอียดของผลิตภัณฑ์
- ตารางมิติพนักงานอธิบายรายละเอียดเกี่ยวกับพนักงาน เช่น พนักงานขาย
- ตารางแสดงมิติช่วงเวลา อธิบายช่วงเวลา มูลค่าเป็นดอลลาร์ หรือปริมาณที่วัดได้อื่นๆ เพื่อให้การรายงานง่ายขึ้น
โดยทั่วไป ตารางมิติจะถูกกำหนดคีย์หลักทดแทนซึ่งมักจะเป็นชนิดข้อมูลจำนวนเต็มแบบคอลัมน์เดียว ที่เชื่อมโยงกับการรวมกันของคุณลักษณะมิติที่ประกอบเป็นคีย์หลัก
ประโยชน์
โครงสร้างข้อมูลแบบสตาร์สคีมา (Star schema) นั้นเป็นโครงสร้างข้อมูล ที่ไม่เป็นไปตามกฎเกณฑ์ปกติ (Denormalized ) ซึ่งหมายความว่ากฎเกณฑ์ปกติที่ใช้กับฐานข้อมูลเชิงสัมพันธ์แบบธุรกรรมจะถูกผ่อนปรนในระหว่างการออกแบบและการใช้งานสตาร์สคีมา ข้อดีของการลดความซ้ำซ้อนของสตาร์สคีมามีดังนี้:
- การสืบค้นข้อมูลที่ง่ายกว่า – ตรรกะการเชื่อมต่อแบบสตาร์สคีมาโดยทั่วไปจะง่ายกว่าตรรกะการเชื่อมต่อที่จำเป็นในการดึงข้อมูลจากสคีมาธุรกรรมที่มีการจัดระเบียบอย่างสูง
- ตรรกะการรายงานทางธุรกิจที่เรียบง่าย – เมื่อเปรียบเทียบกับสคีมาที่มีการกำหนดรูปแบบอย่างสูง สคีมาแบบดาวจะช่วยลดความซับซ้อนของตรรกะการรายงานทางธุรกิจทั่วไป เช่น การรายงานเปรียบเทียบระหว่างช่วงเวลาต่างๆ และการรายงาน ณ วันที่ปัจจุบัน
- ประสิทธิภาพการสืบค้นข้อมูลดีขึ้น – โครงสร้างข้อมูลแบบดาว (star schema) สามารถเพิ่มประสิทธิภาพให้กับแอปพลิเคชันการรายงานแบบอ่านอย่างเดียว เมื่อเปรียบเทียบกับ โครงสร้างข้อมูล ที่มีการจัดระเบียบ อย่างเข้มงวด (highly normalized schemas)
- การรวมข้อมูลที่รวดเร็ว – การค้นหาข้อมูลที่ง่ายกว่าบนสคีมาแบบดาวสามารถส่งผลให้ประสิทธิภาพในการดำเนินการรวมข้อมูลดีขึ้น
- การป้อนข้อมูลเข้าสู่คิวบ์ – ระบบ OLAPทุกระบบใช้สคีมาแบบดาวเพื่อสร้างคิวบ์ OLAP เฉพาะของตนเอง ได้อย่างมีประสิทธิภาพ อันที่จริง ระบบ OLAP หลักส่วนใหญ่มี โหมดการทำงาน ROLAPซึ่งสามารถใช้สคีมาแบบดาวเป็นแหล่งข้อมูลโดยตรงโดยไม่ต้องสร้างโครงสร้างคิวบ์เฉพาะของตนเอง
การใช้งานและการเปรียบเทียบกับรูปแบบเกล็ดหิมะ
สคีมาแบบดาวจะแยกคุณลักษณะมิติออกเป็นตารางกว้างตารางเดียวเพื่อปรับปรุงความเข้าใจง่ายและลดความซับซ้อนของการเชื่อมต่อสำหรับงานวิเคราะห์ ในทางตรงกันข้ามสคีมาแบบเกล็ดหิมะจะทำให้ลำดับชั้นของมิติเป็นตารางที่เชื่อมโยงกันหลายตาราง Kimball แนะนำให้หลีกเลี่ยงการใช้สคีมาแบบเกล็ดหิมะเว้นแต่จะมีเหตุจำเป็นที่ชัดเจน (เช่น มิติขนาดใหญ่มาก) เพราะจะเพิ่มความซับซ้อนให้กับผู้ใช้และอาจส่งผลเสียต่อประสิทธิภาพการสืบค้น[ 5 ] [ 6 ] สคีมาแบบดาวสอดคล้องกับโมเดลหลายมิติ/OLAP ที่ใช้กันทั่วไปในการสนับสนุนการตัดสินใจ[ 7 ]
ตารางทั่วไป
การสร้างแบบจำลองมิติจะแยก ตารางข้อเท็จจริงส่วนกลางและตารางมิติ โดยรอบ ประเภทตารางข้อเท็จจริงทั่วไปในสคีมาแบบดาว ได้แก่ธุรกรรม สแนปช็ อตเป็นระยะและสแนปช็อตสะสมมิติที่สอดคล้องกันที่ใช้บ่อย ได้แก่ วันที่/เวลา ผลิตภัณฑ์ ลูกค้า องค์กร และภูมิศาสตร์[ 8 ] [ 9 ]
ข้อควรพิจารณาด้านประสิทธิภาพการสืบค้นข้อมูล
การค้นหาเชิงวิเคราะห์บนสคีมาแบบดาวมักจะเชื่อมตารางข้อเท็จจริงขนาดใหญ่หนึ่งตารางกับมิติข้อมูลขนาดเล็กจำนวนหนึ่ง ระบบจัดการฐานข้อมูลหลายระบบใช้การเพิ่มประสิทธิภาพ "การเชื่อมแบบดาว" สำหรับรูปแบบนี้ ลักษณะการทำงานของเวิร์กโหลดดังกล่าวโดยทั่วไปจะศึกษาโดยใช้Star Schema Benchmark (SSB ) [ 7 ] [ 10 ]
ตัวอย่าง

ลองพิจารณาฐานข้อมูลยอดขาย อาจจะเป็นของร้านค้าปลีกแห่งหนึ่ง ซึ่งจัดประเภทตามวันที่ ร้านค้า และสินค้า ภาพแผนผังโครงสร้างข้อมูลทางด้านขวาเป็นแผนผังโครงสร้างข้อมูลแบบดาว (Star Schema) ซึ่งเป็นเวอร์ชันของแผนผังโครงสร้างข้อมูลตัวอย่างที่ให้ไว้ในบทความ เกี่ยวกับแผนผังโครงสร้างข้อมูล แบบเกล็ดหิมะ (Snowflake Schema )
Fact_Salesคือตารางข้อเท็จจริง และมีตารางมิติสามตาราง ได้แก่Dim_DateและDim_StoreDim_Product
แต่ละตารางมิติจะมีคีย์หลักอยู่ที่Idคอลัมน์ ซึ่งเชื่อมโยงกับคอลัมน์ใดคอลัมน์หนึ่ง (ในตัวอย่างโครงสร้างข้อมูลจะมองเป็นแถว) ของFact_Salesคีย์หลักแบบสามคอลัมน์ (แบบผสม) ของตารางนั้น ( Date_Id, Store_Id, Product_Id) คอลัมน์ที่ไม่ใช่คีย์หลักUnits_Soldของตารางข้อเท็จจริงในตัวอย่างนี้แสดงถึงค่าหรือตัวชี้วัดที่สามารถใช้ในการคำนวณและการวิเคราะห์ได้ ส่วนคอลัมน์ที่ไม่ใช่คีย์หลักของตารางมิติแสดงถึงคุณลักษณะเพิ่มเติมของมิติ (เช่นYearของDim_Dateมิติ)
ตัวอย่างเช่น คำสั่งค้นหาต่อไปนี้จะตอบคำถามว่าในปี 1997 มีการขายโทรทัศน์ไปกี่เครื่อง สำหรับแต่ละยี่ห้อและแต่ละประเทศ:
SELECT P.Brand , S.Country AS Countries , SUM ( F.Units_Sold )จากตาราง Fact_Sales F เข้าร่วม กับ ตาราง Dim_Date D โดยใช้เงื่อนไขDate_Id ของตารางF เท่ากับD.Id เข้าร่วมกับตารางDim_Store S โดยใช้เงื่อนไขStore_Id ของตารางF เท่ากับS.Id เข้าร่วมกับตารางDim_Product P โดยใช้เงื่อนไขProduct_Id ของตารางF เท่ากับP.Idโดยที่D.Year = 1997 และP.Product_Category = ' tv 'จัดกลุ่มตามP. แบรนด์, S. ประเทศดูเพิ่มเติม
ลิงก์ภายนอก
- ดาว: ภาษาแบบแผนสำหรับสคีมาที่ปรับให้เหมาะสมกับการสืบค้น
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ แผนผังดาว
ในด้าน การคำนวณ สคีมา แบบ ดาว หรือ แบบจำลองดาว เป็นรูป แบบสคีมา ของ ดาต้ามาร์ท ที่ง่ายที่สุด และเป็นแนวทางที่ใช้กันอย่างแพร่หลายที่สุดในการพัฒนาคลังข้อมูลและดาต้ามาร์ทเชิงมิติ [ 1...
แบบอย่าง
โครงสร้างข้อมูลแบบสตาร์สคีมาแยกข้อมูลกระบวนการทางธุรกิจออกเป็นข้อเท็จจริง ซึ่งเป็นข้อมูลเชิงปริมาณที่วัดได้เกี่ยวกับธุรกิจ และมิติ ซึ่งเป็นคุณลักษณะเชิงพรรณนาที่เกี่ยวข้องกับข้อมูลข้อเท็จจริง ตัวอย่างของข้อมูลข้อเท็จจริง ได้แก่ ราคาขาย ปริมาณการขาย เวลา...
ตารางข้อเท็จจริง
ตารางข้อเท็จจริงบันทึกการวัดหรือตัวชี้วัดสำหรับเหตุการณ์เฉพาะ ตารางข้อเท็จจริงโดยทั่วไปประกอบด้วยค่าตัวเลขและคีย์ต่างประเทศไปยังข้อมูลมิติซึ่งเก็บข้อมูลเชิงพรรณนาไว้ [ 4 ] ตารางข้อเท็จจริงได้รับการออกแบบให้มีระดับรายละเอียดที่สม่ำเสมอในระดับต่ำ (เรียกว่า...
ตารางมิติ
โดยทั่วไปแล้ว ตารางมิติจะมีจำนวนระเบียนค่อนข้างน้อยเมื่อเทียบกับตารางข้อเท็จจริง แต่ละระเบียนอาจมีคุณลักษณะจำนวนมากเพื่ออธิบายข้อมูลข้อเท็จจริง มิติสามารถกำหนดลักษณะเฉพาะได้หลากหลาย แต่คุณลักษณะที่พบบ่อยที่สุดที่กำหนดโดยตารางมิติ ได้แก่: