กลับไปหน้าบทความ

อ่าน 3 นาที

แผนผังดาว

ในด้าน การคำนวณ สคีมา แบบ ดาว หรือ แบบจำลองดาว เป็นรูป แบบสคีมา ของ ดาต้ามาร์ท ที่ง่ายที่สุด และเป็นแนวทางที่ใช้กันอย่างแพร่หลายที่สุดในการพัฒนาคลังข้อมูลและดาต้ามาร์ทเชิงมิติ [ 1...

แผนผังดาว

ในด้านการคำนวณ สคีมา แบบดาวหรือแบบจำลองดาวเป็นรูปแบบสคีมา ของ ดาต้ามาร์ท ที่ง่ายที่สุด และเป็นแนวทางที่ใช้กันอย่างแพร่หลายที่สุดในการพัฒนาคลังข้อมูลและดาต้ามาร์ทเชิงมิติ[ 1 ]สคีมาแบบดาวประกอบด้วยตารางข้อเท็จจริง หนึ่งตารางขึ้นไปที่อ้างอิงถึง ตารางมิติจำนวนเท่าใดก็ได้สคีมาแบบดาวเป็นกรณีพิเศษที่สำคัญของสคีมาแบบเกล็ดหิมะและมีประสิทธิภาพมากกว่าในการจัดการกับแบบสอบถามที่ง่ายกว่า[ 2 ]

แผนผังดาวได้รับชื่อมาจากความคล้ายคลึงของแบบจำลองทางกายภาพ[ 3 ] ที่มี รูปร่างคล้ายดาวโดยมีตารางข้อเท็จจริงอยู่ตรงกลาง และตารางมิติที่อยู่รอบๆ แสดงถึงจุดของดาว

แบบอย่าง

โครงสร้างข้อมูลแบบสตาร์สคีมาแยกข้อมูลกระบวนการทางธุรกิจออกเป็นข้อเท็จจริง ซึ่งเป็นข้อมูลเชิงปริมาณที่วัดได้เกี่ยวกับธุรกิจ และมิติ ซึ่งเป็นคุณลักษณะเชิงพรรณนาที่เกี่ยวข้องกับข้อมูลข้อเท็จจริง ตัวอย่างของข้อมูลข้อเท็จจริง ได้แก่ ราคาขาย ปริมาณการขาย เวลา ระยะทาง ความเร็ว และการวัดน้ำหนัก ตัวอย่างของคุณลักษณะมิติที่เกี่ยวข้อง ได้แก่ รุ่นสินค้า สีสินค้า ขนาดสินค้า สถานที่ตั้งทางภูมิศาสตร์ และชื่อพนักงานขาย

สคีมาดาวที่มีมิติหลายมิติบางครั้งเรียกว่าสคีมาตะขาบ [ 4 ] การมีมิติที่มีแอตทริบิวต์เพียงไม่กี่ตัว แม้ว่าจะดูแลรักษาง่ายกว่า แต่ส่งผลให้มีการสืบค้นที่มีการเชื่อมต่อตารางจำนวนมาก และทำให้สคีมาดาวใช้งานได้ยากขึ้น

ตารางข้อเท็จจริง

ตารางข้อเท็จจริงบันทึกการวัดหรือตัวชี้วัดสำหรับเหตุการณ์เฉพาะ ตารางข้อเท็จจริงโดยทั่วไปประกอบด้วยค่าตัวเลขและคีย์ต่างประเทศไปยังข้อมูลมิติซึ่งเก็บข้อมูลเชิงพรรณนาไว้[ 4 ] ตารางข้อเท็จจริงได้รับการออกแบบให้มีระดับรายละเอียดที่สม่ำเสมอในระดับต่ำ (เรียกว่า "ความละเอียด" หรือ " ระดับย่อย ") ซึ่งหมายความว่าข้อเท็จจริงสามารถบันทึกเหตุการณ์ได้ในระดับอะตอมมาก ซึ่งอาจส่งผลให้มีการสะสมบันทึกจำนวนมากในตารางข้อเท็จจริงเมื่อเวลาผ่านไป ตารางข้อเท็จจริงถูกกำหนดเป็นหนึ่งในสามประเภท:

  • ตารางข้อมูลธุรกรรมจะบันทึกข้อเท็จจริงเกี่ยวกับเหตุการณ์เฉพาะ (เช่น เหตุการณ์การขาย)
  • ตารางข้อมูลแบบภาพรวมจะบันทึกข้อมูล ณ จุดเวลาใดเวลาหนึ่ง (เช่น รายละเอียดบัญชี ณ สิ้นเดือน)
  • ตารางภาพรวมจะบันทึกข้อมูลโดยรวม ณ จุดเวลาใดเวลาหนึ่ง (เช่น ยอดขายรวมตั้งแต่ต้นเดือนของผลิตภัณฑ์)

โดยทั่วไป ตารางข้อเท็จจริงจะถูกกำหนดคีย์ตัวแทนเพื่อให้มั่นใจได้ว่าแต่ละแถวสามารถระบุได้อย่างไม่ซ้ำกัน คีย์นี้ก็คือคีย์หลักแบบง่ายๆ นั่นเอง

ตารางมิติ

โดยทั่วไปแล้ว ตารางมิติจะมีจำนวนระเบียนค่อนข้างน้อยเมื่อเทียบกับตารางข้อเท็จจริง แต่ละระเบียนอาจมีคุณลักษณะจำนวนมากเพื่ออธิบายข้อมูลข้อเท็จจริง มิติสามารถกำหนดลักษณะเฉพาะได้หลากหลาย แต่คุณลักษณะที่พบบ่อยที่สุดที่กำหนดโดยตารางมิติ ได้แก่:

  • ตารางมิติเวลาอธิบายเวลาในระดับความละเอียดของเวลาที่ต่ำที่สุดซึ่งมีการบันทึกเหตุการณ์ไว้ในสคีมาแบบดาว
  • ตารางมิติทางภูมิศาสตร์อธิบายข้อมูลตำแหน่งที่ตั้ง เช่น ประเทศ รัฐ หรือเมือง
  • ตารางแสดงขนาดผลิตภัณฑ์อธิบายรายละเอียดของผลิตภัณฑ์
  • ตารางมิติพนักงานอธิบายรายละเอียดเกี่ยวกับพนักงาน เช่น พนักงานขาย
  • ตารางแสดงมิติช่วงเวลา อธิบายช่วงเวลา มูลค่าเป็นดอลลาร์ หรือปริมาณที่วัดได้อื่นๆ เพื่อให้การรายงานง่ายขึ้น

โดยทั่วไป ตารางมิติจะถูกกำหนดคีย์หลักทดแทนซึ่งมักจะเป็นชนิดข้อมูลจำนวนเต็มแบบคอลัมน์เดียว ที่เชื่อมโยงกับการรวมกันของคุณลักษณะมิติที่ประกอบเป็นคีย์หลัก

ประโยชน์

โครงสร้างข้อมูลแบบสตาร์สคีมา (Star schema) นั้นเป็นโครงสร้างข้อมูล ที่ไม่เป็นไปตามกฎเกณฑ์ปกติ (Denormalized ) ซึ่งหมายความว่ากฎเกณฑ์ปกติที่ใช้กับฐานข้อมูลเชิงสัมพันธ์แบบธุรกรรมจะถูกผ่อนปรนในระหว่างการออกแบบและการใช้งานสตาร์สคีมา ข้อดีของการลดความซ้ำซ้อนของสตาร์สคีมามีดังนี้:

  • การสืบค้นข้อมูลที่ง่ายกว่า – ตรรกะการเชื่อมต่อแบบสตาร์สคีมาโดยทั่วไปจะง่ายกว่าตรรกะการเชื่อมต่อที่จำเป็นในการดึงข้อมูลจากสคีมาธุรกรรมที่มีการจัดระเบียบอย่างสูง
  • ตรรกะการรายงานทางธุรกิจที่เรียบง่าย – เมื่อเปรียบเทียบกับสคีมาที่มีการกำหนดรูปแบบอย่างสูง สคีมาแบบดาวจะช่วยลดความซับซ้อนของตรรกะการรายงานทางธุรกิจทั่วไป เช่น การรายงานเปรียบเทียบระหว่างช่วงเวลาต่างๆ และการรายงาน ณ วันที่ปัจจุบัน
  • ประสิทธิภาพการสืบค้นข้อมูลดีขึ้น – โครงสร้างข้อมูลแบบดาว (star schema) สามารถเพิ่มประสิทธิภาพให้กับแอปพลิเคชันการรายงานแบบอ่านอย่างเดียว เมื่อเปรียบเทียบกับ โครงสร้างข้อมูล ที่มีการจัดระเบียบ อย่างเข้มงวด (highly normalized schemas)
  • การรวมข้อมูลที่รวดเร็ว – การค้นหาข้อมูลที่ง่ายกว่าบนสคีมาแบบดาวสามารถส่งผลให้ประสิทธิภาพในการดำเนินการรวมข้อมูลดีขึ้น
  • การป้อนข้อมูลเข้าสู่คิวบ์ – ระบบ OLAPทุกระบบใช้สคีมาแบบดาวเพื่อสร้างคิวบ์ OLAP เฉพาะของตนเอง ได้อย่างมีประสิทธิภาพ อันที่จริง ระบบ OLAP หลักส่วนใหญ่มี โหมดการทำงาน ROLAPซึ่งสามารถใช้สคีมาแบบดาวเป็นแหล่งข้อมูลโดยตรงโดยไม่ต้องสร้างโครงสร้างคิวบ์เฉพาะของตนเอง

การใช้งานและการเปรียบเทียบกับรูปแบบเกล็ดหิมะ

สคีมาแบบดาวจะแยกคุณลักษณะมิติออกเป็นตารางกว้างตารางเดียวเพื่อปรับปรุงความเข้าใจง่ายและลดความซับซ้อนของการเชื่อมต่อสำหรับงานวิเคราะห์ ในทางตรงกันข้ามสคีมาแบบเกล็ดหิมะจะทำให้ลำดับชั้นของมิติเป็นตารางที่เชื่อมโยงกันหลายตาราง Kimball แนะนำให้หลีกเลี่ยงการใช้สคีมาแบบเกล็ดหิมะเว้นแต่จะมีเหตุจำเป็นที่ชัดเจน (เช่น มิติขนาดใหญ่มาก) เพราะจะเพิ่มความซับซ้อนให้กับผู้ใช้และอาจส่งผลเสียต่อประสิทธิภาพการสืบค้น[ 5 ] [ 6 ] สคีมาแบบดาวสอดคล้องกับโมเดลหลายมิติ/OLAP ที่ใช้กันทั่วไปในการสนับสนุนการตัดสินใจ[ 7 ]

ตารางทั่วไป

การสร้างแบบจำลองมิติจะแยก ตารางข้อเท็จจริงส่วนกลางและตารางมิติ โดยรอบ ประเภทตารางข้อเท็จจริงทั่วไปในสคีมาแบบดาว ได้แก่ธุรกรรม สแนปช็ อตเป็นระยะและสแนปช็อตสะสมมิติที่สอดคล้องกันที่ใช้บ่อย ได้แก่ วันที่/เวลา ผลิตภัณฑ์ ลูกค้า องค์กร และภูมิศาสตร์[ 8 ] [ 9 ]

ข้อควรพิจารณาด้านประสิทธิภาพการสืบค้นข้อมูล

การค้นหาเชิงวิเคราะห์บนสคีมาแบบดาวมักจะเชื่อมตารางข้อเท็จจริงขนาดใหญ่หนึ่งตารางกับมิติข้อมูลขนาดเล็กจำนวนหนึ่ง ระบบจัดการฐานข้อมูลหลายระบบใช้การเพิ่มประสิทธิภาพ "การเชื่อมแบบดาว" สำหรับรูปแบบนี้ ลักษณะการทำงานของเวิร์กโหลดดังกล่าวโดยทั่วไปจะศึกษาโดยใช้Star Schema Benchmark (SSB ) [ 7 ] [ 10 ]

ตัวอย่าง

สคีมาแบบดาวที่ใช้โดยแบบสอบถามตัวอย่าง

ลองพิจารณาฐานข้อมูลยอดขาย อาจจะเป็นของร้านค้าปลีกแห่งหนึ่ง ซึ่งจัดประเภทตามวันที่ ร้านค้า และสินค้า ภาพแผนผังโครงสร้างข้อมูลทางด้านขวาเป็นแผนผังโครงสร้างข้อมูลแบบดาว (Star Schema) ซึ่งเป็นเวอร์ชันของแผนผังโครงสร้างข้อมูลตัวอย่างที่ให้ไว้ในบทความ เกี่ยวกับแผนผังโครงสร้างข้อมูล แบบเกล็ดหิมะ (Snowflake Schema )

Fact_Salesคือตารางข้อเท็จจริง และมีตารางมิติสามตาราง ได้แก่Dim_DateและDim_StoreDim_Product

แต่ละตารางมิติจะมีคีย์หลักอยู่ที่Idคอลัมน์ ซึ่งเชื่อมโยงกับคอลัมน์ใดคอลัมน์หนึ่ง (ในตัวอย่างโครงสร้างข้อมูลจะมองเป็นแถว) ของFact_Salesคีย์หลักแบบสามคอลัมน์ (แบบผสม) ของตารางนั้น ( Date_Id, Store_Id, Product_Id) คอลัมน์ที่ไม่ใช่คีย์หลักUnits_Soldของตารางข้อเท็จจริงในตัวอย่างนี้แสดงถึงค่าหรือตัวชี้วัดที่สามารถใช้ในการคำนวณและการวิเคราะห์ได้ ส่วนคอลัมน์ที่ไม่ใช่คีย์หลักของตารางมิติแสดงถึงคุณลักษณะเพิ่มเติมของมิติ (เช่นYearของDim_Dateมิติ)

ตัวอย่างเช่น คำสั่งค้นหาต่อไปนี้จะตอบคำถามว่าในปี 1997 มีการขายโทรทัศน์ไปกี่เครื่อง สำหรับแต่ละยี่ห้อและแต่ละประเทศ:

SELECT P.Brand , S.Country AS Countries , SUM ( F.Units_Sold )จากตาราง Fact_Sales F เข้าร่วม กับ ตาราง Dim_Date D โดยใช้เงื่อนไขDate_Id ของตารางF เท่ากับD.Id เข้าร่วมกับตารางDim_Store S โดยใช้เงื่อนไขStore_Id ของตารางF เท่ากับS.Id เข้าร่วมกับตารางDim_Product P โดยใช้เงื่อนไขProduct_Id ของตารางF เท่ากับP.Idโดยที่D.Year = 1997 และP.Product_Category = ' tv 'จัดกลุ่มตามP. แบรนด์, S. ประเทศ

ดูเพิ่มเติม

  • ดาว: ภาษาแบบแผนสำหรับสคีมาที่ปรับให้เหมาะสมกับการสืบค้น
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Star_schema&oldid=1306074452 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ แผนผังดาว

ในด้าน การคำนวณ สคีมา แบบ ดาว หรือ แบบจำลองดาว เป็นรูป แบบสคีมา ของ ดาต้ามาร์ท ที่ง่ายที่สุด และเป็นแนวทางที่ใช้กันอย่างแพร่หลายที่สุดในการพัฒนาคลังข้อมูลและดาต้ามาร์ทเชิงมิติ [ 1...

แบบอย่าง

โครงสร้างข้อมูลแบบสตาร์สคีมาแยกข้อมูลกระบวนการทางธุรกิจออกเป็นข้อเท็จจริง ซึ่งเป็นข้อมูลเชิงปริมาณที่วัดได้เกี่ยวกับธุรกิจ และมิติ ซึ่งเป็นคุณลักษณะเชิงพรรณนาที่เกี่ยวข้องกับข้อมูลข้อเท็จจริง ตัวอย่างของข้อมูลข้อเท็จจริง ได้แก่ ราคาขาย ปริมาณการขาย เวลา...

ตารางข้อเท็จจริง

ตารางข้อเท็จจริงบันทึกการวัดหรือตัวชี้วัดสำหรับเหตุการณ์เฉพาะ ตารางข้อเท็จจริงโดยทั่วไปประกอบด้วยค่าตัวเลขและคีย์ต่างประเทศไปยังข้อมูลมิติซึ่งเก็บข้อมูลเชิงพรรณนาไว้ [ 4 ] ตารางข้อเท็จจริงได้รับการออกแบบให้มีระดับรายละเอียดที่สม่ำเสมอในระดับต่ำ (เรียกว่า...

ตารางมิติ

โดยทั่วไปแล้ว ตารางมิติจะมีจำนวนระเบียนค่อนข้างน้อยเมื่อเทียบกับตารางข้อเท็จจริง แต่ละระเบียนอาจมีคุณลักษณะจำนวนมากเพื่ออธิบายข้อมูลข้อเท็จจริง มิติสามารถกำหนดลักษณะเฉพาะได้หลากหลาย แต่คุณลักษณะที่พบบ่อยที่สุดที่กำหนดโดยตารางมิติ ได้แก่: