กลับไปหน้าบทความ

อ่าน 8 นาที

พีชคณิตสารสนเทศ

คำว่า " พีชคณิตสารสนเทศ " หมายถึงเทคนิคทางคณิตศาสตร์ในการประมวลผลสารสนเทศทฤษฎีสารสนเทศแบบคลาสสิกมีที่มาจากโคลด แชนนอน เป็นทฤษฎีเกี่ยวกับการส่งผ่านสารสนเทศ...

พีชคณิตสารสนเทศ

คำว่า " พีชคณิตสารสนเทศ " หมายถึงเทคนิคทางคณิตศาสตร์ในการประมวลผลสารสนเทศทฤษฎีสารสนเทศแบบคลาสสิกมีที่มาจากโคลด แชนนอน เป็นทฤษฎีเกี่ยวกับการส่งผ่านสารสนเทศ โดยพิจารณาถึงการสื่อสารและการจัดเก็บ อย่างไรก็ตาม ที่ผ่านมายังไม่ได้พิจารณาว่าสารสนเทศมาจากแหล่งต่างๆ และมักจะถูกรวมเข้าด้วยกัน นอกจากนี้ ในทฤษฎีสารสนเทศแบบคลาสสิกยังละเลยประเด็นที่ว่าเราต้องการแยกส่วนต่างๆ ออกจากข้อมูลชิ้นหนึ่งที่เกี่ยวข้องกับคำถามเฉพาะเจาะจง

การกำหนดการดำเนินการเหล่านี้ในเชิงคณิตศาสตร์นำไปสู่พีชคณิตของข้อมูลซึ่งอธิบายโหมดพื้นฐานของการประมวลผลข้อมูล พีชคณิตดังกล่าวเกี่ยวข้องกับรูปแบบทางคณิตศาสตร์หลายอย่างของวิทยาการคอมพิวเตอร์ซึ่งดูเหมือนจะแตกต่างกันในแง่ผิวเผิน เช่น ฐานข้อมูลเชิงสัมพันธ์ ระบบตรรกะเชิงรูปธรรมหลายระบบ หรือปัญหาเชิงตัวเลขของพีชคณิตเชิงเส้นสิ่งนี้ช่วยให้สามารถพัฒนาขั้นตอนการประมวลผลข้อมูลทั่วไป และทำให้เกิดการรวมวิธีการพื้นฐานของวิทยาการคอมพิวเตอร์ โดยเฉพาะอย่างยิ่ง การ ประมวล ผลข้อมูลแบบกระจาย

ข้อมูลเกี่ยวข้องกับคำถามที่เฉพาะเจาะจง มาจากแหล่งข้อมูลที่แตกต่างกัน ต้องมีการรวบรวม และสามารถมุ่งเน้นไปที่คำถามที่น่าสนใจได้ จากการพิจารณาเหล่านี้ พีชคณิตข้อมูล ( Kohlas 2003 ) จึงเป็นพีชคณิตสองประเภท :

โดยที่เป็นเซมิกรุปซึ่งแสดงถึงการรวมกันหรือการรวมกลุ่มของข้อมูล และเป็นแลตทิซของโดเมน (ที่เกี่ยวข้องกับคำถาม) ซึ่งลำดับบางส่วนสะท้อนถึงระดับความละเอียดของโดเมนหรือคำถาม และเป็นการดำเนินการแบบผสมที่แสดงถึงการโฟกัสหรือการสกัดข้อมูล

ข้อมูลและการดำเนินงาน

กล่าวโดยละเอียด ในพีชคณิตแบบสองประเภทจะมีการกำหนดการดำเนินการต่อไปนี้

การผสมผสาน
การโฟกัส
            

นอกจากนี้ยังมีการกำหนดการดำเนินการแบบแลตติสทั่วไป (เช่น การตัดกันและการรวมเข้าด้วยกัน) ไว้ ด้วย

หลักการพื้นฐานและคำจำกัดความ

สัจพจน์ของพีชคณิตสองประเภทนอกเหนือจากสัจพจน์ของแลตทิซ:

เซมิกรุ๊ป
เป็นเซมิกรุปสลับที่ได้ภายใต้การรวมกับองค์ประกอบที่เป็นกลาง (ซึ่งแสดงถึงข้อมูลที่ว่างเปล่า)
การกระจายตัวของการโฟกัสเหนือการรวมกัน

เพื่อให้ข้อมูลหนึ่งสามารถนำไปรวมกับข้อมูลอีกข้อมูลหนึ่งในโดเมนเดียวกันได้เราอาจเริ่มต้นด้วยการเน้นข้อมูลที่สองก่อนแล้วค่อยนำมารวมกัน ก็ได้

การถ่ายทอดของการโฟกัส

เพื่อให้ข้อมูลเกี่ยวกับและ มีความชัดเจนมากขึ้น เราอาจเน้นข้อมูลไปที่

ภาวะเสื่อมสมรรถภาพทางเพศ

ข้อมูลหนึ่งๆ ที่นำมารวมกับส่วนอื่นๆ ของตัวมันเอง ไม่ได้ก่อให้เกิดสิ่งใหม่ใดๆ

สนับสนุน
โดยที่

ข้อมูลแต่ละส่วนอ้างอิงถึงอย่างน้อยหนึ่งโดเมน (คำถาม)

            

พีชคณิตสองประเภทที่สอดคล้องกับสัจพจน์เหล่านี้เรียกว่าพีชคณิต สารสนเทศ

ลำดับของข้อมูล

สามารถกำหนดลำดับข้อมูลบางส่วนได้โดยการกำหนดเงื่อนไข ว่า ถ้าหมายความว่ามีข้อมูลน้อยกว่าถ้า ไม่เพิ่มข้อมูลใหม่ใดๆ ให้กับเซมิกรุปเป็นเซมิแลตทิซที่สัมพันธ์กับลำดับนี้ กล่าวคือสัมพันธ์กับโดเมน (คำถาม) ใดๆสามารถกำหนดลำดับบางส่วนได้โดยการกำหนดเงื่อนไขว่า ถ้ามันแสดงถึงลำดับของเนื้อหาข้อมูลของและที่สัมพันธ์กับโดเมน (คำถาม)

พีชคณิตข้อมูลที่มีป้ายกำกับ

คู่โดยที่และก่อให้เกิดพีชคณิตสารสนเทศที่มีป้ายกำกับ กล่าว โดยละเอียดกว่า นั้นในพีชคณิตแบบเรียงลำดับสองประเภทจะมีการกำหนดการดำเนินการต่อไปนี้

การติดฉลาก
การผสมผสาน
การฉายภาพ
            

แบบจำลองของพีชคณิตสารสนเทศ

ต่อไปนี้เป็นรายการตัวอย่างของพีชคณิตสารสนเทศที่ไม่ครบถ้วน:

ตัวอย่างการคำนวณ: พีชคณิตเชิงสัมพันธ์

ให้เป็นเซตของสัญลักษณ์ที่เรียกว่าแอตทริบิวต์ (หรือชื่อคอลัมน์ ) สำหรับแต่ละให้เป็นเซตที่ไม่ว่างเปล่า ซึ่งเป็นเซตของค่าที่เป็นไปได้ทั้งหมดของแอตทริบิวต์αตัวอย่างเช่น ถ้า แล้วอาจเป็นเซตของสตริง ในขณะที่และเป็นเซตของจำนวนเต็มที่ไม่เป็นลบทั้งคู่

ให้. x -tupleคือฟังก์ชันfโดยที่ และสำหรับแต่ละเซตของx -tuple ทั้งหมดจะถูกแทนด้วย. สำหรับx -tuple fและเซตย่อย ข้อจำกัดจะถูกกำหนดให้เป็น y -tuple gโดยที่สำหรับทุก.

ความสัมพันธ์Rบนxคือเซตของx -tuple กล่าวคือ เซตย่อยของy เซตของแอตทริบิวต์xเรียกว่าโดเมนของRและใช้ สัญลักษณ์ แทนการฉายภาพของRไปยังyนิยามได้ดังนี้:

การเชื่อมต่อ (Join)ของความสัมพันธ์Rบนตัวแปรxและความสัมพันธ์Sบนตัวแปรyถูกกำหนดดังนี้:

ตัวอย่างเช่น ให้RและSเป็นความสัมพันธ์ดังต่อไปนี้:

ดังนั้นจุดเชื่อมต่อของRและSคือ:

ฐานข้อมูลเชิงสัมพันธ์ที่มีการเชื่อมต่อแบบธรรมชาติ (natural join) เป็นการรวมกัน และการฉายภาพแบบปกติπนั้นเป็นพีชคณิตสารสนเทศ การดำเนินการต่างๆ ได้รับการกำหนดไว้อย่างดีแล้ว เนื่องจาก

  • ถ้าเช่นนั้น

เป็นที่เห็นได้ชัดว่าฐานข้อมูลเชิงสัมพันธ์นั้นสอดคล้องกับสัจพจน์ของพีชคณิตสารสนเทศที่มีป้ายกำกับ:

เซมิกรุป
และ
การถ่ายทอด
ถ้าเช่นนั้น
การผสมผสาน
ถ้าและแล้ว​
ความคงที่
ถ้าเช่นนั้น
สนับสนุน
ถ้าเช่นนั้น

การเชื่อมต่อ

พีชคณิตการประเมินค่า
การละทิ้งสัจพจน์ความเท่าเทียมกันนำไปสู่พีชคณิตการประเมินค่าสัจพจน์เหล่านี้ได้รับการแนะนำโดย ( Shenoy & Shafer 1990 ) เพื่อขยายรูปแบบการคำนวณเฉพาะที่ ( Lauritzen & Spiegelhalter 1988 ) จากเครือข่ายเบย์เซียนไปสู่รูปแบบทั่วไปมากขึ้น รวมถึงฟังก์ชันความเชื่อ ศักยภาพความเป็นไปได้ ฯลฯ ( Kohlas & Shenoy 2000 ) สำหรับรายละเอียดเพิ่มเติมในรูปแบบหนังสือ โปรดดูPouly & Kohlas (2011)
โดเมนและระบบสารสนเทศ
พีชคณิตสารสนเทศแบบกระชับ ( Kohlas 2003 ) เกี่ยวข้องกับโดเมน Scottและระบบสารสนเทศ Scott ( Scott 1970 ); ( Scott 1982 ); ( Larsen & Winskel 1984 )
ข้อมูลที่ไม่แน่นอน
ตัวแปรสุ่มที่มีค่าในพีชคณิตสารสนเทศแสดงถึงระบบการโต้แย้งเชิงความน่าจะเป็น ( Haenni, Kohlas & Lehmann 2000 )
ข้อมูลเชิงความหมาย
พีชคณิตสารสนเทศนำเสนอความหมายโดยการเชื่อมโยงข้อมูลกับคำถามผ่านการเน้นและการรวมกัน ( Groenendijk & Stokhof 1984 ); ( Floridi 2004 )
การไหลเวียนของข้อมูล
พีชคณิตสารสนเทศมีความเกี่ยวข้องกับการไหลของสารสนเทศ โดยเฉพาะอย่างยิ่งการจำแนกประเภท ( Barwise & Seligman 1997 )
การผุพังของต้นไม้
พีชคณิตสารสนเทศถูกจัดระเบียบเป็นโครงสร้างแบบลำดับชั้นคล้ายต้นไม้ และถูกแบ่งย่อยออกเป็นปัญหาที่เล็กกว่า
ทฤษฎีเซมิกรุป
...
แบบจำลององค์ประกอบ
แบบจำลองดังกล่าวอาจถูกกำหนดขึ้นภายในกรอบของพีชคณิตสารสนเทศ: https://arxiv.org/abs/1612.02587
รากฐานเชิงสัจพจน์ที่ขยายเพิ่มเติมของพีชคณิตสารสนเทศและพีชคณิตการประเมินค่า
แนวคิดเรื่องความเป็นอิสระแบบมีเงื่อนไขเป็นพื้นฐานสำหรับพีชคณิตสารสนเทศ และมีรากฐานเชิงสัจพจน์ใหม่ของพีชคณิตสารสนเทศที่อิงตามความเป็นอิสระแบบมีเงื่อนไข ซึ่งเป็นการต่อยอดจากรากฐานเดิม (ดูด้านบน) สามารถดูได้ที่: https://arxiv.org/abs/1701.02658

รากฐานทางประวัติศาสตร์

สัจพจน์สำหรับพีชคณิตสารสนเทศได้มาจากระบบสัจพจน์ที่เสนอไว้ใน (Shenoy and Shafer, 1990) ดูเพิ่มเติมที่ (Shafer, 1991)

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Information_algebra&oldid=1352320962#Connections "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ พีชคณิตสารสนเทศ

คำว่า " พีชคณิตสารสนเทศ " หมายถึงเทคนิคทางคณิตศาสตร์ในการประมวลผลสารสนเทศทฤษฎีสารสนเทศแบบคลาสสิกมีที่มาจากโคลด แชนนอน เป็นทฤษฎีเกี่ยวกับการส่งผ่านสารสนเทศ...

ข้อมูลและการดำเนินงาน

กล่าวโดยละเอียด ในพีชคณิตแบบสองประเภทจะมีการกำหนดการดำเนินการต่อไปนี้ ( Φ , ดี ) {\displaystyle (\Phi ,D)}

หลักการพื้นฐานและคำจำกัดความ

สัจพจน์ของพีชคณิตสองประเภทนอกเหนือจากสัจพจน์ของแลตทิซ: ( Φ , ดี ) {\displaystyle (\Phi ,D)} ดี {\displaystyle D}

ลำดับของข้อมูล

สามารถกำหนดลำดับข้อมูลบางส่วนได้โดยการกำหนดเงื่อนไข ว่า ถ้าหมายความว่ามีข้อมูลน้อยกว่าถ้า ไม่เพิ่มข้อมูลใหม่ใดๆ ให้กับเซมิกรุปเป็น เซมิแลตทิซ ที่สัมพันธ์กับลำดับนี้ กล่าวคือสัมพันธ์กับโดเมน (คำถาม) ใดๆสามารถกำหนดลำดับบางส่วนได้โดยการกำหนดเงื่อนไขว่า...