อ่าน 8 นาที
พีชคณิตสารสนเทศ
คำว่า " พีชคณิตสารสนเทศ " หมายถึงเทคนิคทางคณิตศาสตร์ในการประมวลผลสารสนเทศทฤษฎีสารสนเทศแบบคลาสสิกมีที่มาจากโคลด แชนนอน เป็นทฤษฎีเกี่ยวกับการส่งผ่านสารสนเทศ...
พีชคณิตสารสนเทศ
คำว่า " พีชคณิตสารสนเทศ " หมายถึงเทคนิคทางคณิตศาสตร์ในการประมวลผลสารสนเทศทฤษฎีสารสนเทศแบบคลาสสิกมีที่มาจากโคลด แชนนอน เป็นทฤษฎีเกี่ยวกับการส่งผ่านสารสนเทศ โดยพิจารณาถึงการสื่อสารและการจัดเก็บ อย่างไรก็ตาม ที่ผ่านมายังไม่ได้พิจารณาว่าสารสนเทศมาจากแหล่งต่างๆ และมักจะถูกรวมเข้าด้วยกัน นอกจากนี้ ในทฤษฎีสารสนเทศแบบคลาสสิกยังละเลยประเด็นที่ว่าเราต้องการแยกส่วนต่างๆ ออกจากข้อมูลชิ้นหนึ่งที่เกี่ยวข้องกับคำถามเฉพาะเจาะจง
การกำหนดการดำเนินการเหล่านี้ในเชิงคณิตศาสตร์นำไปสู่พีชคณิตของข้อมูลซึ่งอธิบายโหมดพื้นฐานของการประมวลผลข้อมูล พีชคณิตดังกล่าวเกี่ยวข้องกับรูปแบบทางคณิตศาสตร์หลายอย่างของวิทยาการคอมพิวเตอร์ซึ่งดูเหมือนจะแตกต่างกันในแง่ผิวเผิน เช่น ฐานข้อมูลเชิงสัมพันธ์ ระบบตรรกะเชิงรูปธรรมหลายระบบ หรือปัญหาเชิงตัวเลขของพีชคณิตเชิงเส้นสิ่งนี้ช่วยให้สามารถพัฒนาขั้นตอนการประมวลผลข้อมูลทั่วไป และทำให้เกิดการรวมวิธีการพื้นฐานของวิทยาการคอมพิวเตอร์ โดยเฉพาะอย่างยิ่ง การ ประมวล ผลข้อมูลแบบกระจาย
ข้อมูลเกี่ยวข้องกับคำถามที่เฉพาะเจาะจง มาจากแหล่งข้อมูลที่แตกต่างกัน ต้องมีการรวบรวม และสามารถมุ่งเน้นไปที่คำถามที่น่าสนใจได้ จากการพิจารณาเหล่านี้ พีชคณิตข้อมูล ( Kohlas 2003 ) จึงเป็นพีชคณิตสองประเภท :
โดยที่เป็นเซมิกรุปซึ่งแสดงถึงการรวมกันหรือการรวมกลุ่มของข้อมูล และเป็นแลตทิซของโดเมน (ที่เกี่ยวข้องกับคำถาม) ซึ่งลำดับบางส่วนสะท้อนถึงระดับความละเอียดของโดเมนหรือคำถาม และเป็นการดำเนินการแบบผสมที่แสดงถึงการโฟกัสหรือการสกัดข้อมูล
ข้อมูลและการดำเนินงาน
กล่าวโดยละเอียด ในพีชคณิตแบบสองประเภทจะมีการกำหนดการดำเนินการต่อไปนี้
|
นอกจากนี้ยังมีการกำหนดการดำเนินการแบบแลตติสทั่วไป (เช่น การตัดกันและการรวมเข้าด้วยกัน) ไว้ ด้วย
หลักการพื้นฐานและคำจำกัดความ
สัจพจน์ของพีชคณิตสองประเภทนอกเหนือจากสัจพจน์ของแลตทิซ:
เพื่อให้ข้อมูลหนึ่งสามารถนำไปรวมกับข้อมูลอีกข้อมูลหนึ่งในโดเมนเดียวกันได้เราอาจเริ่มต้นด้วยการเน้นข้อมูลที่สองก่อนแล้วค่อยนำมารวมกัน ก็ได้
เพื่อให้ข้อมูลเกี่ยวกับและ มีความชัดเจนมากขึ้น เราอาจเน้นข้อมูลไปที่
ข้อมูลหนึ่งๆ ที่นำมารวมกับส่วนอื่นๆ ของตัวมันเอง ไม่ได้ก่อให้เกิดสิ่งใหม่ใดๆ
ข้อมูลแต่ละส่วนอ้างอิงถึงอย่างน้อยหนึ่งโดเมน (คำถาม) |
พีชคณิตสองประเภทที่สอดคล้องกับสัจพจน์เหล่านี้เรียกว่าพีชคณิต สารสนเทศ
ลำดับของข้อมูล
สามารถกำหนดลำดับข้อมูลบางส่วนได้โดยการกำหนดเงื่อนไข ว่า ถ้าหมายความว่ามีข้อมูลน้อยกว่าถ้า ไม่เพิ่มข้อมูลใหม่ใดๆ ให้กับเซมิกรุปเป็นเซมิแลตทิซที่สัมพันธ์กับลำดับนี้ กล่าวคือสัมพันธ์กับโดเมน (คำถาม) ใดๆสามารถกำหนดลำดับบางส่วนได้โดยการกำหนดเงื่อนไขว่า ถ้ามันแสดงถึงลำดับของเนื้อหาข้อมูลของและที่สัมพันธ์กับโดเมน (คำถาม)
พีชคณิตข้อมูลที่มีป้ายกำกับ
คู่โดยที่และก่อให้เกิดพีชคณิตสารสนเทศที่มีป้ายกำกับ กล่าว โดยละเอียดกว่า นั้นในพีชคณิตแบบเรียงลำดับสองประเภทจะมีการกำหนดการดำเนินการต่อไปนี้
|
แบบจำลองของพีชคณิตสารสนเทศ
ต่อไปนี้เป็นรายการตัวอย่างของพีชคณิตสารสนเทศที่ไม่ครบถ้วน:
- พีชคณิตเชิงสัมพันธ์ : การลดรูปของพีชคณิตเชิงสัมพันธ์ที่มีการเชื่อมต่อตามธรรมชาติเป็นส่วนประกอบ และการฉายภาพตามปกติ คือ พีชคณิตข้อมูลที่มีป้ายกำกับดูตัวอย่าง
- ระบบข้อจำกัด : ข้อจำกัดก่อให้เกิดพีชคณิตสารสนเทศ ( Jaffar & Maher 1994 )
- Semiring valued algebras : C-Semirings induce information algebras ( Bistarelli, Montanari & Rossi1997 );( Bistarelli et al. 1999 );( Kohlas & Wilson 2006 )
- ตรรกศาสตร์ : ระบบตรรกศาสตร์หลายระบบก่อให้เกิดพีชคณิตสารสนเทศ ( Wilson & Mengin 1999 ) รีดักต์ของพีชคณิตทรงกระบอก ( Henkin, Monk & Tarski 1971 ) หรือพีชคณิตพหุนามเป็นพีชคณิตสารสนเทศที่เกี่ยวข้องกับตรรกศาสตร์ภาคแสดง ( Halmos 2000 )
- พีชคณิตของโมดูล : ( Bergstra, Heeering & Klint 1990 );( de Lavalette 1992 )
- ระบบเชิงเส้น : ระบบสมการเชิงเส้นหรืออสมการเชิงเส้นก่อให้เกิดพีชคณิตสารสนเทศ ( Kohlas 2003 )
ตัวอย่างการคำนวณ: พีชคณิตเชิงสัมพันธ์
ให้เป็นเซตของสัญลักษณ์ที่เรียกว่าแอตทริบิวต์ (หรือชื่อคอลัมน์ ) สำหรับแต่ละให้เป็นเซตที่ไม่ว่างเปล่า ซึ่งเป็นเซตของค่าที่เป็นไปได้ทั้งหมดของแอตทริบิวต์αตัวอย่างเช่น ถ้า แล้วอาจเป็นเซตของสตริง ในขณะที่และเป็นเซตของจำนวนเต็มที่ไม่เป็นลบทั้งคู่
ให้. x -tupleคือฟังก์ชันfโดยที่ และสำหรับแต่ละเซตของx -tuple ทั้งหมดจะถูกแทนด้วย. สำหรับx -tuple fและเซตย่อย ข้อจำกัดจะถูกกำหนดให้เป็น y -tuple gโดยที่สำหรับทุก.
ความสัมพันธ์Rบนxคือเซตของx -tuple กล่าวคือ เซตย่อยของy เซตของแอตทริบิวต์xเรียกว่าโดเมนของRและใช้ สัญลักษณ์ แทนการฉายภาพของRไปยังyนิยามได้ดังนี้:
การเชื่อมต่อ (Join)ของความสัมพันธ์Rบนตัวแปรxและความสัมพันธ์Sบนตัวแปรyถูกกำหนดดังนี้:
ตัวอย่างเช่น ให้RและSเป็นความสัมพันธ์ดังต่อไปนี้:
ดังนั้นจุดเชื่อมต่อของRและSคือ:
ฐานข้อมูลเชิงสัมพันธ์ที่มีการเชื่อมต่อแบบธรรมชาติ (natural join) เป็นการรวมกัน และการฉายภาพแบบปกติπนั้นเป็นพีชคณิตสารสนเทศ การดำเนินการต่างๆ ได้รับการกำหนดไว้อย่างดีแล้ว เนื่องจาก
- ถ้าเช่นนั้น
เป็นที่เห็นได้ชัดว่าฐานข้อมูลเชิงสัมพันธ์นั้นสอดคล้องกับสัจพจน์ของพีชคณิตสารสนเทศที่มีป้ายกำกับ:
- เซมิกรุป
- และ
- การถ่ายทอด
- ถ้าเช่นนั้น
- การผสมผสาน
- ถ้าและแล้ว
- ความคงที่
- ถ้าเช่นนั้น
- สนับสนุน
- ถ้าเช่นนั้น
การเชื่อมต่อ
- พีชคณิตการประเมินค่า
- การละทิ้งสัจพจน์ความเท่าเทียมกันนำไปสู่พีชคณิตการประเมินค่าสัจพจน์เหล่านี้ได้รับการแนะนำโดย ( Shenoy & Shafer 1990 ) เพื่อขยายรูปแบบการคำนวณเฉพาะที่ ( Lauritzen & Spiegelhalter 1988 ) จากเครือข่ายเบย์เซียนไปสู่รูปแบบทั่วไปมากขึ้น รวมถึงฟังก์ชันความเชื่อ ศักยภาพความเป็นไปได้ ฯลฯ ( Kohlas & Shenoy 2000 ) สำหรับรายละเอียดเพิ่มเติมในรูปแบบหนังสือ โปรดดูPouly & Kohlas (2011)
- โดเมนและระบบสารสนเทศ
- พีชคณิตสารสนเทศแบบกระชับ ( Kohlas 2003 ) เกี่ยวข้องกับโดเมน Scottและระบบสารสนเทศ Scott ( Scott 1970 ); ( Scott 1982 ); ( Larsen & Winskel 1984 )
- ข้อมูลที่ไม่แน่นอน
- ตัวแปรสุ่มที่มีค่าในพีชคณิตสารสนเทศแสดงถึงระบบการโต้แย้งเชิงความน่าจะเป็น ( Haenni, Kohlas & Lehmann 2000 )
- ข้อมูลเชิงความหมาย
- พีชคณิตสารสนเทศนำเสนอความหมายโดยการเชื่อมโยงข้อมูลกับคำถามผ่านการเน้นและการรวมกัน ( Groenendijk & Stokhof 1984 ); ( Floridi 2004 )
- การไหลเวียนของข้อมูล
- พีชคณิตสารสนเทศมีความเกี่ยวข้องกับการไหลของสารสนเทศ โดยเฉพาะอย่างยิ่งการจำแนกประเภท ( Barwise & Seligman 1997 )
- การผุพังของต้นไม้
- พีชคณิตสารสนเทศถูกจัดระเบียบเป็นโครงสร้างแบบลำดับชั้นคล้ายต้นไม้ และถูกแบ่งย่อยออกเป็นปัญหาที่เล็กกว่า
- ทฤษฎีเซมิกรุป
- ...
- แบบจำลององค์ประกอบ
- แบบจำลองดังกล่าวอาจถูกกำหนดขึ้นภายในกรอบของพีชคณิตสารสนเทศ: https://arxiv.org/abs/1612.02587
- รากฐานเชิงสัจพจน์ที่ขยายเพิ่มเติมของพีชคณิตสารสนเทศและพีชคณิตการประเมินค่า
- แนวคิดเรื่องความเป็นอิสระแบบมีเงื่อนไขเป็นพื้นฐานสำหรับพีชคณิตสารสนเทศ และมีรากฐานเชิงสัจพจน์ใหม่ของพีชคณิตสารสนเทศที่อิงตามความเป็นอิสระแบบมีเงื่อนไข ซึ่งเป็นการต่อยอดจากรากฐานเดิม (ดูด้านบน) สามารถดูได้ที่: https://arxiv.org/abs/1701.02658
รากฐานทางประวัติศาสตร์
สัจพจน์สำหรับพีชคณิตสารสนเทศได้มาจากระบบสัจพจน์ที่เสนอไว้ใน (Shenoy and Shafer, 1990) ดูเพิ่มเติมที่ (Shafer, 1991)
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ พีชคณิตสารสนเทศ
คำว่า " พีชคณิตสารสนเทศ " หมายถึงเทคนิคทางคณิตศาสตร์ในการประมวลผลสารสนเทศทฤษฎีสารสนเทศแบบคลาสสิกมีที่มาจากโคลด แชนนอน เป็นทฤษฎีเกี่ยวกับการส่งผ่านสารสนเทศ...
ข้อมูลและการดำเนินงาน
กล่าวโดยละเอียด ในพีชคณิตแบบสองประเภทจะมีการกำหนดการดำเนินการต่อไปนี้ ( Φ , ดี ) {\displaystyle (\Phi ,D)}
หลักการพื้นฐานและคำจำกัดความ
สัจพจน์ของพีชคณิตสองประเภทนอกเหนือจากสัจพจน์ของแลตทิซ: ( Φ , ดี ) {\displaystyle (\Phi ,D)} ดี {\displaystyle D}
ลำดับของข้อมูล
สามารถกำหนดลำดับข้อมูลบางส่วนได้โดยการกำหนดเงื่อนไข ว่า ถ้าหมายความว่ามีข้อมูลน้อยกว่าถ้า ไม่เพิ่มข้อมูลใหม่ใดๆ ให้กับเซมิกรุปเป็น เซมิแลตทิซ ที่สัมพันธ์กับลำดับนี้ กล่าวคือสัมพันธ์กับโดเมน (คำถาม) ใดๆสามารถกำหนดลำดับบางส่วนได้โดยการกำหนดเงื่อนไขว่า...