อ่าน 8 นาที
โปรโบออนโต
ProbOnto เป็น ฐานความรู้ และ ออนโทโลยี ของ การแจกแจงความน่าจะเป็น [ 1 ] [ 2 ] ProbOnto 2.
โปรโบออนโต
| โปรโบออนโต | |
|---|---|
| คำสำคัญ | สถิติ , การแจกแจงความน่าจะเป็น |
| วัตถุประสงค์ | ออกแบบ พัฒนา และบำรุงรักษาฐานความรู้และออนโทโลยีของการแจกแจงความน่าจะเป็น |
| ระยะเวลา | 2015 – |
| เว็บไซต์ | probonto.org |
ProbOntoเป็นฐานความรู้และออนโทโลยีของการแจกแจงความน่าจะเป็น [ 1 ] [ 2 ] ProbOnto 2.5 (เผยแพร่เมื่อวันที่ 16 มกราคม 2017) ประกอบด้วยการแจกแจงแบบเอก ตัวแปร และ หลายตัวแปรมากกว่า 150 รายการ และการกำหนดพารามิเตอร์ทางเลือก ความสัมพันธ์และสูตรการกำหนดพารามิเตอร์ใหม่มากกว่า 220 รายการ รวมถึงการสนับสนุนการเข้ารหัส การแจกแจงแบบผสมเชิงประจักษ์และเอกตัวแปรด้วย
การแนะนำ
ProbOnto ได้รับการออกแบบมาเพื่ออำนวยความสะดวกในการเข้ารหัสโมเดลผลกระทบแบบผสมที่ไม่เป็นเชิงเส้นและคำอธิบายประกอบในภาษามาร์กอัปเภสัชศาสตร์ (PharmML) [ 3 ] [ 4 ]ซึ่งพัฒนาโดย DDMoRe [ 5 ] [ 6 ]ซึ่งเป็น โครงการ ริเริ่มด้านยาที่เป็นนวัตกรรมใหม่อย่างไรก็ตาม ProbOnto ด้วยโครงสร้างทั่วไปของมัน จึงสามารถนำไปใช้ในแพลตฟอร์มและเครื่องมือสร้างแบบจำลองอื่นๆ สำหรับการเข้ารหัสและคำอธิบายประกอบของโมเดลที่หลากหลายซึ่งใช้ได้กับข้อมูลแบบไม่ต่อเนื่อง (เช่นการนับ การจัดหมวดหมู่ และเวลาถึงเหตุการณ์ ) และข้อมูลแบบต่อเนื่อง
ฐานความรู้

ฐานข้อมูลความรู้สำหรับแต่ละการแจกจ่าย:
- ฟังก์ชันความหนาแน่นของความน่าจะเป็นหรือ ฟังก์ชัน มวลและหากมีข้อมูลฟังก์ชันการกระจายสะสม ฟังก์ชันอัตราอันตรายและฟังก์ชันการอยู่รอด
- ปริมาณที่เกี่ยวข้อง เช่น ค่าเฉลี่ย มัธยฐาน ฐานนิยม และความแปรปรวน
- พารามิเตอร์และค่าสนับสนุน /คำจำกัดความช่วง และประเภทการกระจาย
- โค้ด LaTeXและRสำหรับฟังก์ชันทางคณิตศาสตร์
- คำจำกัดความของแบบจำลองและเอกสารอ้างอิง
ความสัมพันธ์
ProbOnto เวอร์ชัน 2.5 จัดเก็บความสัมพันธ์ระหว่างการแจกแจงแบบเอกตัวแปรมากกว่า 220 รูปแบบ โดยมีกรณีพิเศษคือการปรับพารามิเตอร์ใหม่ ดังแสดงในรูป แม้ว่าความสัมพันธ์ในรูปแบบนี้มักถูกละเลยในเอกสารทางวิชาการ และผู้เขียนมักเน้นเฉพาะรูปแบบใดรูปแบบหนึ่งสำหรับการแจกแจงแต่ละแบบ แต่ความสัมพันธ์เหล่านี้มีความสำคัญอย่างยิ่งต่อความสามารถในการทำงานร่วมกัน ProbOnto ให้ความสำคัญกับแง่มุมนี้และนำเสนอการแจกแจงมากกว่า 15 รูปแบบที่มีการปรับพารามิเตอร์แบบอื่น
การกำหนดพารามิเตอร์ทางเลือก
การแจกแจงจำนวนมากถูกกำหนดด้วยสูตรที่เทียบเท่าทางคณิตศาสตร์แต่แตกต่างกันทางพีชคณิต ซึ่งนำไปสู่ปัญหาเมื่อแลกเปลี่ยนโมเดลระหว่างเครื่องมือซอฟต์แวร์[ 7 ]ตัวอย่างต่อไปนี้แสดงให้เห็นถึงสิ่งนั้น
การกระจายแบบปกติ
การแจกแจงแบบปกติสามารถนิยามได้อย่างน้อยสามวิธี
- Normal1(μ,σ) โดยมีค่าเฉลี่ย , μ และส่วนเบี่ยงเบนมาตรฐาน , σ [ 8 ]
- Normal2(μ,υ) โดยมีค่าเฉลี่ย μ และความแปรปรวน υ = σ^2 [ 9 ]หรือ
- Normal3(μ,τ) โดยมีค่าเฉลี่ย μ และความแม่นยำ τ = 1/υ = 1/σ^2 [ 10 ] [ 11 ]
สูตรการกำหนดพารามิเตอร์ใหม่
สามารถใช้สูตรต่อไปนี้ในการคำนวณค่าของรูปแบบการแจกแจงปกติทั้งสามแบบใหม่ได้ (เราใช้ตัวย่อ เช่น ie แทนetc.)
การแจกแจงแบบลอการิทมิกปกติ
ในกรณีของการแจกแจงแบบลอการิทมิกปกติมีตัวเลือกมากกว่า เนื่องจากสามารถกำหนดพารามิเตอร์ได้ทั้งในมาตราส่วนปกติและมาตราส่วนลอการิทมิก ดังแสดงในรูป


แบบฟอร์มที่มีให้ใช้งานใน ProbOnto 2.0 ได้แก่
- LogNormal1(μ,σ) โดยมีค่าเฉลี่ย μ และส่วนเบี่ยงเบนมาตรฐาน σ ทั้งคู่ในระดับบันทึก[ 8 ]
- LogNormal2(μ,υ) พร้อมค่าเฉลี่ย, μ, และความแปรปรวน, υ, ทั้งสองในระดับบันทึก
- LogNormal3(m,σ) โดยที่ค่ามัธยฐาน m อยู่ในมาตราส่วนธรรมชาติ และค่าเบี่ยงเบนมาตรฐาน σ อยู่ในมาตราส่วนลอการิทึม[ 8 ]
- LogNormal4(m,cv) โดยที่ค่ามัธยฐาน m และค่าสัมประสิทธิ์ความแปรผัน cv ทั้งสองค่าอยู่ในมาตราส่วนธรรมชาติ
- LogNormal5(μ,τ) โดยมีค่าเฉลี่ย μ และความแม่นยำ τ ทั้งสองในระดับล็อก[ 12 ]
- LogNormal6(m,σ g ) โดยมีค่ามัธยฐาน m และค่าเบี่ยงเบนมาตรฐานทางเรขาคณิต σ gทั้งสองค่าอยู่ในมาตราส่วนธรรมชาติ[ 13 ]
- LogNormal7(μ N ,σ N ) โดยมีค่าเฉลี่ย μ Nและส่วนเบี่ยงเบนมาตรฐาน σ Nทั้งสองในระดับธรรมชาติ[ 14 ]
ฐานข้อมูลความรู้ของ ProbOnto จัดเก็บสูตรการปรับพารามิเตอร์ใหม่เหล่านี้ เพื่อให้สามารถแปลงโมเดลระหว่างเครื่องมือต่างๆ ได้อย่างถูกต้อง
ตัวอย่างสำหรับการกำหนดพารามิเตอร์ใหม่
พิจารณาสถานการณ์ที่ต้องการรันโมเดลโดยใช้เครื่องมือออกแบบที่เหมาะสมที่สุดสองแบบที่แตกต่างกัน เช่น PFIM [ 15 ]และ PopED [ 16 ]โดยแบบแรกใช้การกำหนดพารามิเตอร์ LN2 ส่วนแบบหลังใช้ LN7 ตามลำดับ ดังนั้นจึงจำเป็นต้องมีการกำหนดพารามิเตอร์ใหม่ มิฉะนั้นเครื่องมือทั้งสองจะให้ผลลัพธ์ที่แตกต่างกัน
สำหรับการเปลี่ยนแปลงนั้นสูตรต่อไปนี้ ใช้ได้
สำหรับการเปลี่ยนแปลงนั้น สูตรต่อไปนี้ ใช้ได้
สูตรการกำหนดพารามิเตอร์ใหม่ที่เหลือทั้งหมดสามารถพบได้ในเอกสารข้อกำหนดบนเว็บไซต์โครงการ[ 2 ]
ออนโทโลยี
ฐานความรู้ถูกสร้างขึ้นจากแบบจำลองออนโทโลยีที่เรียบง่าย โดยแก่นแท้แล้ว การกระจายความน่าจะเป็นคืออินสแตนซ์ของคลาส ซึ่งเป็นการเฉพาะของคลาสของวัตถุทางคณิตศาสตร์ การกระจายเกี่ยวข้องกับบุคคลอื่นๆ จำนวนมาก ซึ่งเป็นอินสแตนซ์ของหมวดหมู่ต่างๆ ในออนโทโลยี ตัวอย่างเช่น สิ่งเหล่านี้คือพารามิเตอร์และฟังก์ชันที่เกี่ยวข้องกับการกระจายความน่าจะเป็นที่กำหนด กลยุทธ์นี้ช่วยให้สามารถแสดงคุณลักษณะและความสัมพันธ์ระหว่างวัตถุในโดเมนได้อย่างหลากหลาย ออนโทโลยีสามารถมองได้ว่าเป็นโครงร่างเชิงแนวคิดในโดเมนของคณิตศาสตร์และได้รับการนำไปใช้เป็นฐานความรู้ PowerLoom [ 17 ]เวอร์ชัน OWL ถูกสร้างขึ้นโดยใช้โปรแกรมโดยใช้ API ของ Jena [ 18 ]
ผลลัพธ์สำหรับ ProbOnto จัดเตรียมไว้เป็นวัสดุเสริมและเผยแพร่บนเว็บไซต์ probonto.org หรือเชื่อมโยงจากเว็บไซต์ดังกล่าว เวอร์ชัน OWL ของ ProbOnto มีให้บริการผ่าน Ontology Lookup Service (OLS) [ 19 ]เพื่ออำนวยความสะดวกในการค้นหาและแสดงภาพเนื้อหาอย่างง่าย นอกจากนี้ API ของ OLS ยังมีวิธีการเข้าถึง ProbOnto ผ่านทางโปรแกรมและบูรณาการเข้ากับแอปพลิเคชันต่างๆ ProbOnto ยังได้รับการลงทะเบียนบนพอร์ทัล BioSharing อีกด้วย[ 20 ]
ProbOnto ใน PharmML
PharmML มีอินเทอร์เฟซในรูปแบบของสคีมา XML ทั่วไปสำหรับการกำหนดการแจกแจงและพารามิเตอร์ต่างๆ การกำหนดฟังก์ชันต่างๆ เช่น ฟังก์ชันความหนาแน่นความน่าจะเป็น (PDF) ฟังก์ชันมวลความน่าจะเป็น (PMF) ฟังก์ชันอัตราอันตราย (HF) และฟังก์ชันการอยู่รอด (SF) สามารถเข้าถึงได้ผ่านเมธอดที่ให้ไว้ในสคีมา PharmML
ใช้ตัวอย่าง
ตัวอย่างนี้แสดงวิธีการเข้ารหัสการแจกแจงปัวซง ที่มีค่าศูนย์มากเกินไป โดยใช้ ชื่อรหัสและประกาศชื่อรหัสของพารามิเตอร์ ('rate' และ 'probabilityOfZero') พารามิเตอร์ของแบบจำลองLambdaและP0จะถูกกำหนดให้กับชื่อรหัสของพารามิเตอร์
<Distribution> <po:ProbOnto name= "ZeroInflatedPoisson1" > <po:Parameter name= "rate" > <ct:Assign> <ct:SymbRef symbIdRef= "Lambda" /> </ct:Assign> </po:Parameter> <po:Parameter name= "probabilityOfZero" > <ct:Assign> <ct:SymbRef symbIdRef= "P0" /> </ct:Assign> </po:Parameter> </po:ProbOnto> </Distribution>ในการระบุการแจกแจงใดๆ อย่างชัดเจนโดยใช้ ProbOnto เพียงแค่ประกาศชื่อรหัสและชื่อรหัสของพารามิเตอร์ก็เพียงพอแล้ว ตัวอย่างเพิ่มเติมและข้อกำหนดโดยละเอียดสามารถพบได้ในเว็บไซต์โครงการ[ 2 ]
ดูเพิ่มเติม
- รายการการแจกแจงความน่าจะเป็น
- ออนโทโลยี (วิทยาการคอมพิวเตอร์)
- ความสัมพันธ์ระหว่างการแจกแจงความน่าจะเป็น
- ภาษาออนโทโลยีเว็บ
ลิงก์ภายนอก
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ โปรโบออนโต
ProbOnto เป็น ฐานความรู้ และ ออนโทโลยี ของ การแจกแจงความน่าจะเป็น [ 1 ] [ 2 ] ProbOnto 2.
การแนะนำ
ProbOnto ได้รับการออกแบบมาเพื่ออำนวยความสะดวกในการเข้ารหัส โมเดลผลกระทบแบบผสมที่ไม่เป็นเชิงเส้น และคำอธิบายประกอบในภาษามาร์กอัป เภสัชศาสตร์ (PharmML) [ 3 ] [ 4 ] ซึ่งพัฒนาโดย DDMoRe [ 5 ] [ 6 ] ซึ่งเป็น โครงการ ริเริ่มด้านยาที่เป็นนวัตกรรมใหม่ อย่างไรก็ตาม...
ความสัมพันธ์
ProbOnto เวอร์ชัน 2.5 จัดเก็บความสัมพันธ์ระหว่างการแจกแจงแบบเอกตัวแปรมากกว่า 220 รูปแบบ โดยมีกรณีพิเศษคือการปรับพารามิเตอร์ใหม่ ดังแสดงในรูป แม้ว่าความสัมพันธ์ในรูปแบบนี้มักถูกละเลยในเอกสารทางวิชาการ...
การกำหนดพารามิเตอร์ทางเลือก
การแจกแจงจำนวนมากถูกกำหนดด้วยสูตรที่เทียบเท่าทางคณิตศาสตร์แต่แตกต่างกันทางพีชคณิต ซึ่งนำไปสู่ปัญหาเมื่อแลกเปลี่ยนโมเดลระหว่างเครื่องมือซอฟต์แวร์ [ 7 ] ตัวอย่างต่อไปนี้แสดงให้เห็นถึงสิ่งนั้น