อ่าน 22 นาที
การจัดจำหน่าย Metalog
การ แจกแจงเมทาล็อก เป็นการ แจกแจงความน่าจะเป็นแบบต่อเนื่อง ที่มี ความยืดหยุ่น ออกแบบมาเพื่อให้ใช้งานง่ายในทางปฏิบัติ เมื่อรวมกับรูปแบบการแปลงแล้ว...
การจัดจำหน่าย Metalog


การแจกแจงเมทาล็อกเป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่อง ที่มี ความยืดหยุ่น ออกแบบมาเพื่อให้ใช้งานง่ายในทางปฏิบัติ เมื่อรวมกับรูปแบบการแปลงแล้ว ตระกูลการแจกแจงแบบต่อเนื่องเมทาล็อกมีความโดดเด่นเนื่องจากมี คุณสมบัติ ทั้งหมดต่อไปนี้: ความยืดหยุ่นของรูปร่างที่แทบจะไม่มีขีดจำกัด; การเลือกระหว่างการแจกแจงแบบไม่จำกัด แบบกึ่งจำกัด และแบบจำกัด; ความง่ายในการปรับให้เข้ากับข้อมูลด้วยวิธีการกำลังสองน้อยที่สุดเชิงเส้น; สมการฟังก์ชันควอนไทล์ ( CDF ผกผัน ) ที่เรียบง่ายและอยู่ในรูปแบบปิด ซึ่งอำนวยความสะดวกในการจำลอง ; ฟังก์ชันความหนาแน่นความน่าจะเป็น (PDF ) ที่เรียบง่ายและอยู่ในรูปแบบปิด ; และการปรับปรุงแบบเบย์เซียนในรูปแบบปิดเมื่อมีข้อมูลใหม่ ยิ่งไปกว่านั้น เช่นเดียวกับอนุกรมเทย์เลอร์การแจกแจงเมทาล็อกอาจมีจำนวนพจน์ใดก็ได้ ขึ้นอยู่กับระดับความยืดหยุ่นของรูปร่างที่ต้องการและความต้องการใช้งานอื่นๆ
โดยทั่วไป การประยุกต์ใช้การแจกแจงเมทาล็อกจะมีประโยชน์ โดยมักเกี่ยวข้องกับการปรับข้อมูลเชิงประจักษ์ ข้อมูลจำลอง หรือ ควอนไทล์ ที่ได้จากผู้เชี่ยวชาญให้เข้ากับการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่ราบเรียบ ขอบเขตการประยุกต์ใช้นั้นกว้างขวาง และครอบคลุมถึงเศรษฐศาสตร์ วิทยาศาสตร์ วิศวกรรมศาสตร์ และสาขาอื่นๆ อีกมากมาย การแจกแจงเมทาล็อก หรือที่รู้จักกันในชื่อการแจกแจงคีลิน ได้รับการตีพิมพ์ครั้งแรกในปี 2016 [ 1 ]โดยทอม คีลิน[ 2 ]
ประวัติศาสตร์
ประวัติความเป็นมาของการแจกแจงความน่าจะเป็นสามารถมองได้บางส่วนว่าเป็นความก้าวหน้าของการพัฒนาไปสู่ความยืดหยุ่นที่มากขึ้นในรูปร่างและขอบเขตเมื่อปรับให้เข้ากับข้อมูลการแจกแจงปกติได้รับการตีพิมพ์ครั้งแรกในปี 1756 [ 3 ]และทฤษฎีบทของเบย์สในปี 1763 [ 4 ] การแจกแจงปกติเป็นรากฐานสำหรับการพัฒนาสถิติแบบคลาสสิกส่วนใหญ่ ในทางตรงกันข้าม ทฤษฎีบทของเบย์สเป็นรากฐานสำหรับการแสดงความน่าจะเป็นตามสถานะของข้อมูลและความเชื่อเนื่องจากความน่าจะเป็นตามความเชื่อสามารถมีรูปร่างใดก็ได้และอาจมีขอบเขตตามธรรมชาติ จึงจำเป็นต้องมีการแจกแจงความน่าจะเป็นที่ยืดหยุ่นเพียงพอที่จะรองรับทั้งสองอย่าง ยิ่งไปกว่านั้น ชุดข้อมูลเชิงประจักษ์และการทดลองจำนวนมากแสดงรูปร่างที่ไม่สามารถจับคู่ได้ดีกับการแจกแจงปกติหรือการแจกแจงต่อเนื่องอื่นๆดังนั้นจึงเริ่มมีการค้นหาการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่มีรูปร่างและขอบเขตที่ยืดหยุ่น
ในช่วงต้นศตวรรษที่ 20 ตระกูล การแจกแจงของ Pearson [ 5 ]ซึ่งรวมถึงการแจกแจงแบบปกติเบต้ายูนิฟอร์ม แกมมาสตูเดนต์-ทีไคสแควร์ F และอีกห้าแบบ[ 6 ]ได้ปรากฏขึ้นเป็นความก้าวหน้าครั้งสำคัญในด้านความยืดหยุ่นของรูปร่าง ตามมาด้วย การแจกแจงของ Johnson [ 7 ] [ 8 ]ทั้งสองตระกูลสามารถแสดงโมเมนต์สี่ค่าแรกของข้อมูล ( ค่าเฉลี่ยความแปรปรวนความเบี่ยงเบนและความโค้ง ) ด้วยเส้นโค้งต่อเนื่องที่เรียบ อย่างไรก็ตาม พวกมันไม่มีความสามารถในการจับคู่โมเมนต์ลำดับที่ห้าหรือสูงกว่า ยิ่งไปกว่านั้น สำหรับค่าความเบี่ยงเบนและความโค้งที่กำหนด จะไม่มีทางเลือกของขอบเขต ตัวอย่างเช่น การจับคู่โมเมนต์สี่ค่าแรกของชุดข้อมูลอาจให้การแจกแจงที่มีขอบเขตล่างเป็นลบ แม้ว่าจะทราบว่าปริมาณที่กล่าวถึงนั้นไม่สามารถเป็นลบได้ก็ตาม สุดท้าย สมการของพวกมันประกอบด้วยปริพันธ์ที่ไม่สามารถคำนวณได้และฟังก์ชันทางสถิติที่ซับซ้อน ดังนั้นการปรับให้เข้ากับข้อมูลจึงมักต้องใช้วิธีการวนซ้ำ
ในช่วงต้นศตวรรษที่ 21 นักวิเคราะห์การตัดสินใจเริ่มทำงานเพื่อพัฒนาการกระจายความน่าจะเป็นแบบต่อเนื่องที่จะพอดีกับจุดสามจุดที่กำหนดบนฟังก์ชันการกระจายสะสมสำหรับปริมาณที่ไม่แน่นอน (เช่น ที่ได้จากผู้เชี่ยวชาญและควอนไทล์) การกระจายของตระกูล Pearson และ Johnson โดยทั่วไปไม่เพียงพอสำหรับวัตถุประสงค์นี้ นอกจากนี้ นักวิเคราะห์การตัดสินใจยังแสวงหาการกระจายความน่าจะเป็นที่จะกำหนดพารามิเตอร์ได้ง่ายด้วยข้อมูล (เช่น โดยใช้กำลังสองน้อยที่สุดเชิงเส้นหรือเทียบเท่ากับการถดถอยเชิงเส้น หลายตัวแปร ) คลาสของการกระจายแบบกำหนดพารามิเตอร์ควอนไทล์ (QPD) ที่นำเสนอในปี 2011 บรรลุเป้าหมายทั้งสอง แม้ว่าจะเป็นความก้าวหน้าที่สำคัญด้วยเหตุผลนี้ แต่ QPD ที่ใช้ในตอนแรกเพื่อแสดงคลาสของการกระจายนี้ การกระจายแบบ Simple Q-Normal [ 9 ]มีความยืดหยุ่นของรูปร่างน้อยกว่าตระกูล Pearson และ Johnson และขาดความสามารถในการแสดงการกระจายแบบกึ่งจำกัดและแบบจำกัด หลังจากนั้นไม่นาน Keelin [ 1 ]ได้พัฒนาตระกูลการแจกแจง metalog ซึ่งเป็นอีกตัวอย่างหนึ่งของคลาส QPD ซึ่งมีความยืดหยุ่นด้านรูปร่างมากกว่าตระกูล Pearson และ Johnson มีตัวเลือกขอบเขต มีสมการแบบปิดที่สามารถปรับให้เข้ากับข้อมูลด้วยกำลังสองน้อยที่สุดเชิงเส้น และมีฟังก์ชันควอนไทล์แบบปิดซึ่ง อำนวยความสะดวกในการจำลอง Monte Carlo
นิยามและฟังก์ชันควอนไทล์
การแจกแจงเมทาล็อกเป็นการสรุปทั่วไปของการแจกแจงโลจิสติกโดยคำว่า "เมทาล็อก" เป็นคำย่อของ "เมทาล็อกสติก" คีลินเริ่มต้นด้วยฟังก์ชันควอน ไทล์โลจิสติก และแทนที่การขยายอนุกรมกำลังในความน่าจะเป็นสะสมสำหรับพารามิเตอร์และซึ่งควบคุมตำแหน่งและมาตราส่วนตามลำดับ[ 10 ]
เหตุผลของ Keelin สำหรับการแทนที่นี้มีห้าประการ[ 10 ]ประการแรก ฟังก์ชันควอนไทล์ที่ได้จะมีรูปร่างที่ยืดหยุ่นอย่างมีนัยสำคัญ ซึ่งควบคุมโดยสัมประสิทธิ์ ประการที่สอง จะมีรูปแบบปิดที่เรียบง่ายซึ่งเป็นเชิงเส้นในสัมประสิทธิ์เหล่านี้ ซึ่งหมายความว่าสามารถกำหนดได้ง่ายจากข้อมูลCDF โดย ใช้กำลังสองน้อยที่สุดเชิงเส้นประการที่สาม ฟังก์ชันควอนไทล์ที่ได้จะเรียบ สามารถหาอนุพันธ์ได้ และเป็นเชิงวิเคราะห์ ทำให้มั่นใจได้ว่า จะมีPDFที่เรียบและอยู่ในรูปแบบปิด ประการที่ สี่ การจำลองจะง่ายขึ้นด้วยCDF ผกผัน ในรูปแบบปิดที่ได้ ประการ ที่ห้า เช่นเดียวกับอนุกรมเทย์เลอร์ สามารถใช้ จำนวนเทอมใดก็ได้ขึ้นอยู่กับระดับของรูปร่างที่ยืดหยุ่นที่ต้องการและความต้องการใช้งานอื่นๆ
โปรดทราบว่าดัชนีของสัมประสิทธิ์นั้นเป็นเช่นนั้นและอยู่ในการขยายและอยู่ในการขยาย และดัชนีจะสลับกันหลังจากนั้น ลำดับนี้ถูกเลือกเพื่อให้สองพจน์แรกในฟังก์ชันควอนไทล์เมทาล็อกที่ได้นั้นสอดคล้องกับการแจกแจงโลจิสติกอย่างแม่นยำ การเพิ่มพจน์ที่สามด้วย จะปรับความเบ้ การเพิ่มพจน์ที่สี่ด้วยจะปรับความโค้งเป็นหลัก และการเพิ่มพจน์ที่ไม่เป็นศูนย์ในภายหลังจะให้การปรับแต่งรูปร่างที่ละเอียดอ่อนยิ่งขึ้น[ 10 ] : หน้า 252
การเขียนฟังก์ชันควอนไทล์โลจิสติกใหม่เพื่อรวมการแทนที่ข้างต้นสำหรับและจะได้ฟังก์ชันควอนไทล์เมทาล็อกสำหรับความน่าจะเป็นสะสม
ในทำนองเดียวกัน ฟังก์ชันควอนไทล์ของเมทาล็อกสามารถแสดงในรูปของฟังก์ชันพื้นฐานได้ดังนี้: โดยที่ฟังก์ชันพื้นฐานของเมทาล็อกคือและแต่ละฟังก์ชันถัดไปจะถูกกำหนดเป็นนิพจน์ที่คูณด้วยในสมการข้างต้น โปรดสังเกตว่าสัมประสิทธิ์คือค่ามัธยฐานเนื่องจากพจน์อื่นๆ ทั้งหมดเท่ากับศูนย์เมื่อกรณีพิเศษของฟังก์ชันควอนไทล์ของเมทาล็อกคือการแจกแจงแบบโลจิสติก ( ) และการแจกแจงแบบเอกรูป ( มิฉะนั้น)
ฟังก์ชันความหนาแน่นความน่าจะเป็น
การหาอนุพันธ์เทียบกับจะได้ฟังก์ชันความหนาแน่นควอนไทล์[ 11 ]ส่วนกลับของปริมาณนี้คือฟังก์ชันความหนาแน่นความน่าจะเป็นที่แสดงเป็น p-PDF [ 12 ]
ซึ่งอาจแสดงออกมาในรูปของฟังก์ชันพื้นฐานได้เช่นกัน ดังนี้
- ที่ไหน.
โปรดทราบว่า PDF นี้แสดงในรูปของความน่าจะเป็นสะสมแทนที่จะเป็นตัวแปรที่สนใจในการพล็อต PDF (เช่น ดังแสดงในรูปภาพในหน้านี้) เราสามารถเปลี่ยนแปลงค่าพารามิเตอร์ แล้วพล็อตค่าบนแกนแนวนอน และบนแกนแนวตั้งได้
จากสมการข้างต้นและการแปลงต่อไปนี้ที่ช่วยให้สามารถเลือกขอบเขตได้ ตระกูลของการแจกแจงเมทาล็อกจึงประกอบด้วยเมทาล็อกแบบไม่มีขอบเขต แบบกึ่งมีขอบเขต และแบบมีขอบเขต รวมถึงกรณีพิเศษของกลุ่มเปอร์เซ็นไทล์สมมาตร (SPT) ด้วย
การแจกแจงเมทาล็อกแบบไม่จำกัด แบบกึ่งจำกัด และแบบจำกัด
ตามที่นิยามไว้ข้างต้น การแจกแจงเมทาล็อกไม่มีขอบเขต ยกเว้นในกรณีพิเศษที่ผิดปกติซึ่งสำหรับทุกเทอมที่มีอย่างไรก็ตาม แอปพลิเคชันจำนวนมากต้องการการแจกแจงความน่าจะเป็นที่ยืดหยุ่นซึ่งมีขอบเขตล่างขอบเขตบนหรือทั้งสองอย่าง เพื่อตอบสนองความต้องการนี้ Keelin ใช้การแปลงเพื่อหาการแจกแจงเมทาล็อกแบบกึ่งมีขอบเขตและมีขอบเขต[ 1 ]การแปลงดังกล่าวอยู่ภายใต้คุณสมบัติทั่วไปของฟังก์ชันควอนไทล์: สำหรับฟังก์ชันควอนไทล์ ใดๆ และฟังก์ชันที่เพิ่มขึ้นก็เป็นฟังก์ชันควอนไทล์เช่น กัน [ 13 ]ตัวอย่างเช่นฟังก์ชันควอนไทล์ของการแจกแจงปกติคือ; เนื่องจากลอการิทึมธรรมชาติ , , เป็นฟังก์ชันที่เพิ่มขึ้น ดังนั้นจึงเป็นฟังก์ชันควอนไทล์ของการแจกแจงลอคนอร์มอลในทำนองเดียวกัน การใช้คุณสมบัตินี้กับฟังก์ชันควอนไทล์เมทาล็อกโดยใช้การแปลงด้านล่างจะให้สมาชิกแบบกึ่งมีขอบเขตและมีขอบเขตของตระกูลเมทาล็อก เมื่อพิจารณา ว่ามีการแจกแจงแบบเมทัลล็อก สมาชิกทั้งหมดของตระกูลเมทัลล็อกจะตรงตาม คำจำกัดความของการแจกแจงแบบพารามิเตอร์ควอนไทล์ของ Keelin และ Powley [ 9 ]และด้วยเหตุนี้จึงมีคุณสมบัติของการแจกแจงดังกล่าว
โปรดทราบว่าจำนวนพารามิเตอร์รูปร่างในตระกูลเมทาล็อกจะเพิ่มขึ้นเป็นเส้นตรงตามจำนวนพจน์ดังนั้น เมทาล็อกใดๆ ข้างต้นจึงอาจมีพารามิเตอร์รูปร่างได้หลายตัว ในทางตรงกันข้าม ตระกูลการแจกแจงเพียร์สันและจอห์นสันจำกัดอยู่ที่พารามิเตอร์รูปร่างสองตัวเท่านั้น
การกระจายตัวของโลหะวิทยา SPT

การแจกแจงเมทาล็อกแบบสามเปอร์เซ็นไทล์สมมาตร (SPT) เป็นกรณีพิเศษสามเทอมของการแจกแจงเมทาล็อกแบบไม่จำกัด แบบกึ่งจำกัด และแบบจำกัด[ 14 ]พารามิเตอร์เหล่านี้กำหนดโดยจุดสามจุดนอกเส้นโค้ง CDFในรูปแบบ, , และโดยที่เมทาล็อก SPT มีประโยชน์เมื่อตัวอย่างเช่น ควอนไทล์ที่สอดคล้องกับความน่าจะเป็น CDF (เช่น) ได้รับมาจากผู้เชี่ยวชาญและใช้ในการกำหนดพารามิเตอร์การแจกแจงเมทาล็อกสามเทอม ดังที่กล่าวไว้ด้านล่าง คุณสมบัติทางคณิตศาสตร์บางอย่างจะง่ายขึ้นโดยการกำหนดพารามิเตอร์ SPT
คุณสมบัติ
ตระกูลการแจกแจงความน่าจะเป็นแบบเมทาล็อกมีคุณสมบัติดังต่อไปนี้
ความเป็นไปได้
ฟังก์ชันในรูปแบบของหรือการแปลงข้างต้นใดๆ ก็ตามจะเป็นการแจกแจงความน่าจะเป็นที่เป็นไปได้ก็ต่อเมื่อ PDF ของมันมีค่ามากกว่าศูนย์สำหรับทุก[ 9 ]ซึ่งหมายถึงข้อจำกัดความเป็นไปได้ของเซตของสัมประสิทธิ์
- สำหรับทุกคน
ในการใช้งานจริง โดยทั่วไปแล้วจะต้องตรวจสอบความเป็นไปได้มากกว่าที่จะสันนิษฐาน สำหรับจะรับประกันความเป็นไปได้ สำหรับ(รวมถึงโลหะวิทยา SPT) เงื่อนไขความเป็นไปได้คือและ[ 14 ] สำหรับได้มีการหาแบบฟอร์มปิดที่คล้ายกัน[ 15 ]สำหรับโดยทั่วไปแล้วจะตรวจสอบความเป็นไปได้ด้วยกราฟหรือตัวเลข
เมทาล็อกที่ไม่จำกัดและการแปลงข้างต้นมีชุดสัมประสิทธิ์ที่เป็นไปได้ชุดเดียวกัน[ 16 ]ดังนั้น สำหรับชุดสัมประสิทธิ์ที่กำหนด การยืนยันว่าสำหรับทุก ๆ นั้นเพียงพอโดยไม่คำนึงถึงการแปลงที่ใช้
ความนูน
เซตของสัมประสิทธิ์ metalog ที่เป็นไปได้ สำหรับทั้งหมดเป็นแบบนูนเนื่องจาก ปัญหา การเพิ่มประสิทธิภาพแบบนูนต้องการเซตที่เป็นไปได้แบบนูน คุณสมบัตินี้จึงสามารถลดความซับซ้อนของปัญหาการเพิ่มประสิทธิภาพที่เกี่ยวข้องกับ metalog ได้ ยิ่งไปกว่านั้น คุณสมบัตินี้ยังรับประกันว่าการรวมกันแบบนูน ใดๆ ของเวกเตอร์ของ metalog ที่เป็นไปได้นั้นเป็นไปได้ ซึ่งมีประโยชน์ เช่น เมื่อรวมความคิดเห็นของผู้เชี่ยวชาญหลายคน[ 17 ]หรือการประมาณค่าระหว่าง metalog ที่เป็นไปได้[ 18 ] โดยนัยแล้วการผสม ความน่าจะเป็นใดๆ ของการกระจาย metalog ก็เป็น metalog ด้วยเช่นกัน
การปรับให้เข้ากับข้อมูล

สัมประสิทธิ์สามารถกำหนดได้จากข้อมูลโดยใช้กำลังสองน้อยที่สุดเชิงเส้นเมื่อกำหนดจุดข้อมูลที่ต้องการกำหนดลักษณะเฉพาะของ CDF ของเมทัลล็อก และเมทริกซ์ที่มีองค์ประกอบประกอบด้วยฟังก์ชันพื้นฐานตราบใดที่สามารถผกผันได้ เวกเตอร์คอลัมน์ของสัมประสิทธิ์จะกำหนดโดย โดยที่และเวกเตอร์คอลัมน์ถ้าสมการนี้จะลดลงเหลือโดยที่ CDF ของเมทัลล็อกที่ได้จะวิ่งผ่านจุดข้อมูลทั้งหมดอย่างแม่นยำ สำหรับเมทัลล็อก SPT สมการนี้จะลดลงเหลือการแสดงออกในรูปของจุดทั้งสามโดยตรง[ 14 ]
วิธีการปรับแบบอื่นที่ดำเนินการเป็นโปรแกรมเชิงเส้นจะกำหนดสัมประสิทธิ์โดยการลดผลรวมของระยะทางสัมบูรณ์ระหว่าง CDF และข้อมูลให้เหลือน้อยที่สุด โดยคำนึงถึงข้อจำกัดด้านความเป็นไปได้[ 19 ]


ความยืดหยุ่นของรูปทรง
ตามทฤษฎีความยืดหยุ่นของเมทาล็อก[ 17 ]การกระจายความน่าจะเป็นใดๆ ที่มีฟังก์ชันควอนไทล์ต่อเนื่องสามารถประมาณได้อย่างใกล้ชิดโดยเมทาล็อก ยิ่งไปกว่านั้น ในเอกสารต้นฉบับ Keelin แสดงให้เห็นว่าการกระจายเมทาล็อกสิบเทอมที่กำหนดพารามิเตอร์โดยจุด CDF 105 จุดจากการกระจายแหล่งที่มาแบบดั้งเดิม 30 แบบ (รวมถึงการกระจายแบบปกติ, นักเรียน-t, ล็อกนอร์มัล, แกมมา, เบต้า และค่าสุดขั้ว) ประมาณการกระจายแหล่งที่มาแต่ละแบบภายใน ระยะ KS 0.001 หรือน้อยกว่า[ 20 ]ดังนั้น ความยืดหยุ่นของรูปร่างเมทาล็อกจึงแทบไม่มีขีดจำกัด
ภาพเคลื่อนไหวทางด้านขวามือแสดงให้เห็นถึงสิ่งนี้สำหรับ1การแจกแจงปกติมาตรฐาน โดยที่เมทาล็อกที่มีจำนวนพจน์ต่างกันจะถูกกำหนดพารามิเตอร์โดยชุดจุด 105 จุดเดียวกันจากฟังก์ชันการกระจายสะสม (CDF) ของการแจกแจงปกติมาตรฐาน ฟังก์ชันความหนาแน่นความน่าจะเป็น (PDF) ของเมทาล็อกจะลู่เข้าสู่ PDF ของการแจกแจงปกติมาตรฐานเมื่อจำนวนพจน์เพิ่มขึ้น เมื่อมีสองพจน์ เมทาล็อกจะประมาณค่าการแจกแจงปกติด้วยการแจกแจงโลจิสติก เมื่อจำนวนพจน์เพิ่มขึ้นแต่ละครั้ง ความสอดคล้องก็จะยิ่งใกล้เคียงมากขึ้น เมื่อมี 10 พจน์ PDF ของเมทาล็อกและ PDF ของการแจกแจงปกติมาตรฐานจะดูแยกไม่ออกด้วยตาเปล่า
ในทำนองเดียวกัน ฟังก์ชันความหนาแน่นความน่าจะเป็น (PDF) ของเมทาล็อกแบบกึ่งจำกัดเก้าเทอมนั้นสามารถมองเห็นความแตกต่างจากช่วงของการแจกแจงไวบูลได้ กรณีทั้งหกที่แสดงทางด้านขวา สอดคล้องกับพารามิเตอร์รูปร่างไวบูล 0.5, 0.8, 1.0, 1.5, 2 และ 4 ในแต่ละกรณี เมทาล็อกจะถูกกำหนดพารามิเตอร์โดยจุดเก้าจุดจากฟังก์ชันการแจกแจงสะสมไวบูล (CDF) ที่สอดคล้องกับความน่าจะเป็นสะสม
การบรรจบกันดังกล่าวไม่ได้เกิดขึ้นเฉพาะกับการแจกแจงแบบปกติและไวบูลเท่านั้น คีลินได้แสดงผลลัพธ์ที่คล้ายคลึงกันสำหรับการแจกแจงที่หลากหลาย[ 20 ]และต่อมาก็ได้แสดงตัวอย่างเพิ่มเติม[ 17 ] [ 21 ]
ค่ามัธยฐาน
ค่ามัธยฐานของการแจกแจงใดๆ ในตระกูลเมทาล็อกมีรูปแบบปิดที่เรียบง่าย โปรดสังเกตว่ากำหนดค่ามัธยฐาน และ(เนื่องจากพจน์ถัดไปทั้งหมดเป็นศูนย์สำหรับ) ดังนั้น ค่ามัธยฐานของการแจกแจงเมทาล็อกแบบไม่จำกัดขอบเขต ล็อกเมทาล็อก ล็อกเมทาล็อกลบ และล็อกเมทาล็อกโลจิต คือ, , , และตามลำดับ
ช่วงเวลา
โมเมนต์ของการกระจายเมทาล็อกที่ไม่จำกัดเป็นกรณีพิเศษของสูตรทั่วไปสำหรับ QPD [ 9 ]สำหรับเมทาล็อกที่ไม่จำกัด อินทิกรัลดังกล่าวจะประเมินเป็นโมเมนต์รูปแบบปิดซึ่งเป็นพหุนามอันดับในสัมประสิทธิ์โมเมนต์กลางสี่ตัวแรกของเมทาล็อกที่ไม่จำกัดสี่เทอมคือ:
โมเมนต์สำหรับเทอมที่น้อยกว่าจะรวมอยู่ในสมการเหล่านี้ ตัวอย่างเช่น โมเมนต์ของเมทาล็อกสามเทอมสามารถหาได้โดยการตั้งค่าเป็นศูนย์ โมเมนต์สำหรับเมทาล็อกที่มีเทอมมากกว่า และโมเมนต์ลำดับสูงกว่า ( ) ก็มีให้เช่นกัน[ 22 ]โมเมนต์สำหรับเมทาล็อกแบบกึ่งจำกัดและแบบจำกัดไม่มีให้ในรูปแบบปิด
การกำหนดพารามิเตอร์ด้วยโมเมนต์
ตัวแปรเชิงตรรกะสามพจน์ที่ไม่จำกัดขอบเขตสามารถกำหนดพารามิเตอร์ได้ในรูปแบบปิดโดยใช้โมเมนต์กลาง สามตัวแรก ให้และเป็นค่าเฉลี่ย ความแปรปรวน และความเบี่ยงเบน และให้เป็นความเบี่ยงเบนมาตรฐานนิพจน์ที่เทียบเท่ากันของโมเมนต์ในรูปของสัมประสิทธิ์ และสัมประสิทธิ์ในรูปของโมเมนต์ มีดังต่อไปนี้:
ความเท่าเทียมกันของชุดนิพจน์ทั้งสองนี้สามารถหาได้จากการสังเกตว่าสมการโมเมนต์ทางด้านซ้ายกำหนดพหุนามกำลังสามในรูปของสัมประสิทธิ์และซึ่งสามารถแก้ได้ในรูปแบบปิดเป็นฟังก์ชันของและยิ่งไปกว่านั้น คำตอบนี้มีเอกลักษณ์เฉพาะ[ 23 ]ในแง่ของโมเมนต์ เงื่อนไขความเป็นไปได้คือซึ่งสามารถแสดงได้ว่าเทียบเท่ากับเงื่อนไขความเป็นไปได้ต่อไปนี้ในแง่ของสัมประสิทธิ์: ; และ[ 23 ]
คุณสมบัตินี้สามารถนำมาใช้ได้ เช่น เพื่อแสดงผลรวมของตัวแปรสุ่มอิสระ ที่มีการแจกแจงไม่เหมือนกัน จากค่าคุมูลันต์เป็นที่ทราบกันว่า สำหรับชุดของตัวแปรสุ่มอิสระใดๆ ค่าเฉลี่ย ความแปรปรวน และความเบ้ของผลรวมจะเป็นผลรวมของค่าเฉลี่ย ความแปรปรวน และความเบ้ตามลำดับ การกำหนดพารามิเตอร์ให้กับเมทาล็อกสามเทอมด้วยโมเมนต์กลางเหล่านี้ จะให้การแจกแจงแบบต่อเนื่องที่รักษาโมเมนต์ทั้งสามนี้ไว้อย่างแม่นยำ และด้วยเหตุนี้จึงให้ค่าประมาณที่เหมาะสมกับรูปร่างของการแจกแจงของผลรวมของตัวแปรสุ่มอิสระ
การจำลอง
เนื่องจากฟังก์ชันควอนไทล์ ของ Metalog แสดงอยู่ในรูปแบบปิด Metalog จึงอำนวยความสะดวกในการจำลองแบบมอนเตคาร์โล การแทนที่ตัวอย่างสุ่มที่มีการกระจายแบบสม่ำเสมอลงในฟังก์ชันควอนไทล์ของ Metalog (ฟังก์ชันผกผันของการกระจายสะสม)จะสร้างตัวอย่างสุ่มในรูปแบบปิด ซึ่งช่วยลดความจำเป็นในการหาฟังก์ชันผกผันของการกระจายสะสม ดูรายละเอียดเพิ่มเติมเกี่ยวกับการประยุกต์ใช้ในการจำลองด้านล่าง
การดึงและรวบรวมความคิดเห็นของผู้เชี่ยวชาญ
เนื่องจากความยืดหยุ่นของรูปร่าง การแจกแจงเมทาล็อกจึงเป็นตัวเลือกที่น่าสนใจสำหรับการดึงและนำเสนอความคิดเห็นของผู้เชี่ยวชาญ[ 24 ]ยิ่งไปกว่านั้น หากความคิดเห็นของผู้เชี่ยวชาญหลายคนแสดงออกมาใน รูปของเม ทาล็อกแบบเทอม ความคิดเห็นที่เป็นเอกฉันท์อาจคำนวณได้เป็นเมทาล็อกแบบเทอมในรูปแบบปิด โดยที่สัมประสิทธิ์ของเมทาล็อกที่เป็นเอกฉันท์เป็นเพียงค่าเฉลี่ยถ่วงน้ำหนักของสัมประสิทธิ์ของผู้เชี่ยวชาญแต่ละคน[ 17 ]ผลลัพธ์นี้มาจากVincentizationซึ่งฟังก์ชันควอนไทล์ที่เป็นเอกฉันท์เป็นค่าเฉลี่ยถ่วงน้ำหนักของฟังก์ชันควอนไทล์ของแต่ละบุคคล
การปรับปรุงแบบเบย์เซียนในรูปแบบปิด
ในบทความคลาสสิก Howard (1970) [ 25 ]แสดงให้เห็นว่าการแจกแจงเบต้า-ไบโนเมียลสามารถใช้เพื่ออัปเดตความไม่แน่นอนเกี่ยวกับความถี่ในระยะยาว ของการโยนเหรียญที่ได้ "หัว" ตาม กฎของ Bayes ในรูปแบบปิด โดยพิจารณาจากข้อมูลการโยนเหรียญใหม่ ในทางตรงกันข้าม หากความไม่แน่นอนที่สนใจที่จะอัปเดตไม่ได้ถูกกำหนดโดยความน่าจะเป็นแบบสเกลาร์เหนือเหตุการณ์แบบไม่ต่อเนื่อง (เช่น ผลลัพธ์ของการโยนเหรียญ) แต่โดยฟังก์ชันความหนาแน่นของความน่าจะเป็นเหนือตัวแปรต่อเนื่อง อาจใช้การอัปเดตแบบเบย์เซียนของเมทาล็อกได้ ภายใต้เงื่อนไขบางประการ พารามิเตอร์ควอนไทล์และสัมประสิทธิ์ของเมทาล็อกอาจได้รับการอัปเดตในรูปแบบปิดโดยพิจารณาจากข้อมูลใหม่ตาม กฎ ของBayes [ 17 ]
แอปพลิเคชัน

เนื่องจากรูปทรงและขอบเขตที่ยืดหยุ่น แผนภูมิโลหะจึงสามารถใช้แสดงข้อมูลเชิงประจักษ์หรือข้อมูลอื่นๆ ได้ในแทบทุกสาขาของความพยายามของมนุษย์
- ดาราศาสตร์มีการใช้ Metalogs เพื่อประเมินความเสี่ยงของการชนของดาวเคราะห์น้อย[ 26 ]
- ความปลอดภัยทางไซเบอร์ Metalogs ถูกนำมาใช้ในการประเมินความเสี่ยงด้านความปลอดภัยทางไซเบอร์[ 19 ] [ 27 ]
- การสอบถามและรวบรวมความคิดเห็นของผู้เชี่ยวชาญสำนักงานสถิติแคนาดาได้สอบถามความคิดเห็นของผู้เชี่ยวชาญเกี่ยวกับอัตราการเจริญพันธุ์ในอนาคตของแคนาดาจากผู้เชี่ยวชาญ 18 คน ซึ่งรวมถึงการใช้ข้อมูลป้อนกลับแบบเรียลไทม์ในรูปแบบ PDF ที่ใช้สเปรดชีตโดยอิงจากเมทาล็อกห้าเทอม จากนั้นความคิดเห็นของผู้เชี่ยวชาญแต่ละคนจะถูกถ่วงน้ำหนักและรวมเข้าด้วยกันเป็นการคาดการณ์โดยรวมตามเมทาล็อก[ 24 ]
- การสำรวจและการแสดงภาพข้อมูลเชิงประจักษ์ในชีววิทยาของปลา การกระจายแบบ log metalog 10 เทอม (จำกัดด้านล่างที่ 0) ถูกนำมาใช้กับน้ำหนักของปลาเทราต์เหล็ก 3,474 ตัวที่จับและปล่อยในแม่น้ำ Babine ในบริติชโคลัมเบียในช่วงปี 2006–2010 ลักษณะสองยอดของการกระจายที่ได้นั้นเกิดจากการมีปลาที่วางไข่ครั้งแรกและครั้งที่สองอยู่ในแม่น้ำ ซึ่งปลาที่วางไข่ครั้งที่สองมักจะมีน้ำหนักมากกว่า[ 28 ]
- อุทกวิทยามีการใช้เมทาล็อกแบบกึ่งจำกัด 10 เทอมเพื่อสร้างแบบจำลองการกระจายความน่าจะเป็นของระดับน้ำในแม่น้ำรายปี[ 29 ]
- การผลิตน้ำมันในแหล่งน้ำมันมีการใช้โลหะ SPT แบบกึ่งจำกัดเพื่อวิเคราะห์อคติในการคาดการณ์การผลิตน้ำมันในแหล่งน้ำมันเมื่อเปรียบเทียบกับการผลิตที่สังเกตได้ภายหลัง[ 30 ]
- การจัดการพอร์ตโฟลิโอ SPT metalogs ถูกนำมาใช้เพื่อสร้างแบบจำลองมูลค่าเชิงพาณิชย์ของผลิตภัณฑ์ใหม่และพอร์ตโฟลิโอผลิตภัณฑ์[ 31 ]
- การกระจายอินพุตการจำลองเพื่อสนับสนุนการตัดสินใจประมูล ความไม่แน่นอนเกี่ยวกับมูลค่าในอนาคตของสินทรัพย์ทางการเงิน 259 รายการแต่ละรายการถูกแสดงเป็น SPT metalog การจำลองมูลค่าพอร์ตโฟลิโอทั้งหมดแสดงให้เห็นว่าให้ผลลัพธ์ที่สมจริงกว่าการจำลองที่สอดคล้องกันโดยอิงจากค่าต่ำ ค่ามัธยฐาน และค่าสูงแบบไม่ต่อเนื่องสำหรับสินทรัพย์แต่ละรายการ[ 32 ]
- การกระจายผลลัพธ์การจำลอง Metalogs ยังถูกใช้เพื่อปรับข้อมูลผลลัพธ์จากการจำลองเพื่อแสดงผลลัพธ์เหล่านั้นเป็นการกระจายแบบต่อเนื่องในรูปแบบปิด (ทั้ง CDF และ PDF) เมื่อใช้ในลักษณะนี้ โดยทั่วไปแล้วจะมีความเสถียรและเรียบเนียนกว่าฮิสโตแกรม[ 32 ]
- ผลรวมของลอคนอร์มอลเมทัลล็อกช่วยให้สามารถแสดงการแจกแจงที่ทราบในรูปแบบปิดได้ ซึ่ง CDF ของพวกมันไม่มีการแสดงออกในรูปแบบปิด Keelin et al. (2019) [ 18 ]ประยุกต์ใช้สิ่งนี้กับผลรวมของการแจกแจงลอคนอร์มอลที่เป็นอิสระและมีการแจกแจงเหมือนกัน โดยที่ควอนไทล์ของผลรวมสามารถกำหนดได้จากการจำลองจำนวนมาก ควอนไทล์ดังกล่าวเก้าตัวถูกใช้เพื่อกำหนดพารามิเตอร์ของการแจกแจงเมทัลล็อกแบบกึ่งจำกัดที่วิ่งผ่านควอนไทล์ทั้งเก้าตัวนี้อย่างแม่นยำ พารามิเตอร์ควอนไทล์จะถูกเก็บไว้ในตาราง ซึ่งสามารถประมาณค่าในช่วงเพื่อให้ได้ค่าระหว่างกลาง ค่าเหล่านี้รับประกันว่าเป็นไปได้ด้วยคุณสมบัติความนูนข้างต้น

การเลือกจำนวนพจน์
สำหรับแอปพลิเคชันและชุดข้อมูลที่กำหนด การเลือกจำนวนเทอม metalog ขึ้นอยู่กับบริบทและอาจต้องอาศัยการตัดสินใจ สำหรับการสอบถามผู้เชี่ยวชาญ โดยทั่วไปแล้วสามถึงห้าเทอมก็เพียงพอ สำหรับการสำรวจข้อมูลและการจับคู่การแจกแจงความน่าจะเป็นอื่นๆ เช่น ผลรวมของ lognormal โดยทั่วไปแล้วแปดถึงสิบสองเทอมก็เพียงพอ แผง metalog ซึ่งแสดง PDF ของ metalog ที่สอดคล้องกับจำนวนเทอมที่แตกต่างกันสำหรับชุดข้อมูลที่กำหนด อาจช่วยในการตัดสินใจนี้ได้ ตัวอย่างเช่น ในแผง metalog น้ำหนักปลา steelhead [ 1 ]การใช้เทอมน้อยกว่าเจ็ดเทอมอาจทำให้ข้อมูลไม่เหมาะสมกับแบบจำลอง เนื่องจากบดบังความเป็นสองยอดโดยธรรมชาติของข้อมูล การใช้เทอมมากกว่า 11 เทอมนั้นไม่จำเป็น และในทางทฤษฎีอาจ ทำให้ข้อมูล เหมาะสมกับแบบจำลองมากเกินไป กรณีที่มี 16 เทอมนั้นเป็นไปไม่ได้สำหรับชุดข้อมูลนี้ ดังที่แสดงโดยเซลล์ว่างในแผง metalog เครื่องมืออื่นๆ เช่นการปรับค่าและการเลือกแบบจำลอง ( เกณฑ์ข้อมูล Akaikeและเกณฑ์ข้อมูล Bayesian ) ก็อาจมีประโยชน์เช่นกัน ตัวอย่างเช่น เมื่อนำไปใช้กับข้อมูลน้ำหนักของปลาสตีลเฮด การจัดอันดับ AIC ของการกระจายเมทาล็อกจาก 2-16 เทอม พร้อมกับการกระจายแบบคลาสสิกที่หลากหลาย ระบุว่าเมทาล็อกล็อก 11 เทอมเป็นแบบที่เหมาะสมที่สุดกับข้อมูลนี้ การจัดอันดับ BIC ที่คล้ายกันระบุว่าเมทาล็อกล็อก 10 เทอมเป็นแบบที่เหมาะสมที่สุด Keelin (2016) [ 1 ]เสนอมุมมองเพิ่มเติมเกี่ยวกับการเลือกการกระจายภายในตระกูลเมทาล็อก[ 33 ]
การแจกแจงที่เกี่ยวข้อง
การแจกแจงเมทาล็อกจัดอยู่ในกลุ่มของการแจกแจงที่กำหนดตามฟังก์ชันควอนไทล์ซึ่งรวมถึงการแจกแจงแบบพารามิเตอร์ควอนไทล์ การแจกแจงแลมบ์ดาของทูคีย์ การวางนัยทั่วไปของมัน GLD [ 34 ]การแจกแจงโกวินดาราจูลู[ 35 ]และอื่นๆ[ 13 ]การแจกแจงต่อไปนี้รวมอยู่ในตระกูลเมทาล็อก:
- การแจกแจงโลจิสติกเป็นกรณีพิเศษของการแจกแจงเมทาล็อกแบบไม่จำกัด โดยที่สำหรับทุกๆ
- การแจกแจงแบบเอกรูปเป็นกรณีพิเศษของ: 1) เมทาล็อกที่ไม่จำกัดขอบเขต โดยที่, , และเป็นอย่างอื่น และ 2) เมทาล็อกที่จำกัดขอบเขต โดยที่, , , , และเป็นอย่างอื่น
- การแจกแจงล็อกโลจิสติกหรือที่รู้จักกันในทางเศรษฐศาสตร์ว่า การแจกแจงฟิสก์ เป็นกรณีพิเศษของการแจกแจงล็อกเมทัลโลจิสติก โดยที่และสำหรับทุกค่า
- การแจกแจงแบบลอการิทึมสม่ำเสมอเป็นกรณีพิเศษของการแจกแจงแบบลอการิทึมเมทัลล็อก โดยที่, , , และเป็นอย่างอื่น
- การแจกแจงโลจิต-โลจิสติก[ 36 ]เป็นกรณีพิเศษของโลจิตเมทาล็อก โดยที่สำหรับทุก
ซอฟต์แวร์
สามารถใช้เครื่องมือซอฟต์แวร์ที่ใช้งานได้ฟรีในการทำงานกับระบบจัดเก็บข้อมูล Metalog ได้:
- ไฟล์ Excel เมื่อวางหรือพิมพ์ข้อมูล CDF ลงไป ระบบจะแสดงแผนผังโลหะวิทยา (พร้อมตัวเลือกขอบเขต) ทันที
- เวิร์กบุ๊ก SPT metalogs [ 37 ]คำนวณ metalogs 2–3 เทอมที่กำหนดโดยข้อมูล CDF สามรายการ
- เวิร์กบุ๊ก Metalogs [ 38 ]คำนวณ metalogs 2–16 เทอม (รวมถึงแผง metalog) ที่กำหนดโดยข้อมูล CDF 2-10,000
- เวิร์กบุ๊ก Metalog ของ ELD (ข้อมูลที่มีโอกาสเท่ากัน) [ 39 ]คำนวณ metalog 2–16 เทอมที่กำหนดโดยข้อมูล CDF 2–10,000 โดยที่'s และแผง metalog จะถูกคำนวณโดยอัตโนมัติ
- R. rmetalog [ 40 ] (บนเครือข่ายเก็บถาวร R ที่ครอบคลุม CRAN )
- Python. Pymetalog [ 41 ]เลียนแบบแพ็กเกจ R อย่างใกล้ชิด Metalogistic [ 42 ]ใช้ประโยชน์จากแพลตฟอร์มSciPy
- MakeDistribution.com[43] facilitates experimentation with metalogs parameterized by several CDF data points. The SPT metalog calculator,[44] metalog calculator[45] and ELD metalog calculator[46] are online versions of the Excel Workbooks.
- SIPmath Modeler Tools[47] support metalog distributions in an Excel add-In for simulation.
- Lumina's Analytica Free 101 software[48] for modeling and aiding difficult decisions.
- BayesFusion's Metalog Builder [49] allows for interactive building of metalog distributions. BayesFusion's GeNIe [50] (academic version of the software is free for academic research and teaching) implements the metalog distributions.
Commercially available packages also support the use of metalog distributions:
- FrontLine Solvers: Analytic Solver, RASON, and Solver SDK,[51] software for optimization. Automatically fits user data to the full range of (bounded and unbounded, multi-term) metalog distributions and provides option to compare metalog distributions with classical distributions based on user-selected goodness of fit criteria.
- Lone Star Analysis: TruNavigator and AnalyticsOS software [52] for predictive and prescriptive analytics.
ลิงก์ภายนอก
- เว็บไซต์ของ Metalog Distributions คือwww.metalogs.org
- ช่อง YouTube ของ Metalog Distributions นำเสนอวิดีโอให้ความรู้
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การจัดจำหน่าย Metalog
การ แจกแจงเมทาล็อก เป็นการ แจกแจงความน่าจะเป็นแบบต่อเนื่อง ที่มี ความยืดหยุ่น ออกแบบมาเพื่อให้ใช้งานง่ายในทางปฏิบัติ เมื่อรวมกับรูปแบบการแปลงแล้ว...
ประวัติศาสตร์
ประวัติความเป็นมาของ การแจกแจงความน่า จะเป็นสามารถมองได้บางส่วนว่าเป็นความก้าวหน้าของการพัฒนาไปสู่ความยืดหยุ่นที่มากขึ้นในรูปร่างและขอบเขตเมื่อ ปรับให้เข้ากับข้อมูล การ แจกแจงปกติ ได้รับการตีพิมพ์ครั้งแรกในปี 1756 [ 3 ] และ ทฤษฎีบทของเบย์ส ในปี 1763 [ 4 ]...
นิยามและฟังก์ชันควอนไทล์
การแจกแจงเมทาล็อกเป็นการสรุปทั่วไปของ การแจกแจงโลจิสติก โดยคำว่า "เมทาล็อก" เป็นคำย่อของ "เมทาล็อกสติก" คีลินเริ่มต้นด้วย ฟังก์ชันควอน ไทล์โลจิสติก และแทนที่การขยายอนุกรมกำลังในความน่าจะเป็นสะสมสำหรับพารามิเตอร์และซึ่งควบคุมตำแหน่งและมาตราส่วนตามลำดับ [ 10 ]...
ฟังก์ชันความหนาแน่นความน่าจะเป็น
การหาอนุพันธ์เทียบกับจะได้ฟังก์ชันความหนาแน่นควอนไทล์ [ 11 ] ส่วนกลับของปริมาณนี้คือ ฟังก์ชันความหนาแน่นความน่าจะเป็น ที่แสดงเป็น p-PDF [ 12 ] x = เอ็ม เค ( y ) {\displaystyle x=M_{k}(y)} y {\displaystyle y} q ( y ) = ง x / ง y {\displaystyle q(y)=dx/dy} ( q...