อ่าน 24 นาที
การกระจายแบบคอชี
การแจกแจงโคชี (Cauchy distribution ) ซึ่งตั้งชื่อตามออกัสติน-หลุยส์ โคชีเป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องเป็นที่รู้จักกันโดยเฉพาะในหมู่นักฟิสิกส์ว่า การแจกแจงลอเรนซ์ (Lorentz.
การกระจายแบบคอชี
| คอชี่ | |||
|---|---|---|---|
ฟังก์ชันความหนาแน่นความน่าจะเป็น | |||
ฟังก์ชันการกระจายสะสม | |||
| พารามิเตอร์ | ตำแหน่ง ( จริง ) มาตราส่วน (จริง) | ||
| สนับสนุน | |||
| พีดี | |||
| ซีดีเอฟ | |||
| ควอนไทล์ | |||
| หมายถึง | ไม่ได้กำหนด | ||
| ค่ามัธยฐาน | |||
| โหมด | |||
| ความแปรปรวน | ไม่ได้กำหนด | ||
| โกรธ | |||
| ความเบี่ยงเบน | ไม่ได้กำหนด | ||
| ความโค้งส่วนเกิน | ไม่ได้กำหนด | ||
| เอนโทรปี | |||
| เอ็มจีเอฟ | ไม่มีอยู่จริง | ||
| ซีเอฟ | |||
| ข้อมูลของฟิชเชอร์ | |||
การแจกแจงโคชี (Cauchy distribution ) ซึ่งตั้งชื่อตามออกัสติน-หลุยส์ โคชีเป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องเป็นที่รู้จักกันโดยเฉพาะในหมู่นักฟิสิกส์ว่า การแจกแจงลอเรนซ์ (Lorentz distribution ) (ตั้งชื่อตามเฮนดริก ลอเรนซ์ ) การแจกแจงโคชี-ลอเรนซ์ ( Cauchy–Lorentz distribution) ฟังก์ชันลอเรนซ์ ( Lorentz(ian) function ) หรือ การแจกแจงไบรต์-วิกเนอร์ ( Breit–Wigner distribution ) การแจกแจงโคชีคือการแจกแจงของจุดตัดแกนx ของรังสีที่ออกจาก จุดหนึ่งโดยมีมุมที่แจกแจงอย่างสม่ำเสมอ นอกจากนี้ยังเป็นการแจกแจงของอัตราส่วนของตัวแปรสุ่มอิสระสองตัวที่แจกแจงแบบปกติโดยมีค่าเฉลี่ยเป็นศูนย์
การแจกแจงโคชีมักถูกใช้ในทางสถิติเป็นตัวอย่างมาตรฐานของการแจกแจง " ผิดปกติ " เนื่องจากทั้งค่าคาดหวังและความแปรปรวน ของมัน ไม่ได้ถูกกำหนด (แต่ดู§ โมเมนต์ด้านล่าง) การแจกแจงโคชีไม่มีโมเมนต์ จำกัด ที่มีลำดับมากกว่าหรือเท่ากับหนึ่ง มีเพียงโมเมนต์สัมบูรณ์ที่เป็นเศษส่วนเท่านั้น[ 1 ]การแจกแจงโคชีไม่มีฟังก์ชันสร้างโมเมนต์
ในทางคณิตศาสตร์มันมีความเกี่ยวข้องอย่างใกล้ชิดกับเคอร์เนลปัวซงซึ่งเป็นคำตอบพื้นฐานของสมการลาปลาสในระนาบครึ่งบน
เป็นการแจกแจงแบบเสถียร ประเภทหนึ่ง ที่มีฟังก์ชันความหนาแน่นความน่าจะเป็นที่สามารถแสดงออกมาในเชิงวิเคราะห์ได้ โดยอีกสองประเภทคือการแจกแจงแบบปกติและการแจกแจงแบบเลวี
คำจำกัดความ
ต่อไปนี้คือโครงสร้างที่สำคัญที่สุด
สมมาตรแบบหมุน
ถ้าหากยืนอยู่หน้าเส้นและเตะลูกบอลไปในมุมสุ่มที่มีการกระจายอย่างสม่ำเสมอไปยังเส้นนั้น การกระจายของจุดที่ลูกบอลกระทบเส้นจะเป็นการกระจายแบบโคชี (Cauchy distribution)
ตัวอย่างเช่น พิจารณาจุดที่ในระนาบ xy และเลือกเส้นตรงที่ผ่านจุดนั้น โดยทิศทาง (มุมกับแกน x) ถูกเลือกแบบสุ่มอย่างสม่ำเสมอ (ระหว่าง −180° และ 0°) จุดตัดของเส้นตรงกับแกน x จะเป็นไปตามการแจกแจงแบบโคชี (Cauchy distribution) ที่มีตำแหน่งและ มาตราส่วน
คำจำกัดความนี้ให้วิธีการง่ายๆ ในการสุ่มตัวอย่างจาก1การแจกแจงโคชีมาตรฐาน ให้เป็นตัวอย่างจากการแจกแจงเอกรูปจากแล้วเราสามารถสร้างตัวอย่างจากการแจกแจงโคชีมาตรฐานโดยใช้
เมื่อและเป็นตัวแปรสุ่มอิสระที่มีการแจกแจงแบบปกติโดยมีค่าเฉลี่ย 0 และความแปรปรวน 1 แล้ว อัตราส่วนจะมีการแจกแจงแบบโคชีมาตรฐาน
โดยทั่วไปแล้ว ถ้าเป็นการกระจายแบบสมมาตรเชิงการหมุนบนระนาบ อัตราส่วนจะมีลักษณะการกระจายแบบโคชีมาตรฐาน
ฟังก์ชันความหนาแน่นความน่าจะเป็น (PDF)
การแจกแจงโคชีเป็นการแจกแจงความน่าจะเป็นที่มีฟังก์ชันความหนาแน่นความน่าจะเป็น (PDF) ดังต่อไปนี้ [ 1 ] [ 2 ]
โดยที่คือพารามิเตอร์ตำแหน่งซึ่งระบุตำแหน่งของจุดสูงสุดของการกระจาย และคือพารามิเตอร์มาตราส่วนซึ่งระบุความกว้างครึ่งหนึ่งที่ค่าสูงสุดครึ่งหนึ่ง (HWHM) หรืออีกนัยหนึ่งคือความกว้างเต็มที่ที่ค่าสูงสุดครึ่งหนึ่ง (FWHM) ยังเท่ากับครึ่งหนึ่งของช่วงควอไทล์และบางครั้งเรียกว่าข้อผิดพลาดที่น่าจะเป็นไปได้ [ 1 ] ฟังก์ชันนี้ยังเป็นที่รู้จักในชื่อฟังก์ชันลอเรนซ์ [ 3 ]และเป็นตัวอย่างของฟังก์ชันเดลต้าเริ่มต้นและด้วยเหตุนี้จึงเข้าใกล้ฟังก์ชันเดลต้าของดิแรกในขีดจำกัดเมื่อAugustin -Louis Cauchyได้ใช้ฟังก์ชันความหนาแน่นดังกล่าวในปี 1827 โดยมี พารามิเตอร์มาตราส่วน ที่เล็กมากกำหนดฟังก์ชันเดลต้าของดิแรกนี้
คุณสมบัติของไฟล์ PDF
ค่าสูงสุดหรือแอมพลิจูดสูงสุดของฟังก์ชันความหนาแน่นความน่าจะเป็นแบบโคชี (Cauchy PDF) คือซึ่ง อยู่ที่
บางครั้ง การแสดงฟังก์ชันความหนาแน่นความน่าจะเป็น (PDF) ในรูปของพารามิเตอร์เชิงซ้อนก็สะดวกกว่า
กรณีพิเศษเมื่อและเรียกว่าการแจกแจงโคชีมาตรฐานที่มีฟังก์ชันความหนาแน่นความน่าจะเป็น[ 4 ] [ 5 ]
ในวิชาฟิสิกส์ มักใช้ฟังก์ชันลอเรนซ์แบบสามพารามิเตอร์ โดยที่คือความสูงของยอด ฟังก์ชันลอเรนซ์แบบสามพารามิเตอร์ที่กล่าวมานั้น โดยทั่วไปไม่ใช่ฟังก์ชันความหนาแน่นความน่าจะเป็น เนื่องจากค่าอินทิเกรตไม่เท่ากับ 1 ยกเว้นในกรณีพิเศษที่
ฟังก์ชันการกระจายสะสม (CDF)
การแจกแจงโคชีเป็นการแจกแจงความน่าจะเป็นที่มีฟังก์ชันการแจกแจงสะสม (CDF) ดังต่อไปนี้:
และฟังก์ชันควอนไทล์(ฟังก์ชันการกระจายสะสมผกผัน) ของการแจกแจงโคชีคือ ดังนั้น ควาร์ไทล์ที่หนึ่งและที่สามคือและ ด้วยเหตุนี้ช่วงระหว่างควาร์ไทล์คือ
สำหรับการแจกแจงแบบมาตรฐาน ฟังก์ชันการแจกแจงสะสมจะลดรูปเหลือเพียงฟังก์ชันอาร์คแทงเจนต์ :
สิ่งก่อสร้างอื่นๆ
การแจกแจงโคชีมาตรฐานคือการแจกแจงtของนักเรียนที่มีองศาอิสระหนึ่งองศา ดังนั้นจึงสามารถสร้างได้โดยวิธีใดก็ได้ที่สร้างการแจกแจง t ของนักเรียน[ 6 ]
ถ้าเป็นเมทริกซ์ความแปรปรวนร่วมแบบบวกกึ่งบวกที่มีรายการแนวทแยงเป็นบวกอย่างเคร่งครัด แล้วสำหรับเวกเตอร์สุ่มอิสระและเหมือนกัน ทุกประการ และ เวกเตอร์สุ่มใดๆที่เป็นอิสระจากและโดยที่และ(กำหนดการ กระจายเชิงหมวดหมู่ ) จะเป็นจริงว่า[ 7 ]
คุณสมบัติ
การแจกแจงโคชีเป็นตัวอย่างของการแจกแจงที่ไม่มีค่าเฉลี่ยความแปรปรวนหรือโมเมนต์ลำดับ สูงกว่าที่กำหนดไว้ แต่ ค่าฐานนิยมและค่ามัธยฐานนั้นกำหนดไว้อย่างชัดเจนและมีค่าเท่ากับ 0 ทั้งคู่
การแจกแจงโคชีเป็นการแจกแจงความน่าจะเป็นที่แบ่งได้ไม่จำกัดนอกจากนี้ยังเป็นการแจกแจงที่มีเสถียรภาพ อย่างเคร่งครัดอีกด้วย [ 8 ]
ตระกูลของตัวแปรสุ่มที่มีการแจกแจงแบบ Cauchy ปิดภายใต้การแปลงเศษส่วนเชิงเส้นที่มีสัมประสิทธิ์จริง[ 9 ]ในส่วนนี้ โปรดดู การกำหนดพารามิเตอร์ของการแจกแจงแบบ Cauchy ของ McCullagh ด้วย
ผลรวมของตัวแปรสุ่มที่มีการแจกแจงแบบโคชี
ถ้าตัวแปร สุ่มตัวอย่างเป็นแบบอิสระและมีการกระจายเหมือนกัน (IID)จากการแจกแจงแบบโคชีมาตรฐานค่าเฉลี่ยของตัวแปรสุ่มตัวอย่าง นั้น ก็จะมีการแจกแจงแบบโคชีมาตรฐานเช่นกัน โดยเฉพาะอย่างยิ่ง ค่าเฉลี่ยจะไม่ลู่เข้าสู่ค่าเฉลี่ย และดังนั้น การแจกแจงแบบโคชีมาตรฐานจึงไม่เป็นไปตามกฎของจำนวนมาก
สามารถพิสูจน์ได้โดยการอินทิเกรตซ้ำๆ กับ PDF หรือที่สะดวกกว่านั้นคือโดยใช้ฟังก์ชันลักษณะเฉพาะของการแจกแจงโคชีมาตรฐาน (ดูด้านล่าง): ด้วยวิธีนี้ เราจะได้และดังนั้นการแจกแจงโคชีมาตรฐานจึงมี
โดยทั่วไปแล้ว ถ้าเป็นอิสระต่อกันและมีการแจกแจงแบบโคชี โดยมีพารามิเตอร์ตำแหน่งและและเป็นจำนวนจริง แล้ว ก็จะมีการแจกแจงแบบโคชี โดยมีตำแหน่งและ เป็นจำนวน จริง เช่นกัน เราจะเห็นว่าไม่มีกฎของจำนวนมากสำหรับผลรวมถ่วงน้ำหนักใดๆ ของการแจกแจงแบบโคชีที่เป็นอิสระต่อกัน
สิ่งนี้แสดงให้เห็นว่าเงื่อนไขของความแปรปรวนจำกัดในทฤษฎีบทลิมิตกลางไม่สามารถละทิ้งได้ นอกจากนี้ยังเป็นตัวอย่างของทฤษฎีบทลิมิตกลางในรูปแบบทั่วไปมากขึ้น ซึ่งเป็นลักษณะเฉพาะของการแจกแจงเสถียร ทั้งหมด โดยการแจกแจงโคชีเป็นกรณีพิเศษของการแจกแจงดังกล่าว
ทฤษฎีบทลิมิตกลาง
ถ้าเป็นตัวอย่าง IID ที่มี PDF เช่นนั้นมีค่าจำกัดแต่ไม่เป็นศูนย์ แล้วการแจกแจงจะลู่เข้าสู่การแจกแจงโคชีที่มีมาตราส่วน[ 10 ]
ฟังก์ชันลักษณะเฉพาะ
ให้แทนตัวแปรสุ่มที่มีการแจกแจงแบบโคชีฟังก์ชันลักษณะเฉพาะของการแจกแจงแบบโคชี กำหนดโดย
ซึ่งก็คือการแปลงฟูริเยร์ของความหนาแน่นความน่าจะเป็นนั่นเอง ความหนาแน่นความน่าจะเป็นดั้งเดิมสามารถแสดงได้ในรูปของฟังก์ชันลักษณะเฉพาะ โดยพื้นฐานแล้วโดยใช้การแปลงฟูริเยร์ผกผัน:
โมเมนต์ ลำดับที่ nของการแจกแจง คือ อนุพันธ์ลำดับที่ nของฟังก์ชันลักษณะเฉพาะที่ประเมินค่า ณ จุด x = 0 สังเกตว่าฟังก์ชันลักษณะเฉพาะไม่สามารถหาอนุพันธ์ได้ที่จุดกำเนิด: นี่สอดคล้องกับข้อเท็จจริงที่ว่าการแจกแจงโคชีไม่มีโมเมนต์ที่กำหนดไว้อย่างชัดเจนสูงกว่าโมเมนต์ลำดับที่ศูนย์
ความแตกต่าง Kullback–Leibler
ความแตกต่าง Kullback –Leiblerระหว่างการแจกแจง Cauchy สองรายการมีสูตรปิดสมมาตรดังต่อไปนี้: [ 11 ]
ความแตกต่าง fใดๆระหว่างการแจกแจง Cauchy สองแบบจะสมมาตรและสามารถแสดงเป็นฟังก์ชันของความแตกต่างไคกำลังสองได้[ 12 ] มี สูตรสำเร็จรูปสำหรับความแปรผันทั้งหมดความแตกต่าง Jensen–Shannonระยะทาง Hellingerเป็นต้น
เอนโทรปี
เอนโทรปีของการแจกแจงโคชีมีค่าดังนี้:
อนุพันธ์ของฟังก์ชันควอนไทล์หรือฟังก์ชันความหนาแน่นควอนไทล์ สำหรับการแจกแจงโคชี คือ:
เอนโทรปีเชิงอนุพันธ์ของการกระจายสามารถกำหนดได้ในแง่ของความหนาแน่นควอนไทล์[ 13 ]โดยเฉพาะ:
การแจกแจงโคชีเป็นการแจกแจงความน่าจะเป็นเอนโทรปีสูงสุดสำหรับตัวแปรสุ่มซึ่ง[ 14 ]
ช่วงเวลา
การแจกแจงโคชีมักถูกใช้เป็นตัวอย่างค้านในหลักสูตรความน่าจะเป็นเบื้องต้น เนื่องจากเป็นการแจกแจงที่ไม่มีโมเมนต์ที่กำหนดไว้อย่างชัดเจน (หรือ "ไม่แน่นอน")
ตัวอย่างช่วงเวลา
ถ้าเราสุ่มตัวอย่างแบบ IID จากการแจกแจงแบบโคชีมาตรฐาน ลำดับของค่าเฉลี่ยตัวอย่างจะเป็นซึ่งก็มีการแจกแจงแบบโคชีมาตรฐานเช่นกัน ดังนั้น ไม่ว่าเราจะสุ่มตัวอย่างกี่พจน์ ค่าเฉลี่ยตัวอย่างก็จะไม่ลู่เข้าสู่ค่าคงที่
ในทำนองเดียวกัน ค่าความแปรปรวนของตัวอย่างก็ไม่ลู่เข้าสู่ค่าคง ที่เช่นกัน

วิถีการเปลี่ยนแปลงโดยทั่วไปจะมีลักษณะเป็นช่วงเวลาที่ยาวนานของการลู่เข้าสู่ศูนย์อย่างช้าๆ สลับกับการกระโดดครั้งใหญ่ที่ห่างจากศูนย์ แต่ไม่เคยห่างออกไปไกลเกินไป วิถีการเปลี่ยนแปลงโดยทั่วไปจะมีลักษณะคล้ายกัน แต่การกระโดดจะสะสมเร็วกว่าการลดลง และลู่เข้าสู่ค่าอนันต์ วิถีการเปลี่ยนแปลงทั้งสองแบบนี้แสดงอยู่ในรูปภาพ
ค่าโมเมนต์ของตัวอย่างที่มีอันดับต่ำกว่า 1 จะลู่เข้าสู่ศูนย์ ส่วนค่าโมเมนต์ของตัวอย่างที่มีอันดับสูงกว่า 2 จะลู่เข้าสู่ค่าอนันต์เร็วกว่าค่าความแปรปรวนของตัวอย่างเสียอีก
หมายถึง
ถ้าการแจกแจงความน่าจะเป็นมีฟังก์ชันความหนาแน่น แล้วค่าเฉลี่ย (ถ้ามี) จะกำหนดโดย
| 1 |
เราสามารถประเมิน ค่าอินทิกรัลไม่เหมาะสมสองด้านนี้ได้โดยการคำนวณผลรวมของอินทิกรัลไม่เหมาะสมด้านเดียวสองตัว นั่นคือ
| 2 |
สำหรับจำนวนจริงใดๆ
เพื่อให้อินทิกรัลมีอยู่ (แม้จะเป็นค่าอนันต์) อย่างน้อยหนึ่งเทอมในผลรวมนี้ควรมีค่าจำกัด หรือทั้งสองเทอมควรมีค่าอนันต์และมีเครื่องหมายเดียวกัน แต่ในกรณีของการแจกแจงโคชี เทอมทั้งสองในผลรวมนี้ ( 2 ) มีค่าอนันต์และมีเครื่องหมายตรงข้าม ดังนั้น ( 1 ) จึงไม่สามารถนิยามได้ และด้วยเหตุนี้ค่าเฉลี่ยจึงไม่สามารถนิยามได้เช่นกัน[ 15 ]เมื่อค่าเฉลี่ยของฟังก์ชันการแจกแจงความน่าจะเป็น (PDF) ไม่สามารถนิยามได้ ไม่มีใครสามารถคำนวณค่าเฉลี่ยที่เชื่อถือได้จากจุดข้อมูลการทดลองได้ ไม่ว่าขนาดของตัวอย่างจะเป็นเท่าใดก็ตาม
โปรดทราบว่าค่าหลักของ Cauchyของค่าเฉลี่ยของการแจกแจง Cauchy คือ ซึ่งก็คือศูนย์ ในทางกลับกัน อินทิกรัลที่เกี่ยวข้อง ไม่ใช่ ศูนย์ ดังที่เห็นได้จากการคำนวณอินทิกรัล สิ่งนี้แสดงให้เห็นอีกครั้งว่าค่าเฉลี่ย ( 1 ) ไม่สามารถมีอยู่ได้
ผลลัพธ์ต่างๆ ในทฤษฎีความน่าจะเป็นเกี่ยวกับค่าที่คาดหวังเช่นกฎของจำนวนมากที่แข็งแกร่งไม่เป็นไปตามการแจกแจงโคชี[ 15 ]
ช่วงเวลาเล็กๆ
ช่วงเวลาสัมบูรณ์สำหรับนั้นถูกกำหนดไว้แล้ว เพราะเรามี
ช่วงเวลาที่สูงกว่า
การแจกแจงโคชีไม่มีโมเมนต์จำกัดในลำดับใดๆ อย่างไรก็ตามโมเมนต์ดิบ ระดับสูงบางส่วน มีอยู่จริงและมีค่าเป็นอนันต์ ตัวอย่างเช่น โมเมนต์ดิบอันดับสอง:
เมื่อจัดเรียงสูตรใหม่ จะเห็นได้ว่าโมเมนต์ที่สองนั้นโดยพื้นฐานแล้วคือปริพันธ์อนันต์ของค่าคงที่ (ในที่นี้คือ 1) โมเมนต์ดิบที่มีเลขชี้กำลังคู่ที่สูงกว่าจะมีค่าเป็นอนันต์เช่นกัน อย่างไรก็ตาม โมเมนต์ดิบที่มีเลขชี้กำลังคี่นั้นไม่มีค่า ซึ่งแตกต่างอย่างชัดเจนจากการมีค่าเป็นอนันต์ โมเมนต์ดิบที่มีเลขชี้กำลังคี่ไม่มีค่าเนื่องจากค่าของมันโดยพื้นฐานแล้วเทียบเท่ากับเนื่องจากครึ่งทั้งสองของปริพันธ์ลู่เข้าและมีเครื่องหมายตรงข้ามกัน โมเมนต์ดิบตัวแรกคือค่าเฉลี่ย ซึ่งเนื่องจากเป็นจำนวนคี่ จึงไม่มีอยู่จริง (ดูการอธิบายข้างต้นเกี่ยวกับเรื่องนี้ด้วย) ซึ่งหมายความว่าโมเมนต์กลางและโมเมนต์มาตรฐาน ทั้งหมด ไม่มีค่า เนื่องจากทั้งหมดขึ้นอยู่กับค่าเฉลี่ย ความแปรปรวน ซึ่งเป็นโมเมนต์กลางตัวที่สอง ก็ไม่มีอยู่จริงเช่นกัน (แม้ว่าโมเมนต์ดิบตัวที่สองจะมีค่าเป็นอนันต์ก็ตาม)
ผลลัพธ์สำหรับโมเมนต์ที่สูงกว่านั้นได้มาจากอสมการของ Hölderซึ่งหมายความว่าโมเมนต์ที่สูงกว่า (หรือครึ่งหนึ่งของโมเมนต์) จะลู่เข้าสู่ค่าอนันต์หากโมเมนต์ที่ต่ำกว่าลู่เข้าสู่ค่าอนันต์
โมเมนต์ของการแจกแจงแบบตัดทอน
พิจารณาการแจกแจงแบบตัดทอนที่กำหนดโดยการจำกัดการแจกแจงโคชีมาตรฐานไว้ที่ช่วง[−10 100 , 10 100 ]การแจกแจงแบบตัดทอนดังกล่าวมีโมเมนต์ทั้งหมด (และทฤษฎีบทขีดจำกัดกลางใช้ได้กับ การสังเกต แบบ iidจากการแจกแจงนี้) แต่ในทางปฏิบัติแล้ว การแจกแจงนี้มีพฤติกรรมเหมือนการแจกแจงโคชีเกือบทั้งหมด[ 16 ]
คุณสมบัติการแปลง
- ถ้าเช่นนั้น[ 17 ]
- ถ้าและเป็นอิสระต่อกันแล้วและ
- ถ้าเช่นนั้น
- การกำหนดพารามิเตอร์ของ McCullagh ของการแจกแจง Cauchy : [ 18 ]การแสดงการแจกแจง Cauchy ในรูปของพารามิเตอร์เชิงซ้อนหนึ่งตัวกำหนดให้หมายถึงถ้าแล้ว: โดยที่, , และเป็นจำนวนจริง
- โดยใช้ธรรมเนียมเดียวกันกับข้างต้น ถ้าเช่นนั้น: [ 18 ]โดยที่คือ การกระจายแบบโค ชีวงกลม
การอนุมานทางสถิติ
การประมาณค่าพารามิเตอร์
เนื่องจากพารามิเตอร์ของการแจกแจงโคชีไม่สอดคล้องกับค่าเฉลี่ยและความแปรปรวน การพยายามประมาณค่าพารามิเตอร์ของการแจกแจงโคชีโดยใช้ค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างจะไม่ประสบความสำเร็จ[ 19 ]ตัวอย่างเช่น หากสุ่มตัวอย่าง iid ขนาดnจากการแจกแจงโคชี เราสามารถคำนวณค่าเฉลี่ยตัวอย่างได้ดังนี้:
แม้ว่าค่าตัวอย่างจะกระจุกตัวอยู่รอบค่ากลางแต่ค่าเฉลี่ยของตัวอย่างจะมีความแปรปรวนมากขึ้นเมื่อมีการเก็บข้อมูลมากขึ้น เนื่องจากความน่าจะเป็นที่จะพบจุดตัวอย่างที่มีค่าสัมบูรณ์มากจะเพิ่มขึ้น ที่จริงแล้ว การกระจายตัวของค่าเฉลี่ยของตัวอย่างจะเท่ากับการกระจายตัวของค่าที่สังเกตได้เอง กล่าวคือ ค่าเฉลี่ยของตัวอย่างขนาดใหญ่ไม่ได้ดีกว่า (หรือแย่กว่า) ค่าที่สังเกตได้เพียงค่าเดียวจากตัวอย่างนั้น ในทำนองเดียวกัน การคำนวณความแปรปรวนของตัวอย่างจะให้ค่าที่มากขึ้นเมื่อมีการเก็บข้อมูลมากขึ้น
ดังนั้น จึงจำเป็นต้องมีวิธีการที่แข็งแกร่งกว่าในการประมาณค่าศูนย์กลางและพารามิเตอร์การปรับขนาด วิธีง่ายๆ วิธีหนึ่งคือการใช้ค่ามัธยฐานของตัวอย่างเป็นตัวประมาณค่าของ และใช้ครึ่งหนึ่งของช่วงควอไทล์ ของตัวอย่าง เป็นตัวประมาณค่าของนอกจากนี้ยังมีการพัฒนาวิธีการที่แม่นยำและแข็งแกร่งกว่าอื่นๆ อีกด้วย[ 20 ] [ 21 ] ตัวอย่างเช่นค่าเฉลี่ยที่ถูกตัดทอนของสถิติลำดับ ตัวอย่าง 24% ตรงกลาง จะให้ค่าประมาณของที่มีประสิทธิภาพมากกว่าการใช้ค่ามัธยฐานของตัวอย่างหรือค่าเฉลี่ยของตัวอย่างทั้งหมด[ 22 ] [ 23 ]อย่างไรก็ตาม เนื่องจากหางที่หนาของการกระจายแบบโคชี ประสิทธิภาพของตัวประมาณค่าจะลดลงหากใช้ตัวอย่างมากกว่า 24% [ 22 ] [ 23 ]
อีกวิธีง่ายๆ คือการพิจารณาค่าเฉลี่ยเลขคณิตกึ่ง เชิงซ้อน ของตัวอย่าง ให้ โดย ที่เป็นตัวสร้างค่าเฉลี่ยเลขคณิตกึ่งเชิงซ้อน ถ้าแล้วจะเป็นค่าเฉลี่ยเรขาคณิตเชิงซ้อนและถ้า แล้วจะเป็นค่าเฉลี่ยฮาร์มอนิกเชิงซ้อน เป็นตัวประมาณค่าแบบ ปิดที่ไม่เอนเอียง และ สอดคล้องกันอย่างแข็งแกร่งสำหรับพารามิเตอร์ตำแหน่งและมาตราส่วนร่วมกันภายใต้ การกำหนดพารามิเตอร์ของ McCullagh ของการแจกแจง Cauchy [ 24 ] [ 25 ] ทฤษฎีบท ขีดจำกัดกลางและประสิทธิภาพของ Bahadur ก็ใช้ได้กับ เช่นกัน
ความน่าจะเป็นสูงสุดยังสามารถใช้ในการประมาณค่าพารามิเตอร์และได้ อย่างไรก็ตาม วิธีนี้มักจะซับซ้อนขึ้นเนื่องจากต้องหาค่ารากของพหุนามดีกรีสูง และอาจมีรากหลายรากที่แสดงถึงค่าสูงสุดเฉพาะที่[ 26 ]นอกจากนี้ แม้ว่าตัวประมาณค่าความน่าจะเป็นสูงสุดจะมีประสิทธิภาพในเชิงอะซิมโทติก แต่ก็ค่อนข้างไม่มีประสิทธิภาพสำหรับตัวอย่างขนาดเล็ก[ 27 ] [ 28 ] ฟังก์ชันลอการิทึมความน่าจะเป็นสำหรับการกระจายโคชีสำหรับขนาดตัวอย่างคือ:
การหาค่าสูงสุดของฟังก์ชันความน่าจะเป็นล็อกโดยเทียบกับและโดยการหาอนุพันธ์อันดับแรก จะได้ระบบสมการต่อไปนี้:
โปรดทราบว่า
เทียบเท่ากับ
และนั่น
เป็นฟังก์ชันเอกภาคในและคำตอบต้องเป็นไปตาม เงื่อนไขนั้น
การแก้ปัญหาเฉพาะสำหรับต้องใช้การแก้พหุนามดีกรี[ 26 ]และการแก้ปัญหาเฉพาะสำหรับต้องใช้การแก้พหุนามดีกรีดังนั้น ไม่ว่าจะแก้ปัญหาสำหรับพารามิเตอร์ตัวเดียวหรือทั้งสองพารามิเตอร์พร้อมกัน โดย ทั่วไปแล้วจำเป็นต้อง ใช้ วิธีแก้ปัญหา เชิงตัวเลขบนคอมพิวเตอร์ ประโยชน์ของการประมาณค่าความน่าจะเป็นสูงสุดคือประสิทธิภาพเชิงอะซิมโทติก การประมาณค่าโดยใช้ค่ามัธยฐานของตัวอย่างมีประสิทธิภาพเชิงอะซิมโทติกเพียงประมาณ 81% เมื่อเทียบกับการประมาณ ค่า โดยความน่าจะเป็นสูงสุด[ 23 ] [ 29 ]ค่าเฉลี่ยตัวอย่างที่ถูกตัดทอนโดยใช้สถิติลำดับกลาง 24% มีประสิทธิภาพเชิงอะซิมโทติกประมาณ 88% เมื่อเทียบกับ การประมาณค่าความน่าจะเป็นสูงสุด[ 23 ]เมื่อ ใช้ วิธีของนิวตันเพื่อหาคำตอบสำหรับการประมาณค่าความน่าจะเป็นสูงสุด สถิติลำดับกลาง 24% สามารถใช้เป็นคำตอบเริ่มต้นสำหรับได้
สามารถประมาณรูปร่างได้โดยใช้ค่ามัธยฐานของค่าสัมบูรณ์ เนื่องจากสำหรับตำแหน่งที่ 0 ตัวแปรโคชีพารามิเตอร์ รูปร่าง
การแจกแจงที่เกี่ยวข้อง
ทั่วไป
- การแจกแจงtของนักเรียน
- การแจกแจงtของนักเรียนที่ไม่เป็นมาตรฐาน
- ถ้าเป็นอิสระแล้ว
- ถ้าเช่นนั้น
- ถ้าเช่นนั้น
- ถ้า เช่นนั้น
- การแจกแจงโคชีเป็นกรณีจำกัดของการแจกแจงเพียร์สันประเภทที่ 4
- การแจกแจงโคชีเป็นกรณีพิเศษของการแจกแจงเพียร์สันประเภท 7 [ 1 ]
- การแจกแจงโคชีเป็นการแจกแจงแบบเสถียรกล่าวคือ ถ้าแล้ว
- การแจกแจงโคชีเป็นการแจกแจงแบบเอกฐานของการแจกแจงไฮเปอร์โบลิก
- การแจกแจงโคชีแบบวนรอบ (wrapped Cauchy distribution)ซึ่งมีค่าอยู่บนวงกลม ได้มาจากการแจกแจงโคชีโดยการวนรอบวงกลม
- ถ้า, , แล้ว. สำหรับการแจกแจงแบบครึ่งโคชี ความสัมพันธ์จะเป็นจริงโดยการตั้งค่า.
การวัดแบบเลวี
การแจกแจงโคชีเป็นการแจกแจงเสถียรที่มีดัชนี 1 การแสดงแทนแบบเลวี-คินชินของการแจกแจงเสถียรดังกล่าวสำหรับพารามิเตอร์ 1 มีดังนี้:
ที่ไหน
และสามารถแสดงออกมาได้อย่างชัดเจน[ 30 ]ในกรณีของการแจกแจงโคชี จะมี
การแสดงผลครั้งสุดท้ายนี้เป็นผลมาจากสูตร
การแจกแจงโคชีแบบหลายตัวแปร
เวกเตอร์สุ่ม จะเรียกว่ามีการแจกแจงโคชีแบบหลายตัวแปร ถ้าการรวมเชิงเส้นทุกส่วนของเวกเตอร์สุ่มนั้นมีการแจกแจงโคชี นั่นคือ สำหรับเวกเตอร์คงที่ใดๆตัวแปรสุ่มควรมีการแจกแจงโคชีแบบตัวแปรเดียว[ 31 ] ฟังก์ชันลักษณะเฉพาะของการแจกแจงโคชีแบบหลายตัวแปรมีดังนี้:
โดยที่และเป็นฟังก์ชันจริงที่มีฟังก์ชันเอกพันธุ์ดีกรีหนึ่งและฟังก์ชันเอกพันธุ์บวกดีกรีหนึ่ง[ 31 ] อย่างเป็นทางการมากขึ้น: [ 31 ]
สำหรับทุกคน
ตัวอย่างของการแจกแจงโคชีแบบสองตัวแปรสามารถแสดงได้ดังนี้: [ 32 ] โปรดทราบว่าในตัวอย่างนี้ แม้ว่าค่าความแปรปรวนร่วมระหว่างและจะเป็น 0 แต่และก็ไม่ได้เป็นอิสระทางสถิติ[ 32 ]
เราสามารถเขียนสูตรนี้สำหรับตัวแปรเชิงซ้อนได้เช่นกัน จากนั้นฟังก์ชันความหนาแน่นความน่าจะเป็นของโคชีเชิงซ้อนจะเป็นดังนี้:
เช่นเดียวกับที่การแจกแจงโคชีมาตรฐานคือการแจกแจงทีของนักเรียนที่มีหนึ่งองศาอิสระ การแจกแจงความหนาแน่นโคชีแบบหลายมิติก็คือการแจกแจงนักเรียนแบบหลายตัวแปร ที่มีหนึ่งองศาอิสระ ความหนาแน่นของการแจกแจงนักเรียนแบบหลายมิติที่มีหนึ่งองศาอิสระคือ:
คุณสมบัติของการแจกแจงโคชีแบบหลายมิติ จึงเป็นกรณีพิเศษของการแจกแจงสตูเดนต์แบบหลายตัวแปร
การเกิดขึ้นและการประยุกต์ใช้
โดยทั่วไป

- ในสเปกโทรสโกปี การกระจายแบบคอชีอธิบายรูปร่างของเส้นสเปกตรัมซึ่งอยู่ภายใต้การขยายตัวแบบเอกพันธุ์ซึ่งอะตอมทั้งหมดมีปฏิสัมพันธ์ในลักษณะเดียวกันกับช่วงความถี่ที่อยู่ในรูปร่างเส้น กลไกหลายอย่างทำให้เกิดการขยายตัวแบบเอกพันธุ์ โดยเฉพาะอย่างยิ่งการขยายตัวจากการชน[ 33 ]การขยายตัวตามอายุหรือการขยายตัวตามธรรมชาติยังทำให้เกิดรูปร่างเส้นที่อธิบายโดยการกระจายแบบคอชี
- การประยุกต์ใช้การแจกแจงโคชีหรือการแปลงของมันสามารถพบได้ในสาขาที่เกี่ยวข้องกับการเติบโตแบบเลขชี้กำลังบทความปี 1958 โดยไวท์[ 34 ]ได้กำหนดสถิติการทดสอบสำหรับตัวประมาณค่าของสมการและเมื่อพบตัวประมาณค่าความน่าจะเป็นสูงสุดโดยใช้กำลังสองน้อยที่สุดแบบธรรมดา แสดงให้เห็นว่าการแจกแจงการสุ่มตัวอย่างของสถิติคือการแจกแจงโคชี
- การกระจายแบบ Cauchy มักเป็นการกระจายของการสังเกตสำหรับวัตถุที่กำลังหมุน การอ้างอิงแบบคลาสสิกสำหรับเรื่องนี้เรียกว่าปัญหาประภาคารของ Gull [ 35 ]และดังที่กล่าวไว้ในส่วนข้างต้นว่าเป็นการกระจายแบบ Breit–Wigner ในฟิสิกส์อนุภาค
- ในทางอุทกวิทยาการแจกแจงแบบโคชี (Cauchy distribution) ถูกนำมาใช้กับเหตุการณ์สุดขั้ว เช่น ปริมาณน้ำฝนสูงสุดในหนึ่งวันต่อปี และปริมาณน้ำไหลของแม่น้ำ ภาพสีฟ้าแสดงตัวอย่างการปรับการแจกแจงแบบโคชีให้เข้ากับปริมาณน้ำฝนสูงสุดในหนึ่งวันรายเดือนที่เรียงลำดับแล้ว โดยแสดงแถบความเชื่อมั่น 90% ตามการแจกแจงแบบทวินามด้วยข้อมูลปริมาณน้ำฝนแสดงโดย การพล็ อตตำแหน่งเป็นส่วนหนึ่งของการวิเคราะห์ความถี่สะสม
- ตามแบบจำลองของลอเรนซ์นิพจน์สำหรับส่วนจินตภาพของค่าสภาพยอมทางไฟฟ้า เชิงซ้อนคือการกระจายแบบโคชี
- ในฐานะการกระจายเพิ่มเติมเพื่อสร้างแบบจำลองหางอ้วนในด้านการเงินเชิงคำนวณ การกระจายแบบ Cauchy สามารถใช้เพื่อสร้างแบบจำลอง VAR ( มูลค่าความเสี่ยง ) ซึ่งสร้างความน่าจะเป็นของความเสี่ยงสุดขั้วได้มากกว่าการกระจายแบบ Gaussian มาก [ 36 ]
การแจกแจง Breit–Wigner แบบสัมพัทธภาพ
ใน ฟิสิกส์ นิวเคลียร์และอนุภาคโปรไฟล์พลังงานของเรโซแนนซ์อธิบายโดยการกระจาย Breit–Wigner แบบสัม พัทธภาพ ในขณะที่การกระจาย Cauchy คือการกระจาย Breit–Wigner (แบบไม่สัมพัทธภาพ) [ 37 ]
ประวัติศาสตร์

ฟังก์ชันที่มีรูปแบบเหมือนฟังก์ชันความหนาแน่นของการแจกแจงโคชีได้รับการศึกษาทางเรขาคณิตโดยแฟร์มาต์ในปี 1659 และต่อมาเป็นที่รู้จักในชื่อแม่มดแห่งอักเนซีหลังจากที่มาเรีย กาเอตานา อักเนซีรวมไว้เป็นตัวอย่างในตำราแคลคูลัสของเธอในปี 1748 แม้จะมีชื่อเช่นนั้น แต่การวิเคราะห์คุณสมบัติของการแจกแจงโคชีอย่างชัดเจนครั้งแรกได้รับการตีพิมพ์โดยนักคณิตศาสตร์ชาวฝรั่งเศสปัวซงในปี 1824 โดยโคชีเพิ่งเข้ามาเกี่ยวข้องกับเรื่องนี้ในช่วงที่มีการโต้แย้งทางวิชาการในปี 1853 [ 38 ]ปัวซงตั้งข้อสังเกตว่าหากนำค่าเฉลี่ยของการสังเกตตามการแจกแจงดังกล่าวมา ใช้ ค่า เบี่ยงเบนมาตรฐานจะไม่ลู่เข้าสู่จำนวนจำกัดใดๆ ดังนั้น การใช้ ทฤษฎีบทลิมิตกลางของลาปลาซกับการแจกแจงดังกล่าวจึงไม่เหมาะสม เนื่องจากถือว่ามีค่าเฉลี่ยและความแปรปรวนที่จำกัด อย่างไรก็ตาม ปัวซงไม่ได้มองว่าประเด็นนี้สำคัญ ตรงกันข้ามกับบีเนเมที่คิดว่าการพิจารณาการกระจายตัวแบบนั้นไม่สมจริง และได้โต้แย้งกับโคชีในเรื่องนี้เป็นเวลานาน
ดูเพิ่มเติม
- เที่ยวบินเลวีและกระบวนการเลวี
- การแจกแจงลาปลาสการแปลงฟูริเยร์ของการแจกแจงโคชี
- กระบวนการโคชี
- กระบวนการที่เสถียร
- การแจกจ่ายแบบสแลช
- การจัดจำหน่ายของมอฟแฟต
ลิงก์ภายนอก
- "การแจกแจงแบบโคชี" , สารานุกรมคณิตศาสตร์ , EMS Press , 2001 [1994]
- การใช้งานครั้งแรก: ข้อมูลเกี่ยวกับลำดับการแจกแจงของ Cauchy มีข้อมูลทางประวัติศาสตร์อยู่บ้าง
- ไวส์สไตน์, เอริค ดับเบิลยู. "การแจกแจงโคชี" . MathWorld .
- คู่มืออ้างอิงห้องสมุดวิทยาศาสตร์ GNU – GNU Scientific Library
- อัตราส่วนของตัวแปรปกติ โดย จอร์จ มาร์ซาเกลีย
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การกระจายแบบคอชี
การแจกแจงโคชี (Cauchy distribution ) ซึ่งตั้งชื่อตามออกัสติน-หลุยส์ โคชีเป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องเป็นที่รู้จักกันโดยเฉพาะในหมู่นักฟิสิกส์ว่า การแจกแจงลอเรนซ์ (Lorentz.
สมมาตรแบบหมุน
ถ้าหากยืนอยู่หน้าเส้นและเตะลูกบอลไปในมุมสุ่มที่มีการกระจายอย่างสม่ำเสมอไปยังเส้นนั้น การกระจายของจุดที่ลูกบอลกระทบเส้นจะเป็นการกระจายแบบโคชี (Cauchy distribution)
ฟังก์ชันความหนาแน่นความน่าจะเป็น (PDF)
การแจกแจงโคชีเป็นการแจกแจงความน่าจะเป็นที่มี ฟังก์ชันความหนาแน่นความน่าจะเป็น (PDF) ดังต่อไปนี้ [ 1 ] [ 2 ] เอฟ ( x ; x 0 , γ ) = 1 π γ [ 1 + ( x − x 0 γ ) 2 ] = 1 π [ γ ( x − x 0 ) 2 + γ 2 ] , {\displaystyle f(x;x_{0},\gamma )={\frac {1}{\pi \gamma...
ฟังก์ชันการกระจายสะสม (CDF)
การแจกแจงโคชีเป็นการแจกแจงความน่าจะเป็นที่มี ฟังก์ชันการแจกแจงสะสม (CDF) ดังต่อไปนี้: เอฟ ( x ; x 0 , γ ) = 1 π อาร์คตัน ( x − x 0 γ ) + 1 2 {\displaystyle F(x;x_{0},\gamma )={\frac {1}{\pi }}\arctan \left({\frac {x-x_{0}}{\gamma }}\right)+{\frac {1}{2}}}