กลับไปหน้าบทความ

อ่าน 14 นาที

แบบจำลองเชิงเส้นทั่วไปเวกเตอร์

ในทางสถิติ มีการเสนอ แบบจำลองเชิงเส้นทั่วไปแบบเวกเตอร์ ( VGLMs ) เพื่อขยายขอบเขตของแบบจำลองที่รองรับโดยแบบจำลองเชิงเส้นทั่วไป ( GLMs ) โดยเฉพาะอย่างยิ่ง VGLMs...

แบบจำลองเชิงเส้นทั่วไปเวกเตอร์

ในทางสถิติ มีการเสนอ แบบจำลองเชิงเส้นทั่วไปแบบเวกเตอร์ ( VGLMs ) เพื่อขยายขอบเขตของแบบจำลองที่รองรับโดยแบบจำลองเชิงเส้นทั่วไป ( GLMs ) โดยเฉพาะอย่างยิ่ง VGLMs อนุญาตให้ตัวแปรตอบสนองอยู่นอกเหนือตระกูลเลขชี้กำลัง แบบคลาสสิก และมีพารามิเตอร์มากกว่าหนึ่งตัว แต่ละพารามิเตอร์ (ไม่จำเป็นต้องเป็นค่าเฉลี่ย) สามารถแปลงได้ด้วยฟังก์ชันเชื่อมโยงกรอบงาน VGLM ยังมีขนาดใหญ่พอที่จะรองรับการตอบสนองหลายรายการได้อย่างเป็นธรรมชาติ ซึ่งก็คือการตอบสนองอิสระหลายรายการที่มาจากการแจกแจงทางสถิติเฉพาะ โดยอาจมีค่าพารามิเตอร์ที่แตกต่างกัน

แบบจำลองเชิงเส้นทั่วไปแบบเวกเตอร์ได้รับการอธิบายโดยละเอียดใน Yee (2015) [ 1 ] อัลกอริทึมหลักที่ใช้คือวิธีการถ่วงน้ำหนักกำลังสองน้อยที่สุดแบบวนซ้ำ สำหรับ การประมาณค่า ความน่าจะเป็นสูงสุดของพารามิเตอร์แบบจำลองทั้งหมด โดยเฉพาะอย่างยิ่ง การให้คะแนนของ Fisher ถูกนำมาใช้ในลักษณะดังกล่าว ซึ่งสำหรับแบบจำลองส่วนใหญ่ จะใช้ค่าอนุพันธ์อันดับแรกและอันดับสองที่คาดหวังของฟังก์ชันลอการิทึมความน่าจะเป็น

แรงจูงใจ

โดยพื้นฐานแล้ว GLM ครอบคลุมแบบจำลองพารามิเตอร์เดียวจากตระกูลเอกซ์โพเนนเชียล แบบคลาสสิก และรวมถึงแบบจำลองการถดถอยทางสถิติที่สำคัญที่สุด 3 แบบ ได้แก่ แบบจำลองเชิงเส้น การถดถอยปัวซงสำหรับข้อมูลนับ และการถดถอยโลจิสติกสำหรับข้อมูลตอบสนองแบบไบนารี อย่างไรก็ตาม ตระกูลเอกซ์โพเนนเชียลนั้นมีข้อจำกัดมากเกินไปสำหรับการวิเคราะห์ข้อมูลทั่วไป ตัวอย่างเช่น สำหรับข้อมูลนับ มักพบปัญหาค่าศูนย์มากเกินไป การตัดค่าศูนย์ และการกระจายตัวเกิน และการดัดแปลงแบบชั่วคราวที่ทำกับแบบจำลองทวินามและปัวซงในรูปแบบของแบบจำลองกึ่งทวินามและกึ่งปัวซงนั้นอาจถูกมองว่าเป็นการแก้ปัญหาเฉพาะหน้าและไม่น่าพอใจ แต่กรอบงาน VGLM สามารถจัดการกับแบบจำลองต่างๆ ได้อย่างง่ายดาย เช่น การถดถอย ปัวซงที่มีค่าศูนย์มากเกินไปการถดถอยปัวซงที่เปลี่ยนแปลงค่าศูนย์ (แบบมีอุปสรรค) การถดถอยปัวซงเชิงบวก และ การถดถอยทวินามเชิงลบยกตัวอย่างเช่น สำหรับแบบจำลองเชิงเส้น ความแปรปรวนของการแจกแจงแบบปกติจะถูกลดระดับเป็นพารามิเตอร์มาตราส่วน และมักถูกมองว่าเป็นพารามิเตอร์ที่ไม่พึงประสงค์ (หากนับว่าเป็นพารามิเตอร์เลยก็ตาม) แต่กรอบงาน VGLM อนุญาตให้สร้างแบบจำลองความแปรปรวนโดยใช้ตัวแปรเสริมได้

โดยรวมแล้ว เราอาจมองว่า VGLM เป็น GLM ที่จัดการกับโมเดลหลายแบบนอกเหนือจากตระกูลเอกซ์โปเนนเชียลแบบคลาสสิก และไม่จำกัดอยู่แค่การประมาณค่าเฉลี่ยเพียงค่าเดียว ในระหว่างการประมาณค่า แทนที่จะใช้กำลังสองน้อยที่สุดแบบถ่วงน้ำหนัก ในระหว่าง IRLS เราจะใช้กำลังสองน้อยที่สุดแบบทั่วไปเพื่อจัดการกับความสัมพันธ์ระหว่างตัวทำนายเชิงเส้น M ตัว

ข้อมูลและสัญลักษณ์

เราสมมติว่าการตอบสนองหรือผลลัพธ์หรือตัวแปรตาม (หรือตัวแปรตามหลายตัว) นั้นถูกสร้างขึ้นจากแบบจำลองการแจกแจง แบบใดแบบหนึ่ง การแจกแจงส่วนใหญ่เป็นแบบเอกตัวแปร ดังนั้นและตัวอย่างหนึ่งของ การแจกแจงแบบเอกตัวแปร คือการแจกแจงปกติแบบทวิตัวแปร

บางครั้งเราเขียนข้อมูลของเราใน รูปแบบโดยแต่ละการสังเกตทั้งn ครั้ง ถือว่าเป็นอิสระต่อกัน ดังนั้น โดยที่คือค่าน้ำหนักก่อนหน้าที่เป็นบวกที่ทราบแล้ว และมักจะเป็น

ตัวแปรอธิบายหรือตัวแปรอิสระจะเขียนเป็นหรือเมื่อจำเป็นต้องใช้i ก็จะเขียนเป็น โดยปกติจะมีค่าคงที่ซึ่งในกรณีนี้ จะ เป็น หรือ

อันที่จริงแล้ว เฟรมเวิร์ก VGLM อนุญาตให้มี การตอบสนอง S ครั้งโดยแต่ละครั้งมีมิติในตัวอย่างข้างต้นS  = 1 ดังนั้นมิติของ จึงโดยทั่วไปแล้วคือเราจัดการกับ การตอบสนอง S ครั้ง ด้วยโค้ด เช่นสำหรับS  = 3 เพื่อความง่าย ในบทความนี้ส่วนใหญ่จึงใช้S  = 1 vglm(cbind(y1, y2, y3) ~ x2 + x3, ..., data = mydata)

ส่วนประกอบของโมเดล

โดยทั่วไป VGLM จะประกอบด้วยองค์ประกอบสี่อย่าง:

1. ฟังก์ชันความหนาแน่นความน่าจะเป็นหรือฟังก์ชันมวลความน่าจะเป็นจากแบบจำลองทางสถิติบางแบบ ซึ่งสามารถคำนวณค่าลอการิทึมความน่าจะเป็นอนุพันธ์อันดับแรกและเมทริกซ์ข้อมูลที่คาดหวังได้ โดยแบบจำลองดังกล่าวต้องเป็นไปตามเงื่อนไขความสม่ำเสมอของ MLEทั่วไป
2. ใช้ตัวทำนายเชิงเส้นที่อธิบายไว้ด้านล่างเพื่อสร้างแบบจำลองสำหรับแต่ละพารามิเตอร์
3. เชื่อมโยงฟังก์ชันต่างๆ เข้าด้วยกัน โดยที่
4. เมทริกซ์ข้อจำกัด สำหรับแต่ละคอลัมน์ที่มีอันดับเต็มและทราบค่าแล้ว

ตัวทำนายเชิงเส้น

ตัวทำนายเชิงเส้นแต่ละตัวเป็นปริมาณที่รวมข้อมูลเกี่ยวกับตัวแปรอิสระเข้าไว้ในแบบจำลอง สัญลักษณ์( ภาษากรีก " eta ") แทนตัวทำนายเชิงเส้น และใช้ ตัวห้อย j เพื่อระบุตัวทำนายลำดับที่ jมันเชื่อมโยง พารามิเตอร์ลำดับที่ jกับตัวแปรอธิบาย และ แสดงออกมาในรูปของการรวม เชิง เส้น (ดังนั้นจึงเรียกว่า "เชิงเส้น") ของพารามิเตอร์ที่ไม่ทราบค่า กล่าว คือ ของสัมประสิทธิ์การถดถอย

พารามิเตอร์ที่jของการแจกแจงนั้นขึ้นอยู่กับตัวแปรอิสระผ่านทาง

ให้เป็นเวกเตอร์ของตัวทำนายเชิงเส้นทั้งหมด (เพื่อความสะดวก เราจะให้ มีมิติM เสมอ ) ดังนั้นตัวแปรอิสระทั้งหมด ที่ประกอบขึ้นเป็น อาจส่งผลต่อพารามิเตอร์ทั้งหมด ผ่านทางตัวทำนายเชิงเส้น ต่อมา เราจะอนุญาตให้ตัวทำนายเชิงเส้นถูกขยายไปเป็นตัวทำนายแบบบวก ซึ่งเป็นผลรวมของฟังก์ชันเรียบของแต่ละตัวและแต่ละฟังก์ชันจะถูกประมาณจากข้อมูล

ฟังก์ชันเชื่อมโยงแต่ละฟังก์ชันแสดงความสัมพันธ์ระหว่างตัวทำนายเชิงเส้นและพารามิเตอร์ของการแจกแจง มีฟังก์ชันเชื่อมโยงที่ใช้กันทั่วไปหลายฟังก์ชัน และการเลือกใช้อาจค่อนข้างเป็นไปตามอำเภอใจ ควรพยายามจับคู่โดเมนของฟังก์ชันเชื่อมโยงกับช่วงของค่าพารามิเตอร์ของการแจกแจง โปรดสังเกตว่าข้างต้นอนุญาตให้ใช้ฟังก์ชันเชื่อมโยงที่แตกต่างกันสำหรับแต่ละพารามิเตอร์ ฟังก์ชันเหล่านี้มีคุณสมบัติคล้ายกับแบบจำลองเชิงเส้นทั่วไปตัวอย่างเช่น ฟังก์ชันเชื่อมโยงที่ใช้กันทั่วไป ได้แก่ ฟังก์ชัน เชื่อมโยง logitสำหรับพารามิเตอร์ในช่วงและ ฟังก์ชันเชื่อมโยง logสำหรับพารามิเตอร์ที่เป็นบวกแพ็กเกจนี้มีฟังก์ชันสำหรับพารามิเตอร์ที่สามารถรับค่าได้ทั้งบวกและลบ VGAMidentitylink()

เมทริกซ์ข้อจำกัด

โดยทั่วไปแล้ว กรอบงาน VGLM อนุญาตให้มีข้อจำกัดเชิงเส้นใดๆ ระหว่างสัมประสิทธิ์การถดถอยของตัวทำนายเชิงเส้นแต่ละตัว ตัวอย่างเช่น เราอาจต้องการกำหนดให้บางตัวเท่ากับ 0 หรือกำหนดให้บางตัวเท่ากัน เรามี

โดยที่คือเมทริกซ์ข้อจำกัดแต่ละเมทริกซ์ข้อจำกัดเป็นที่ทราบและกำหนดไว้ล่วงหน้า มีMแถว และระหว่าง 1 ถึงMคอลัมน์ องค์ประกอบของเมทริกซ์ข้อจำกัดมีค่าจำกัด และมักจะเป็น 0 หรือ 1 เท่านั้น ตัวอย่างเช่น ค่า 0 หมายถึงการละเว้นองค์ประกอบนั้น ในขณะที่ค่า 1 หมายถึงการรวมองค์ประกอบนั้น เป็นเรื่องปกติที่บางแบบจำลองจะมี สมมติฐานเรื่อง ความขนานซึ่งหมายความว่า สำหรับและสำหรับบางแบบจำลอง สำหรับด้วยเช่นกัน กรณีพิเศษเมื่อสำหรับทุกเรียกว่าข้อจำกัดที่ไม่สำคัญสัมประสิทธิ์การถดถอยทั้งหมดได้รับการประมาณค่าและไม่มีความสัมพันธ์กัน และเรียกว่า พารามิเตอร์ ที่มีค่าคงที่เท่านั้นหาก แถวที่ jของ ทั้งหมดเท่ากับสำหรับ กล่าว คือ เท่ากับค่าคงที่เท่านั้น ดังนั้นพารามิเตอร์ที่มีค่าคงที่เท่านั้นจึงถูกจำลองอย่างง่ายที่สุดเท่าที่จะเป็นไปได้ในรูปของค่าสเกลาร์

โดยทั่วไปแล้ว พารามิเตอร์ที่ไม่ทราบค่าจะถูกประมาณค่าโดยใช้วิธีความน่าจะเป็นสูงสุดสัมประสิทธิ์การถดถอยทั้งหมดสามารถนำมาใส่ในเมทริกซ์ได้ดังนี้:

สิ่งอำนวยความสะดวก xij

โดยทั่วไปแล้ว เราสามารถอนุญาตให้ค่าของตัวแปร มีค่าแตกต่างกันได้สำหรับแต่ละกรณีตัวอย่างเช่น หากตัวทำนายเชิงเส้นแต่ละตัวใช้สำหรับจุดเวลาที่แตกต่างกัน เราอาจมีตัวแปรเสริมที่เปลี่ยนแปลงตามเวลา ตัวอย่างเช่น ในแบบจำลองการเลือกแบบไม่ต่อเนื่องเรามี แบบจำลองโลจิต แบบ มีเงื่อนไข แบบจำลอง โลจิตแบบ ซ้อน แบบจำลองโลจิต แบบทั่วไปและอื่นๆ เพื่อแยกแยะความแตกต่างระหว่างตัวแปรต่างๆ และปรับแบบจำลองโลจิตแบบหลายตัวเลือกให้เหมาะสมกับ เช่น การเลือกวิธีการเดินทาง ตัวแปรเช่นต้นทุนจะแตกต่างกันไปขึ้นอยู่กับตัวเลือก ตัวอย่างเช่น แท็กซี่แพงกว่ารถบัส ซึ่งแพงกว่าการเดิน ความสามารถของแบบจำลองนี้ช่วยให้เราสามารถสรุปเป็นแบบจำลอง ทั่วไปได้ xijVGAM

สูตรทั่วไปที่สุดคือ

ในที่นี้คือค่าชดเชย ที่ไม่บังคับ ซึ่ง ในทางปฏิบัติจะแปลงเป็น เมทริกซ์ แพ็กเกจนี้มีอาร์กิวเมนต์ที่อนุญาตให้ป้อนองค์ประกอบที่ต่อเนื่องกันของเมทริกซ์แนวทแยงได้ VGAMxij

ซอฟต์แวร์

Yee (2015) [ 1 ]อธิบาย การใช้งานแพ็กเกจ Rที่เรียกว่า VGAM [ 2 ] ปัจจุบันซอฟต์แวร์นี้รองรับโมเดล/การแจกแจงประมาณ 150 แบบ ฟังก์ชันการสร้างแบบจำลองหลักคือvglm()และvgam()อาร์กิวเมนต์familyจะถูกกำหนดให้กับฟังก์ชันตระกูล VGAMเช่นfamily = negbinomialสำหรับการถดถอย แบบ ทวินามเชิงลบfamily = poissonffสำหรับการ ถดถอย แบบปัวซองfamily = propoddsสำหรับโมเดลสัดส่วนคี่หรือ โมเดลโลจิตสะสมสำหรับการถดถอยเชิงหมวดหมู่แบบเรียงลำดับ

การติดตั้ง

ความน่าจะเป็นสูงสุด

เรากำลังเพิ่มค่าลอการิทึมความน่าจะเป็นให้สูงสุด

โดยที่ค่าน้ำหนักก่อนหน้าเป็นค่าบวกและทราบค่าอยู่ แล้ว สามารถหาค่าประมาณความน่าจะเป็นสูงสุดได้โดยใช้อัลก อริทึม กำลังสองน้อยที่สุดแบบถ่วงน้ำหนักซ้ำๆ โดย ใช้ วิธี การให้คะแนนของฟิชเชอร์พร้อมการอัปเดตในรูปแบบ:

เมทริก ซ์ ข้อมูลของฟิชเชอร์ในการวนซ้ำครั้งที่aอยู่ที่ไหนเรียกอีกอย่างว่าเมทริกซ์ข้อมูลที่คาดหวังหรือEIM

วีแอลเอ็ม

สำหรับการคำนวณเมทริกซ์แบบจำลอง (ขนาดเล็ก) ที่สร้างขึ้นจากด้านขวาของสูตรในvglm() และเมทริกซ์ข้อจำกัดจะถูกรวมเข้าด้วยกันเพื่อสร้าง เมทริกซ์แบบจำลองขนาด ใหญ่ จาก นั้นจึงใช้ IRLS กับ เมทริกซ์ X ขนาดใหญ่ นี้ เมทริกซ์นี้เรียกว่าเมทริกซ์ VLM เนื่องจากแบบจำลองเชิงเส้นเวกเตอร์เป็นปัญหาการหาค่ากำลังสองน้อยที่สุดพื้นฐานที่กำลังแก้ไข VLM คือการถดถอยหลายตัวแปรแบบถ่วงน้ำหนัก โดยที่เมทริกซ์ความแปรปรวนร่วมสำหรับแต่ละแถวของเมทริกซ์การตอบสนองไม่จำเป็นต้องเหมือนกัน และเป็นที่ทราบ (ในการถดถอยหลายตัวแปรแบบคลาสสิก ข้อผิดพลาดทั้งหมดมีเมทริกซ์ความแปรปรวนร่วมเดียวกัน และไม่ทราบค่า) โดยเฉพาะอย่างยิ่ง VLM จะลดผลรวมกำลังสองแบบถ่วงน้ำหนักให้เหลือน้อยที่สุด

ปริมาณนี้จะถูกทำให้มีค่าน้อยที่สุดในแต่ละรอบการทำซ้ำของ IRLS การตอบสนองในการทำงาน (หรือที่เรียกว่าการตอบสนองเทียมและเวกเตอร์ขึ้นอยู่แบบปรับแล้ว ) คือ

โดยที่ค่าเหล่านี้เรียกว่าค่าน้ำหนักการทำงานหรือเมทริกซ์ค่าน้ำหนักการทำงานเมทริกซ์เหล่านี้สมมาตรและเป็นบวกแน่นอน การใช้ EIM ช่วยให้มั่นใจได้ว่าค่าเหล่านี้ทั้งหมดเป็นบวกแน่นอน (ไม่ใช่แค่ผลรวมของค่าเหล่านั้น) ในพื้นที่พารามิเตอร์ส่วนใหญ่ ในทางตรงกันข้าม การใช้ Newton–Raphson จะหมายความว่าจะใช้เมทริกซ์ข้อมูลที่สังเกตได้ ซึ่งมักจะเป็นบวกแน่นอนในส่วนย่อยที่เล็กกว่าของพื้นที่พารามิเตอร์

ในทางคอมพิวเตอร์การแยกส่วนแบบ Choleskyถูกนำมาใช้เพื่อผกผันเมทริกซ์น้ำหนักการทำงาน และแปลง ปัญหา การหาค่ากำลังสองน้อยที่สุดแบบทั่วไปโดยรวมให้เป็นปัญหา การหาค่ากำลังสองน้อยที่สุดแบบธรรมดา

ตัวอย่าง

แบบจำลองเชิงเส้นทั่วไป

แน่นอนว่าแบบจำลองเชิงเส้นทั่วไป ทั้งหมด เป็นกรณีพิเศษของ VGLM แต่เรามักจะประมาณค่าพารามิเตอร์ทั้งหมดโดยใช้ การประมาณ ค่าความน่าจะเป็นสูงสุด แบบเต็มรูป แบบ แทนที่จะใช้วิธีโมเมนต์สำหรับพารามิเตอร์มาตราส่วน

การตอบสนองเชิงหมวดหมู่แบบเรียงลำดับ

หากตัวแปรตอบสนองเป็นการวัดเชิงลำดับที่มีM  + 1 ระดับเราสามารถใช้ฟังก์ชันแบบจำลองในรูปแบบต่อไปนี้ได้:

  ที่ไหน

สำหรับ ลิงก์g ที่แตกต่างกัน จะนำไปสู่แบบจำลองอัตราส่วนความน่าจะเป็นแบบสัดส่วนหรือ แบบจำลอง โพรบิตแบบเรียงลำดับตัวอย่างเช่นฟังก์ชันตระกูลจะกำหนดลิงก์โพรบิตให้กับความน่าจะเป็นสะสม ดังนั้นแบบจำลองนี้จึงเรียกว่าแบบจำลองโพรบิตสะสมโดยทั่วไปแล้วจะเรียกว่า แบบ จำลอง ลิงก์สะสมVGAMcumulative(link = probit)

สำหรับการแจกแจงแบบหมวดหมู่และการแจกแจงแบบพหุนาม ค่าที่ได้จากการประมาณจะเป็นเวกเตอร์ความน่าจะเป็นขนาด ( M  + 1) โดยมีคุณสมบัติว่าผลรวมของความน่าจะเป็นทั้งหมดเท่ากับ 1 ความน่าจะเป็นแต่ละค่าแสดงถึงโอกาสที่จะเกิดค่าใดค่าหนึ่งจาก ค่าที่เป็นไปได้ M  + 1 ค่า

การตอบสนองเชิงหมวดหมู่ที่ไม่เรียงลำดับ

หากตัวแปรตอบสนองเป็นการวัดเชิงนามหรือข้อมูลไม่เป็นไปตามข้อสมมติของแบบจำลองเชิงลำดับ เราอาจใช้แบบจำลองในรูปแบบต่อไปนี้:

ลิงก์ข้างต้นบางครั้งเรียกว่า ลิงก์ มัลติโลจิตและแบบจำลองนี้เรียกว่า แบบจำลอง โลจิตแบบหลายตัว เลือก โดยทั่วไปมักเลือกใช้ระดับแรกหรือระดับสุดท้ายของการตอบสนองเป็น กลุ่ม อ้างอิงหรือ กลุ่ม พื้นฐานในตัวอย่างข้างต้นใช้ระดับสุดท้ายฟังก์ชันตระกูล (family function) เหมาะสมกับแบบจำลองข้างต้น และมีอาร์กิวเมนต์ที่สามารถกำหนดระดับที่ใช้เป็นกลุ่มอ้างอิงได้ VGAMmultinomial()refLevel

นับข้อมูล

ทฤษฎี GLM แบบคลาสสิกใช้การถดถอยแบบปัวซงสำหรับข้อมูลนับจำนวนโดยทั่วไปแล้ว ตัวแปรเชื่อมโยงจะเป็นลอการิทึม ซึ่งเรียกว่าตัวแปรเชื่อมโยงแบบแคนอนิกฟังก์ชันความแปรปรวนจะเป็นสัดส่วนกับค่าเฉลี่ย:

โดยปกติแล้ว ค่าพารามิเตอร์การกระจายจะถูกกำหนดให้คงที่ที่หนึ่ง หากค่าไม่เป็นเช่นนั้น แบบจำลอง ความน่าจะเป็นเสมือน ที่ได้ มักจะถูกอธิบายว่าเป็นแบบจำลองปัวซงที่มีการกระจายเกินหรือแบบจำลองปัวซงเสมือนและโดยทั่วไปจะประมาณค่าโดยใช้วิธีโมเมนต์ ดังนั้นจึงเป็นการยากที่จะหา ช่วงความเชื่อมั่นสำหรับค่าดังกล่าว

ในทางตรงกันข้าม VGLM นำเสนอแบบจำลองที่หลากหลายกว่ามากในการจัดการกับความแปรปรวนที่มากเกินไปเมื่อเทียบกับการแจกแจงปัวซง เช่น การแจกแจง ทวินามเชิงลบและรูปแบบต่างๆ ของการแจกแจงดังกล่าว แบบจำลองการถดถอยเชิงนับอีกแบบหนึ่งคือ การแจกแจง ปัวซงแบบทั่วไปแบบจำลองอื่นๆ ที่เป็นไปได้ ได้แก่ การแจกแจงซีตาและการแจกแจงซิปฟ์

ส่วนขยาย

แบบจำลองเชิงเส้นทั่วไปเวกเตอร์อันดับลด

RR-VGLM คือ VGLM ที่ส่วนย่อยของ เมทริกซ์ Bมีอันดับต่ำกว่าโดยไม่เสียความเป็นทั่วไป สมมติว่าเป็นการแบ่งส่วนของเวกเตอร์ตัวแปรอิสระ ดังนั้นส่วนของ เมทริกซ์ Bที่สอดคล้องกับจะอยู่ในรูปแบบโดยที่และ เป็นเมทริกซ์บาง (กล่าวคือ มีRคอลัมน์) เช่น เวกเตอร์ ถ้าอันดับR  = 1 RR-VGLM มีข้อดีหลายประการเมื่อนำไปใช้กับแบบจำลองและชุดข้อมูลบางประเภท ประการแรก ถ้าMและpมีขนาดใหญ่ จำนวนสัมประสิทธิ์การถดถอยที่ประมาณโดย VGLM จะมีขนาดใหญ่ ( ) ดังนั้น RR-VGLM สามารถลดจำนวนสัมประสิทธิ์การถดถอยที่ประมาณได้อย่างมาก ถ้าRมีค่าต่ำ เช่นR  = 1 หรือR  = 2 ตัวอย่างของแบบจำลองที่สิ่งนี้มีประโยชน์เป็นพิเศษคือแบบจำลองโลจิตหลายตัวเลือก RR หรือที่รู้จักกันในชื่อแบบจำลองสเตอริโอไทป์ประการที่สอง เป็น เวกเตอร์ Rของตัวแปรแฝงและมักจะสามารถตีความได้อย่างมีประโยชน์ ถ้าR  = 1 เราสามารถเขียนได้ ว่าตัวแปรแฝงประกอบด้วยค่าสัมประสิทธิ์การถ่วงน้ำหนักของตัวแปรอธิบาย จะเห็นได้ว่า RR-VGLM ใช้การรวมเชิงเส้นที่เหมาะสมที่สุดของตัวแปรแฝง จากนั้น จึงทำการปรับ VGLM ให้เข้ากับตัวแปรอธิบาย ประการที่สามสามารถสร้างbiplot ได้ถ้า R  = 2 ซึ่งช่วยให้สามารถมองเห็นแบบจำลองได้

สามารถแสดงได้ว่า RR-VGLM นั้นก็คือ VGLM ที่มีเมทริกซ์ข้อจำกัดสำหรับตัวแปรในนั้นไม่ทราบค่าและต้องได้รับการประมาณค่า จากนั้นจึงปรากฏว่าสำหรับตัวแปรดังกล่าว RR-VGLM สามารถประมาณค่าได้ด้วย อัลกอริทึม แบบสลับกันซึ่งจะกำหนดค่า และประมาณค่าจากนั้นกำหนดค่าและประมาณค่าเป็นต้น

ในทางปฏิบัติ จำเป็นต้องมีข้อจำกัดเฉพาะบางประการสำหรับ และ/หรือในฟังก์ชันจะใช้ข้อจำกัดมุมตามค่าเริ่มต้น ซึ่งหมายความว่า แถว R แถวบนสุด ของจะถูกตั้งค่าเป็นRR-VGLM ได้รับการเสนอในปี 2546 [ 3 ]VGAMrrvglm()

สองต่อหนึ่ง

กรณีพิเศษของ RR-VGLM คือเมื่อR  = 1 และM  = 2 ซึ่งเป็นการลดมิติจาก 2 พารามิเตอร์เหลือ 1 พารามิเตอร์ จากนั้นสามารถแสดงได้ว่า

โดยที่องค์ประกอบและได้รับการประมาณค่า ในทำนองเดียวกัน

สูตรนี้ให้การเชื่อมโยงระหว่างและโดยจะสร้างความสัมพันธ์ระหว่างพารามิเตอร์สองตัวของแบบจำลอง ซึ่งอาจมีประโยชน์ เช่น สำหรับการสร้างแบบจำลองความสัมพันธ์ระหว่างค่าเฉลี่ยและความแปรปรวน บางครั้งอาจมีการเลือกฟังก์ชันเชื่อมโยง ดังนั้นจึงมีความยืดหยุ่นเล็กน้อยในการเชื่อมโยงพารามิเตอร์สองตัว เช่น ฟังก์ชัน logit, probit, cauchit หรือ cloglog สำหรับพารามิเตอร์ในช่วงหน่วย สูตรข้างต้นมีประโยชน์อย่างยิ่งสำหรับการ แจกแจงแบบทวินามเชิงลบ (negative binomial distribution ) ดังนั้น RR-NB จึงมีฟังก์ชันความแปรปรวน

นักวิจัยบางท่านเรียกวิธีการนี้ว่า รูปแบบ NB-P โดยสามารถประมาณค่า และได้ และยังสามารถหาช่วงความเชื่อมั่นโดยประมาณสำหรับค่าเหล่านั้นได้ด้วย

นอกจากนี้ ยังสามารถปรับ NB รูปแบบอื่นๆ ที่มีประโยชน์อีกหลายรูปแบบได้ด้วยความช่วยเหลือจากการเลือกเมทริกซ์ข้อจำกัดที่เหมาะสม ตัวอย่างเช่นNB  − 1, NB  − 2 ( negbinomial()ค่าเริ่มต้น), NB  −  Hดู Yee (2014) [ 4 ]และตาราง 11.3 ของ Yee (2015) [ 1 ]

RCIMs

นอกจากนี้ ยังมีการเสนอแบบจำลองปฏิสัมพันธ์ระหว่างแถวและคอลัมน์ (RCIMs) ซึ่งเป็นแบบจำลอง RR-VGLM ประเภทพิเศษ RCIMs ใช้ได้เฉพาะกับเมทริกซ์ Y เท่านั้น และไม่มีตัวแปรอธิบายที่ระบุไว้อย่างชัดเจนแต่จะมีการกำหนดตัวแปรบ่งชี้สำหรับแต่ละแถวและคอลัมน์อย่างชัดเจน และอนุญาตให้มีปฏิสัมพันธ์ลำดับR ในรูปแบบ ที่กำหนด กรณีพิเศษของแบบจำลองประเภทนี้ ได้แก่แบบจำลองความสัมพันธ์ RC ของ Goodman และระเบียบวิธีความแปรปรวนแบบกึ่งๆ ตามที่นำไปใช้ในแพ็กเกจ R qvcalc

RCIMs สามารถนิยามได้ว่าเป็น RR-VGLM ที่นำไปใช้กับYโดยมีเงื่อนไขดังนี้

สำหรับแบบจำลองความสัมพันธ์แบบ Goodman RC เราจะได้ว่า ถ้าR  = 0 แสดงว่าเป็นการถดถอยแบบปัวซงที่เหมาะสมกับเมทริกซ์ของจำนวนนับที่มีผลกระทบตามแถวและคอลัมน์ ซึ่งมีแนวคิดคล้ายกับแบบจำลอง ANOVA สองทางที่ไม่มีปฏิสัมพันธ์

อีกตัวอย่างหนึ่งของ RCIM คือ ถ้าเป็นฟังก์ชันเชื่อมโยงเอกลักษณ์ และพารามิเตอร์ คือค่ามัธยฐาน และแบบจำลองสอดคล้องกับการแจกแจงแบบลาปลาสที่ไม่สมมาตร RCIM ที่ไม่มีปฏิสัมพันธ์จะคล้ายกับเทคนิคที่เรียกว่า การขัดเงาค่ามัธยฐาน (median polish )

ในVGAMฟังก์ชันrcim()และgrc()เหมาะกับโมเดลข้างต้น นอกจากนี้ Yee และ Hadi (2014) [ 5 ] ยังแสดงให้เห็นว่า RCIMs สามารถใช้เพื่อปรับโมเดลการเรียงลำดับกำลังสองที่ไม่จำกัดให้เข้ากับข้อมูลชนิดพันธุ์ได้ นี่เป็นตัวอย่างของ การวิเคราะห์การไล่ระดับ ทางอ้อมใน การเรียงลำดับ (หัวข้อหนึ่งในนิเวศวิทยาเชิงสถิติ)

แบบจำลองเสริมทั่วไปเวกเตอร์

แบบจำลองเสริมทั่วไปแบบเวกเตอร์ (VGAMs) เป็นส่วนขยายที่สำคัญของแบบจำลองเสริมทั่วไปแบบเวกเตอร์ (VGLMs) โดยที่ตัวทำนายเชิงเส้นไม่จำเป็นต้องเป็นเชิงเส้นในตัวแปรอิสระแต่เป็นผลรวมของฟังก์ชันปรับเรียบที่ใช้กับตัวแปรอิสระ

โดยที่ตัวทำนายแบบบวกM เหล่านี้ฟังก์ชันเรียบแต่ละฟังก์ชันได้รับการประมาณจากข้อมูล ดังนั้น VGLM จึงขับเคลื่อนด้วยแบบจำลองในขณะที่ VGAM ขับเคลื่อนด้วยข้อมูลปัจจุบัน มีเพียงสปลายเรียบเท่านั้นที่ถูกนำมาใช้ในแพ็กเกจ สำหรับM  > 1 สปลายเรียบเหล่านี้จะเป็นเวกเตอร์สปลายซึ่งประมาณฟังก์ชันส่วนประกอบพร้อมกัน แน่นอนว่าเราสามารถใช้สปลายถดถอยกับ VGLM ได้ แรงจูงใจเบื้องหลัง VGAM คล้ายกับของ Hastie และ Tibshirani (1990) [ 6 ] และ Wood (2017) [ 7 ] VGAM ได้รับการเสนอในปี 1996 [ 8 ]VGAM

ปัจจุบันมีการดำเนินการเพื่อประมาณค่า VGAM โดยใช้P-splines ของ Eilers และ Marx (1996) [ 9 ] ซึ่งช่วยให้มีข้อดีหลายประการเหนือการใช้smoothing splinesและ vector backfittingเช่น ความสามารถในการเลือกพารามิเตอร์การปรับเรียบอัตโนมัติได้ง่ายขึ้น

แบบจำลองเชิงเส้นทั่วไปเวกเตอร์ลดอันดับกำลังสอง

วิธีการนี้จะเพิ่มฟังก์ชันกำลังสองของตัวแปรแฝงเข้าไปในคลาส RR-VGLM ผลลัพธ์ที่ได้คือเส้นโค้งรูปทรงระฆังที่สามารถปรับให้เข้ากับการตอบสนองแต่ละครั้งได้ โดยเป็นฟังก์ชันของตัวแปรแฝง สำหรับR  = 2 จะได้พื้นผิวรูปทรงระฆังเป็นฟังก์ชันของตัวแปรแฝง 2 ตัว ซึ่งคล้ายกับ การแจกแจงปกติแบบสองตัวแปร การประยุกต์ใช้ QRR-VGLM เฉพาะด้านสามารถพบได้ในนิเวศวิทยาในสาขาการวิเคราะห์หลายตัวแปรที่เรียกว่า การจัดเรียงลำดับ (ordination )

ตัวอย่างเฉพาะเจาะจงอันดับ 1 ของ QRR-VGLM คือ ข้อมูลปัวซงที่มีSชนิดพันธุ์ แบบจำลองสำหรับชนิดพันธุ์sคือการถดถอยปัวซง

สำหรับการกำหนดพารามิเตอร์ทางด้านขวาสุดซึ่งใช้สัญลักษณ์นั้นมีความหมายทางนิเวศวิทยาเป็นพิเศษ เพราะสัญลักษณ์เหล่านั้นเกี่ยวข้องกับความอุดม สมบูรณ์ของชนิดพันธุ์ ค่าที่เหมาะสมที่สุดและค่าความทนทานตามลำดับ ตัวอย่างเช่น ความทนทานเป็นการวัดความกว้างของนิเวศวิทยา และค่ามากหมายความว่าชนิดพันธุ์นั้นสามารถอาศัยอยู่ในสภาพแวดล้อมที่หลากหลาย ในสมการข้างต้น เราต้องการเพื่อให้ได้เส้นโค้งรูปทรงระฆัง

QRR-VGLMs เหมาะสมกับแบบจำลองการจัดเรียงแบบเกาส์เซียนโดยการประมาณค่าความน่าจะเป็นสูงสุด และเป็นตัวอย่างของการวิเคราะห์ความชันโดยตรงฟังก์ชันcqo()ในVGAMแพ็กเกจปัจจุบันเรียกใช้optim()เพื่อค้นหาค่าที่เหมาะสมที่สุด และเมื่อได้ค่าดังกล่าวแล้ว ก็สามารถคำนวณคะแนนไซต์และปรับแบบจำลองเชิงเส้นทั่วไป ที่เหมาะสม กับค่านั้นได้อย่างง่ายดาย ฟังก์ชันนี้ตั้งชื่อตามตัวย่อ CQO ซึ่งย่อมาจาก constrained quadratic ordination : constrainedหมายถึงการวิเคราะห์ความชันโดยตรง (มีตัวแปรสิ่งแวดล้อม และการรวมเชิงเส้นของตัวแปรเหล่านี้ถูกนำมาใช้เป็นตัวแปรแฝง) และquadraticหมายถึงรูปแบบกำลังสองในตัวแปรแฝง บนมาตราส่วน น่าเสียดายที่ QRR-VGLMs มีความไวต่อค่าผิดปกติทั้งในตัวแปรตอบสนองและตัวแปรอธิบาย รวมทั้งมีค่าใช้จ่ายในการคำนวณสูง และอาจให้ผลลัพธ์เฉพาะที่มากกว่าผลลัพธ์โดยรวม QRR-VGLMs ได้รับการเสนอในปี 2004 [ 10 ]

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • ฮิลเบ, โจเซฟ (2011). การถดถอยแบบทวินามเชิงลบ (ฉบับที่ 2). เคมบริดจ์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์. ISBN 978-0-521-19815-8.{{cite book}}: CS1 maint: publisher location (link)
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Vector_generalized_linear_model&oldid=1326522064 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ แบบจำลองเชิงเส้นทั่วไปเวกเตอร์

ในทางสถิติ มีการเสนอ แบบจำลองเชิงเส้นทั่วไปแบบเวกเตอร์ ( VGLMs ) เพื่อขยายขอบเขตของแบบจำลองที่รองรับโดยแบบจำลองเชิงเส้นทั่วไป ( GLMs ) โดยเฉพาะอย่างยิ่ง VGLMs...

แรงจูงใจ

โดยพื้นฐานแล้ว GLM ครอบคลุมแบบจำลองพารามิเตอร์เดียวจาก ตระกูลเอกซ์โพเนนเชียล แบบคลาสสิก และรวมถึงแบบจำลองการถดถอยทางสถิติที่สำคัญที่สุด 3 แบบ ได้แก่ แบบจำลองเชิงเส้น การถดถอยปัวซงสำหรับข้อมูลนับ และการถดถอยโลจิสติกสำหรับข้อมูลตอบสนองแบบไบนารี อย่างไรก็ตาม...

ข้อมูลและสัญลักษณ์

เราสมมติว่าการตอบสนองหรือผลลัพธ์หรือ ตัวแปรตาม (หรือตัวแปรตามหลายตัว) นั้นถูกสร้างขึ้นจากแบบจำลอง การแจกแจง แบบใดแบบหนึ่ง การแจกแจงส่วนใหญ่เป็นแบบเอกตัวแปร ดังนั้นและตัวอย่างหนึ่งของ การแจกแจงแบบเอกตัวแปร คือการแจกแจงปกติแบบทวิตัวแปร y = ( y 1 , … , y คิว 1 )...

ส่วนประกอบของโมเดล

โดยทั่วไป VGLM จะประกอบด้วยองค์ประกอบสี่อย่าง: