แบบจำลองเชิงเส้นทั่วไปเวกเตอร์

ในทางสถิติ มีการเสนอ แบบจำลองเชิงเส้นทั่วไปแบบเวกเตอร์ ( VGLMs ) เพื่อขยายขอบเขตของแบบจำลองที่รองรับโดยแบบจำลองเชิงเส้นทั่วไป ( GLMs ) โดยเฉพาะอย่างยิ่ง VGLMs อนุญาตให้ตัวแปรตอบสนองอยู่นอกเหนือตระกูลเลขชี้กำลัง แบบคลาสสิก และมีพารามิเตอร์มากกว่าหนึ่งตัว แต่ละพารามิเตอร์ (ไม่จำเป็นต้องเป็นค่าเฉลี่ย) สามารถแปลงได้ด้วยฟังก์ชันเชื่อมโยงกรอบงาน VGLM ยังมีขนาดใหญ่พอที่จะรองรับการตอบสนองหลายรายการได้อย่างเป็นธรรมชาติ ซึ่งก็คือการตอบสนองอิสระหลายรายการที่มาจากการแจกแจงทางสถิติเฉพาะ โดยอาจมีค่าพารามิเตอร์ที่แตกต่างกัน

แบบจำลองเชิงเส้นทั่วไปแบบเวกเตอร์ได้รับการอธิบายโดยละเอียดใน Yee (2015) ^{[ 1 ]} อัลกอริทึมหลักที่ใช้คือวิธีการ ถ่วงน้ำหนักกำลังสองน้อยที่สุดแบบวนซ้ำ สำหรับ การประมาณค่า ความน่าจะเป็นสูงสุดของพารามิเตอร์แบบจำลองทั้งหมด โดยเฉพาะอย่างยิ่ง การให้คะแนนของ Fisher ถูกนำมาใช้ในลักษณะดังกล่าว ซึ่งสำหรับแบบจำลองส่วนใหญ่ จะใช้ค่าอนุพันธ์อันดับแรกและอันดับสองที่คาดหวังของฟังก์ชันลอการิทึมความน่าจะเป็น

แรงจูงใจ

โดยพื้นฐานแล้ว GLM ครอบคลุมแบบจำลองพารามิเตอร์เดียวจากตระกูลเอกซ์โพเนนเชียล แบบคลาสสิก และรวมถึงแบบจำลองการถดถอยทางสถิติที่สำคัญที่สุด 3 แบบ ได้แก่ แบบจำลองเชิงเส้น การถดถอยปัวซงสำหรับข้อมูลนับ และการถดถอยโลจิสติกสำหรับข้อมูลตอบสนองแบบไบนารี อย่างไรก็ตาม ตระกูลเอกซ์โพเนนเชียลนั้นมีข้อจำกัดมากเกินไปสำหรับการวิเคราะห์ข้อมูลทั่วไป ตัวอย่างเช่น สำหรับข้อมูลนับ มักพบปัญหาค่าศูนย์มากเกินไป การตัดค่าศูนย์ และการกระจายตัวเกิน และการดัดแปลงแบบชั่วคราวที่ทำกับแบบจำลองทวินามและปัวซงในรูปแบบของแบบจำลองกึ่งทวินามและกึ่งปัวซงนั้นอาจถูกมองว่าเป็นการแก้ปัญหาเฉพาะหน้าและไม่น่าพอใจ แต่กรอบงาน VGLM สามารถจัดการกับแบบจำลองต่างๆ ได้อย่างง่ายดาย เช่น การถดถอย ปัวซงที่มีค่าศูนย์มากเกินไปการถดถอยปัวซงที่เปลี่ยนแปลงค่าศูนย์ (แบบมีอุปสรรค) การถดถอยปัวซงเชิงบวก และ การถดถอยทวินามเชิงลบยกตัวอย่างเช่น สำหรับแบบจำลองเชิงเส้น ความแปรปรวนของการแจกแจงแบบปกติจะถูกลดระดับเป็นพารามิเตอร์มาตราส่วน และมักถูกมองว่าเป็นพารามิเตอร์ที่ไม่พึงประสงค์ (หากนับว่าเป็นพารามิเตอร์เลยก็ตาม) แต่กรอบงาน VGLM อนุญาตให้สร้างแบบจำลองความแปรปรวนโดยใช้ตัวแปรเสริมได้

โดยรวมแล้ว เราอาจมองว่า VGLM เป็น GLM ที่จัดการกับโมเดลหลายแบบนอกเหนือจากตระกูลเอกซ์โปเนนเชียลแบบคลาสสิก และไม่จำกัดอยู่แค่การประมาณค่าเฉลี่ยเพียงค่าเดียว ในระหว่างการประมาณค่า แทนที่จะใช้กำลังสองน้อยที่สุดแบบถ่วงน้ำหนัก ในระหว่าง IRLS เราจะใช้กำลังสองน้อยที่สุดแบบทั่วไปเพื่อจัดการกับความสัมพันธ์ระหว่างตัวทำนายเชิงเส้น M ตัว

ข้อมูลและสัญลักษณ์

เราสมมติว่าการตอบสนองหรือผลลัพธ์หรือตัวแปรตาม (หรือตัวแปรตามหลายตัว) นั้นถูกสร้างขึ้นจากแบบจำลองการแจกแจง แบบใดแบบหนึ่ง การแจกแจงส่วนใหญ่เป็นแบบเอกตัวแปร ดังนั้นและตัวอย่างหนึ่งของ การแจกแจงแบบเอกตัวแปร คือการแจกแจงปกติแบบทวิตัวแปร ${\boldสัญลักษณ์ {y}}=(y_{1},\ldots ,y_{Q_{1}})^{T}$ $Q_{1}=1$ $Q_{1}=2$

บางครั้งเราเขียนข้อมูลของเราใน รูปแบบโดยแต่ละการสังเกตทั้งn ครั้ง ถือว่าเป็นอิสระต่อกัน ดังนั้น โดยที่คือค่าน้ำหนักก่อนหน้าที่เป็นบวกที่ทราบแล้ว และมักจะเป็น $({\boldสัญลักษณ์ {x}__{i},w_{i},{\boldสัญลักษณ์ {y}__{i})$ $i=1,\ldots ,n$ ${\boldsymbol {y}}_{i}=(y_{i1},\ldots ,y_{iQ_{1}})^{T}$ $w_{i}$ $w_{i}=1$

ตัวแปรอธิบายหรือตัวแปรอิสระจะเขียนเป็นหรือเมื่อจำเป็นต้องใช้i ก็จะเขียนเป็น โดยปกติจะมีค่าคงที่ซึ่งในกรณีนี้ จะ เป็น หรือ ${\boldsymbol {x}}=(x_{1},\ldots ,x_{p})^{T}$ ${\boldsymbol {x}}_{i}=(x_{i1},\ldots ,x_{ip})^{T}$ $x_{1}=1$ $x_{i1}=1$

อันที่จริงแล้ว เฟรมเวิร์ก VGLM อนุญาตให้มี การตอบสนอง S ครั้งโดยแต่ละครั้งมีมิติในตัวอย่างข้างต้นS = 1 ดังนั้นมิติของ จึงโดยทั่วไปแล้วคือเราจัดการกับ การตอบสนอง S ครั้ง ด้วยโค้ด เช่นสำหรับS = 3 เพื่อความง่าย ในบทความนี้ส่วนใหญ่จึงใช้S = 1 $Q_{1}$ ${\boldsymbol {y}}_{i}$ $Q=S\times Q_{1}$ vglm(cbind(y1, y2, y3) ~ x2 + x3, ..., data = mydata)

ส่วนประกอบของโมเดล

โดยทั่วไป VGLM จะประกอบด้วยองค์ประกอบสี่อย่าง:

1. ฟังก์ชันความหนาแน่นความน่าจะเป็นหรือฟังก์ชันมวลความน่าจะเป็นจากแบบจำลองทางสถิติบางแบบ ซึ่งสามารถคำนวณค่าลอการิทึมความน่าจะเป็นอนุพันธ์อันดับแรกและเมทริกซ์ข้อมูลที่คาดหวังได้ โดยแบบจำลองดังกล่าวต้องเป็นไปตามเงื่อนไขความสม่ำเสมอของ MLEทั่วไป

\ell

\partial \ell /\partial \theta _{j}

2. ใช้ตัวทำนายเชิงเส้นที่อธิบายไว้ด้านล่างเพื่อสร้างแบบจำลองสำหรับแต่ละพารามิเตอร์

\eta _{j}

\theta _{j}

j=1,\ldots ,M.

3. เชื่อมโยงฟังก์ชันต่างๆ เข้าด้วยกัน โดยที่

g_{j}

\theta _{j}=g_{j}^{-1}(\eta _{j}).

4. เมทริกซ์ข้อจำกัด สำหรับแต่ละคอลัมน์ที่มีอันดับเต็มและทราบค่าแล้ว

{\boldsymbol {H}}_{k}

k=1,\ldots ,p,

ตัวทำนายเชิงเส้น

ตัวทำนายเชิงเส้นแต่ละตัวเป็นปริมาณที่รวมข้อมูลเกี่ยวกับตัวแปรอิสระเข้าไว้ในแบบจำลอง สัญลักษณ์( ภาษากรีก " eta ") แทนตัวทำนายเชิงเส้น และใช้ ตัวห้อย j เพื่อระบุตัวทำนายลำดับที่ jมันเชื่อมโยง พารามิเตอร์ลำดับที่ jกับตัวแปรอธิบาย และ แสดงออกมาในรูปของการรวม เชิง เส้น (ดังนั้นจึงเรียกว่า "เชิงเส้น") ของพารามิเตอร์ที่ไม่ทราบค่า กล่าว คือ ของสัมประสิทธิ์การถดถอย $\eta _{j}$ $\eta _{j}$ ${\boldsymbol {\beta }}_{j},$ $\beta _{(j)k}$

พารามิเตอร์ที่jของการแจกแจงนั้นขึ้นอยู่กับตัวแปรอิสระผ่านทาง $\theta _{j}$ ${\boldsymbol {x}},$

g_{j}(\theta _{j})=\eta _{j}={\boldsymbol {\beta }}_{j}^{T}{\boldsymbol {x}}.

ให้เป็นเวกเตอร์ของตัวทำนายเชิงเส้นทั้งหมด (เพื่อความสะดวก เราจะให้ มีมิติM เสมอ ) ดังนั้นตัวแปรอิสระทั้งหมด ที่ประกอบขึ้นเป็น อาจส่งผลต่อพารามิเตอร์ทั้งหมด ผ่านทางตัวทำนายเชิงเส้น ต่อมา เราจะอนุญาตให้ตัวทำนายเชิงเส้นถูกขยายไปเป็นตัวทำนายแบบบวก ซึ่งเป็นผลรวมของฟังก์ชันเรียบของแต่ละตัวและแต่ละฟังก์ชันจะถูกประมาณจากข้อมูล ${\boldsymbol {\eta }}=(\eta _{1},\ldots ,\eta _{M})^{T}$ ${\boldsymbol {\eta }}$ ${\boldsymbol {x}}$ $\eta _{j}$ $x_{k}$

ฟังก์ชันการเชื่อมโยง

ฟังก์ชันเชื่อมโยงแต่ละฟังก์ชันแสดงความสัมพันธ์ระหว่างตัวทำนายเชิงเส้นและพารามิเตอร์ของการแจกแจง มีฟังก์ชันเชื่อมโยงที่ใช้กันทั่วไปหลายฟังก์ชัน และการเลือกใช้อาจค่อนข้างเป็นไปตามอำเภอใจ ควรพยายามจับคู่โดเมนของฟังก์ชันเชื่อมโยงกับช่วงของค่าพารามิเตอร์ของการแจกแจง โปรดสังเกตว่าข้างต้นอนุญาตให้ใช้ฟังก์ชันเชื่อมโยงที่แตกต่างกันสำหรับแต่ละพารามิเตอร์ ฟังก์ชันเหล่านี้มีคุณสมบัติคล้ายกับแบบจำลองเชิงเส้นทั่วไปตัวอย่างเช่น ฟังก์ชันเชื่อมโยงที่ใช้กันทั่วไป ได้แก่ ฟังก์ชัน เชื่อมโยง logitสำหรับพารามิเตอร์ในช่วงและ ฟังก์ชันเชื่อมโยง logสำหรับพารามิเตอร์ที่เป็นบวกแพ็กเกจนี้มีฟังก์ชันสำหรับพารามิเตอร์ที่สามารถรับค่าได้ทั้งบวกและลบ $g_{j}$ $(0,1)$ VGAMidentitylink()

เมทริกซ์ข้อจำกัด

โดยทั่วไปแล้ว กรอบงาน VGLM อนุญาตให้มีข้อจำกัดเชิงเส้นใดๆ ระหว่างสัมประสิทธิ์การถดถอยของตัวทำนายเชิงเส้นแต่ละตัว ตัวอย่างเช่น เราอาจต้องการกำหนดให้บางตัวเท่ากับ 0 หรือกำหนดให้บางตัวเท่ากัน เรามี $\beta _{(j)k}$

{\boldsymbol {\eta }}=\sum _{k=1}^{p}\,{\boldsymbol {\beta }}_{(k)}^{}\,x_{k}=\sum _{k=1}^{p}\,{\boldsymbol {H}}_{k}\;{\boldsymbol {\beta }}_{(k)}^{*}\,x_{k}

โดยที่คือเมทริกซ์ข้อจำกัดแต่ละเมทริกซ์ข้อจำกัดเป็นที่ทราบและกำหนดไว้ล่วงหน้า มีMแถว และระหว่าง 1 ถึงMคอลัมน์ องค์ประกอบของเมทริกซ์ข้อจำกัดมีค่าจำกัด และมักจะเป็น 0 หรือ 1 เท่านั้น ตัวอย่างเช่น ค่า 0 หมายถึงการละเว้นองค์ประกอบนั้น ในขณะที่ค่า 1 หมายถึงการรวมองค์ประกอบนั้น เป็นเรื่องปกติที่บางแบบจำลองจะมี สมมติฐานเรื่อง ความขนานซึ่งหมายความว่า สำหรับและสำหรับบางแบบจำลอง สำหรับด้วยเช่นกัน กรณีพิเศษเมื่อสำหรับทุกเรียกว่าข้อจำกัดที่ไม่สำคัญสัมประสิทธิ์การถดถอยทั้งหมดได้รับการประมาณค่าและไม่มีความสัมพันธ์กัน และเรียกว่า พารามิเตอร์ ที่มีค่าคงที่เท่านั้นหาก แถวที่ jของ ทั้งหมดเท่ากับสำหรับ กล่าว คือ เท่ากับค่าคงที่เท่านั้น ดังนั้นพารามิเตอร์ที่มีค่าคงที่เท่านั้นจึงถูกจำลองอย่างง่ายที่สุดเท่าที่จะเป็นไปได้ในรูปของค่าสเกลาร์ ${\boldsymbol {H}}_{k}$ ${\boldsymbol {H}}_{k}={\boldsymbol {1}}_{M}$ $k=2,\ldots ,p$ $k=1$ ${\boldsymbol {H}}_{k}={\boldsymbol {I}}_{M}$ $k=1,\ldots ,p$ $\theta _{j}$ ${\boldsymbol {H}}_{k}=$ ${\boldsymbol {0}}^{T}$ $k=2,\ldots ,p$ $\eta _{j}=\beta _{(j)1}^{*}$

โดยทั่วไปแล้ว พารามิเตอร์ที่ไม่ทราบค่าจะถูกประมาณค่าโดยใช้วิธีความน่าจะเป็นสูงสุดสัมประสิทธิ์การถดถอยทั้งหมดสามารถนำมาใส่ในเมทริกซ์ได้ดังนี้: ${\boldsymbol {\beta }}^{*}=({\boldsymbol {\beta }}_{(1)}^{*T},\ldots ,{\boldsymbol {\beta }}_{(p)}^{*T})^{T}$

{\boldsymbol {\eta }}_{i}={\boldsymbol {B}}^{T}{\boldsymbol {x}}_{i}={\begin{pmatrix}{\boldsymbol {\beta }}_{1}^{T}\,{\boldsymbol {x}}_{i}\\\vdots \\{\boldsymbol {\beta }}_{M}^{T}\,{\boldsymbol {x}}_{i}\\\end{pmatrix}}=\left({\boldsymbol {\beta }}_{(1)}^{},\ldots ,{\boldsymbol {\beta }}_{(p)}^{}\right)\;{\boldsymbol {x}}_{i}.

สิ่งอำนวยความสะดวก xij

โดยทั่วไปแล้ว เราสามารถอนุญาตให้ค่าของตัวแปร มีค่าแตกต่างกันได้สำหรับแต่ละกรณีตัวอย่างเช่น หากตัวทำนายเชิงเส้นแต่ละตัวใช้สำหรับจุดเวลาที่แตกต่างกัน เราอาจมีตัวแปรเสริมที่เปลี่ยนแปลงตามเวลา ตัวอย่างเช่น ในแบบจำลองการเลือกแบบไม่ต่อเนื่องเรามี แบบจำลองโลจิต แบบ มีเงื่อนไข แบบจำลอง โลจิตแบบ ซ้อน แบบจำลองโลจิต แบบทั่วไปและอื่นๆ เพื่อแยกแยะความแตกต่างระหว่างตัวแปรต่างๆ และปรับแบบจำลองโลจิตแบบหลายตัวเลือกให้เหมาะสมกับ เช่น การเลือกวิธีการเดินทาง ตัวแปรเช่นต้นทุนจะแตกต่างกันไปขึ้นอยู่กับตัวเลือก ตัวอย่างเช่น แท็กซี่แพงกว่ารถบัส ซึ่งแพงกว่าการเดิน ความสามารถของแบบจำลองนี้ช่วยให้เราสามารถสรุปเป็นแบบจำลอง ทั่วไปได้ $x_{k}$ $\eta _{j}$ xijVGAM $\eta _{j}({\boldsymbol {x}}_{i})$ $\eta _{j}({\boldsymbol {x}}_{ij})$

สูตรทั่วไปที่สุดคือ

{\boldsymbol {\eta }}_{i}={\boldsymbol {o}}_{i}+\sum _{k=1}^{p}\,diag(x_{ik1},\ldots ,x_{ikM})\,\mathbf {H} _{k}\,{\boldsymbol {\beta }}_{(k)}^{*}.

ในที่นี้คือค่าชดเชย ที่ไม่บังคับ ซึ่ง ในทางปฏิบัติจะแปลงเป็น เมทริกซ์ แพ็กเกจนี้มีอาร์กิวเมนต์ที่อนุญาตให้ป้อนองค์ประกอบที่ต่อเนื่องกันของเมทริกซ์แนวทแยงได้ ${\boldsymbol {o}}_{i}$ $n\times M$ VGAMxij

ซอฟต์แวร์

Yee (2015) ^{[ 1 ]}อธิบาย การใช้งานแพ็กเกจ Rที่เรียกว่า VGAM ^{[ 2 ]} ปัจจุบันซอฟต์แวร์นี้รองรับโมเดล/การแจกแจงประมาณ 150 แบบ ฟังก์ชันการสร้างแบบจำลองหลักคือvglm()และvgam()อาร์กิวเมนต์familyจะถูกกำหนดให้กับฟังก์ชันตระกูล VGAMเช่นfamily = negbinomialสำหรับการถดถอย แบบ ทวินามเชิงลบfamily = poissonffสำหรับการ ถดถอย แบบปัวซองfamily = propoddsสำหรับโมเดลสัดส่วนคี่หรือ โมเดลโลจิตสะสมสำหรับการถดถอยเชิงหมวดหมู่แบบเรียงลำดับ

การติดตั้ง

ความน่าจะเป็นสูงสุด

เรากำลังเพิ่มค่าลอการิทึมความน่าจะเป็นให้สูงสุด

\ell =\sum _{i=1}^{n}\,w_{i}\,\ell _{i},

โดยที่ค่าน้ำหนักก่อนหน้าเป็นค่าบวกและทราบค่าอยู่ แล้ว สามารถหาค่าประมาณความน่าจะเป็นสูงสุดได้โดยใช้อัลก อริทึม กำลังสองน้อยที่สุดแบบถ่วงน้ำหนักซ้ำๆ โดย ใช้ วิธี การให้คะแนนของฟิชเชอร์พร้อมการอัปเดตในรูปแบบ: $w_{i}$

{\boldsymbol {\beta }}^{(a+1)}={\boldsymbol {\beta }}^{(a)}+{\boldsymbol {\mathcal {I}}}^{-1}({\boldsymbol {\beta }}^{(a)})\,\,\mathbf {u} ({\boldsymbol {\beta }}^{(a)}),

เมทริก ซ์ ข้อมูลของฟิชเชอร์ในการวนซ้ำครั้งที่aอยู่ที่ไหนเรียกอีกอย่างว่าเมทริกซ์ข้อมูลที่คาดหวังหรือEIM ${\boldsymbol {\mathcal {I}}}({\boldsymbol {\beta }}^{(a)})$

วีแอลเอ็ม

สำหรับการคำนวณเมทริกซ์แบบจำลอง (ขนาดเล็ก) ที่สร้างขึ้นจากด้านขวาของสูตรในvglm() และเมทริกซ์ข้อจำกัดจะถูกรวมเข้าด้วยกันเพื่อสร้าง เมทริกซ์แบบจำลองขนาด ใหญ่ จาก นั้นจึงใช้ IRLS กับ เมทริกซ์ X ขนาดใหญ่ นี้ เมทริกซ์นี้เรียกว่าเมทริกซ์ VLM เนื่องจากแบบจำลองเชิงเส้นเวกเตอร์เป็นปัญหาการหาค่ากำลังสองน้อยที่สุดพื้นฐานที่กำลังแก้ไข VLM คือการถดถอยหลายตัวแปรแบบถ่วงน้ำหนัก โดยที่เมทริกซ์ความแปรปรวนร่วมสำหรับแต่ละแถวของเมทริกซ์การตอบสนองไม่จำเป็นต้องเหมือนกัน และเป็นที่ทราบ (ในการถดถอยหลายตัวแปรแบบคลาสสิก ข้อผิดพลาดทั้งหมดมีเมทริกซ์ความแปรปรวนร่วมเดียวกัน และไม่ทราบค่า) โดยเฉพาะอย่างยิ่ง VLM จะลดผลรวมกำลังสองแบบถ่วงน้ำหนักให้เหลือน้อยที่สุด

\mathrm {ResSS} =\sum _{i=1}^{n}\;w_{i}\left\{\mathbf {z} _{i}^{(a-1)}-{\boldsymbol {\eta }}_{i}^{(a-1)}\right\}^{T}\mathbf {W} _{i}^{(a-1)}\left\{\mathbf {z} _{i}^{(a-1)}-{\boldsymbol {\eta }}_{i}^{(a-1)}\right\}

ปริมาณนี้จะถูกทำให้มีค่าน้อยที่สุดในแต่ละรอบการทำซ้ำของ IRLS การตอบสนองในการทำงาน (หรือที่เรียกว่าการตอบสนองเทียมและเวกเตอร์ขึ้นอยู่แบบปรับแล้ว ) คือ

\mathbf {z} _{i}={\boldsymbol {\eta }}_{i}+\mathbf {W} _{i}^{-1}\mathbf {u} _{i},

โดยที่ค่าเหล่านี้เรียกว่าค่าน้ำหนักการทำงานหรือเมทริกซ์ค่าน้ำหนักการทำงานเมทริกซ์เหล่านี้สมมาตรและเป็นบวกแน่นอน การใช้ EIM ช่วยให้มั่นใจได้ว่าค่าเหล่านี้ทั้งหมดเป็นบวกแน่นอน (ไม่ใช่แค่ผลรวมของค่าเหล่านั้น) ในพื้นที่พารามิเตอร์ส่วนใหญ่ ในทางตรงกันข้าม การใช้ Newton–Raphson จะหมายความว่าจะใช้เมทริกซ์ข้อมูลที่สังเกตได้ ซึ่งมักจะเป็นบวกแน่นอนในส่วนย่อยที่เล็กกว่าของพื้นที่พารามิเตอร์ $\mathbf {W} _{i}$

ในทางคอมพิวเตอร์การแยกส่วนแบบ Choleskyถูกนำมาใช้เพื่อผกผันเมทริกซ์น้ำหนักการทำงาน และแปลง ปัญหา การหาค่ากำลังสองน้อยที่สุดแบบทั่วไปโดยรวมให้เป็นปัญหา การหาค่ากำลังสองน้อยที่สุดแบบธรรมดา

ตัวอย่าง

แบบจำลองเชิงเส้นทั่วไป

แน่นอนว่าแบบจำลองเชิงเส้นทั่วไป ทั้งหมด เป็นกรณีพิเศษของ VGLM แต่เรามักจะประมาณค่าพารามิเตอร์ทั้งหมดโดยใช้ การประมาณ ค่าความน่าจะเป็นสูงสุด แบบเต็มรูป แบบ แทนที่จะใช้วิธีโมเมนต์สำหรับพารามิเตอร์มาตราส่วน

การตอบสนองเชิงหมวดหมู่แบบเรียงลำดับ

หากตัวแปรตอบสนองเป็นการวัดเชิงลำดับที่มีM + 1 ระดับเราสามารถใช้ฟังก์ชันแบบจำลองในรูปแบบต่อไปนี้ได้:

g(\theta _{j})=\eta _{j}

ที่ไหน

\theta _{j}=\mathrm {Pr} (Y\leq j),

สำหรับ ลิงก์g ที่แตกต่างกัน จะนำไปสู่แบบจำลองอัตราส่วนความน่าจะเป็นแบบสัดส่วนหรือ แบบจำลอง โพรบิตแบบเรียงลำดับตัวอย่างเช่นฟังก์ชันตระกูลจะกำหนดลิงก์โพรบิตให้กับความน่าจะเป็นสะสม ดังนั้นแบบจำลองนี้จึงเรียกว่าแบบจำลองโพรบิตสะสมโดยทั่วไปแล้วจะเรียกว่า แบบ จำลอง ลิงก์สะสม $j=1,\ldots ,M.$ VGAMcumulative(link = probit)

สำหรับการแจกแจงแบบหมวดหมู่และการแจกแจงแบบพหุนาม ค่าที่ได้จากการประมาณจะเป็นเวกเตอร์ความน่าจะเป็นขนาด ( M + 1) โดยมีคุณสมบัติว่าผลรวมของความน่าจะเป็นทั้งหมดเท่ากับ 1 ความน่าจะเป็นแต่ละค่าแสดงถึงโอกาสที่จะเกิดค่าใดค่าหนึ่งจาก ค่าที่เป็นไปได้ M + 1 ค่า

การตอบสนองเชิงหมวดหมู่ที่ไม่เรียงลำดับ

หากตัวแปรตอบสนองเป็นการวัดเชิงนามหรือข้อมูลไม่เป็นไปตามข้อสมมติของแบบจำลองเชิงลำดับ เราอาจใช้แบบจำลองในรูปแบบต่อไปนี้:

\log \left[{\frac {Pr(Y=j)}{\mathrm {Pr} (Y=M+1)}}\right]=\eta _{j},

ลิงก์ข้างต้นบางครั้งเรียกว่า ลิงก์ มัลติโลจิตและแบบจำลองนี้เรียกว่า แบบจำลอง โลจิตแบบหลายตัว เลือก โดยทั่วไปมักเลือกใช้ระดับแรกหรือระดับสุดท้ายของการตอบสนองเป็น กลุ่ม อ้างอิงหรือ กลุ่ม พื้นฐานในตัวอย่างข้างต้นใช้ระดับสุดท้ายฟังก์ชันตระกูล (family function) เหมาะสมกับแบบจำลองข้างต้น และมีอาร์กิวเมนต์ที่สามารถกำหนดระดับที่ใช้เป็นกลุ่มอ้างอิงได้ $j=1,\ldots ,M.$ VGAMmultinomial()refLevel

นับข้อมูล

ทฤษฎี GLM แบบคลาสสิกใช้การถดถอยแบบปัวซงสำหรับข้อมูลนับจำนวนโดยทั่วไปแล้ว ตัวแปรเชื่อมโยงจะเป็นลอการิทึม ซึ่งเรียกว่าตัวแปรเชื่อมโยงแบบแคนอนิกฟังก์ชันความแปรปรวนจะเป็นสัดส่วนกับค่าเฉลี่ย:

\operatorname {Var} (Y_{i})=\tau \mu _{i},\,

โดยปกติแล้ว ค่าพารามิเตอร์การกระจายจะถูกกำหนดให้คงที่ที่หนึ่ง หากค่าไม่เป็นเช่นนั้น แบบจำลอง ความน่าจะเป็นเสมือน ที่ได้ มักจะถูกอธิบายว่าเป็นแบบจำลองปัวซงที่มีการกระจายเกินหรือแบบจำลองปัวซงเสมือนและโดยทั่วไปจะประมาณค่าโดยใช้วิธีโมเมนต์ ดังนั้นจึงเป็นการยากที่จะหา ช่วงความเชื่อมั่นสำหรับค่าดังกล่าว $\tau$ $\tau$ $\tau$

ในทางตรงกันข้าม VGLM นำเสนอแบบจำลองที่หลากหลายกว่ามากในการจัดการกับความแปรปรวนที่มากเกินไปเมื่อเทียบกับการแจกแจงปัวซง เช่น การแจกแจง ทวินามเชิงลบและรูปแบบต่างๆ ของการแจกแจงดังกล่าว แบบจำลองการถดถอยเชิงนับอีกแบบหนึ่งคือ การแจกแจง ปัวซงแบบทั่วไปแบบจำลองอื่นๆ ที่เป็นไปได้ ได้แก่ การแจกแจงซีตาและการแจกแจงซิปฟ์

ส่วนขยาย

แบบจำลองเชิงเส้นทั่วไปเวกเตอร์อันดับลด

RR-VGLM คือ VGLM ที่ส่วนย่อยของ เมทริกซ์ Bมีอันดับต่ำกว่าโดยไม่เสียความเป็นทั่วไป สมมติว่าเป็นการแบ่งส่วนของเวกเตอร์ตัวแปรอิสระ ดังนั้นส่วนของ เมทริกซ์ Bที่สอดคล้องกับจะอยู่ในรูปแบบโดยที่และ เป็นเมทริกซ์บาง (กล่าวคือ มีRคอลัมน์) เช่น เวกเตอร์ ถ้าอันดับR = 1 RR-VGLM มีข้อดีหลายประการเมื่อนำไปใช้กับแบบจำลองและชุดข้อมูลบางประเภท ประการแรก ถ้าMและpมีขนาดใหญ่ จำนวนสัมประสิทธิ์การถดถอยที่ประมาณโดย VGLM จะมีขนาดใหญ่ ( ) ดังนั้น RR-VGLM สามารถลดจำนวนสัมประสิทธิ์การถดถอยที่ประมาณได้อย่างมาก ถ้าRมีค่าต่ำ เช่นR = 1 หรือR = 2 ตัวอย่างของแบบจำลองที่สิ่งนี้มีประโยชน์เป็นพิเศษคือแบบจำลองโลจิตหลายตัวเลือก RR หรือที่รู้จักกันในชื่อแบบจำลองสเตอริโอไทป์ประการที่สอง เป็น เวกเตอร์ Rของตัวแปรแฝงและมักจะสามารถตีความได้อย่างมีประโยชน์ ถ้าR = 1 เราสามารถเขียนได้ ว่าตัวแปรแฝงประกอบด้วยค่าสัมประสิทธิ์การถ่วงน้ำหนักของตัวแปรอธิบาย จะเห็นได้ว่า RR-VGLM ใช้การรวมเชิงเส้นที่เหมาะสมที่สุดของตัวแปรแฝง จากนั้น จึงทำการปรับ VGLM ให้เข้ากับตัวแปรอธิบาย ประการที่สามสามารถสร้างbiplot ได้ถ้า R = 2 ซึ่งช่วยให้สามารถมองเห็นแบบจำลองได้ ${\boldsymbol {x}}=({\boldsymbol {x}}_{1}^{T},{\boldsymbol {x}}_{2}^{T})^{T}$ ${\boldsymbol {x}}_{2}$ ${\boldsymbol {A}}{\boldsymbol {C}}^{T}$ ${\boldsymbol {A}}$ ${\boldsymbol {C}}$ $M\times p$ ${\boldsymbol {\nu }}={\boldsymbol {C}}^{T}{\boldsymbol {x}}_{2}=(\nu _{1},\ldots ,\nu _{R})^{T}$ $\nu ={\boldsymbol {c}}^{T}{\boldsymbol {x}}_{2}$ ${\boldsymbol {x}}_{2}$ $({\boldsymbol {x}}_{1},{\boldsymbol {\nu }})$

สามารถแสดงได้ว่า RR-VGLM นั้นก็คือ VGLM ที่มีเมทริกซ์ข้อจำกัดสำหรับตัวแปรในนั้นไม่ทราบค่าและต้องได้รับการประมาณค่า จากนั้นจึงปรากฏว่าสำหรับตัวแปรดังกล่าว RR-VGLM สามารถประมาณค่าได้ด้วย อัลกอริทึม แบบสลับกันซึ่งจะกำหนดค่า และประมาณค่าจากนั้นกำหนดค่าและประมาณค่าเป็นต้น ${\boldsymbol {x}}_{2}$ ${\boldsymbol {H}}_{k}={\boldsymbol {A}}$ ${\boldsymbol {A}}$ ${\boldsymbol {C}},$ ${\boldsymbol {C}}$ ${\boldsymbol {A}}$

ในทางปฏิบัติ จำเป็นต้องมีข้อจำกัดเฉพาะบางประการสำหรับ และ/หรือในฟังก์ชันจะใช้ข้อจำกัดมุมตามค่าเริ่มต้น ซึ่งหมายความว่า แถว R แถวบนสุด ของจะถูกตั้งค่าเป็นRR-VGLM ได้รับการเสนอในปี 2546 ^[³^] ${\boldsymbol {A}}$ ${\boldsymbol {C}}$ VGAMrrvglm() ${\boldsymbol {A}}$ ${\boldsymbol {I}}_{R}$

สองต่อหนึ่ง

กรณีพิเศษของ RR-VGLM คือเมื่อR = 1 และM = 2 ซึ่งเป็นการลดมิติจาก 2 พารามิเตอร์เหลือ 1 พารามิเตอร์ จากนั้นสามารถแสดงได้ว่า

\theta _{2}=g_{2}^{-1}\left(t_{1}+a_{21}\cdot g_{1}(\theta _{1})\right),

โดยที่องค์ประกอบและได้รับการประมาณค่า ในทำนองเดียวกัน $t_{1}$ $a_{21}$

\eta _{2}=t_{1}+a_{21}\cdot \eta _{1}.

สูตรนี้ให้การเชื่อมโยงระหว่างและโดยจะสร้างความสัมพันธ์ระหว่างพารามิเตอร์สองตัวของแบบจำลอง ซึ่งอาจมีประโยชน์ เช่น สำหรับการสร้างแบบจำลองความสัมพันธ์ระหว่างค่าเฉลี่ยและความแปรปรวน บางครั้งอาจมีการเลือกฟังก์ชันเชื่อมโยง ดังนั้นจึงมีความยืดหยุ่นเล็กน้อยในการเชื่อมโยงพารามิเตอร์สองตัว เช่น ฟังก์ชัน logit, probit, cauchit หรือ cloglog สำหรับพารามิเตอร์ในช่วงหน่วย สูตรข้างต้นมีประโยชน์อย่างยิ่งสำหรับการ แจกแจงแบบทวินามเชิงลบ (negative binomial distribution ) ดังนั้น RR-NB จึงมีฟังก์ชันความแปรปรวน $\eta _{1}$ $\eta _{2}$

\operatorname {Var} (Y\mid {\boldsymbol {x}})=\mu ({\boldsymbol {x}})+\delta _{1}\,\mu ({\boldsymbol {x}})^{\delta _{2}}.

นักวิจัยบางท่านเรียกวิธีการนี้ว่า รูปแบบ NB-P โดยสามารถประมาณค่า และได้ และยังสามารถหาช่วงความเชื่อมั่นโดยประมาณสำหรับค่าเหล่านั้นได้ด้วย $\delta _{1}$ $\delta _{2}$

นอกจากนี้ ยังสามารถปรับ NB รูปแบบอื่นๆ ที่มีประโยชน์อีกหลายรูปแบบได้ด้วยความช่วยเหลือจากการเลือกเมทริกซ์ข้อจำกัดที่เหมาะสม ตัวอย่างเช่นNB − 1, NB − 2 ( negbinomial()ค่าเริ่มต้น), NB − Hดู Yee (2014) ^{[ 4 ]}และตาราง 11.3 ของ Yee (2015) ^{[ 1 ]}

RCIMs

นอกจากนี้ ยังมีการเสนอแบบจำลองปฏิสัมพันธ์ระหว่างแถวและคอลัมน์ (RCIMs) ซึ่งเป็นแบบจำลอง RR-VGLM ประเภทพิเศษ RCIMs ใช้ได้เฉพาะกับเมทริกซ์ Y เท่านั้น และไม่มีตัวแปรอธิบายที่ระบุไว้อย่างชัดเจนแต่จะมีการกำหนดตัวแปรบ่งชี้สำหรับแต่ละแถวและคอลัมน์อย่างชัดเจน และอนุญาตให้มีปฏิสัมพันธ์ลำดับR ในรูปแบบ ที่กำหนด กรณีพิเศษของแบบจำลองประเภทนี้ ได้แก่แบบจำลองความสัมพันธ์ RC ของ Goodman และระเบียบวิธีความแปรปรวนแบบกึ่งๆ ตามที่นำไปใช้ในแพ็กเกจ R ${\boldsymbol {x}}$ ${\boldsymbol {A}}{\boldsymbol {C}}^{T}$ qvcalc

RCIMs สามารถนิยามได้ว่าเป็น RR-VGLM ที่นำไปใช้กับYโดยมีเงื่อนไขดังนี้

g_{1}(\theta _{1})\equiv \eta _{1ij}=\beta _{0}+\alpha _{i}+\gamma _{j}+\sum _{r=1}^{R}c_{ir}\,a_{jr}.

สำหรับแบบจำลองความสัมพันธ์แบบ Goodman RC เราจะได้ว่า ถ้าR = 0 แสดงว่าเป็นการถดถอยแบบปัวซงที่เหมาะสมกับเมทริกซ์ของจำนวนนับที่มีผลกระทบตามแถวและคอลัมน์ ซึ่งมีแนวคิดคล้ายกับแบบจำลอง ANOVA สองทางที่ไม่มีปฏิสัมพันธ์ $\eta _{1ij}=\log \mu _{ij},$

อีกตัวอย่างหนึ่งของ RCIM คือ ถ้าเป็นฟังก์ชันเชื่อมโยงเอกลักษณ์ และพารามิเตอร์ คือค่ามัธยฐาน และแบบจำลองสอดคล้องกับการแจกแจงแบบลาปลาสที่ไม่สมมาตร RCIM ที่ไม่มีปฏิสัมพันธ์จะคล้ายกับเทคนิคที่เรียกว่า การขัดเงาค่ามัธยฐาน (median polish ) $g_{1}$

ในVGAMฟังก์ชันrcim()และgrc()เหมาะกับโมเดลข้างต้น นอกจากนี้ Yee และ Hadi (2014) ^{[ 5 ]} ยังแสดงให้เห็นว่า RCIMs สามารถใช้เพื่อปรับโมเดลการเรียงลำดับกำลังสองที่ไม่จำกัดให้เข้ากับข้อมูลชนิดพันธุ์ได้ นี่เป็นตัวอย่างของ การวิเคราะห์การไล่ระดับ ทางอ้อมใน การเรียงลำดับ (หัวข้อหนึ่งในนิเวศวิทยาเชิงสถิติ)

แบบจำลองเสริมทั่วไปเวกเตอร์

แบบจำลองเสริมทั่วไปแบบเวกเตอร์ (VGAMs) เป็นส่วนขยายที่สำคัญของแบบจำลองเสริมทั่วไปแบบเวกเตอร์ (VGLMs) โดยที่ตัวทำนายเชิงเส้นไม่จำเป็นต้องเป็นเชิงเส้นในตัวแปรอิสระแต่เป็นผลรวมของฟังก์ชันปรับเรียบที่ใช้กับตัวแปรอิสระ $\eta _{j}$ $x_{k}$ $x_{k}$

{\boldsymbol {\eta }}({\boldsymbol {x}})={\boldsymbol {H}}_{1}\,{\boldsymbol {\beta }}_{(1)}^{*}+{\boldsymbol {H}}_{2}\,{\boldsymbol {f}}_{(2)}^{*}(x_{2})+{\boldsymbol {H}}_{3}\,{\boldsymbol {f}}_{(3)}^{*}(x_{3})+\cdots \,\!

โดยที่ตัวทำนายแบบบวกM เหล่านี้ฟังก์ชันเรียบแต่ละฟังก์ชันได้รับการประมาณจากข้อมูล ดังนั้น VGLM จึงขับเคลื่อนด้วยแบบจำลองในขณะที่ VGAM ขับเคลื่อนด้วยข้อมูลปัจจุบัน มีเพียงสปลายเรียบเท่านั้นที่ถูกนำมาใช้ในแพ็กเกจ สำหรับM > 1 สปลายเรียบเหล่านี้จะเป็นเวกเตอร์สปลายซึ่งประมาณฟังก์ชันส่วนประกอบพร้อมกัน แน่นอนว่าเราสามารถใช้สปลายถดถอยกับ VGLM ได้ แรงจูงใจเบื้องหลัง VGAM คล้ายกับของ Hastie และ Tibshirani (1990) ^[⁶^] และ Wood (2017) ^[⁷^] VGAM ได้รับการเสนอในปี 1996 ^[⁸^] ${\boldsymbol {f}}_{(k)}^{*}(x_{k})=(f_{(1)k}^{*}(x_{k}),f_{(2)k}^{*}(x_{k}),\ldots )^{T}.$ $f_{(j)k}^{*}$ VGAM $f_{(j)k}^{*}(x_{k})$

ปัจจุบันมีการดำเนินการเพื่อประมาณค่า VGAM โดยใช้P-splines ของ Eilers และ Marx (1996) ^{[ 9 ]} ซึ่งช่วยให้มีข้อดีหลายประการเหนือการใช้smoothing splinesและ vector backfittingเช่น ความสามารถในการเลือกพารามิเตอร์การปรับเรียบอัตโนมัติได้ง่ายขึ้น

แบบจำลองเชิงเส้นทั่วไปเวกเตอร์ลดอันดับกำลังสอง

วิธีการนี้จะเพิ่มฟังก์ชันกำลังสองของตัวแปรแฝงเข้าไปในคลาส RR-VGLM ผลลัพธ์ที่ได้คือเส้นโค้งรูปทรงระฆังที่สามารถปรับให้เข้ากับการตอบสนองแต่ละครั้งได้ โดยเป็นฟังก์ชันของตัวแปรแฝง สำหรับR = 2 จะได้พื้นผิวรูปทรงระฆังเป็นฟังก์ชันของตัวแปรแฝง 2 ตัว ซึ่งคล้ายกับ การแจกแจงปกติแบบสองตัวแปร การประยุกต์ใช้ QRR-VGLM เฉพาะด้านสามารถพบได้ในนิเวศวิทยาในสาขาการวิเคราะห์หลายตัวแปรที่เรียกว่า การจัดเรียงลำดับ (ordination )

ตัวอย่างเฉพาะเจาะจงอันดับ 1 ของ QRR-VGLM คือ ข้อมูลปัวซงที่มีSชนิดพันธุ์ แบบจำลองสำหรับชนิดพันธุ์sคือการถดถอยปัวซง

\log \,\mu _{s}(\nu )=\eta _{s}(\nu )=\beta _{(s)1}+\beta _{(s)2}\,\nu +\beta _{(s)3}\,\nu ^{2}=\alpha _{s}-{\frac {1}{2}}\left({\frac {\nu -u_{s}}{t_{s}}}\right)^{2},

สำหรับการกำหนดพารามิเตอร์ทางด้านขวาสุดซึ่งใช้สัญลักษณ์นั้นมีความหมายทางนิเวศวิทยาเป็นพิเศษ เพราะสัญลักษณ์เหล่านั้นเกี่ยวข้องกับความอุดม สมบูรณ์ของชนิดพันธุ์ ค่าที่เหมาะสมที่สุดและค่าความทนทานตามลำดับ ตัวอย่างเช่น ความทนทานเป็นการวัดความกว้างของนิเวศวิทยา และค่ามากหมายความว่าชนิดพันธุ์นั้นสามารถอาศัยอยู่ในสภาพแวดล้อมที่หลากหลาย ในสมการข้างต้น เราต้องการเพื่อให้ได้เส้นโค้งรูปทรงระฆัง $s=1,\ldots ,S$ $\alpha _{s},$ $u_{s},$ $t_{s},$ $\beta _{(s)3}<0$

QRR-VGLMs เหมาะสมกับแบบจำลองการจัดเรียงแบบเกาส์เซียนโดยการประมาณค่าความน่าจะเป็นสูงสุด และเป็นตัวอย่างของการวิเคราะห์ความชันโดยตรงฟังก์ชันcqo()ในVGAMแพ็กเกจปัจจุบันเรียกใช้optim()เพื่อค้นหาค่าที่เหมาะสมที่สุด และเมื่อได้ค่าดังกล่าวแล้ว ก็สามารถคำนวณคะแนนไซต์และปรับแบบจำลองเชิงเส้นทั่วไป ที่เหมาะสม กับค่านั้นได้อย่างง่ายดาย ฟังก์ชันนี้ตั้งชื่อตามตัวย่อ CQO ซึ่งย่อมาจาก constrained quadratic ordination : constrainedหมายถึงการวิเคราะห์ความชันโดยตรง (มีตัวแปรสิ่งแวดล้อม และการรวมเชิงเส้นของตัวแปรเหล่านี้ถูกนำมาใช้เป็นตัวแปรแฝง) และquadraticหมายถึงรูปแบบกำลังสองในตัวแปรแฝง บนมาตราส่วน น่าเสียดายที่ QRR-VGLMs มีความไวต่อค่าผิดปกติทั้งในตัวแปรตอบสนองและตัวแปรอธิบาย รวมทั้งมีค่าใช้จ่ายในการคำนวณสูง และอาจให้ผลลัพธ์เฉพาะที่มากกว่าผลลัพธ์โดยรวม QRR-VGLMs ได้รับการเสนอในปี 2004 ^[¹⁰^] ${\boldsymbol {C}}$ ${\boldsymbol {\nu }}$ ${\boldsymbol {\eta }}$

ดูเพิ่มเติม

อ่านเพิ่มเติม

ฮิลเบ, โจเซฟ (2011). การถดถอยแบบทวินามเชิงลบ (ฉบับที่ 2). เคมบริดจ์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์. ISBN 978-0-521-19815-8.{{cite book}}: CS1 maint: publisher location (link)

[ 1 ]

[ 2 ]

[

[ 4 ]

[ 5 ]

[

[

[

[ 9 ]

[