กลับไปหน้าบทความ

อ่าน 6 นาที

สปลายการถดถอยแบบปรับตัวหลายตัวแปร

ในทางสถิติสปลายการถดถอยแบบปรับตัวหลายตัวแปร ( MARS ) เป็นรูปแบบหนึ่งของการวิเคราะห์การถดถอย ที่ Jerome H.

สปลายการถดถอยแบบปรับตัวหลายตัวแปร

ในทางสถิติปลายการถดถอยแบบปรับตัวหลายตัวแปร ( MARS ) เป็นรูปแบบหนึ่งของการวิเคราะห์การถดถอย ที่ Jerome H. Friedmanนำเสนอในปี 1991 [ 1 ]เป็น เทคนิค การถดถอยแบบไม่ใช้พารามิเตอร์และสามารถมองได้ว่าเป็นส่วนขยายของแบบจำลองเชิงเส้นที่จำลองความไม่เป็นเชิงเส้นและปฏิสัมพันธ์ระหว่างตัวแปรโดยอัตโนมัติ

คำว่า "MARS" เป็นเครื่องหมายการค้าและได้รับอนุญาตให้ใช้โดย Salford Systems เพื่อหลีกเลี่ยงการละเมิดเครื่องหมายการค้า การใช้งาน MARS แบบโอเพนซอร์สจำนวนมากจึงเรียกว่า "Earth" [ 2 ] [ 3 ]

พื้นฐาน

ส่วนนี้จะแนะนำ MARS โดยใช้ตัวอย่างประกอบ เราเริ่มต้นด้วยชุดข้อมูล: เมทริกซ์ของตัวแปรป้อนเข้าxและเวกเตอร์ของการตอบสนองที่สังเกตได้yโดยแต่ละแถวในx จะมีการตอบสนองหนึ่ง ค่า ตัวอย่างเช่น ข้อมูลอาจเป็นดังนี้:

xy
10.516.4
10.718.8
10.819.7
......
20.677.0

ในกรณีนี้มีตัวแปรอิสระ เพียงตัวเดียว ดังนั้น เมทริกซ์ xจึงมีเพียงคอลัมน์เดียว จากค่าที่วัดได้เหล่านี้ เราต้องการสร้างแบบจำลองที่สามารถทำนายค่าy ที่คาดหวัง สำหรับค่าx ที่กำหนด ให้

แบบจำลองเชิงเส้น

แบบจำลองเชิงเส้นสำหรับข้อมูลข้างต้นคือ โดยหมวกบนเครื่องหมายแสดงว่าค่า y นั้นถูกประมาณจากข้อมูล รูปทางด้านขวาแสดงกราฟของฟังก์ชันนี้: เส้นตรงที่แสดงค่า y ที่ทำนายได้เทียบกับxโดยค่าy ดั้งเดิม แสดงเป็นจุดสีแดง

ข้อมูลที่ได้จากค่าx ที่มีค่าสุดขั้ว แสดงให้เห็นว่าความสัมพันธ์ระหว่างyและxอาจไม่ใช่ความสัมพันธ์เชิงเส้น (ดูจุดสีแดงที่สัมพันธ์กับเส้นถดถอยที่ค่าx ต่ำและสูง ) ดังนั้นเราจึงใช้ซอฟต์แวร์ MARS เพื่อสร้างแบบจำลองโดยอัตโนมัติโดยคำนึงถึงความไม่เป็นเชิงเส้น ซอฟต์แวร์ MARS จะสร้างแบบจำลองจากค่าxและy ที่กำหนด ให้ดังนี้

แบบจำลอง MARS อย่างง่ายของข้อมูลชุดเดียวกัน

ภาพทางด้านขวาแสดงกราฟของฟังก์ชันนี้: ค่าที่ทำนายได้เทียบกับxโดยที่ค่าy เดิม แสดงเป็นจุดสีแดงอีกครั้ง ค่าการตอบสนองที่ทำนายได้ในขณะนี้มีความสอดคล้องกับค่า y เดิมมากขึ้น

MARS ได้สร้างจุดหักงอในค่าy ที่ทำนายไว้โดยอัตโนมัติ เพื่อพิจารณาถึงความไม่เป็นเชิงเส้น จุดหักงอนี้เกิดจากฟังก์ชันบานพับฟังก์ชันบานพับคือนิพจน์ที่ขึ้นต้นด้วย(โดยที่คือถ้ามิฉะนั้น) ฟังก์ชันบานพับจะอธิบายรายละเอียดเพิ่มเติมด้านล่าง

ในตัวอย่างง่ายๆ นี้ เราสามารถเห็นได้อย่างง่ายดายจากกราฟว่าyมีความสัมพันธ์แบบไม่เป็นเชิงเส้นกับx (และอาจเดาได้ว่า y แปรผันตามกำลังสองของx ) อย่างไรก็ตาม โดยทั่วไปแล้วจะมีตัวแปรอิสระ หลายตัว และความสัมพันธ์ระหว่างyกับตัวแปรเหล่านี้จะไม่ชัดเจนและมองเห็นได้ยากจากการวาดกราฟ เราสามารถใช้ MARS เพื่อค้นหาความสัมพันธ์แบบไม่เป็นเชิงเส้นนั้นได้

ตัวอย่างนิพจน์ MARS ที่มีตัวแปรหลายตัวคือ

ปฏิสัมพันธ์ระหว่างตัวแปรในแบบจำลอง MARS

สมการนี้แสดงแบบจำลองมลพิษทางอากาศ (ระดับโอโซน) โดยขึ้นอยู่กับอุณหภูมิและตัวแปรอื่นๆ อีกเล็กน้อย โปรดสังเกตว่าพจน์สุดท้ายในสูตร (ในบรรทัดสุดท้าย) นั้นรวมถึงปฏิสัมพันธ์ระหว่างและด้วย

รูปทางด้านขวาแสดงค่าที่ทำนายได้และค่าที่เปลี่ยนแปลงไป โดยตัวแปรอื่นๆ ถูกกำหนดให้มีค่ามัธยฐานคงที่ รูปแสดงให้เห็นว่าลมไม่มีผลต่อระดับโอโซนเว้นแต่ทัศนวิสัยจะต่ำ เราจะเห็นว่า MARS สามารถสร้างพื้นผิวการถดถอยที่มีความยืดหยุ่นสูงได้โดยการรวมฟังก์ชันบานพับเข้าด้วยกัน

เพื่อให้ได้สมการข้างต้น กระบวนการสร้างแบบจำลอง MARS จะเลือกตัวแปรที่จะใช้โดยอัตโนมัติ (บางตัวแปรมีความสำคัญ บางตัวแปรไม่สำคัญ) ตำแหน่งของจุดหักงอในฟังก์ชันบานพับ และวิธีการรวมฟังก์ชันบานพับเข้าด้วยกัน

แบบจำลอง MARS

MARS สร้างแบบจำลองของรูปแบบ

แบบจำลองนี้คือผลรวมถ่วงน้ำหนักของฟังก์ชันพื้นฐาน โดยแต่ละ ฟังก์ชันพื้นฐาน มีสัมประสิทธิ์คงที่ ตัวอย่างเช่น แต่ละบรรทัดในสูตรสำหรับโอโซนข้างต้นคือฟังก์ชันพื้นฐานหนึ่งฟังก์ชันคูณด้วยสัมประสิทธิ์ของฟังก์ชันนั้น

ฟังก์ชันพื้นฐาน แต่ละ ฟังก์ชัน จะมีรูปแบบใดรูปแบบหนึ่งจากสามรูปแบบต่อไปนี้:

  1. ค่าคงที่ 1 มีเพียงพจน์เดียวเท่านั้น คือ ค่าจุดตัดแกน y ในสูตรโอโซนข้างต้น ค่าจุดตัดแกน y คือ 5.2
  2. ฟังก์ชัน บานพับฟังก์ชันบานพับมีรูปแบบเป็น หรือ MARS จะเลือกตัวแปรและค่าของตัวแปรเหล่านั้นสำหรับจุดเชื่อมต่อของฟังก์ชันบานพับโดยอัตโนมัติ ตัวอย่างของฟังก์ชันพื้นฐานดังกล่าวสามารถดูได้ในสามบรรทัดกลางของสูตรโอโซน
  3. ผลคูณของฟังก์ชันบานพับสองฟังก์ชันขึ้นไป ฟังก์ชันพื้นฐานเหล่านี้สามารถใช้จำลองปฏิสัมพันธ์ระหว่างตัวแปรสองตัวขึ้นไปได้

ตัวอย่างเช่น บรรทัดสุดท้ายของสูตรโอโซน

หน้าที่ของบานพับ

ฟังก์ชันบานพับคู่ที่สะท้อนกันโดยมีปมอยู่ที่ x=3.1

ส่วนสำคัญของแบบจำลอง MARS คือฟังก์ชันบานพับที่มีรูปแบบ หรือ โดยที่เป็นค่าคงที่ เรียกว่าน็อตรูปทางด้านขวาแสดงคู่ฟังก์ชันบานพับที่สะท้อนกัน โดยมีน็อตอยู่ที่ 3.1

ฟังก์ชันบานพับจะมีค่าเป็นศูนย์ในช่วงบางส่วนของช่วงค่า ดังนั้นจึงสามารถใช้แบ่งข้อมูลออกเป็นส่วนๆ ที่ไม่ทับซ้อนกัน ซึ่งแต่ละส่วนสามารถจัดการได้อย่างอิสระ ตัวอย่างเช่น ฟังก์ชันบานพับคู่หนึ่งที่สะท้อนกันในนิพจน์ จะสร้าง กราฟเชิงเส้น แบบแบ่งส่วนดังที่แสดงไว้สำหรับแบบจำลอง MARS อย่างง่ายในส่วนก่อนหน้า

บางคนอาจคิดว่าฟังก์ชันเชิงเส้นแบบเป็นช่วงเท่านั้นที่สามารถสร้างได้จากฟังก์ชันบานพับ แต่ความจริงแล้วฟังก์ชันบานพับสามารถคูณกันเพื่อสร้างฟังก์ชันที่ไม่เป็นเชิงเส้นได้

ฟังก์ชันบานพับเรียกอีกอย่างว่า ฟังก์ชันทางลาดฟังก์ชันไม้ฮอกกี้หรือ ฟังก์ชัน ปรับแก้แทนที่จะใช้สัญลักษณ์ที่ใช้ในบทความนี้ ฟังก์ชันบานพับมักจะแสดงด้วย โดยที่ค่าเฉลี่ยจะมีค่าเป็นบวก

กระบวนการสร้างแบบจำลอง

MARS สร้างแบบจำลองในสองขั้นตอน ได้แก่ การส่งผ่านไปข้างหน้าและการส่งผ่านย้อนกลับ วิธีการสองขั้นตอนนี้เหมือนกับที่ใช้ในโครงสร้าง ต้นไม้ แบ่งพาร์ติชันแบบเรียกซ้ำ

การส่งบอลไปข้างหน้า

MARS เริ่มต้นด้วยแบบจำลองที่ประกอบด้วยเพียงพจน์ค่าคงที่ (ซึ่งก็คือค่าเฉลี่ยของค่าการตอบสนอง)

จากนั้น MARS จะเพิ่มฟังก์ชันพื้นฐานเป็นคู่ๆ ลงในแบบจำลองซ้ำๆ ในแต่ละขั้นตอน มันจะหาคู่ของฟังก์ชันพื้นฐานที่ให้การลดค่า ความคลาดเคลื่อน ของผล รวมกำลังสองสูงสุด (เป็นอัลกอริทึมแบบโลภ ) ฟังก์ชันพื้นฐานสองฟังก์ชันในคู่จะเหมือนกันทุกประการ ยกเว้นว่าจะใช้ด้านที่แตกต่างกันของฟังก์ชันบานพับแบบสะท้อนสำหรับแต่ละฟังก์ชัน ฟังก์ชันพื้นฐานใหม่แต่ละฟังก์ชันประกอบด้วยเทอมที่มีอยู่แล้วในแบบจำลอง (ซึ่งอาจเป็นเทอมค่าคงที่) คูณด้วยฟังก์ชันบานพับใหม่ ฟังก์ชันบานพับถูกกำหนดโดยตัวแปรและปม ดังนั้นในการเพิ่มฟังก์ชันพื้นฐานใหม่ MARS ต้องค้นหาในทุกๆ ชุดค่าผสมของสิ่งต่อไปนี้:

  1. คำศัพท์ที่มีอยู่แล้ว (เรียกว่าคำศัพท์หลักในบริบทนี้)
  2. ตัวแปรทั้งหมด (เพื่อเลือกหนึ่งตัวสำหรับฟังก์ชันพื้นฐานใหม่)
  3. ค่าทั้งหมดของตัวแปรแต่ละตัว (สำหรับปมของฟังก์ชันบานพับใหม่)

ในการคำนวณค่าสัมประสิทธิ์ของแต่ละพจน์ MARS จะใช้การถดถอยเชิงเส้นกับพจน์เหล่านั้น

กระบวนการเพิ่มพจน์นี้จะดำเนินต่อไปจนกว่าการเปลี่ยนแปลงของค่าความคลาดเคลื่อนที่เหลืออยู่จะน้อยเกินไปที่จะดำเนินการต่อ หรือจนกว่าจะถึงจำนวนพจน์สูงสุด ซึ่งผู้ใช้จะระบุจำนวนพจน์สูงสุดไว้ก่อนเริ่มสร้างแบบจำลอง

โดยปกติการค้นหาในแต่ละขั้นตอนจะทำใน ลักษณะของการค้นหา แบบใช้กำลังทั้งหมดแต่ลักษณะสำคัญของ MARS คือเนื่องจากธรรมชาติของฟังก์ชันบานพับ การค้นหาสามารถทำได้อย่างรวดเร็วโดยใช้เทคนิคการอัปเดตกำลังสองน้อยที่สุดที่รวดเร็ว การค้นหาแบบใช้กำลังทั้งหมดสามารถเร่งความเร็วได้โดยใช้ฮิวริสติกที่ลดจำนวนเทอมหลักที่พิจารณาในแต่ละขั้นตอน ("Fast MARS" [ 4 ] )

การส่งบอลกลับหลัง

โดยปกติแล้ว การส่งผ่านข้อมูลไปข้างหน้า จะทำให้โมเดล เกิดการโอเวอร์ฟิตเพื่อสร้างโมเดลที่มีความสามารถในการสรุปผลได้ดีขึ้น การส่งผ่านข้อมูลย้อนกลับจะตัดแต่งโมเดล โดยลบเทอมที่มีประสิทธิภาพน้อยที่สุดในแต่ละขั้นตอน จนกว่าจะพบโมเดลย่อยที่ดีที่สุด จากนั้นจะเปรียบเทียบชุดย่อยของโมเดลโดยใช้เกณฑ์การตรวจสอบความถูกต้องแบบไขว้ทั่วไป (Generalized Cross Validation: GCV) ที่อธิบายไว้ด้านล่าง

การส่งผ่านย้อนกลับมีข้อได้เปรียบเหนือการส่งผ่านไปข้างหน้าตรงที่ ในแต่ละขั้นตอนสามารถเลือกคำใดก็ได้ที่จะลบออก ในขณะที่การส่งผ่านไปข้างหน้าในแต่ละขั้นตอนจะเห็นได้เฉพาะคู่คำถัดไปเท่านั้น

การส่งผ่านไปข้างหน้าจะเพิ่มพจน์เป็นคู่ๆ แต่การส่งผ่านย้อนกลับมักจะตัดพจน์ด้านใดด้านหนึ่งของคู่ทิ้งไป ดังนั้นจึงมักไม่เห็นพจน์เป็นคู่ๆ ในแบบจำลองสุดท้าย เราสามารถเห็นจุดเชื่อมต่อแบบคู่ได้ในสมการในตัวอย่าง MARS แรกข้างต้น แต่ไม่มีคู่ที่สมบูรณ์เหลืออยู่ในตัวอย่างโอโซน

การตรวจสอบความถูกต้องแบบทั่วไป

การส่งผ่านย้อนกลับจะเปรียบเทียบประสิทธิภาพของแบบจำลองต่างๆ โดยใช้การตรวจสอบแบบไขว้ทั่วไป (Generalized Cross-Validation หรือ GCV) ซึ่งเป็นรูปแบบย่อยของเกณฑ์ข้อมูล Akaikeที่ประมาณ ค่าคะแนน การตรวจสอบแบบไขว้แบบตัดออกทีละตัว (leave-one-out cross-validation)ในกรณีพิเศษที่ข้อผิดพลาดเป็นแบบเกาส์เซียน หรือเมื่อใช้ฟังก์ชันการสูญ เสียแบบกำลังสอง GCV ถูกนำเสนอโดย Craven และ Wahbaและได้รับการขยายเพิ่มเติมโดย Friedman สำหรับ MARS ค่า GCV ที่ต่ำกว่าแสดงถึงแบบจำลองที่ดีกว่า สูตรสำหรับ GCV คือ

GCV = RSS / ( N · (1 − (จำนวนพารามิเตอร์ที่มีประสิทธิภาพ) / N ) 2 )

โดยที่ RSS คือผลรวมกำลังสองของส่วนเหลือที่วัดจากข้อมูลฝึกฝนและNคือจำนวนการสังเกต (จำนวนแถวใน เมทริกซ์ x )

จำนวนพารามิเตอร์ที่มีประสิทธิภาพถูกกำหนดดังนี้

(จำนวนพารามิเตอร์ที่มีประสิทธิภาพ) = (จำนวนเทอม Mars) + (ค่าปรับ) · ((จำนวนเทอม Mars) − 1 ) / 2

โดย ปกติ ค่าปรับจะมีค่าเท่ากับ 2 (ซึ่งให้ผลลัพธ์เทียบเท่ากับเกณฑ์ข้อมูลของ Akaike ) แต่ผู้ใช้สามารถเพิ่มค่าปรับได้หากต้องการ

โปรดทราบว่า

(จำนวนเทอมของดาวอังคาร − 1 ) / 2

คือจำนวนของปมฟังก์ชันบานพับ ดังนั้นสูตรจึงลงโทษการเพิ่มปม ด้วยเหตุนี้ สูตร GCV จึงปรับ (เช่น เพิ่ม) ค่า RSS ในการฝึกอบรมเพื่อลงโทษแบบจำลองที่ซับซ้อนมากขึ้น เราลงโทษความยืดหยุ่นเพราะแบบจำลองที่ยืดหยุ่นเกินไปจะจำลองการเกิดขึ้นเฉพาะของสัญญาณรบกวนในข้อมูลแทนที่จะเป็นโครงสร้างที่เป็นระบบของข้อมูล

ข้อจำกัด

ข้อจำกัดข้อหนึ่งที่ได้กล่าวถึงไปแล้วคือ ผู้ใช้สามารถระบุจำนวนเทอมสูงสุดในขั้นตอนการส่งต่อข้อมูลได้

นอกจากนี้ ยังสามารถกำหนดข้อจำกัดเพิ่มเติมในการส่งผ่านข้อมูลไปข้างหน้าได้โดยการระบุระดับปฏิสัมพันธ์สูงสุดที่อนุญาต โดยทั่วไปแล้วจะอนุญาตให้มีปฏิสัมพันธ์เพียงหนึ่งหรือสองระดับเท่านั้น แต่สามารถใช้ระดับที่สูงกว่าได้เมื่อข้อมูลสนับสนุน ตัวอย่าง MARS แรกข้างต้นกำหนดระดับปฏิสัมพันธ์สูงสุดไว้ที่หนึ่ง (เช่น ไม่มีปฏิสัมพันธ์หรือใช้แบบจำลองแบบบวก ) ส่วนในตัวอย่างโอโซนกำหนดไว้ที่สอง

นอกจากนี้ ยังสามารถกำหนดข้อจำกัดอื่นๆ สำหรับการประมวลผลไปข้างหน้าได้อีกด้วย ตัวอย่างเช่น ผู้ใช้สามารถระบุได้ว่าอนุญาตให้มีการโต้ตอบได้เฉพาะกับตัวแปรอินพุตบางตัวเท่านั้น ข้อจำกัดดังกล่าวอาจมีความเหมาะสมเนื่องจากความรู้เกี่ยวกับกระบวนการที่สร้างข้อมูลนั้นขึ้นมา

ข้อดีและข้อเสีย

  • แบบจำลอง MARS นั้นเข้าใจและตีความได้ง่าย[ 5 ]
  • MARS สามารถจัดการได้ทั้งข้อมูลต่อเนื่องและข้อมูลเชิงหมวดหมู่[ 6 ] [ 7 ]
  • MARS (เช่นเดียวกับการแบ่งพาร์ติชันแบบเรียกซ้ำ) จะทำการเลือกตัวแปร โดยอัตโนมัติ (หมายความว่าจะรวมตัวแปรที่สำคัญไว้ในแบบจำลองและไม่รวมตัวแปรที่ไม่สำคัญ) อย่างไรก็ตาม อาจมีความไม่แน่นอนในการเลือก โดยเฉพาะอย่างยิ่งเมื่อมีตัวทำนายที่มีความสัมพันธ์กัน และสิ่งนี้อาจส่งผลต่อความสามารถในการตีความ[ 5 ]
  • การสร้างแบบจำลอง MARS มักต้องการการเตรียมข้อมูลเพียงเล็กน้อยหรือไม่มีเลย[ 5 ]
  • รหัสจากหนังสือBayesian Methods for Nonlinear Classification and Regression [ 8 ]สำหรับ Bayesian MARS
  • แบบจำลองเชิงเส้นทั่วไป (GLMs) สามารถนำมาใช้ในแบบจำลอง MARS ได้โดยการใช้ฟังก์ชันเชื่อมโยงหลังจากสร้างแบบจำลอง MARS เสร็จแล้ว ตัวอย่างเช่น แบบจำลอง MARS สามารถนำการถดถอยโลจิสติก มาใช้ ในการทำนายความน่าจะเป็นได้
  • การถดถอยแบบไม่เชิงเส้นใช้เมื่อทราบรูปแบบพื้นฐานของฟังก์ชัน และใช้การถดถอยเพื่อประมาณค่าพารามิเตอร์ของฟังก์ชันนั้นเท่านั้น ในทางกลับกัน MARS ประมาณค่าฟังก์ชันเหล่านั้นเอง แม้ว่าจะมีความจำกัดอย่างมากเกี่ยวกับลักษณะของฟังก์ชัน (ข้อจำกัดเหล่านี้จำเป็นเพราะการค้นหาแบบจำลองจากข้อมูลเป็นปัญหาผกผันที่ไม่สามารถหาคำตอบได้หากไม่มีข้อจำกัดเกี่ยวกับแบบจำลอง)
  • การแบ่งพาร์ติชันแบบเรียกซ้ำ (โดยทั่วไปเรียกว่า CART) MARS สามารถมองได้ว่าเป็นการขยายผลของการแบ่งพาร์ติชันแบบเรียกซ้ำที่อนุญาตให้ใช้โมเดลแบบต่อเนื่อง ซึ่งอาจให้ความเหมาะสมที่ดีกว่าสำหรับข้อมูลเชิงตัวเลข
  • แบบจำลองเสริมทั่วไป (Generalized Additive Models: GAMs) แตกต่างจาก MARS ตรงที่ GAMs ใช้ ฟังก์ชัน loessหรือspline พหุนามที่เรียบ กว่า แทนที่จะใช้ฟังก์ชัน hinge และจะไม่จำลองปฏิสัมพันธ์ระหว่างตัวแปรโดยอัตโนมัติ การปรับให้เรียบขึ้นและการไม่มีพจน์การถดถอยช่วยลดความแปรปรวนเมื่อเทียบกับ MARS แต่การละเลยปฏิสัมพันธ์ระหว่างตัวแปรอาจทำให้เกิดอคติมากขึ้น
  • TSMARS ( Time Series Mars) เป็นคำที่ใช้เมื่อแบบจำลอง MARS ถูกนำไปใช้ใน บริบท ของอนุกรมเวลา โดยทั่วไปในการตั้งค่านี้ ตัวแปรทำนายคือค่าอนุกรมเวลาที่ล่าช้า ส่งผลให้ได้ แบบจำลองสปลายแบบ อัตถารีเกรสซีฟ แบบจำลองเหล่านี้และส่วนขยายเพื่อรวมแบบจำลองสปลายค่าเฉลี่ยเคลื่อนที่นั้นได้อธิบายไว้ใน " การสร้างแบบจำลองและการพยากรณ์อนุกรมเวลา แบบตัวแปรเดียวโดยใช้ TSMARS: การศึกษาแบบจำลองอนุกรมเวลาแบบอัตถารีเกรสซีฟ ตามฤดูกาล และค่าเฉลี่ยเคลื่อนที่แบบเกณฑ์โดยใช้ TSMARS"
  • Bayesian MARS (BMARS) ใช้รูปแบบโมเดลเดียวกัน แต่สร้างโมเดลโดยใช้วิธีการแบบเบย์เซียน อาจได้โมเดล MARS ที่เหมาะสมที่สุดที่แตกต่างกัน เนื่องจากวิธีการสร้างโมเดลแตกต่างกัน ผลลัพธ์ของ BMARS โดยทั่วไปคือกลุ่มตัวอย่างภายหลังของโมเดล MARS ซึ่งช่วยให้สามารถทำนายความน่าจะเป็นได้[ 9 ]

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • Hastie T., Tibshirani R. และ Friedman JH (2009) องค์ประกอบของการเรียนรู้ทางสถิติฉบับที่ 2 สปริงเกอร์ISBN 978-0-387-84857-0(มีส่วนที่เกี่ยวกับดาวอังคาร)
  • Faraway J. (2005) การขยายแบบจำลองเชิงเส้นด้วย R , CRC, ISBN 978-1-58488-424-8(มีตัวอย่างการใช้ MARS ร่วมกับ R)
  • Heping Zhang และ Burton H. Singer (2010) การแบ่งพาร์ติชันแบบเรียกซ้ำและการประยุกต์ใช้ฉบับที่ 2 Springer, ISBN 978-1-4419-6823-4(มีบทหนึ่งเกี่ยวกับ MARS และกล่าวถึงการปรับแต่งอัลกอริธึมบางส่วน)
  • Denison DGT, Holmes CC, Mallick BK และ Smith AFM (2004) วิธีการแบบเบย์เซียนสำหรับการจำแนกและการถดถอยแบบไม่เชิงเส้น สำนักพิมพ์ Wiley, ISBN 978-0-471-49036-4
  • Berk RA (2008) การเรียนรู้ทางสถิติจากมุมมองของการถดถอย , Springer, ISBN 978-0-387-77500-5
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Multivariate_adaptive_regression_spline&oldid=1337482970 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ สปลายการถดถอยแบบปรับตัวหลายตัวแปร

ในทางสถิติสปลายการถดถอยแบบปรับตัวหลายตัวแปร ( MARS ) เป็นรูปแบบหนึ่งของการวิเคราะห์การถดถอย ที่ Jerome H.

พื้นฐาน

ส่วนนี้จะแนะนำ MARS โดยใช้ตัวอย่างประกอบ เราเริ่มต้นด้วยชุดข้อมูล: เมทริกซ์ของตัวแปรป้อนเข้า x และเวกเตอร์ของการตอบสนองที่สังเกตได้ y โดยแต่ละแถวใน x จะมีการตอบสนองหนึ่ง ค่า ตัวอย่างเช่น ข้อมูลอาจเป็นดังนี้:

หน้าที่ของบานพับ

ส่วนสำคัญของแบบจำลอง MARS คือ ฟังก์ชันบานพับ ที่มีรูปแบบ หรือ โดยที่เป็นค่าคงที่ เรียกว่า น็อต รูปทางด้านขวาแสดงคู่ฟังก์ชันบานพับที่สะท้อนกัน โดยมีน็อตอยู่ที่ 3.

กระบวนการสร้างแบบจำลอง

MARS สร้างแบบจำลองในสองขั้นตอน ได้แก่ การส่งผ่านไปข้างหน้าและการส่งผ่านย้อนกลับ วิธีการสองขั้นตอนนี้เหมือนกับที่ใช้ในโครงสร้าง ต้นไม้ แบ่งพาร์ติชันแบบเรียกซ้ำ