อ่าน 4 นาที
การตรวจจับปฏิสัมพันธ์อัตโนมัติแบบไคสแควร์
การตรวจจับปฏิสัมพันธ์อัตโนมัติแบบไคสแควร์ ( CHAID ) [ 1 ] เป็น เทคนิค ต้นไม้ตัดสินใจ ที่อิงตามการทดสอบความสำคัญที่ปรับแล้ว ( การ แก้ไข Bonferroni การทดสอบ Holm-Bonferroni ) [ 2 ]...
การตรวจจับปฏิสัมพันธ์อัตโนมัติแบบไคสแควร์
การตรวจจับปฏิสัมพันธ์อัตโนมัติแบบไคสแควร์ ( CHAID ) [ 1 ]เป็น เทคนิค ต้นไม้ตัดสินใจที่อิงตามการทดสอบความสำคัญที่ปรับแล้ว ( การแก้ไข Bonferroni การทดสอบ Holm-Bonferroni ) [ 2 ] [ 3 ]
ประวัติศาสตร์
CHAID อิงตามการขยายอย่างเป็นทางการของขั้นตอน AID (Automatic Interaction Detection) [ 4 ]และ THAID (THeta Automatic Interaction Detection) [ 5 ] [ 6 ]ในช่วงทศวรรษ 1960 และ 1970 ซึ่งในทางกลับกันก็เป็นการขยายจากการวิจัยก่อนหน้านี้ รวมถึงการวิจัยที่ดำเนินการโดย Belson ในสหราชอาณาจักรในช่วงทศวรรษ 1950 [ 7 ]
ในปี พ.ศ. 2518 เทคนิค CHAID ได้รับการพัฒนาขึ้นในแอฟริกาใต้ และได้รับการตีพิมพ์ในปี พ.ศ. 2523 โดย Gordon V. Kass ซึ่งได้ทำวิทยานิพนธ์ปริญญาเอกเกี่ยวกับหัวข้อนี้[ 2 ]
ประวัติของวิธีการต้นไม้แบบกำกับดูแลก่อนหน้านี้สามารถพบได้ในRitschardซึ่งรวมถึงคำอธิบายโดยละเอียดของอัลกอริทึม CHAID ดั้งเดิมและส่วนขยาย CHAID ที่ครอบคลุมโดย Biggs, De Ville และ Suen [ 3 ] [ 1 ]
CHAID ถูกนำมาใช้เป็น เทคนิค การขุดค้นข้อมูลซึ่งเป็นเทคนิคที่ใช้การแบ่งแบบหลายวิธีเพื่อสร้างกลุ่มที่แยกจากกันและทำความเข้าใจผลกระทบของกลุ่มเหล่านั้นต่อตัวแปรตาม CHAID ได้รับเลือกสำหรับการวิเคราะห์เนื่องจากมีเกณฑ์หลักห้าประการดังนี้:
1. ข้อมูลที่ป้อนเข้ามาส่วนใหญ่เป็นข้อมูลเชิงหมวดหมู่
2. ประสิทธิภาพในการประมวลผลชุดข้อมูลขนาดใหญ่
3. มีภาพประกอบที่ชัดเจนและเข้าใจง่าย
4. ความง่ายในการนำกฎทางธุรกิจที่สร้างจาก CHAID ไปใช้/บูรณาการในธุรกิจ และ
5. คุณภาพข้อมูลขาเข้าสามารถจัดการได้อย่างมีประสิทธิภาพ[ 8 ] [ 9 ]
คุณสมบัติ
CHAID สามารถใช้สำหรับการทำนาย (ในลักษณะเดียวกับการวิเคราะห์การถดถอยซึ่ง CHAID เวอร์ชันนี้เดิมเรียกว่า XAID) รวมถึงการจำแนกประเภท และการตรวจจับปฏิสัมพันธ์ระหว่างตัวแปร[ 4 ] [ 5 ] [ 6 ]
ในทางปฏิบัติ CHAID มักถูกใช้ในบริบทของการตลาดทางตรงเพื่อเลือกกลุ่มผู้บริโภคเพื่อทำนายว่าการตอบสนองต่อตัวแปรบางอย่างจะส่งผลต่อตัวแปรอื่นอย่างไร แม้ว่าการประยุกต์ใช้ในช่วงแรกๆ จะอยู่ในด้านการวิจัยทางการแพทย์และจิตเวชก็ตาม
เช่นเดียวกับแผนผังการตัดสินใจอื่นๆ CHAID มีข้อดีคือผลลัพธ์ที่ได้นั้นมองเห็นได้ชัดเจนและเข้าใจง่าย เนื่องจากโดยค่าเริ่มต้นจะใช้การแบ่งแบบหลายทาง จึงจำเป็นต้องใช้ขนาดตัวอย่างที่ค่อนข้างใหญ่เพื่อให้ทำงานได้อย่างมีประสิทธิภาพ เพราะหากขนาดตัวอย่างเล็กเกินไป กลุ่มผู้ตอบแบบสอบถามอาจเล็กเกินไปจนไม่สามารถวิเคราะห์ได้อย่างน่าเชื่อถือ
ข้อดีที่สำคัญอย่างหนึ่งของ CHAID เมื่อเทียบกับทางเลือกอื่น ๆ เช่น การวิเคราะห์การถดถอยพหุตัวแปร คือ CHAID เป็นวิธีการวิเคราะห์แบบไม่ใช้พารามิเตอร์
ดูเพิ่มเติม
- การแก้ไขแบบบอนเฟอร์โรนี
- การแจกแจงไคกำลังสอง
- การเรียนรู้ต้นไม้ตัดสินใจ
- แบบจำลองคลาสแฝง
- ส่วนแบ่งตลาด
- การเปรียบเทียบหลายรายการ
- การสร้างแบบจำลองสมการโครงสร้าง
บรรณานุกรม
- Press, Laurence I.; Rogers, Miles S.; & Shure, Gerald H.; เทคนิคเชิงโต้ตอบสำหรับการวิเคราะห์ข้อมูลหลายตัวแปร , วิทยาศาสตร์พฤติกรรม, เล่มที่ 14 (1969), หน้า 364–370
- ฮอว์กินส์, ดักลาส เอ็ม. และ คาสส์, กอร์ดอน วี. การตรวจจับปฏิสัมพันธ์อัตโนมัติใน ฮอว์กินส์, ดักลาส เอ็ม. (บรรณาธิการ), หัวข้อในการวิเคราะห์หลายตัวแปรประยุกต์ , สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์, เคมบริดจ์, 1982, หน้า 269–302
- Hooton, Thomas M.; Haley, Robert W.; Culver, David H.; White, John W.; Morgan, W. Meade; และ Carroll, Raymond J.; ความสัมพันธ์ร่วมกันของปัจจัยเสี่ยงหลายประการกับการเกิดการติดเชื้อในโรงพยาบาล , American Journal of Medicine, Vol. 70, (1981), หน้า 960–970
- Brink, Susanne; & Van Schalkwyk, Dirk J.; ระดับเฟอร์ริตินในซีรั่มและปริมาตรเม็ดเลือดแดงเฉลี่ยเป็นตัวทำนายปริมาณธาตุเหล็กในไขกระดูก , วารสารการแพทย์แอฟริกาใต้, เล่มที่ 61, (1982), หน้า 432–434
- McKenzie, Dean P.; McGorry, Patrick D.; Wallace, Chris S.; Low, Lee H.; Copolov, David L.; และ Singh, Bruce S.; การสร้างแผนผังการตัดสินใจวินิจฉัยขั้นต่ำ , วิธีการสารสนเทศทางการแพทย์, เล่มที่ 32 (1993), หน้า 161–166
- Magidson, Jay; แนวทาง CHAID ในการสร้างแบบจำลองการแบ่งกลุ่ม: การตรวจจับปฏิสัมพันธ์อัตโนมัติแบบไคสแควร์ใน Bagozzi, Richard P. (บรรณาธิการ); วิธีการวิจัยการตลาดขั้นสูง , Blackwell, Oxford, GB, 1994, หน้า 118–159
- Hawkins, Douglas M.; Young, S. S.; & Rosinko, A.; Analysis of a large structure-activity dataset using recursive partitioning, Quantitative Structure-Activity Relationships, Vol. 16, (1997), pp. 296–302
External lkinks
- Luchman, J.N.; CHAID: Stata module to conduct chi-square automated interaction detection, Available for free download, or type within Stata: ssc install chaid.
- Luchman, J.N.; CHAIDFOREST: Stata module to conduct random forest ensemble classification based on chi-square automated interaction detection (CHAID) as base learner, Available for free download, or type within Stata: ssc install chaidforest.
- IBM SPSS Decision Trees grows exhaustive CHAID trees as well as a few other types of trees such as CART.
- An R package CHAID is available on R-Forge.
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การตรวจจับปฏิสัมพันธ์อัตโนมัติแบบไคสแควร์
การตรวจจับปฏิสัมพันธ์อัตโนมัติแบบไคสแควร์ ( CHAID ) [ 1 ] เป็น เทคนิค ต้นไม้ตัดสินใจ ที่อิงตามการทดสอบความสำคัญที่ปรับแล้ว ( การ แก้ไข Bonferroni การทดสอบ Holm-Bonferroni ) [ 2 ]...
ประวัติศาสตร์
CHAID อิงตามการขยายอย่างเป็นทางการของขั้นตอน AID (Automatic Interaction Detection) [ 4 ] และ THAID (THeta Automatic Interaction Detection) [ 5 ] [ 6 ] ในช่วงทศวรรษ 1960 และ 1970 ซึ่งในทางกลับกันก็เป็นการขยายจากการวิจัยก่อนหน้านี้ รวมถึงการวิจัยที่ดำเนินการโดย...
คุณสมบัติ
CHAID สามารถใช้สำหรับการทำนาย (ในลักษณะเดียวกับ การวิเคราะห์การถดถอย ซึ่ง CHAID เวอร์ชันนี้เดิมเรียกว่า XAID) รวมถึงการจำแนกประเภท และการตรวจจับปฏิสัมพันธ์ระหว่างตัวแปร [ 4 ] [ 5 ] [ 6 ]
ดูเพิ่มเติม
การแก้ไขแบบบอนเฟอร์โรนี การแจกแจงไคกำลังสอง การเรียนรู้ต้นไม้ตัดสินใจ แบบจำลองคลาสแฝง ส่วนแบ่งตลาด การเปรียบเทียบหลายรายการ การสร้างแบบจำลองสมการโครงสร้าง