กลับไปหน้าบทความ

อ่าน 4 นาที

การตรวจจับปฏิสัมพันธ์อัตโนมัติแบบไคสแควร์

การตรวจจับปฏิสัมพันธ์อัตโนมัติแบบไคสแควร์ ( CHAID ) [ 1 ] เป็น เทคนิค ต้นไม้ตัดสินใจ ที่อิงตามการทดสอบความสำคัญที่ปรับแล้ว ( การ แก้ไข Bonferroni การทดสอบ Holm-Bonferroni ) [ 2 ]...

การตรวจจับปฏิสัมพันธ์อัตโนมัติแบบไคสแควร์

การตรวจจับปฏิสัมพันธ์อัตโนมัติแบบไคสแควร์ ( CHAID ) [ 1 ]เป็น เทคนิค ต้นไม้ตัดสินใจที่อิงตามการทดสอบความสำคัญที่ปรับแล้ว ( การแก้ไข Bonferroni การทดสอบ Holm-Bonferroni ) [ 2 ] [ 3 ]

ประวัติศาสตร์

CHAID อิงตามการขยายอย่างเป็นทางการของขั้นตอน AID (Automatic Interaction Detection) [ 4 ]และ THAID (THeta Automatic Interaction Detection) [ 5 ] [ 6 ]ในช่วงทศวรรษ 1960 และ 1970 ซึ่งในทางกลับกันก็เป็นการขยายจากการวิจัยก่อนหน้านี้ รวมถึงการวิจัยที่ดำเนินการโดย Belson ในสหราชอาณาจักรในช่วงทศวรรษ 1950 [ 7 ]

ในปี พ.ศ. 2518 เทคนิค CHAID ได้รับการพัฒนาขึ้นในแอฟริกาใต้ และได้รับการตีพิมพ์ในปี พ.ศ. 2523 โดย Gordon V. Kass ซึ่งได้ทำวิทยานิพนธ์ปริญญาเอกเกี่ยวกับหัวข้อนี้[ 2 ]

ประวัติของวิธีการต้นไม้แบบกำกับดูแลก่อนหน้านี้สามารถพบได้ในRitschardซึ่งรวมถึงคำอธิบายโดยละเอียดของอัลกอริทึม CHAID ดั้งเดิมและส่วนขยาย CHAID ที่ครอบคลุมโดย Biggs, De Ville และ Suen [ 3 ] [ 1 ]

CHAID ถูกนำมาใช้เป็น เทคนิค การขุดค้นข้อมูลซึ่งเป็นเทคนิคที่ใช้การแบ่งแบบหลายวิธีเพื่อสร้างกลุ่มที่แยกจากกันและทำความเข้าใจผลกระทบของกลุ่มเหล่านั้นต่อตัวแปรตาม CHAID ได้รับเลือกสำหรับการวิเคราะห์เนื่องจากมีเกณฑ์หลักห้าประการดังนี้:

1. ข้อมูลที่ป้อนเข้ามาส่วนใหญ่เป็นข้อมูลเชิงหมวดหมู่

2. ประสิทธิภาพในการประมวลผลชุดข้อมูลขนาดใหญ่

3. มีภาพประกอบที่ชัดเจนและเข้าใจง่าย

4. ความง่ายในการนำกฎทางธุรกิจที่สร้างจาก CHAID ไปใช้/บูรณาการในธุรกิจ และ

5. คุณภาพข้อมูลขาเข้าสามารถจัดการได้อย่างมีประสิทธิภาพ[ 8 ] [ 9 ]

คุณสมบัติ

CHAID สามารถใช้สำหรับการทำนาย (ในลักษณะเดียวกับการวิเคราะห์การถดถอยซึ่ง CHAID เวอร์ชันนี้เดิมเรียกว่า XAID) รวมถึงการจำแนกประเภท และการตรวจจับปฏิสัมพันธ์ระหว่างตัวแปร[ 4 ] [ 5 ] [ 6 ]

ในทางปฏิบัติ CHAID มักถูกใช้ในบริบทของการตลาดทางตรงเพื่อเลือกกลุ่มผู้บริโภคเพื่อทำนายว่าการตอบสนองต่อตัวแปรบางอย่างจะส่งผลต่อตัวแปรอื่นอย่างไร แม้ว่าการประยุกต์ใช้ในช่วงแรกๆ จะอยู่ในด้านการวิจัยทางการแพทย์และจิตเวชก็ตาม

เช่นเดียวกับแผนผังการตัดสินใจอื่นๆ CHAID มีข้อดีคือผลลัพธ์ที่ได้นั้นมองเห็นได้ชัดเจนและเข้าใจง่าย เนื่องจากโดยค่าเริ่มต้นจะใช้การแบ่งแบบหลายทาง จึงจำเป็นต้องใช้ขนาดตัวอย่างที่ค่อนข้างใหญ่เพื่อให้ทำงานได้อย่างมีประสิทธิภาพ เพราะหากขนาดตัวอย่างเล็กเกินไป กลุ่มผู้ตอบแบบสอบถามอาจเล็กเกินไปจนไม่สามารถวิเคราะห์ได้อย่างน่าเชื่อถือ

ข้อดีที่สำคัญอย่างหนึ่งของ CHAID เมื่อเทียบกับทางเลือกอื่น ๆ เช่น การวิเคราะห์การถดถอยพหุตัวแปร คือ CHAID เป็นวิธีการวิเคราะห์แบบไม่ใช้พารามิเตอร์

ดูเพิ่มเติม

บรรณานุกรม

  • Press, Laurence I.; Rogers, Miles S.; & Shure, Gerald H.; เทคนิคเชิงโต้ตอบสำหรับการวิเคราะห์ข้อมูลหลายตัวแปร , วิทยาศาสตร์พฤติกรรม, เล่มที่ 14 (1969), หน้า 364–370
  • ฮอว์กินส์, ดักลาส เอ็ม. และ คาสส์, กอร์ดอน วี. การตรวจจับปฏิสัมพันธ์อัตโนมัติใน ฮอว์กินส์, ดักลาส เอ็ม. (บรรณาธิการ), หัวข้อในการวิเคราะห์หลายตัวแปรประยุกต์ , สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์, เคมบริดจ์, 1982, หน้า 269–302
  • Hooton, Thomas M.; Haley, Robert W.; Culver, David H.; White, John W.; Morgan, W. Meade; และ Carroll, Raymond J.; ความสัมพันธ์ร่วมกันของปัจจัยเสี่ยงหลายประการกับการเกิดการติดเชื้อในโรงพยาบาล , American Journal of Medicine, Vol. 70, (1981), หน้า 960–970
  • Brink, Susanne; & Van Schalkwyk, Dirk J.; ระดับเฟอร์ริตินในซีรั่มและปริมาตรเม็ดเลือดแดงเฉลี่ยเป็นตัวทำนายปริมาณธาตุเหล็กในไขกระดูก , วารสารการแพทย์แอฟริกาใต้, เล่มที่ 61, (1982), หน้า 432–434
  • McKenzie, Dean P.; McGorry, Patrick D.; Wallace, Chris S.; Low, Lee H.; Copolov, David L.; และ Singh, Bruce S.; การสร้างแผนผังการตัดสินใจวินิจฉัยขั้นต่ำ , วิธีการสารสนเทศทางการแพทย์, เล่มที่ 32 (1993), หน้า 161–166
  • Magidson, Jay; แนวทาง CHAID ในการสร้างแบบจำลองการแบ่งกลุ่ม: การตรวจจับปฏิสัมพันธ์อัตโนมัติแบบไคสแควร์ใน Bagozzi, Richard P. (บรรณาธิการ); วิธีการวิจัยการตลาดขั้นสูง , Blackwell, Oxford, GB, 1994, หน้า 118–159
  • Hawkins, Douglas M.; Young, S. S.; & Rosinko, A.; Analysis of a large structure-activity dataset using recursive partitioning, Quantitative Structure-Activity Relationships, Vol. 16, (1997), pp. 296–302

External lkinks

  • Luchman, J.N.; CHAID: Stata module to conduct chi-square automated interaction detection, Available for free download, or type within Stata: ssc install chaid.
  • Luchman, J.N.; CHAIDFOREST: Stata module to conduct random forest ensemble classification based on chi-square automated interaction detection (CHAID) as base learner, Available for free download, or type within Stata: ssc install chaidforest.
  • IBM SPSS Decision Trees grows exhaustive CHAID trees as well as a few other types of trees such as CART.
  • An R package CHAID is available on R-Forge.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Chi-square_automatic_interaction_detection&oldid=1349583179"

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การตรวจจับปฏิสัมพันธ์อัตโนมัติแบบไคสแควร์

การตรวจจับปฏิสัมพันธ์อัตโนมัติแบบไคสแควร์ ( CHAID ) [ 1 ] เป็น เทคนิค ต้นไม้ตัดสินใจ ที่อิงตามการทดสอบความสำคัญที่ปรับแล้ว ( การ แก้ไข Bonferroni การทดสอบ Holm-Bonferroni ) [ 2 ]...

ประวัติศาสตร์

CHAID อิงตามการขยายอย่างเป็นทางการของขั้นตอน AID (Automatic Interaction Detection) [ 4 ] และ THAID (THeta Automatic Interaction Detection) [ 5 ] [ 6 ] ในช่วงทศวรรษ 1960 และ 1970 ซึ่งในทางกลับกันก็เป็นการขยายจากการวิจัยก่อนหน้านี้ รวมถึงการวิจัยที่ดำเนินการโดย...

คุณสมบัติ

CHAID สามารถใช้สำหรับการทำนาย (ในลักษณะเดียวกับ การวิเคราะห์การถดถอย ซึ่ง CHAID เวอร์ชันนี้เดิมเรียกว่า XAID) รวมถึงการจำแนกประเภท และการตรวจจับปฏิสัมพันธ์ระหว่างตัวแปร [ 4 ] [ 5 ] [ 6 ]

ดูเพิ่มเติม

การแก้ไขแบบบอนเฟอร์โรนี การแจกแจงไคกำลังสอง การเรียนรู้ต้นไม้ตัดสินใจ แบบจำลองคลาสแฝง ส่วนแบ่งตลาด การเปรียบเทียบหลายรายการ การสร้างแบบจำลองสมการโครงสร้าง