อ่าน 7 นาที
แค็กเกิล
Kaggleเป็นแพลตฟอร์มการแข่งขันวิทยาศาสตร์ข้อมูลและชุมชนออนไลน์สำหรับนักวิทยาศาสตร์ข้อมูลและ ผู้ปฏิบัติงานด้าน การเรียนรู้ของเครื่องภายใต้Google LLC Kaggle...
แค็กเกิล
โลโก้ Kaggle | |
| พิมพ์ | บริษัทในเครือ |
|---|---|
| อุตสาหกรรม | วิทยาศาสตร์ข้อมูล |
| ก่อตั้ง | เมษายน 2553 |
| ผู้ก่อตั้ง | |
| สำนักงานใหญ่ | ซานฟรานซิสโก สหรัฐอเมริกา |
บุคคลสำคัญ |
|
| สินค้า | การแข่งขัน, Kaggle Kernels, Kaggle Datasets, Kaggle Learn |
| พ่อแม่ | Google (ปี 2017 – ปัจจุบัน) |
| เว็บไซต์ | kaggle.com |
Kaggleเป็นแพลตฟอร์มการแข่งขันวิทยาศาสตร์ข้อมูลและชุมชนออนไลน์สำหรับนักวิทยาศาสตร์ข้อมูลและ ผู้ปฏิบัติงานด้าน การเรียนรู้ของเครื่องภายใต้Google LLC Kaggle ช่วยให้ผู้ใช้สามารถค้นหาและเผยแพร่ชุดข้อมูล สำรวจและสร้างแบบจำลองในสภาพแวดล้อมวิทยาศาสตร์ข้อมูลบนเว็บ ทำงานร่วมกับนักวิทยาศาสตร์ข้อมูลและวิศวกรการเรียนรู้ของเครื่องคนอื่นๆ และเข้าร่วมการแข่งขันเพื่อแก้ปัญหาความท้าทายด้านวิทยาศาสตร์ข้อมูล[ 1 ] Kaggle ยังอำนวยความสะดวกในการใช้ข้อมูลที่ไม่ถูกต้องและไม่น่าเชื่อถือในการวิจัยทางการแพทย์อีกด้วย
ประวัติศาสตร์
Kaggle ก่อตั้งโดยAnthony Goldbloomในเดือนเมษายน 2010 [ 2 ] Jeremy Howardหนึ่งในผู้ใช้ Kaggle คนแรกๆ เข้าร่วมในเดือนพฤศจิกายน 2010 และดำรงตำแหน่งประธานและหัวหน้านักวิทยาศาสตร์[ 3 ]นอกจากนี้ในทีมยังมีNicholas Gruenซึ่งดำรงตำแหน่งประธานผู้ก่อตั้ง[ 4 ]ในปี 2011 บริษัทระดมทุนได้ 12.5 ล้านดอลลาร์ และMax Levchinกลายเป็นประธาน[ 5 ]เมื่อวันที่ 8 มีนาคม 2017 Fei-Fei Liหัวหน้านักวิทยาศาสตร์ของ Google ประกาศว่าGoogleกำลังเข้าซื้อกิจการ Kaggle [ 6 ]
ในเดือนมิถุนายน พ.ศ. 2560 Kaggle มีผู้ใช้งานที่ลงทะเบียนเกิน 1 ล้านราย และ ณ เดือนตุลาคม พ.ศ. 2566 มีผู้ใช้งานมากกว่า 15 ล้านรายใน 194 ประเทศ[ 7 ] [ 8 ] [ 9 ]
ในปี 2022 ผู้ก่อตั้ง Goldbloom และ Hamner ได้ลาออกจากตำแหน่ง และ D. Sculley กลายเป็นCEO [ 10 ]
ในเดือนกุมภาพันธ์ 2023 Kaggle ได้เปิดตัว Models ซึ่งอนุญาตให้ผู้ใช้ค้นหาและใช้โมเดลที่ได้รับการฝึกฝนล่วงหน้าผ่านการผสานรวมอย่างลึกซึ้งกับแพลตฟอร์ม Kaggle ส่วนที่เหลือ[ 11 ]
ในเดือนเมษายน พ.ศ. 2568 Kaggle ได้ร่วมมือกับมูลนิธิวิกิมีเดีย[ 12 ]
ภาพรวมของเว็บไซต์
การแข่งขัน
มีการจัดการแข่งขัน การเรียนรู้ของเครื่องหลายรายการบน Kaggle นับตั้งแต่บริษัทก่อตั้งขึ้น การแข่งขันที่น่าสนใจ ได้แก่ การจดจำท่าทางสำหรับMicrosoft Kinect [ 13 ]การสร้างAI ฟุตบอล สำหรับแมนเชสเตอร์ซิตี้การเขียนโค้ดอัลกอริทึมการซื้อขายสำหรับTwo Sigma Investments [ 14 ] และการปรับปรุงการค้นหาอนุภาคฮิกส์ที่CERN [ 15 ]
ผู้จัดการแข่งขันจะเตรียมข้อมูลและคำอธิบายของปัญหา ผู้จัดการแข่งขันอาจเลือกได้ว่าจะให้รางวัลเป็นเงินหรือไม่ ผู้เข้าร่วมจะทดลองใช้เทคนิคต่างๆ และแข่งขันกันเพื่อสร้างแบบจำลองที่ดีที่สุด ผลงานจะถูกเผยแพร่ต่อสาธารณะผ่าน Kaggle Kernels เพื่อให้ได้เกณฑ์มาตรฐานที่ดีขึ้นและเพื่อสร้างแรงบันดาลใจให้เกิดแนวคิดใหม่ๆ สามารถส่งผลงานได้ผ่าน Kaggle Kernels ผ่านการอัปโหลดด้วยตนเอง หรือใช้ Kaggle APIสำหรับการแข่งขันส่วนใหญ่ ผลงานจะได้รับการให้คะแนนทันที (โดยพิจารณาจากความแม่นยำในการทำนายเทียบกับไฟล์โซลูชันที่ซ่อนอยู่) และสรุปผลบนกระดานผู้นำแบบเรียลไทม์ หลังจากหมดเขต ผู้จัดการแข่งขันจะจ่ายเงินรางวัลเพื่อแลกกับ "ใบอนุญาตทั่วโลก ถาวร เพิกถอนไม่ได้ และไม่มีค่าลิขสิทธิ์ [...] ในการใช้ผลงานที่ชนะ" กล่าวคือ อัลกอริทึม ซอฟต์แวร์ และทรัพย์สินทางปัญญา ที่เกี่ยวข้อง ที่พัฒนาขึ้น ซึ่ง "ไม่เป็นเอกสิทธิ์เว้นแต่จะระบุไว้เป็นอย่างอื่น" [ 16 ]
นอกจากการแข่งขันสาธารณะแล้ว Kaggle ยังมีการแข่งขันส่วนตัวซึ่งจำกัดเฉพาะผู้เข้าร่วมอันดับต้น ๆ ของ Kaggle เท่านั้น Kaggle ยังมีเครื่องมือฟรีสำหรับครูวิทยาศาสตร์ข้อมูลในการจัดการแข่งขันการเรียนรู้เครื่องจักรเชิงวิชาการ[ 17 ] นอกจากนี้ Kaggle ยังจัดการแข่งขันคัดเลือกบุคลากรซึ่งนักวิทยาศาสตร์ข้อมูลแข่งขันกันเพื่อโอกาสในการสัมภาษณ์งานที่บริษัทวิทยาศาสตร์ข้อมูลชั้นนำ เช่นFacebook , Winton CapitalและWalmart
การแข่งขันของ Kaggle ส่งผลให้เกิดโครงการที่ประสบความสำเร็จ เช่น การพัฒนาการวิจัย เกี่ยว กับ HIV [ 18 ] การจัดอันดับหมากรุก[ 19 ]และการพยากรณ์การจราจร[ 20 ] Geoffrey Hintonและ George Dahl ใช้โครงข่ายประสาทเทียมเชิง ลึก เพื่อชนะการแข่งขันที่จัดโดยMerck Vlad Mnih (หนึ่งในนักเรียนของ Hinton) ใช้โครงข่ายประสาทเทียมเชิงลึกเพื่อชนะการแข่งขันที่จัดโดยAdzunaส่งผลให้เทคนิคนี้ถูกนำไปใช้โดยคนอื่นๆ ในชุมชน Kaggle Tianqi Chen จากมหาวิทยาลัยวอชิงตันยังใช้ Kaggle เพื่อแสดงพลังของXGBoostซึ่งต่อมาได้เข้ามาแทนที่Random Forestในฐานะหนึ่งในวิธีการหลักที่ใช้ในการชนะการแข่งขัน Kaggle
มีการตีพิมพ์เอกสารทางวิชาการหลายฉบับโดยอิงจากผลการค้นพบจากการแข่งขัน Kaggle [ 21 ] ปัจจัยหนึ่งที่สนับสนุนเรื่องนี้คือกระดานผู้นำแบบเรียลไทม์ ซึ่งกระตุ้นให้ผู้เข้าร่วมคิดค้นนวัตกรรมต่อไปนอกเหนือจากแนวปฏิบัติที่ดีที่สุดที่มีอยู่[ 22 ]วิธีการที่ชนะมักจะถูกเขียนไว้ในบล็อกของผู้ชนะ Kaggle
ระบบความก้าวหน้า
Kaggle ได้นำระบบความก้าวหน้ามาใช้เพื่อรับรู้และให้รางวัลแก่ผู้ใช้ตามการมีส่วนร่วมและความสำเร็จภายในแพลตฟอร์ม ระบบนี้ประกอบด้วยห้าระดับ ได้แก่ ระดับเริ่มต้น ระดับผู้ร่วมให้ข้อมูล ระดับผู้เชี่ยวชาญ ระดับปรมาจารย์ และระดับปรมาจารย์ แต่ละระดับจะได้รับจากการปฏิบัติตามเกณฑ์เฉพาะในการแข่งขัน ชุดข้อมูล เคอร์เนล (การแบ่งปันโค้ด) และการสนทนา[ 23 ]
ระดับสูงสุด Kaggle Grandmaster จะมอบให้แก่ผู้ใช้ที่ติดอันดับต้น ๆ ในการแข่งขันหลายรายการ รวมถึงการจัดอันดับสูงในทีมเดี่ยว ณ วันที่ 2 เมษายน 2568 จากบัญชี Kaggle ทั้งหมด 23.29 ล้านบัญชี มี 2,973 บัญชีที่ได้รับสถานะ Kaggle Master และ 612 บัญชีที่ได้รับสถานะ Kaggle Grandmaster [ 24 ]
สมุดบันทึก Kaggle

Kaggle มี สภาพแวดล้อมการพัฒนาแบบบูรณาการออนไลน์แบบใช้เบราว์เซอร์ฟรีเรียกว่า Kaggle Notebooks ซึ่งออกแบบมาสำหรับวิทยาศาสตร์ข้อมูลและการเรียนรู้ของเครื่องผู้ใช้สามารถเขียนและเรียกใช้โค้ดในPythonหรือRนำเข้าชุดข้อมูล ใช้ไลบรารีที่เป็นที่นิยม และฝึกโมเดลบนCPU , GPUหรือTPUได้โดยตรงบนคลาวด์ สภาพแวดล้อมนี้มักใช้สำหรับการส่งผลงานเข้าแข่งขัน บทช่วยสอน การศึกษา และการวิเคราะห์ข้อมูล เชิง สำรวจ[ 25 ] [ 26 ]
ปัญหาการวิจัยทางการแพทย์
ในเดือนธันวาคม พ.ศ. 2568 มีบทความตีพิมพ์ในThe Transmitterชื่อเรื่อง "พิเศษ: Springer Nature ถอนและลบสิ่งพิมพ์เกือบ 40 ฉบับที่ฝึกเครือข่ายประสาทเทียมบนชุดข้อมูลที่ 'บ้าบอ'" [ 27 ]ชุดข้อมูลดังกล่าวถูกอัปโหลดไปยัง Kaggle ซึ่งประกอบด้วยภาพถ่ายใบหน้าของเด็กออทิสติกและเด็กที่ไม่เป็นออทิสติก ชุดข้อมูลนี้มีภาพมากกว่า 2,900 ภาพ และไม่น่าเป็นไปได้ที่เด็กเหล่านี้หรือครอบครัวของพวกเขาจะให้ความยินยอมในการใช้ภาพถ่ายเพื่อการวิจัยทางการแพทย์ หรือภาพเหล่านั้นได้รับการอนุมัติทางจริยธรรมสำหรับการวิจัย บทความที่ใช้ชุดข้อมูลใน Springer Nature ถูกถอนออกจากวรรณกรรมทางวิทยาศาสตร์ มีสิ่งพิมพ์อื่นอย่างน้อย 90 ฉบับที่อ้างอิงถึงชุดข้อมูลเวอร์ชันหนึ่ง
ในเดือนเมษายน พ.ศ. 2569 มีการระบุชุดข้อมูลอีกสองชุดบน Kaggle ที่ไม่มีแหล่งที่มาของข้อมูล ซึ่งได้รับการตีพิมพ์ในNatureในชื่อเรื่องว่า "แบบจำลองการทำนายโรคด้วย AI หลายสิบแบบได้รับการฝึกฝนจากข้อมูลที่น่าสงสัย" [ 28 ] [ 29 ] [ 30 ]ชุดข้อมูลเหล่านี้ถูกนำไปใช้ในแบบจำลองการทำนายทางคลินิก 125 แบบ อย่างน้อยสองแบบถูกนำไปใช้ในโรงพยาบาลในอินโดนีเซียและสเปนขณะที่บทความหนึ่งที่ใช้ชุดข้อมูลนี้ถูกอ้างอิงในสิทธิบัตรอุปกรณ์ทางการแพทย์ ณ วันที่ 5 มิถุนายน พ.ศ. 2569 บทความห้าบทความที่ใช้ชุดข้อมูลเหล่านี้ถูกถอนออกจากเอกสารทางวิทยาศาสตร์แล้ว
ในเดือนพฤษภาคม 2026 มีการตรวจสอบการตีพิมพ์งานวิจัยเพิ่มเติมโดยใช้ชุดข้อมูลภาพสองชุดจาก Kaggle ในScientific ReportsบทความในRetraction Watch “ชุดข้อมูลที่ 'แย่แบบตลก' ใช้ในการฝึกแบบจำลองทางคลินิกสำหรับโรคหลอดเลือดสมองและโรคเบาหวาน” [ 31 ]เน้นย้ำว่าภาพเหล่านั้นรวมถึงนักแสดงชื่อดัง เช่น ซิลเวสเตอร์ สตอลโลน ในบทแรมโบ้ จอร์จ คลูนีย์ แองเจลินา โจลี และแดเนียล เครก รวมถึงเด็กๆ ด้วย การใช้ภาพเด็กเหล่านี้ในการวิจัยทางการแพทย์โดยไม่ได้รับความยินยอมนั้นถือว่าผิดจริยธรรม การค้นหาภาพย้อนกลับพบว่าภาพบางส่วนไม่ได้เกี่ยวข้องกับโรคหลอดเลือดสมองแต่เกี่ยวข้องกับ อัมพาตใบหน้า ชุดข้อมูลหนึ่งไม่สามารถใช้งานได้บน Kaggle อีกต่อไป ในขณะที่อีกชุดหนึ่งยังคงอยู่และระบุว่าภาพอาจอยู่ภายใต้ลิขสิทธิ์
Kaggle อาศัยข้อมูลเมตาและแหล่งที่มาที่รายงานด้วยตนเองของชุมชน[ 31 ]และกล่าวถึงการใช้ชุดข้อมูลโรคหลอดเลือดสมองและโรคเบาหวานที่ระบุไว้ใน "หลักฐานของข้อมูลที่ไม่น่าเชื่อถือและแหล่งที่มาของข้อมูลที่ไม่ดีในการวิจัยแบบจำลองการทำนายทางคลินิกและการปฏิบัติทางคลินิก" ว่าถูกต้องตามกฎหมายอย่างสมบูรณ์และไม่ละเมิดข้อกำหนดในการให้บริการของพวกเขา[ 31 ] [ 29 ] [ 30 ]
ดูเพิ่มเติม
- การเขียนโปรแกรมเชิงแข่งขัน
- แพลตฟอร์มการแข่งขันด้านวิทยาศาสตร์ข้อมูล
- แอนโทนี่ โกลด์บลูม
- ใบหน้ากอด
- Google Colab
อ่านเพิ่มเติม
- "การแข่งขันช่วยส่องแสงให้เห็นถึงสสารมืด" สำนักงานนโยบายวิทยาศาสตร์และเทคโนโลยี เว็บไซต์ทำเนียบขาว มิถุนายน 2554
- "ขอให้อัลกอริทึมที่ดีที่สุดเป็นผู้ชนะ..." วอลล์สตรีทเจอร์นัล มีนาคม 2011
- "การแข่งขัน Kaggle มีเป้าหมายเพื่อส่งเสริมบรรณาธิการวิกิพีเดีย" นิวไซเอนทิสต์กรกฎาคม 2011 เก็บถาวรเมื่อ 22 มีนาคม 2016 ที่Wayback Machine
- "การตรวจสอบความถูกต้องของการวิจัยชีววิทยาเชิงระบบในยุคของการแข่งขันแบบร่วมมือ" วารสารNature Nanotechnologyกันยายน 2011
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ แค็กเกิล
Kaggleเป็นแพลตฟอร์มการแข่งขันวิทยาศาสตร์ข้อมูลและชุมชนออนไลน์สำหรับนักวิทยาศาสตร์ข้อมูลและ ผู้ปฏิบัติงานด้าน การเรียนรู้ของเครื่องภายใต้Google LLC Kaggle...
ประวัติศาสตร์
Kaggle ก่อตั้งโดย Anthony Goldbloom ในเดือนเมษายน 2010 [ 2 ] Jeremy Howard หนึ่งในผู้ใช้ Kaggle คนแรกๆ เข้าร่วมในเดือนพฤศจิกายน 2010 และดำรงตำแหน่งประธานและหัวหน้านักวิทยาศาสตร์ [ 3 ] นอกจากนี้ในทีมยังมี Nicholas Gruen ซึ่งดำรงตำแหน่งประธานผู้ก่อตั้ง [ 4 ]...
การแข่งขัน
มีการจัดการแข่งขัน การเรียนรู้ของเครื่อง หลายรายการ บน Kaggle นับตั้งแต่บริษัทก่อตั้งขึ้น การแข่งขันที่น่าสนใจ ได้แก่ การจดจำท่าทางสำหรับ Microsoft Kinect [ 13 ] การสร้าง AI ฟุตบอล สำหรับ แมน เชสเตอร์ซิตี้ การเขียนโค้ดอัลกอริทึมการซื้อขายสำหรับ Two Sigma...
ระบบความก้าวหน้า
Kaggle ได้นำระบบความก้าวหน้ามาใช้เพื่อรับรู้และให้รางวัลแก่ผู้ใช้ตามการมีส่วนร่วมและความสำเร็จภายในแพลตฟอร์ม ระบบนี้ประกอบด้วยห้าระดับ ได้แก่ ระดับเริ่มต้น ระดับผู้ร่วมให้ข้อมูล ระดับผู้เชี่ยวชาญ ระดับปรมาจารย์ และระดับปรมาจารย์...