กลับไปหน้าบทความ

อ่าน 7 นาที

แค็กเกิล

Kaggleเป็นแพลตฟอร์มการแข่งขันวิทยาศาสตร์ข้อมูลและชุมชนออนไลน์สำหรับนักวิทยาศาสตร์ข้อมูลและ ผู้ปฏิบัติงานด้าน การเรียนรู้ของเครื่องภายใต้Google LLC Kaggle...

แค็กเกิล

แค็กเกิล
พิมพ์บริษัทในเครือ
อุตสาหกรรมวิทยาศาสตร์ข้อมูล
ก่อตั้งเมษายน 2553
ผู้ก่อตั้ง
สำนักงานใหญ่ซานฟรานซิสโก สหรัฐอเมริกา
บุคคลสำคัญ
สินค้าการแข่งขัน, Kaggle Kernels, Kaggle Datasets, Kaggle Learn
พ่อแม่Google (ปี 2017 – ปัจจุบัน)
เว็บไซต์kaggle.com

Kaggleเป็นแพลตฟอร์มการแข่งขันวิทยาศาสตร์ข้อมูลและชุมชนออนไลน์สำหรับนักวิทยาศาสตร์ข้อมูลและ ผู้ปฏิบัติงานด้าน การเรียนรู้ของเครื่องภายใต้Google LLC Kaggle ช่วยให้ผู้ใช้สามารถค้นหาและเผยแพร่ชุดข้อมูล สำรวจและสร้างแบบจำลองในสภาพแวดล้อมวิทยาศาสตร์ข้อมูลบนเว็บ ทำงานร่วมกับนักวิทยาศาสตร์ข้อมูลและวิศวกรการเรียนรู้ของเครื่องคนอื่นๆ และเข้าร่วมการแข่งขันเพื่อแก้ปัญหาความท้าทายด้านวิทยาศาสตร์ข้อมูล[ 1 ] Kaggle ยังอำนวยความสะดวกในการใช้ข้อมูลที่ไม่ถูกต้องและไม่น่าเชื่อถือในการวิจัยทางการแพทย์อีกด้วย

ประวัติศาสตร์

Kaggle ก่อตั้งโดยAnthony Goldbloomในเดือนเมษายน 2010 [ 2 ] Jeremy Howardหนึ่งในผู้ใช้ Kaggle คนแรกๆ เข้าร่วมในเดือนพฤศจิกายน 2010 และดำรงตำแหน่งประธานและหัวหน้านักวิทยาศาสตร์[ 3 ]นอกจากนี้ในทีมยังมีNicholas Gruenซึ่งดำรงตำแหน่งประธานผู้ก่อตั้ง[ 4 ]ในปี 2011 บริษัทระดมทุนได้ 12.5 ล้านดอลลาร์ และMax Levchinกลายเป็นประธาน[ 5 ]เมื่อวันที่ 8 มีนาคม 2017 Fei-Fei Liหัวหน้านักวิทยาศาสตร์ของ Google ประกาศว่าGoogleกำลังเข้าซื้อกิจการ Kaggle [ 6 ]

ในเดือนมิถุนายน พ.ศ. 2560 Kaggle มีผู้ใช้งานที่ลงทะเบียนเกิน 1 ล้านราย และ ณ เดือนตุลาคม พ.ศ. 2566 มีผู้ใช้งานมากกว่า 15 ล้านรายใน 194 ประเทศ[ 7 ] [ 8 ] [ 9 ]

ในปี 2022 ผู้ก่อตั้ง Goldbloom และ Hamner ได้ลาออกจากตำแหน่ง และ D. Sculley กลายเป็นCEO [ 10 ]

ในเดือนกุมภาพันธ์ 2023 Kaggle ได้เปิดตัว Models ซึ่งอนุญาตให้ผู้ใช้ค้นหาและใช้โมเดลที่ได้รับการฝึกฝนล่วงหน้าผ่านการผสานรวมอย่างลึกซึ้งกับแพลตฟอร์ม Kaggle ส่วนที่เหลือ[ 11 ]

ในเดือนเมษายน พ.ศ. 2568 Kaggle ได้ร่วมมือกับมูลนิธิวิกิมีเดีย[ 12 ]

ภาพรวมของเว็บไซต์

การแข่งขัน

มีการจัดการแข่งขัน การเรียนรู้ของเครื่องหลายรายการบน Kaggle นับตั้งแต่บริษัทก่อตั้งขึ้น การแข่งขันที่น่าสนใจ ได้แก่ การจดจำท่าทางสำหรับMicrosoft Kinect [ 13 ]การสร้างAI ฟุตบอล สำหรับแมนเชสเตอร์ซิตี้การเขียนโค้ดอัลกอริทึมการซื้อขายสำหรับTwo Sigma Investments [ 14 ] และการปรับปรุงการค้นหาอนุภาคฮิกส์ที่CERN [ 15 ]

ผู้จัดการแข่งขันจะเตรียมข้อมูลและคำอธิบายของปัญหา ผู้จัดการแข่งขันอาจเลือกได้ว่าจะให้รางวัลเป็นเงินหรือไม่ ผู้เข้าร่วมจะทดลองใช้เทคนิคต่างๆ และแข่งขันกันเพื่อสร้างแบบจำลองที่ดีที่สุด ผลงานจะถูกเผยแพร่ต่อสาธารณะผ่าน Kaggle Kernels เพื่อให้ได้เกณฑ์มาตรฐานที่ดีขึ้นและเพื่อสร้างแรงบันดาลใจให้เกิดแนวคิดใหม่ๆ สามารถส่งผลงานได้ผ่าน Kaggle Kernels ผ่านการอัปโหลดด้วยตนเอง หรือใช้ Kaggle APIสำหรับการแข่งขันส่วนใหญ่ ผลงานจะได้รับการให้คะแนนทันที (โดยพิจารณาจากความแม่นยำในการทำนายเทียบกับไฟล์โซลูชันที่ซ่อนอยู่) และสรุปผลบนกระดานผู้นำแบบเรียลไทม์ หลังจากหมดเขต ผู้จัดการแข่งขันจะจ่ายเงินรางวัลเพื่อแลกกับ "ใบอนุญาตทั่วโลก ถาวร เพิกถอนไม่ได้ และไม่มีค่าลิขสิทธิ์ [...] ในการใช้ผลงานที่ชนะ" กล่าวคือ อัลกอริทึม ซอฟต์แวร์ และทรัพย์สินทางปัญญา ที่เกี่ยวข้อง ที่พัฒนาขึ้น ซึ่ง "ไม่เป็นเอกสิทธิ์เว้นแต่จะระบุไว้เป็นอย่างอื่น" [ 16 ]

นอกจากการแข่งขันสาธารณะแล้ว Kaggle ยังมีการแข่งขันส่วนตัวซึ่งจำกัดเฉพาะผู้เข้าร่วมอันดับต้น ๆ ของ Kaggle เท่านั้น Kaggle ยังมีเครื่องมือฟรีสำหรับครูวิทยาศาสตร์ข้อมูลในการจัดการแข่งขันการเรียนรู้เครื่องจักรเชิงวิชาการ[ 17 ] นอกจากนี้ Kaggle ยังจัดการแข่งขันคัดเลือกบุคลากรซึ่งนักวิทยาศาสตร์ข้อมูลแข่งขันกันเพื่อโอกาสในการสัมภาษณ์งานที่บริษัทวิทยาศาสตร์ข้อมูลชั้นนำ เช่นFacebook , Winton CapitalและWalmart

การแข่งขันของ Kaggle ส่งผลให้เกิดโครงการที่ประสบความสำเร็จ เช่น การพัฒนาการวิจัย เกี่ยว กับ HIV [ 18 ] การจัดอันดับหมากรุก[ 19 ]และการพยากรณ์การจราจร[ 20 ] Geoffrey Hintonและ George Dahl ใช้โครงข่ายประสาทเทียมเชิง ลึก เพื่อชนะการแข่งขันที่จัดโดยMerck Vlad Mnih (หนึ่งในนักเรียนของ Hinton) ใช้โครงข่ายประสาทเทียมเชิงลึกเพื่อชนะการแข่งขันที่จัดโดยAdzunaส่งผลให้เทคนิคนี้ถูกนำไปใช้โดยคนอื่นๆ ในชุมชน Kaggle Tianqi Chen จากมหาวิทยาลัยวอชิงตันยังใช้ Kaggle เพื่อแสดงพลังของXGBoostซึ่งต่อมาได้เข้ามาแทนที่Random Forestในฐานะหนึ่งในวิธีการหลักที่ใช้ในการชนะการแข่งขัน Kaggle

มีการตีพิมพ์เอกสารทางวิชาการหลายฉบับโดยอิงจากผลการค้นพบจากการแข่งขัน Kaggle [ 21 ] ปัจจัยหนึ่งที่สนับสนุนเรื่องนี้คือกระดานผู้นำแบบเรียลไทม์ ซึ่งกระตุ้นให้ผู้เข้าร่วมคิดค้นนวัตกรรมต่อไปนอกเหนือจากแนวปฏิบัติที่ดีที่สุดที่มีอยู่[ 22 ]วิธีการที่ชนะมักจะถูกเขียนไว้ในบล็อกของผู้ชนะ Kaggle

ระบบความก้าวหน้า

Kaggle ได้นำระบบความก้าวหน้ามาใช้เพื่อรับรู้และให้รางวัลแก่ผู้ใช้ตามการมีส่วนร่วมและความสำเร็จภายในแพลตฟอร์ม ระบบนี้ประกอบด้วยห้าระดับ ได้แก่ ระดับเริ่มต้น ระดับผู้ร่วมให้ข้อมูล ระดับผู้เชี่ยวชาญ ระดับปรมาจารย์ และระดับปรมาจารย์ แต่ละระดับจะได้รับจากการปฏิบัติตามเกณฑ์เฉพาะในการแข่งขัน ชุดข้อมูล เคอร์เนล (การแบ่งปันโค้ด) และการสนทนา[ 23 ]

ระดับสูงสุด Kaggle Grandmaster จะมอบให้แก่ผู้ใช้ที่ติดอันดับต้น ๆ ในการแข่งขันหลายรายการ รวมถึงการจัดอันดับสูงในทีมเดี่ยว ณ วันที่ 2 เมษายน 2568 จากบัญชี Kaggle ทั้งหมด 23.29 ล้านบัญชี มี 2,973 บัญชีที่ได้รับสถานะ Kaggle Master และ 612 บัญชีที่ได้รับสถานะ Kaggle Grandmaster [ 24 ]

สมุดบันทึก Kaggle

ภาพหน้าจอ Kaggle Notebooks

Kaggle มี สภาพแวดล้อมการพัฒนาแบบบูรณาการออนไลน์แบบใช้เบราว์เซอร์ฟรีเรียกว่า Kaggle Notebooks ซึ่งออกแบบมาสำหรับวิทยาศาสตร์ข้อมูลและการเรียนรู้ของเครื่องผู้ใช้สามารถเขียนและเรียกใช้โค้ดในPythonหรือRนำเข้าชุดข้อมูล ใช้ไลบรารีที่เป็นที่นิยม และฝึกโมเดลบนCPU , GPUหรือTPUได้โดยตรงบนคลาวด์ สภาพแวดล้อมนี้มักใช้สำหรับการส่งผลงานเข้าแข่งขัน บทช่วยสอน การศึกษา และการวิเคราะห์ข้อมูล เชิง สำรวจ[ 25 ] [ 26 ]

ปัญหาการวิจัยทางการแพทย์

ในเดือนธันวาคม พ.ศ. 2568 มีบทความตีพิมพ์ในThe Transmitterชื่อเรื่อง "พิเศษ: Springer Nature ถอนและลบสิ่งพิมพ์เกือบ 40 ฉบับที่ฝึกเครือข่ายประสาทเทียมบนชุดข้อมูลที่ 'บ้าบอ'" [ 27 ]ชุดข้อมูลดังกล่าวถูกอัปโหลดไปยัง Kaggle ซึ่งประกอบด้วยภาพถ่ายใบหน้าของเด็กออทิสติกและเด็กที่ไม่เป็นออทิสติก ชุดข้อมูลนี้มีภาพมากกว่า 2,900 ภาพ และไม่น่าเป็นไปได้ที่เด็กเหล่านี้หรือครอบครัวของพวกเขาจะให้ความยินยอมในการใช้ภาพถ่ายเพื่อการวิจัยทางการแพทย์ หรือภาพเหล่านั้นได้รับการอนุมัติทางจริยธรรมสำหรับการวิจัย บทความที่ใช้ชุดข้อมูลใน Springer Nature ถูกถอนออกจากวรรณกรรมทางวิทยาศาสตร์ มีสิ่งพิมพ์อื่นอย่างน้อย 90 ฉบับที่อ้างอิงถึงชุดข้อมูลเวอร์ชันหนึ่ง

ในเดือนเมษายน พ.ศ. 2569 มีการระบุชุดข้อมูลอีกสองชุดบน Kaggle ที่ไม่มีแหล่งที่มาของข้อมูล ซึ่งได้รับการตีพิมพ์ในNatureในชื่อเรื่องว่า "แบบจำลองการทำนายโรคด้วย AI หลายสิบแบบได้รับการฝึกฝนจากข้อมูลที่น่าสงสัย" [ 28 ] [ 29 ] [ 30 ]ชุดข้อมูลเหล่านี้ถูกนำไปใช้ในแบบจำลองการทำนายทางคลินิก 125 แบบ อย่างน้อยสองแบบถูกนำไปใช้ในโรงพยาบาลในอินโดนีเซียและสเปนขณะที่บทความหนึ่งที่ใช้ชุดข้อมูลนี้ถูกอ้างอิงในสิทธิบัตรอุปกรณ์ทางการแพทย์ ณ วันที่ 5 มิถุนายน พ.ศ. 2569 บทความห้าบทความที่ใช้ชุดข้อมูลเหล่านี้ถูกถอนออกจากเอกสารทางวิทยาศาสตร์แล้ว

ในเดือนพฤษภาคม 2026 มีการตรวจสอบการตีพิมพ์งานวิจัยเพิ่มเติมโดยใช้ชุดข้อมูลภาพสองชุดจาก Kaggle ในScientific ReportsบทความในRetraction Watch “ชุดข้อมูลที่ 'แย่แบบตลก' ใช้ในการฝึกแบบจำลองทางคลินิกสำหรับโรคหลอดเลือดสมองและโรคเบาหวาน” [ 31 ]เน้นย้ำว่าภาพเหล่านั้นรวมถึงนักแสดงชื่อดัง เช่น ซิลเวสเตอร์ สตอลโลน ในบทแรมโบ้ จอร์จ คลูนีย์ แองเจลินา โจลี และแดเนียล เครก รวมถึงเด็กๆ ด้วย การใช้ภาพเด็กเหล่านี้ในการวิจัยทางการแพทย์โดยไม่ได้รับความยินยอมนั้นถือว่าผิดจริยธรรม การค้นหาภาพย้อนกลับพบว่าภาพบางส่วนไม่ได้เกี่ยวข้องกับโรคหลอดเลือดสมองแต่เกี่ยวข้องกับ อัมพาตใบหน้า ชุดข้อมูลหนึ่งไม่สามารถใช้งานได้บน Kaggle อีกต่อไป ในขณะที่อีกชุดหนึ่งยังคงอยู่และระบุว่าภาพอาจอยู่ภายใต้ลิขสิทธิ์

Kaggle อาศัยข้อมูลเมตาและแหล่งที่มาที่รายงานด้วยตนเองของชุมชน[ 31 ]และกล่าวถึงการใช้ชุดข้อมูลโรคหลอดเลือดสมองและโรคเบาหวานที่ระบุไว้ใน "หลักฐานของข้อมูลที่ไม่น่าเชื่อถือและแหล่งที่มาของข้อมูลที่ไม่ดีในการวิจัยแบบจำลองการทำนายทางคลินิกและการปฏิบัติทางคลินิก" ว่าถูกต้องตามกฎหมายอย่างสมบูรณ์และไม่ละเมิดข้อกำหนดในการให้บริการของพวกเขา[ 31 ] [ 29 ] [ 30 ]

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • "การแข่งขันช่วยส่องแสงให้เห็นถึงสสารมืด" สำนักงานนโยบายวิทยาศาสตร์และเทคโนโลยี เว็บไซต์ทำเนียบขาว มิถุนายน 2554
  • "ขอให้อัลกอริทึมที่ดีที่สุดเป็นผู้ชนะ..." วอลล์สตรีทเจอร์นัล มีนาคม 2011
  • "การแข่งขัน Kaggle มีเป้าหมายเพื่อส่งเสริมบรรณาธิการวิกิพีเดีย" นิวไซเอนทิสต์กรกฎาคม 2011 เก็บถาวรเมื่อ 22 มีนาคม 2016 ที่Wayback Machine
  • "การตรวจสอบความถูกต้องของการวิจัยชีววิทยาเชิงระบบในยุคของการแข่งขันแบบร่วมมือ" วารสารNature Nanotechnologyกันยายน 2011
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Kaggle&oldid=1359950118#Kaggle_Notebooks "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ แค็กเกิล

Kaggleเป็นแพลตฟอร์มการแข่งขันวิทยาศาสตร์ข้อมูลและชุมชนออนไลน์สำหรับนักวิทยาศาสตร์ข้อมูลและ ผู้ปฏิบัติงานด้าน การเรียนรู้ของเครื่องภายใต้Google LLC Kaggle...

ประวัติศาสตร์

Kaggle ก่อตั้งโดย Anthony Goldbloom ในเดือนเมษายน 2010 [ 2 ] Jeremy Howard หนึ่งในผู้ใช้ Kaggle คนแรกๆ เข้าร่วมในเดือนพฤศจิกายน 2010 และดำรงตำแหน่งประธานและหัวหน้านักวิทยาศาสตร์ [ 3 ] นอกจากนี้ในทีมยังมี Nicholas Gruen ซึ่งดำรงตำแหน่งประธานผู้ก่อตั้ง [ 4 ]...

การแข่งขัน

มีการจัดการแข่งขัน การเรียนรู้ของเครื่อง หลายรายการ บน Kaggle นับตั้งแต่บริษัทก่อตั้งขึ้น การแข่งขันที่น่าสนใจ ได้แก่ การจดจำท่าทางสำหรับ Microsoft Kinect [ 13 ] การสร้าง AI ฟุตบอล สำหรับ แมน เชสเตอร์ซิตี้ การเขียนโค้ดอัลกอริทึมการซื้อขายสำหรับ Two Sigma...

ระบบความก้าวหน้า

Kaggle ได้นำระบบความก้าวหน้ามาใช้เพื่อรับรู้และให้รางวัลแก่ผู้ใช้ตามการมีส่วนร่วมและความสำเร็จภายในแพลตฟอร์ม ระบบนี้ประกอบด้วยห้าระดับ ได้แก่ ระดับเริ่มต้น ระดับผู้ร่วมให้ข้อมูล ระดับผู้เชี่ยวชาญ ระดับปรมาจารย์ และระดับปรมาจารย์...