กลับไปหน้าบทความ

อ่าน 3 นาที

แคทบูสต์

CatBoost [ 6 ] เป็น ไลบรารี ซอฟต์แวร์โอเพนซอร์ส ที่พัฒนาโดย Yandex โดยมี เฟรมเวิร์ก การเพิ่มประสิทธิภาพแบบไล่ระดับ ซึ่งในบรรดาคุณสมบัติอื่นๆ...

แคทบูสต์

แคทบูสต์
ผู้เขียนต้นฉบับAndrey Gulin: [ 1 ] / Yandex
นักพัฒนาผู้ร่วมให้ข้อมูล Yandexและ CatBoost [ 2 ]
ปล่อย18 กรกฎาคม 2560 [ 3 ] [ 4 ] ( 18 กรกฎาคม 2560 )
เวอร์ชันเสถียร
1.2.8 [ 5 ] / 13 เมษายน 2568 ( 13 เมษายน 2568 )
เขียนเป็นPython , R , C++ , Java
ระบบปฏิบัติการลินุกซ์ , มอสซาเรลล่า , วินโดวส์
พิมพ์การเรียนรู้ของเครื่อง
ใบอนุญาตใบอนุญาต Apache 2.0
เว็บไซต์catboost .ai

CatBoost [ 6 ]เป็นไลบรารีซอฟต์แวร์โอเพนซอร์สที่พัฒนาโดยYandexโดยมี เฟรมเวิร์ก การเพิ่มประสิทธิภาพแบบไล่ระดับซึ่งในบรรดาคุณสมบัติอื่นๆ พยายามแก้ปัญหาสำหรับคุณลักษณะเชิงหมวดหมู่โดยใช้ทางเลือกที่ขับเคลื่อนด้วยการเรียงสับเปลี่ยนแทนอัลกอริทึมแบบคลาสสิก[ 7 ] สามารถใช้งานได้บน Linux, Windows, macOS และมีให้ใช้งานใน Python [ 8 ] R [ 9 ] และโมเดลที่สร้าง โดยใช้CatBoost สามารถใช้สำหรับการทำนายในC++ , Java [ 10 ] C# , Rust , Core ML , ONNXและPMMLซอร์สโค้ดได้รับอนุญาตภายใต้Apache License และมีให้ ใช้งานบน GitHub [ 6 ]

นิตยสาร InfoWorldมอบรางวัลให้กับไลบรารีนี้ในฐานะ "เครื่องมือการเรียนรู้ของเครื่องที่ดีที่สุด" ประจำปี 2017 [ 11 ]ร่วมกับ TensorFlow , Pytorch , XGBoostและไลบรารีอื่นๆ อีก 8 ไลบรารี

Kaggleระบุว่า CatBoost เป็นหนึ่งในเฟรมเวิร์กการเรียนรู้ของเครื่อง (ML) ที่ใช้บ่อยที่สุดในโลก โดยติดอันดับ 8 เฟรมเวิร์ก ML ที่ใช้บ่อยที่สุดในการสำรวจปี 2020 [ 12 ]และติดอันดับ 7 เฟรมเวิร์ก ML ที่ใช้บ่อยที่สุดในการสำรวจปี 2021 [ 13 ]

ณ เดือนเมษายน พ.ศ. 2565 CatBoost ได้รับการติดตั้งประมาณ 100,000 ครั้งต่อวันจากที่เก็บPyPI [ 14 ]

คุณสมบัติ

CatBoost ได้รับความนิยมมากกว่าอัลกอริธึมการเพิ่มประสิทธิภาพแบบไล่ระดับอื่นๆ ส่วนใหญ่เนื่องมาจากคุณสมบัติดังต่อไปนี้[ 15 ]

  • การจัดการแบบดั้งเดิมสำหรับคุณลักษณะเชิงหมวดหมู่[ 16 ]
  • การฝึกอบรม GPU ที่รวดเร็ว[ 17 ]
  • การแสดงผลข้อมูลและเครื่องมือสำหรับการวิเคราะห์แบบจำลองและคุณลักษณะ
  • การใช้ ต้นไม้ ที่ไม่รับรู้หรือต้นไม้สมมาตรเพื่อการประมวลผลที่เร็วขึ้น
  • การเพิ่มประสิทธิภาพตามลำดับเพื่อเอาชนะปัญหาการโอเวอร์ฟิตติ้ง[ 7 ]

ประวัติศาสตร์

ในปี 2009 Andrey Gulin ได้พัฒนาMatrixNetซึ่งเป็นไลบรารีการเพิ่มประสิทธิภาพแบบไล่ระดับ (gradient boosting) ที่เป็นกรรมสิทธิ์เฉพาะ และถูกนำไปใช้ใน Yandex เพื่อจัดอันดับผลการค้นหา ตั้งแต่ปี 2009 เป็นต้นมา MatrixNet ได้ถูกนำไปใช้ในโครงการต่างๆ ของ Yandex รวมถึงระบบแนะนำสินค้าและระบบพยากรณ์อากาศ

ในช่วงปี 2014–2015 Andrey Gulin ได้ร่วมงานกับทีมวิจัยเพื่อเริ่มต้นโครงการใหม่ชื่อ Tensornet ซึ่งมีเป้าหมายเพื่อแก้ปัญหา "วิธีการทำงานกับข้อมูลเชิงหมวดหมู่ " ผลงานของพวกเขาได้พัฒนาเป็นไลบรารี Gradient Boosting ที่เป็นกรรมสิทธิ์หลายตัว โดยแต่ละตัวมีแนวทางที่แตกต่างกันในการจัดการกับข้อมูลเชิงหมวดหมู่

ในปี 2016 ทีมโครงสร้างพื้นฐานการเรียนรู้ของเครื่อง (Machine Learning Infrastructure) ที่นำโดย Anna Dorogush เริ่มพัฒนา Gradient Boosting ใน Yandex ซึ่งรวมถึง Matrixnet และ Tensornet พวกเขาได้พัฒนาและเปิดเผยซอร์สโค้ดเวอร์ชันถัดไปของไลบรารี Gradient Boosting ที่เรียกว่า CatBoost ซึ่งรองรับข้อมูลประเภทหมวดหมู่และข้อความ การฝึกอบรมด้วย GPU การวิเคราะห์โมเดล และเครื่องมือแสดงภาพข้อมูล

CatBoost เปิดให้ใช้งานแบบโอเพนซอร์สในเดือนกรกฎาคม 2017 และยังคงได้รับการพัฒนาอย่างต่อเนื่องทั้งใน Yandex และชุมชนโอเพนซอร์ส

แอปพลิเคชัน

  • JetBrainsใช้ CatBoost สำหรับการเติมโค้ดอัตโนมัติ[ 18 ]
  • Cloudflareใช้ CatBoost สำหรับการตรวจจับบอท[ 19 ]
  • Careemใช้ CatBoost เพื่อทำนายจุดหมายปลายทางในอนาคตของการเดินทาง[ 20 ]

ดูเพิ่มเติม

  • แคทบูสต์
  • GitHub - catboost/catboost
  • CatBoost - Yandex Technology
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=CatBoost&oldid=1349191056 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ แคทบูสต์

CatBoost [ 6 ] เป็น ไลบรารี ซอฟต์แวร์โอเพนซอร์ส ที่พัฒนาโดย Yandex โดยมี เฟรมเวิร์ก การเพิ่มประสิทธิภาพแบบไล่ระดับ ซึ่งในบรรดาคุณสมบัติอื่นๆ...

คุณสมบัติ

CatBoost ได้รับความนิยมมากกว่าอัลกอริธึมการเพิ่มประสิทธิภาพแบบไล่ระดับอื่นๆ ส่วนใหญ่เนื่องมาจากคุณสมบัติดังต่อไปนี้ [ 15 ]

ประวัติศาสตร์

ในปี 2009 Andrey Gulin ได้พัฒนา MatrixNet ซึ่งเป็นไลบรารีการเพิ่มประสิทธิภาพแบบไล่ระดับ (gradient boosting) ที่เป็นกรรมสิทธิ์เฉพาะ และถูกนำไปใช้ใน Yandex เพื่อจัดอันดับผลการค้นหา ตั้งแต่ปี 2009 เป็นต้นมา MatrixNet ได้ถูกนำไปใช้ในโครงการต่างๆ ของ Yandex...

แอปพลิเคชัน

JetBrains ใช้ CatBoost สำหรับการเติมโค้ดอัตโนมัติ [ 18 ] Cloudflare ใช้ CatBoost สำหรับการตรวจจับบอท [ 19 ] Careem ใช้ CatBoost เพื่อทำนายจุดหมายปลายทางในอนาคตของการเดินทาง [ 20 ]