อ่าน 3 นาที
อิมพาล่า อะปาเช่
Apache Impala เป็น เอ็นจิ้ น การสืบค้น SQL แบบขนานขนาดใหญ่ (MPP) แบบโอเพนซอร์สสำหรับข้อมูลที่จัดเก็บใน คลัสเตอร์คอมพิวเตอร์ ที่ทำงานบน Apache Hadoop [ 1 ] Impala...
อิมพาล่า อะปาเช่
| อิมพาล่า อะปาเช่ | |
|---|---|
| นักพัฒนา | มูลนิธิซอฟต์แวร์ Apache |
| ปล่อย | 28 เมษายน 2556 |
| เวอร์ชันเสถียร | 4.5.0 / 4 มีนาคม 2025 |
| เขียนเป็น | ซี++จาวา |
| ระบบปฏิบัติการ | ข้ามแพลตฟอร์ม |
| พิมพ์ | Hadoopเชิงสัมพันธ์- การวิเคราะห์ |
| ใบอนุญาต | ใบอนุญาต Apache 2.0 |
| เว็บไซต์ | impala.apache.org |
| ที่เก็บข้อมูล | คลังข้อมูลอิมพาลา |
Apache Impalaเป็นเอ็นจิ้ น การสืบค้น SQL แบบขนานขนาดใหญ่ (MPP) แบบโอเพนซอร์สสำหรับข้อมูลที่จัดเก็บในคลัสเตอร์คอมพิวเตอร์ที่ทำงานบนApache Hadoop [ 1 ] Impalaได้รับการอธิบายว่าเป็นเวอร์ชันโอเพนซอร์สของGoogle F1ซึ่งเป็นแรงบันดาลใจในการพัฒนาในปี 2012 [ 2 ]
คำอธิบาย
Apache Impala เป็นเอ็นจิ้นการสืบค้นข้อมูลที่ทำงานบน Apache Hadoop โครงการนี้ได้รับการประกาศในเดือนตุลาคม 2012 พร้อมกับการแจกจ่ายเบต้าทดสอบ สาธารณะ [ 3 ] [ 4 ]และเปิดให้ใช้งานได้ทั่วไปในเดือนพฤษภาคม 2013 [ 5 ]
Impala นำ เทคโนโลยี ฐานข้อมูลแบบขนาน ที่ปรับขนาดได้ มาสู่ Hadoop ทำให้ผู้ใช้สามารถส่งคำสั่งSQL ที่มีความหน่วงต่ำไปยังข้อมูลที่จัดเก็บใน HDFSและApache HBaseโดยไม่จำเป็นต้องย้ายหรือแปลงข้อมูล Impala ผสานรวมเข้ากับ Hadoop เพื่อใช้รูปแบบไฟล์และข้อมูล เมตาเดต้า ความปลอดภัย และเฟรมเวิร์กการจัดการทรัพยากรเดียวกันกับที่ใช้โดยMapReduce , Apache Hive , Apache Pigและซอฟต์แวร์ Hadoop อื่นๆ
Impala ถูกออกแบบมาสำหรับนักวิเคราะห์และนักวิทยาศาสตร์ข้อมูล เพื่อทำการวิเคราะห์ข้อมูลที่จัดเก็บใน Hadoop ผ่าน SQL หรือ เครื่องมือ Business Intelligence ผลลัพธ์ที่ได้คือ การประมวลผลข้อมูลขนาดใหญ่ (ผ่าน MapReduce) และการสืบค้นข้อมูลแบบโต้ตอบ สามารถทำได้บนระบบเดียวกัน โดยใช้ข้อมูลและเมตาเดต้าชุดเดียวกัน ซึ่งช่วยลดความจำเป็นในการย้ายชุดข้อมูลไปยังระบบเฉพาะทางและ/หรือรูปแบบที่เป็นกรรมสิทธิ์ เพียงเพื่อทำการวิเคราะห์
คุณสมบัติเด่นได้แก่:
- รองรับการจัดเก็บข้อมูลHDFS , S3 , Microsoft Azure Blob Storage, Apache HBaseและApache Kudu
- สามารถอ่านไฟล์ Hadoop ได้หลายรูปแบบ รวมถึงไฟล์ข้อความ, LZO , SequenceFile , Avro , RCFile , ParquetและORC
- รองรับระบบรักษาความปลอดภัยของ Hadoop ( การตรวจสอบสิทธิ์ Kerberos , LDAP )
- การอนุญาตแบบละเอียดตามบทบาทด้วยApache Ranger
- ใช้เมตาเดต้า ไดรเวอร์ ODBCและไวยากรณ์ SQL จากApache Hive
ในช่วงต้นปี 2013 มีการประกาศ รูปแบบไฟล์แบบคอลัมน์ที่เรียกว่าParquetสำหรับสถาปัตยกรรมต่างๆ รวมถึง Impala [ 6 ] ในเดือนธันวาคม 2013 Amazon Web Servicesประกาศสนับสนุน Impala [ 7 ] ในช่วงต้นปี 2014 MapRเพิ่มการสนับสนุน Impala [ 8 ] ในปี 2015 มีการประกาศรูปแบบอื่นที่เรียกว่าKuduซึ่งClouderaเสนอที่จะบริจาคให้กับApache Software Foundationพร้อมกับ Impala [ 9 ] Impala ได้รับการยกระดับเป็น Apache Top-Level Project (TLP) เมื่อวันที่ 28 พฤศจิกายน 2017 [ 10 ]
ดูเพิ่มเติม
- Apache Drill — โครงการโอเพนซอร์สที่คล้ายคลึงกันซึ่งได้รับแรงบันดาลใจจาก Dremel
- Dremel — เครื่องมือที่คล้ายกันจาก Google
- Trino — เอ็นจิ้นการสืบค้นข้อมูล SQL แบบโอเพนซอร์ส สร้างโดยผู้สร้าง Presto
- Presto — เครื่องมือประมวลผลคำสั่ง SQL แบบโอเพนซอร์สที่สร้างโดย Facebook และได้รับการสนับสนุนโดยTeradata
ลิงก์ภายนอก
- เว็บไซต์โครงการApache Impala
- ซอร์สโค้ดของโปรเจ็กต์Impala บน GitHub
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ อิมพาล่า อะปาเช่
Apache Impala เป็น เอ็นจิ้ น การสืบค้น SQL แบบขนานขนาดใหญ่ (MPP) แบบโอเพนซอร์สสำหรับข้อมูลที่จัดเก็บใน คลัสเตอร์คอมพิวเตอร์ ที่ทำงานบน Apache Hadoop [ 1 ] Impala...
คำอธิบาย
Apache Impala เป็นเอ็นจิ้นการสืบค้นข้อมูลที่ทำงานบน Apache Hadoop โครงการนี้ได้รับการประกาศในเดือนตุลาคม 2012 พร้อมกับการแจกจ่าย เบต้าทดสอบ สาธารณะ [ 3 ] [ 4 ] และเปิดให้ใช้งานได้ทั่วไปในเดือนพฤษภาคม 2013 [ 5 ]
ดูเพิ่มเติม
Apache Drill — โครงการโอเพนซอร์สที่คล้ายคลึงกันซึ่งได้รับแรงบันดาลใจจาก Dremel Dremel — เครื่องมือที่คล้ายกันจาก Google Trino — เอ็นจิ้นการสืบค้นข้อมูล SQL แบบโอเพนซอร์ส สร้างโดยผู้สร้าง Presto Presto — เครื่องมือประมวลผลคำสั่ง SQL แบบโอเพนซอร์สที่สร้างโดย...
ลิงก์ภายนอก
เว็บไซต์โครงการApache Impala ซอร์สโค้ดของโปรเจ็กต์Impala บน GitHub ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Apache_Impala&oldid=1330310232 "