อิมพาล่า อะปาเช่

อิมพาล่า อะปาเช่
อิมพาล่า อะปาเช่
นักพัฒนา	มูลนิธิซอฟต์แวร์ Apache
ปล่อย	28 เมษายน 2556
เวอร์ชันเสถียร	4.5.0 / 4 มีนาคม 2025
เขียนเป็น	ซี++จาวา
ระบบปฏิบัติการ	ข้ามแพลตฟอร์ม
พิมพ์	Hadoopเชิงสัมพันธ์- การวิเคราะห์
ใบอนุญาต	ใบอนุญาต Apache 2.0
เว็บไซต์	impala.apache.org
ที่เก็บข้อมูล	คลังข้อมูลอิมพาลา

Apache Impalaเป็นเอ็นจิ้ น การสืบค้น SQL แบบขนานขนาดใหญ่ (MPP) แบบโอเพนซอร์สสำหรับข้อมูลที่จัดเก็บในคลัสเตอร์คอมพิวเตอร์ที่ทำงานบนApache Hadoop [ ^{1 ] Impala}ได้รับการอธิบายว่าเป็นเวอร์ชันโอเพนซอร์สของGoogle F1ซึ่งเป็นแรงบันดาลใจในการพัฒนาในปี 2012 ^{[ 2 ]}

คำอธิบาย

Apache Impala เป็นเอ็นจิ้นการสืบค้นข้อมูลที่ทำงานบน Apache Hadoop โครงการนี้ได้รับการประกาศในเดือนตุลาคม 2012 พร้อมกับการแจกจ่ายเบต้าทดสอบ สาธารณะ ^{[ 3 ]}^{[ 4 ]}และเปิดให้ใช้งานได้ทั่วไปในเดือนพฤษภาคม 2013 ^{[ 5 ]}

Impala นำ เทคโนโลยี ฐานข้อมูลแบบขนาน ที่ปรับขนาดได้ มาสู่ Hadoop ทำให้ผู้ใช้สามารถส่งคำสั่งSQL ที่มีความหน่วงต่ำไปยังข้อมูลที่จัดเก็บใน HDFSและApache HBaseโดยไม่จำเป็นต้องย้ายหรือแปลงข้อมูล Impala ผสานรวมเข้ากับ Hadoop เพื่อใช้รูปแบบไฟล์และข้อมูล เมตาเดต้า ความปลอดภัย และเฟรมเวิร์กการจัดการทรัพยากรเดียวกันกับที่ใช้โดยMapReduce , Apache Hive , Apache Pigและซอฟต์แวร์ Hadoop อื่นๆ

Impala ถูกออกแบบมาสำหรับนักวิเคราะห์และนักวิทยาศาสตร์ข้อมูล เพื่อทำการวิเคราะห์ข้อมูลที่จัดเก็บใน Hadoop ผ่าน SQL หรือ เครื่องมือ Business Intelligence ผลลัพธ์ที่ได้คือ การประมวลผลข้อมูลขนาดใหญ่ (ผ่าน MapReduce) และการสืบค้นข้อมูลแบบโต้ตอบ สามารถทำได้บนระบบเดียวกัน โดยใช้ข้อมูลและเมตาเดต้าชุดเดียวกัน ซึ่งช่วยลดความจำเป็นในการย้ายชุดข้อมูลไปยังระบบเฉพาะทางและ/หรือรูปแบบที่เป็นกรรมสิทธิ์ เพียงเพื่อทำการวิเคราะห์

คุณสมบัติเด่นได้แก่:

รองรับการจัดเก็บข้อมูลHDFS , S3 , Microsoft Azure Blob Storage, Apache HBaseและApache Kudu
สามารถอ่านไฟล์ Hadoop ได้หลายรูปแบบ รวมถึงไฟล์ข้อความ, LZO , SequenceFile , Avro , RCFile , ParquetและORC
รองรับระบบรักษาความปลอดภัยของ Hadoop ( การตรวจสอบสิทธิ์ Kerberos , LDAP )
การอนุญาตแบบละเอียดตามบทบาทด้วยApache Ranger
ใช้เมตาเดต้า ไดรเวอร์ ODBCและไวยากรณ์ SQL จากApache Hive

ในช่วงต้นปี 2013 มีการประกาศ รูปแบบไฟล์แบบคอลัมน์ที่เรียกว่าParquetสำหรับสถาปัตยกรรมต่างๆ รวมถึง Impala ^{[ 6 ]} ในเดือนธันวาคม 2013 Amazon Web Servicesประกาศสนับสนุน Impala ^{[ 7 ]} ในช่วงต้นปี 2014 MapRเพิ่มการสนับสนุน Impala ^{[ 8 ]} ในปี 2015 มีการประกาศรูปแบบอื่นที่เรียกว่าKuduซึ่งClouderaเสนอที่จะบริจาคให้กับApache Software Foundationพร้อมกับ Impala ^{[ 9 ]} Impala ได้รับการยกระดับเป็น Apache Top-Level Project (TLP) เมื่อวันที่ 28 พฤศจิกายน 2017 ^{[ 10 ]}

ดูเพิ่มเติม

Apache Drill — โครงการโอเพนซอร์สที่คล้ายคลึงกันซึ่งได้รับแรงบันดาลใจจาก Dremel
Dremel — เครื่องมือที่คล้ายกันจาก Google
Trino — เอ็นจิ้นการสืบค้นข้อมูล SQL แบบโอเพนซอร์ส สร้างโดยผู้สร้าง Presto
Presto — เครื่องมือประมวลผลคำสั่ง SQL แบบโอเพนซอร์สที่สร้างโดย Facebook และได้รับการสนับสนุนโดยTeradata

ลิงก์ภายนอก

เว็บไซต์โครงการApache Impala
ซอร์สโค้ดของโปรเจ็กต์Impala บน GitHub

1 ] Impala

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

อิมพาล่า อะปาเช่

คำอธิบาย

ดูเพิ่มเติม

ลิงก์ภายนอก

ข้อมูลสำคัญจากบทความ