อ่าน 10 นาที
ซูเปอร์แฟมิลีโปรตีน
ซูเปอร์แฟมิลีโปรตีนคือกลุ่มที่ใหญ่ที่สุด ( clade ) ของโปรตีนที่สามารถอนุมานบรรพบุรุษร่วมกัน ได้ (ดู homology )...
ซูเปอร์แฟมิลีโปรตีน
ซูเปอร์แฟมิลีโปรตีนคือกลุ่มที่ใหญ่ที่สุด ( clade ) ของโปรตีนที่สามารถอนุมานบรรพบุรุษร่วมกัน ได้ (ดู homology ) โดยปกติบรรพบุรุษร่วมกันนี้จะอนุมานจากความสอดคล้องของโครงสร้าง[ 1 ]และความคล้ายคลึงกันทางกลไก แม้ว่าจะไม่มีความคล้ายคลึงกันของลำดับที่ชัดเจนก็ตาม[ 2 ] จากนั้นจึงสามารถอนุมาน homology ของลำดับได้แม้ว่าจะไม่ปรากฏชัด (เนื่องจากความคล้ายคลึงกันของลำดับต่ำ) โดยทั่วไปซูเปอร์แฟมิลีจะประกอบด้วย แฟมิ ลีโปรตีนหลายแฟมิลีซึ่งแสดงความคล้ายคลึงกันของลำดับภายในแต่ละแฟมิลี คำว่าprotein clanมักใช้สำหรับ ซูเปอร์แฟมิลี ของโปรตีเอสและไกลโคซิลไฮโดรเลสโดยอิงตามระบบการจำแนกประเภทMEROPSและCAZy [ 2 ] [ 3 ]
คำว่าfold ของโปรตีนหมายถึงแนวคิดที่คล้ายกันโดยอิงจากการเปรียบเทียบโครงสร้าง ในบางแผนการ เช่น SCOP และCATHถือว่าเป็นระดับที่สูงกว่าซูเปอร์แฟมิลี (โดยบรรพบุรุษร่วมกันในระดับ fold ไม่ได้รับการสนับสนุนอย่างแข็งแกร่งเท่ากับระดับซูเปอร์แฟมิลี) ในขณะที่แผนการอื่นๆ ถือว่ามีความหมายเหมือนกัน ระดับที่สูงกว่า fold คือfold classซึ่งอธิบายโทโพโลยีคร่าวๆ ของโปรตีน (เช่น all-α, all-β, α+β, α/β) [ 4 ]
การระบุตัวตน
มีการระบุซูเปอร์แฟมิลีของโปรตีนโดยใช้วิธีการหลายวิธี สมาชิกที่มีความสัมพันธ์ใกล้ชิดกันสามารถระบุได้ด้วยวิธีการที่แตกต่างจากวิธีการที่จำเป็นในการจัดกลุ่มสมาชิกที่มีความแตกต่างทางวิวัฒนาการมากที่สุด
ความคล้ายคลึงของลำดับ

- * ลำดับอนุรักษ์
- : การกลายพันธุ์แบบอนุรักษ์ ,
- การกลายพันธุ์แบบกึ่งอนุรักษ์ และ
- ␣ การกลายพันธุ์ที่ไม่คงสภาพ
ในอดีต ความคล้ายคลึงกันของลำดับกรดอะมิโนที่แตกต่างกันถือเป็นวิธีการอนุมานความเหมือนกัน ที่พบได้บ่อยที่สุด [ 6 ]ความคล้ายคลึงกันของลำดับถือเป็นตัวทำนายความสัมพันธ์ที่ดี เนื่องจากลำดับที่คล้ายคลึงกันมีแนวโน้มที่จะเป็นผลมาจากการจำลองยีนและวิวัฒนาการแบบแยกสายมากกว่าที่จะเป็นผลมาจากวิวัฒนาการแบบรวมสายลำดับกรดอะมิโนมักจะได้รับการอนุรักษ์ไว้มากกว่าลำดับดีเอ็นเอ (เนื่องจากรหัสพันธุกรรมที่เสื่อมสภาพ ) ดังนั้นจึงเป็นวิธีการตรวจจับที่ไวต่อการเปลี่ยนแปลงมากกว่า เนื่องจากกรดอะมิโนบางชนิดมีคุณสมบัติที่คล้ายคลึงกัน (เช่น ประจุ ความชอบน้ำ ขนาด) การกลายพันธุ์แบบอนุรักษ์ที่สลับกรดอะมิโนเหล่านี้มักจะไม่มีผลต่อการทำงาน บริเวณลำดับที่ได้รับการอนุรักษ์ไว้มากที่สุดของโปรตีนมักจะสอดคล้องกับบริเวณที่มีความสำคัญต่อการทำงาน เช่นบริเวณเร่งปฏิกิริยาและบริเวณการจับ เนื่องจากบริเวณเหล่านี้ทนต่อการเปลี่ยนแปลงลำดับได้น้อยกว่า
การใช้ความคล้ายคลึงของลำดับเพื่ออนุมานความสัมพันธ์ทางพันธุกรรมมีข้อจำกัดหลายประการ ไม่มีระดับความคล้ายคลึงของลำดับขั้นต่ำที่รับประกันว่าจะได้โครงสร้างที่เหมือนกันทุกประการ ในช่วงเวลาวิวัฒนาการที่ยาวนาน โปรตีนที่เกี่ยวข้องอาจไม่แสดงความคล้ายคลึงของลำดับที่ตรวจพบได้เลย ลำดับที่มีการแทรกและการลบ จำนวนมาก บางครั้งก็อาจจัดเรียง ได้ยาก และระบุบริเวณลำดับที่เหมือนกันได้ยากเช่นกัน ตัวอย่างเช่น ใน กลุ่ม โปรตีเอสPAไม่มีกรดอะมิโนใดที่ได้รับการอนุรักษ์ไว้ตลอดทั้งซูเปอร์แฟมิลี แม้แต่กรด อะมิโนในกลุ่ม เร่งปฏิกิริยาในทางกลับกัน ตระกูลแต่ละตระกูลที่ประกอบกันเป็นซูเปอร์แฟมิลีนั้นถูกกำหนดบนพื้นฐานของการจัดเรียงลำดับ ตัวอย่างเช่น ตระกูลโปรตีเอส C04 ภายในกลุ่ม PA
อย่างไรก็ตาม ความคล้ายคลึงของลำดับถือเป็นหลักฐานที่ใช้กันทั่วไปในการอนุมานความสัมพันธ์ เนื่องจากจำนวนลำดับที่ทราบมีมากกว่าจำนวนโครงสร้างตติยภูมิที่ ทราบอย่างมาก [ 7 ]ในกรณีที่ไม่มีข้อมูลโครงสร้าง ความคล้ายคลึงของลำดับจะจำกัดขอบเขตของโปรตีนที่สามารถกำหนดให้อยู่ในซูเปอร์แฟมิลีได้[ 7 ]
ความคล้ายคลึงทางโครงสร้าง

โครงสร้างได้รับการอนุรักษ์ทางวิวัฒนาการมากกว่าลำดับมาก ดังนั้นโปรตีนที่มีโครงสร้างคล้ายคลึงกันมากอาจมีลำดับที่แตกต่างกันอย่างสิ้นเชิง[ 8 ]ในช่วงเวลาวิวัฒนาการที่ยาวนานมาก มีกรดอะมิโนเพียงไม่กี่ตัวเท่านั้นที่แสดงการอนุรักษ์ลำดับกรดอะมิโนที่ตรวจพบได้ อย่างไรก็ตาม องค์ประกอบ โครงสร้างทุติยภูมิและ ลวดลาย โครงสร้างตติยภูมิได้รับการอนุรักษ์ไว้สูง พลวัตของ โปรตีน บางอย่าง [ 9 ]และการเปลี่ยนแปลงโครงสร้างของโปรตีนอาจได้รับการอนุรักษ์ไว้เช่นกัน ดังที่เห็นในตระกูลเซอพิน [ 10 ] ด้วยเหตุนี้ โครงสร้างตติยภูมิของโปรตีนจึงสามารถใช้เพื่อตรวจจับความเหมือนกันระหว่างโปรตีนได้ แม้ว่าจะไม่มีหลักฐานความสัมพันธ์เหลืออยู่ในลำดับของพวกมันก็ตาม โปรแกรม การจัดเรียงโครงสร้างเช่นDALIใช้โครงสร้าง 3 มิติของโปรตีนที่สนใจเพื่อค้นหาโปรตีนที่มีโครงสร้างพับคล้ายกัน[ 11 ]อย่างไรก็ตาม ในบางโอกาส โปรตีนที่เกี่ยวข้องอาจวิวัฒนาการให้มีโครงสร้างที่แตกต่างกัน[ 12 ]และความสัมพันธ์สามารถอนุมานได้โดยวิธีการอื่นเท่านั้น[ 13 ] [ 14 ] [ 15 ]
ความคล้ายคลึงเชิงกลไก
กลไกการเร่งปฏิกิริยาของเอนไซม์ภายในซูเปอร์แฟมิลีมักจะได้รับการอนุรักษ์ไว้ แม้ว่า ความจำเพาะ ของสารตั้งต้นอาจแตกต่างกันอย่างมีนัยสำคัญ[ 16 ]หมู่เร่งปฏิกิริยามักจะเกิดขึ้นในลำดับเดียวกันในลำดับโปรตีน[ 17 ]สำหรับแฟมิลีภายในกลุ่มโปรตีเอส PA แม้ว่าจะมีการวิวัฒนาการที่แตกต่างกันของ หมู่เร่ง ปฏิกิริยาสามหมู่ที่ใช้ในการเร่งปฏิกิริยา แต่สมาชิกทั้งหมดใช้กลไกที่คล้ายกันในการเร่งปฏิกิริยาแบบโควาเลนต์และนิวคลีโอฟิลิกบนโปรตีน เปปไทด์ หรือกรดอะมิโน[ 18 ]อย่างไรก็ตาม กลไกเพียงอย่างเดียวไม่เพียงพอที่จะอนุมานความสัมพันธ์ กลไกการเร่งปฏิกิริยาบางอย่างได้รับการวิวัฒนาการแบบบรรจบกันหลายครั้งโดยอิสระ และจึงก่อตัวเป็นซูเปอร์แฟมิลีที่แยกจากกัน[ 19 ] [ 20 ] [ 21 ]และในบางซูเปอร์แฟมิลีแสดงกลไกที่แตกต่างกันหลากหลาย (แม้ว่ามักจะคล้ายคลึงกันทางเคมี) [ 16 ] [ 22 ]
ความสำคัญเชิงวิวัฒนาการ
กลุ่มโปรตีนขนาดใหญ่แสดงถึงขีดจำกัดปัจจุบันของความสามารถของเราในการระบุบรรพบุรุษร่วมกัน[ 23 ]พวกมันเป็น กลุ่ม วิวัฒนาการ ที่ใหญ่ที่สุด ตามหลักฐาน โดยตรง ที่เป็นไปได้ในปัจจุบัน ดังนั้นพวกมันจึงเป็นหนึ่งในเหตุการณ์วิวัฒนาการที่เก่าแก่ที่สุดที่กำลังศึกษาอยู่ในปัจจุบัน กลุ่มโปรตีนขนาดใหญ่บางกลุ่มมีสมาชิกอยู่ในอาณาจักรของสิ่งมีชีวิต ทั้งหมด ซึ่งบ่งชี้ว่าบรรพบุรุษร่วมสุดท้ายของกลุ่มโปรตีนขนาดใหญ่นั้นอยู่ในบรรพบุรุษร่วมสากลสุดท้ายของสิ่งมีชีวิตทั้งหมด (LUCA) [ 24 ]
สมาชิกในกลุ่มซูเปอร์แฟมิลีอาจอยู่ในสปีชีส์ที่แตกต่างกัน โดยโปรตีนบรรพบุรุษคือรูปแบบของโปรตีนที่มีอยู่ในสปีชีส์บรรพบุรุษนั้น ( ออร์โทโลจี ) ในทางกลับกัน โปรตีนอาจอยู่ในสปีชีส์เดียวกัน แต่พัฒนามาจากโปรตีนตัวเดียวที่มีการเพิ่ม จำนวนยีน ในจีโนม ( พาราโลจี )
การกระจายความเสี่ยง
โปรตีนส่วนใหญ่ประกอบด้วยโดเมนหลายโดเมน โปรตีนยูคาริโอตประมาณ 66-80% มีโดเมนหลายโดเมน ในขณะที่โปรตีนโปรคาริโอตประมาณ 40-60% มีโดเมนหลายโดเมน[ 6 ]เมื่อเวลาผ่านไป ซูเปอร์แฟมิลีของโดเมนจำนวนมากได้ผสมปนเปกัน ในความเป็นจริง เป็นเรื่องยากมากที่จะพบ "ซูเปอร์แฟมิลีที่แยกออกจากกันอย่างสม่ำเสมอ" [ 6 ] [ 1 ] เมื่อโดเมนรวมกัน ลำดับโดเมนจากปลาย N ไปยังปลาย C ("สถาปัตยกรรมโดเมน") มักจะได้รับการอนุรักษ์ไว้อย่างดี นอกจากนี้ จำนวนการรวมกันของโดเมนที่พบในธรรมชาติมีน้อยเมื่อเทียบกับจำนวนความเป็นไปได้ ซึ่งบ่งชี้ว่าการคัดเลือกกระทำกับทุกการรวมกัน[ 6 ]
ตัวอย่าง
- ซูเปอร์แฟมิลี α/β ไฮโดรเลส
- สมาชิกมีแผ่น α/β ร่วมกัน ซึ่งประกอบด้วย 8 สายที่เชื่อมต่อกันด้วยเกลียวพร้อมด้วย สารตกค้าง ไตรแอดเร่งปฏิกิริยาในลำดับเดียวกัน[ 25 ]กิจกรรมต่างๆ ได้แก่โปรตีเอสไล เปส เพอร์ออกซิเดส เอ สเทอเรส อีพอกไซด์ไฮโดรเลสและดีฮาโลเจเนส[ 26 ]
- กลุ่มเอนไซม์อัลคาไลน์ฟอสฟาเตส
- สมาชิกมีโครงสร้างแซนด์วิช αβα ร่วมกัน[ 27 ]รวมถึงดำเนินการปฏิกิริยาผสมพันธุ์ ทั่วไป ด้วยกลไกทั่วไป[ 28 ]
- ตระกูลใหญ่โกลบิน
- สมาชิกมีโครงสร้างโกลบินแบบเฮลิกซ์อัลฟา 8 อันร่วมกัน [ 29 ] [ 30 ]
- ตระกูลอิมมูโนโกลบูลิน
- สมาชิกมีโครงสร้างคล้ายแซนด์วิชที่ประกอบด้วยแผ่นเบต้าสแตรนด์แบบขนาน สอง แผ่น ( Ig-fold ) และเกี่ยวข้องกับการจดจำ การจับ และการยึดเกาะ[ 31 ] [ 32 ]
- ซูเปอร์แฟมิลี่ LYRM
- สมาชิกมีโมทีฟ LYR ที่ได้รับการอนุรักษ์ ( ลิวซีน – ไทโรซีน – อาร์จินีน ) ฝังอยู่ภายใน โครงสร้าง เกลียวอัลฟา 3 อัน และทำหน้าที่เป็นโปรตีนอะแดปเตอร์ที่จำเป็นสำหรับ การประกอบ คลัสเตอร์ Fe–S ของไมโทคอนเดรีย และการประกอบคอมเพล็กซ์ฟอสโฟรีเลชันแบบออกซิเดชัน[ 33 ] [ 34 ]
- ตระกูล PA
- สมาชิกมี โครงสร้างแบบ β-barrelสองชั้นคล้ายไคโมทริปซินและ กลไก การย่อยโปรตีน ที่คล้ายกัน แต่มีความเหมือนกันของลำดับน้อยกว่า 10% กลุ่มนี้ประกอบด้วยโปรตีเอสทั้งซิสเทอีนและเซริน ( นิวคลีโอไฟล์ ต่างกัน ) [ 2 ] [ 35 ]
- ซูเปอร์แฟมิลี่ราส
- สมาชิกมีโดเมน G ที่เร่งปฏิกิริยาร่วมกันซึ่งประกอบด้วยแผ่นเบต้า 6 สายที่ล้อมรอบด้วยเกลียวอัลฟา 5 อัน[ 36 ]
- ซูเปอร์แฟมิลี่ RSH
- สมาชิกมีความสามารถในการไฮโดรไลซ์และ/หรือสังเคราะห์สารเตือนภัยppGpp ใน การตอบ สนองที่เข้มงวด[ 37 ]
- ตระกูลเซอร์พิน
- สมาชิกมีโครงสร้างที่มีพลังงานสูงและเครียดซึ่งสามารถเกิดการเปลี่ยนแปลงโครงสร้าง ขนาดใหญ่ได้ ซึ่งโดยทั่วไปจะใช้เพื่อยับยั้งเอนไซม์เซรินและซิสเทอีนโปรตีเอสโดยการทำลายโครงสร้างของเอนไซม์[ 10 ]
- ตระกูลบาร์เรล TIM สุดยิ่งใหญ่
- สมาชิกมีโครงสร้างบาร์เรล α 8 β 8 ขนาดใหญ่ร่วมกัน เป็นหนึ่งในโครงสร้างพับโปรตีน ที่พบได้บ่อยที่สุด และความเป็นเอกพันธุ์ของซูเปอร์แฟมิลีนี้ยังคงเป็นที่ถกเถียงกันอยู่[ 38 ] [ 39 ]
แหล่งข้อมูลซูเปอร์แฟมิลีโปรตีน
ตัวอย่างเช่น ฐานข้อมูลทางชีววิทยาหลายแห่งได้บันทึกข้อมูลเกี่ยวกับซูเปอร์แฟมิลีของโปรตีนและโครงสร้างพับของโปรตีนไว้ดังนี้:
- Pfam - ฐานข้อมูลตระกูลโปรตีนสำหรับการจัดเรียงลำดับและ HMMs
- PROSITE - ฐานข้อมูลโดเมน โปรตีนตระกูล และตำแหน่งการทำงานต่างๆ
- PIRSF - ระบบการจำแนกประเภทซูเปอร์แฟมิลี
- PASS2 - การจัดเรียงโปรตีนในรูปแบบซูเปอร์แฟมิลีโครงสร้าง เวอร์ชัน 2
- ซูเปอร์แฟมิลี - คลังข้อมูล HMM ที่แสดงถึงซูเปอร์แฟมิลี และฐานข้อมูลคำอธิบายประกอบ (ซูเปอร์แฟมิลีและแฟมิลี) สำหรับสิ่งมีชีวิตทั้งหมดที่มีการจัดลำดับจีโนมอย่างสมบูรณ์
- SCOPและCATH - การจำแนกโครงสร้างโปรตีนออกเป็นซูเปอร์แฟมิลี แฟมิลี และโดเมน
ในทำนองเดียวกัน มีอัลกอริธึมที่ค้นหา โปรตีนในฐาน ข้อมูล PDBที่มีโครงสร้างคล้ายคลึงกับโครงสร้างเป้าหมาย ตัวอย่างเช่น:
- DALI - การจัดเรียงโครงสร้างโดยใช้วิธีเมทริกซ์การจัดเรียงระยะทาง
ดูเพิ่มเติม
ลิงก์ภายนอก
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ซูเปอร์แฟมิลีโปรตีน
ซูเปอร์แฟมิลีโปรตีนคือกลุ่มที่ใหญ่ที่สุด ( clade ) ของโปรตีนที่สามารถอนุมานบรรพบุรุษร่วมกัน ได้ (ดู homology )...
การระบุตัวตน
มีการระบุซูเปอร์แฟมิลีของโปรตีนโดยใช้วิธีการหลายวิธี สมาชิกที่มีความสัมพันธ์ใกล้ชิดกันสามารถระบุได้ด้วยวิธีการที่แตกต่างจากวิธีการที่จำเป็นในการจัดกลุ่มสมาชิกที่มีความแตกต่างทางวิวัฒนาการมากที่สุด
ความคล้ายคลึงของลำดับ
ในอดีต ความคล้ายคลึงกันของลำดับกรดอะมิโนที่แตกต่างกันถือเป็นวิธีการอนุมาน ความเหมือนกัน ที่พบได้บ่อยที่สุด [ 6 ] ความคล้ายคลึงกันของลำดับถือเป็นตัวทำนายความสัมพันธ์ที่ดี เนื่องจากลำดับที่คล้ายคลึงกันมีแนวโน้มที่จะเป็นผลมาจากการ จำลองยีน และ...
ความคล้ายคลึงทางโครงสร้าง
โครงสร้าง ได้รับการอนุรักษ์ทางวิวัฒนาการมากกว่าลำดับมาก ดังนั้นโปรตีนที่มีโครงสร้างคล้ายคลึงกันมากอาจมีลำดับที่แตกต่างกันอย่างสิ้นเชิง [ 8 ] ในช่วงเวลาวิวัฒนาการที่ยาวนานมาก มีกรดอะมิโนเพียงไม่กี่ตัวเท่านั้นที่แสดงการอนุรักษ์ลำดับกรดอะมิโนที่ตรวจพบได้...