ซูเปอร์แฟมิลีโปรตีน

ซูเปอร์แฟมิลีโปรตีนคือกลุ่มที่ใหญ่ที่สุด ( clade ) ของโปรตีนที่สามารถอนุมานบรรพบุรุษร่วมกัน ได้ (ดู homology ) โดยปกติบรรพบุรุษร่วมกันนี้จะอนุมานจากความสอดคล้องของโครงสร้าง^{[ 1 ]}และความคล้ายคลึงกันทางกลไก แม้ว่าจะไม่มีความคล้ายคลึงกันของลำดับที่ชัดเจนก็ตาม^{[ 2 ]} จากนั้นจึงสามารถอนุมาน homology ของลำดับได้แม้ว่าจะไม่ปรากฏชัด (เนื่องจากความคล้ายคลึงกันของลำดับต่ำ) โดยทั่วไปซูเปอร์แฟมิลีจะประกอบด้วย แฟมิ ลีโปรตีนหลายแฟมิลีซึ่งแสดงความคล้ายคลึงกันของลำดับภายในแต่ละแฟมิลี คำว่าprotein clanมักใช้สำหรับ ซูเปอร์แฟมิลี ของโปรตีเอสและไกลโคซิลไฮโดรเลสโดยอิงตามระบบการจำแนกประเภทMEROPSและCAZy ^{[ 2 ]}^{[ 3 ]}

คำว่าfold ของโปรตีนหมายถึงแนวคิดที่คล้ายกันโดยอิงจากการเปรียบเทียบโครงสร้าง ในบางแผนการ เช่น SCOP และCATHถือว่าเป็นระดับที่สูงกว่าซูเปอร์แฟมิลี (โดยบรรพบุรุษร่วมกันในระดับ fold ไม่ได้รับการสนับสนุนอย่างแข็งแกร่งเท่ากับระดับซูเปอร์แฟมิลี) ในขณะที่แผนการอื่นๆ ถือว่ามีความหมายเหมือนกัน ระดับที่สูงกว่า fold คือfold classซึ่งอธิบายโทโพโลยีคร่าวๆ ของโปรตีน (เช่น all-α, all-β, α+β, α/β) ^{[ 4 ]}

การระบุตัวตน

ด้านบน แสดงการอนุรักษ์ โครงสร้างทุติยภูมิของสมาชิก 80 ตัวในกลุ่มโปรตีเอส PA (ซูเปอร์แฟมิลี) H แสดงถึงเกลียวอัลฟา E แสดงถึงแผ่นเบตา L แสดงถึงลูป ด้านล่าง แสดงการอนุรักษ์ลำดับสำหรับการจัดเรียงเดียวกัน ลูกศรชี้ไปยังหมู่กรดอะมิโนเร่งปฏิกิริยาจัดเรียงบนพื้นฐานของโครงสร้างโดยDALI

มีการระบุซูเปอร์แฟมิลีของโปรตีนโดยใช้วิธีการหลายวิธี สมาชิกที่มีความสัมพันธ์ใกล้ชิดกันสามารถระบุได้ด้วยวิธีการที่แตกต่างจากวิธีการที่จำเป็นในการจัดกลุ่มสมาชิกที่มีความแตกต่างทางวิวัฒนาการมากที่สุด

ความคล้ายคลึงของลำดับ

ในอดีต ความคล้ายคลึงกันของลำดับกรดอะมิโนที่แตกต่างกันถือเป็นวิธีการอนุมานความเหมือนกัน ที่พบได้บ่อยที่สุด ^{[ 6 ]}ความคล้ายคลึงกันของลำดับถือเป็นตัวทำนายความสัมพันธ์ที่ดี เนื่องจากลำดับที่คล้ายคลึงกันมีแนวโน้มที่จะเป็นผลมาจากการจำลองยีนและวิวัฒนาการแบบแยกสายมากกว่าที่จะเป็นผลมาจากวิวัฒนาการแบบรวมสายลำดับกรดอะมิโนมักจะได้รับการอนุรักษ์ไว้มากกว่าลำดับดีเอ็นเอ (เนื่องจากรหัสพันธุกรรมที่เสื่อมสภาพ ) ดังนั้นจึงเป็นวิธีการตรวจจับที่ไวต่อการเปลี่ยนแปลงมากกว่า เนื่องจากกรดอะมิโนบางชนิดมีคุณสมบัติที่คล้ายคลึงกัน (เช่น ประจุ ความชอบน้ำ ขนาด) การกลายพันธุ์แบบอนุรักษ์ที่สลับกรดอะมิโนเหล่านี้มักจะไม่มีผลต่อการทำงาน บริเวณลำดับที่ได้รับการอนุรักษ์ไว้มากที่สุดของโปรตีนมักจะสอดคล้องกับบริเวณที่มีความสำคัญต่อการทำงาน เช่นบริเวณเร่งปฏิกิริยาและบริเวณการจับ เนื่องจากบริเวณเหล่านี้ทนต่อการเปลี่ยนแปลงลำดับได้น้อยกว่า

การใช้ความคล้ายคลึงของลำดับเพื่ออนุมานความสัมพันธ์ทางพันธุกรรมมีข้อจำกัดหลายประการ ไม่มีระดับความคล้ายคลึงของลำดับขั้นต่ำที่รับประกันว่าจะได้โครงสร้างที่เหมือนกันทุกประการ ในช่วงเวลาวิวัฒนาการที่ยาวนาน โปรตีนที่เกี่ยวข้องอาจไม่แสดงความคล้ายคลึงของลำดับที่ตรวจพบได้เลย ลำดับที่มีการแทรกและการลบ จำนวนมาก บางครั้งก็อาจจัดเรียง ได้ยาก และระบุบริเวณลำดับที่เหมือนกันได้ยากเช่นกัน ตัวอย่างเช่น ใน กลุ่ม โปรตีเอสPAไม่มีกรดอะมิโนใดที่ได้รับการอนุรักษ์ไว้ตลอดทั้งซูเปอร์แฟมิลี แม้แต่กรด อะมิโนในกลุ่ม เร่งปฏิกิริยาในทางกลับกัน ตระกูลแต่ละตระกูลที่ประกอบกันเป็นซูเปอร์แฟมิลีนั้นถูกกำหนดบนพื้นฐานของการจัดเรียงลำดับ ตัวอย่างเช่น ตระกูลโปรตีเอส C04 ภายในกลุ่ม PA

อย่างไรก็ตาม ความคล้ายคลึงของลำดับถือเป็นหลักฐานที่ใช้กันทั่วไปในการอนุมานความสัมพันธ์ เนื่องจากจำนวนลำดับที่ทราบมีมากกว่าจำนวนโครงสร้างตติยภูมิที่ ทราบอย่างมาก ^{[ 7 ]}ในกรณีที่ไม่มีข้อมูลโครงสร้าง ความคล้ายคลึงของลำดับจะจำกัดขอบเขตของโปรตีนที่สามารถกำหนดให้อยู่ในซูเปอร์แฟมิลีได้^{[ 7 ]}

ความคล้ายคลึงทางโครงสร้าง

โครงสร้างได้รับการอนุรักษ์ทางวิวัฒนาการมากกว่าลำดับมาก ดังนั้นโปรตีนที่มีโครงสร้างคล้ายคลึงกันมากอาจมีลำดับที่แตกต่างกันอย่างสิ้นเชิง^{[ 8 ]}ในช่วงเวลาวิวัฒนาการที่ยาวนานมาก มีกรดอะมิโนเพียงไม่กี่ตัวเท่านั้นที่แสดงการอนุรักษ์ลำดับกรดอะมิโนที่ตรวจพบได้ อย่างไรก็ตาม องค์ประกอบ โครงสร้างทุติยภูมิและ ลวดลาย โครงสร้างตติยภูมิได้รับการอนุรักษ์ไว้สูง พลวัตของ โปรตีน บางอย่าง ^{[ 9 ]}และการเปลี่ยนแปลงโครงสร้างของโปรตีนอาจได้รับการอนุรักษ์ไว้เช่นกัน ดังที่เห็นในตระกูลเซอพิน [ ^{10 ] ด้วย}เหตุนี้ โครงสร้างตติยภูมิของโปรตีนจึงสามารถใช้เพื่อตรวจจับความเหมือนกันระหว่างโปรตีนได้ แม้ว่าจะไม่มีหลักฐานความสัมพันธ์เหลืออยู่ในลำดับของพวกมันก็ตาม โปรแกรม การจัดเรียงโครงสร้างเช่นDALIใช้โครงสร้าง 3 มิติของโปรตีนที่สนใจเพื่อค้นหาโปรตีนที่มีโครงสร้างพับคล้ายกัน^{[ 11 ]}อย่างไรก็ตาม ในบางโอกาส โปรตีนที่เกี่ยวข้องอาจวิวัฒนาการให้มีโครงสร้างที่แตกต่างกัน^{[ 12 ]}และความสัมพันธ์สามารถอนุมานได้โดยวิธีการอื่นเท่านั้น^{[ 13 ]}^{[ 14 ]}^{[ 15 ]}

ความคล้ายคลึงเชิงกลไก

กลไกการเร่งปฏิกิริยาของเอนไซม์ภายในซูเปอร์แฟมิลีมักจะได้รับการอนุรักษ์ไว้ แม้ว่า ความจำเพาะ ของสารตั้งต้นอาจแตกต่างกันอย่างมีนัยสำคัญ^{[ 16 ]}หมู่เร่งปฏิกิริยามักจะเกิดขึ้นในลำดับเดียวกันในลำดับโปรตีน^{[ 17 ]}สำหรับแฟมิลีภายในกลุ่มโปรตีเอส PA แม้ว่าจะมีการวิวัฒนาการที่แตกต่างกันของ หมู่เร่ง ปฏิกิริยาสามหมู่ที่ใช้ในการเร่งปฏิกิริยา แต่สมาชิกทั้งหมดใช้กลไกที่คล้ายกันในการเร่งปฏิกิริยาแบบโควาเลนต์และนิวคลีโอฟิลิกบนโปรตีน เปปไทด์ หรือกรดอะมิโน^{[ 18 ]}อย่างไรก็ตาม กลไกเพียงอย่างเดียวไม่เพียงพอที่จะอนุมานความสัมพันธ์ กลไกการเร่งปฏิกิริยาบางอย่างได้รับการวิวัฒนาการแบบบรรจบกันหลายครั้งโดยอิสระ และจึงก่อตัวเป็นซูเปอร์แฟมิลีที่แยกจากกัน^{[ 19 ]}^{[ 20 ]}^{[ 21 ]}และในบางซูเปอร์แฟมิลีแสดงกลไกที่แตกต่างกันหลากหลาย (แม้ว่ามักจะคล้ายคลึงกันทางเคมี) ^{[ 16 ]}^{[ 22 ]}

ความสำคัญเชิงวิวัฒนาการ

กลุ่มโปรตีนขนาดใหญ่แสดงถึงขีดจำกัดปัจจุบันของความสามารถของเราในการระบุบรรพบุรุษร่วมกัน^{[ 23 ]}พวกมันเป็น กลุ่ม วิวัฒนาการ ที่ใหญ่ที่สุด ตามหลักฐาน โดยตรง ที่เป็นไปได้ในปัจจุบัน ดังนั้นพวกมันจึงเป็นหนึ่งในเหตุการณ์วิวัฒนาการที่เก่าแก่ที่สุดที่กำลังศึกษาอยู่ในปัจจุบัน กลุ่มโปรตีนขนาดใหญ่บางกลุ่มมีสมาชิกอยู่ในอาณาจักรของสิ่งมีชีวิต ทั้งหมด ซึ่งบ่งชี้ว่าบรรพบุรุษร่วมสุดท้ายของกลุ่มโปรตีนขนาดใหญ่นั้นอยู่ในบรรพบุรุษร่วมสากลสุดท้ายของสิ่งมีชีวิตทั้งหมด (LUCA) ^{[ 24 ]}

สมาชิกในกลุ่มซูเปอร์แฟมิลีอาจอยู่ในสปีชีส์ที่แตกต่างกัน โดยโปรตีนบรรพบุรุษคือรูปแบบของโปรตีนที่มีอยู่ในสปีชีส์บรรพบุรุษนั้น ( ออร์โทโลจี ) ในทางกลับกัน โปรตีนอาจอยู่ในสปีชีส์เดียวกัน แต่พัฒนามาจากโปรตีนตัวเดียวที่มีการเพิ่ม จำนวนยีน ในจีโนม ( พาราโลจี )

การกระจายความเสี่ยง

โปรตีนส่วนใหญ่ประกอบด้วยโดเมนหลายโดเมน โปรตีนยูคาริโอตประมาณ 66-80% มีโดเมนหลายโดเมน ในขณะที่โปรตีนโปรคาริโอตประมาณ 40-60% มีโดเมนหลายโดเมน^{[ 6 ]}เมื่อเวลาผ่านไป ซูเปอร์แฟมิลีของโดเมนจำนวนมากได้ผสมปนเปกัน ในความเป็นจริง เป็นเรื่องยากมากที่จะพบ "ซูเปอร์แฟมิลีที่แยกออกจากกันอย่างสม่ำเสมอ" ^{[ 6 ]}^{[ 1 ]} เมื่อโดเมนรวมกัน ลำดับโดเมนจากปลาย N ไปยังปลาย C ("สถาปัตยกรรมโดเมน") มักจะได้รับการอนุรักษ์ไว้อย่างดี นอกจากนี้ จำนวนการรวมกันของโดเมนที่พบในธรรมชาติมีน้อยเมื่อเทียบกับจำนวนความเป็นไปได้ ซึ่งบ่งชี้ว่าการคัดเลือกกระทำกับทุกการรวมกัน^{[ 6 ]}

ตัวอย่าง

ซูเปอร์แฟมิลี α/β ไฮโดรเลส: สมาชิกมีแผ่น α/β ร่วมกัน ซึ่งประกอบด้วย 8 สายที่เชื่อมต่อกันด้วยเกลียวพร้อมด้วย สารตกค้าง ไตรแอดเร่งปฏิกิริยาในลำดับเดียวกัน^{[ 25 ]}กิจกรรมต่างๆ ได้แก่โปรตีเอสไล เปส เพอร์ออกซิเดส เอ ส เทอเรส อีพอกไซด์ไฮโดรเลสและดีฮาโลเจเนส^{[ 26 ]}
กลุ่มเอนไซม์อัลคาไลน์ฟอสฟาเตส: สมาชิกมีโครงสร้างแซนด์วิช αβα ร่วมกัน^{[ 27 ]}รวมถึงดำเนินการปฏิกิริยาผสมพันธุ์ ทั่วไป ด้วยกลไกทั่วไป^{[ 28 ]}
ตระกูลใหญ่โกลบิน: สมาชิกมีโครงสร้างโกลบินแบบเฮลิกซ์อัลฟา 8 อันร่วมกัน ^[²⁹^]^[³⁰^]
ตระกูลอิมมูโนโกลบูลิน: สมาชิกมีโครงสร้างคล้ายแซนด์วิชที่ประกอบด้วยแผ่นเบต้าสแตรนด์แบบขนาน สอง แผ่น ( Ig-fold ) และเกี่ยวข้องกับการจดจำ การจับ และการยึดเกาะ^[³¹^]^[³²^]
ซูเปอร์แฟมิลี่ LYRM: สมาชิกมีโมทีฟ LYR ที่ได้รับการอนุรักษ์ ( ลิวซีน – ไทโรซีน – อาร์จินีน ) ฝังอยู่ภายใน โครงสร้าง เกลียวอัลฟา 3 อัน และทำหน้าที่เป็นโปรตีนอะแดปเตอร์ที่จำเป็นสำหรับ การประกอบ คลัสเตอร์ Fe–S ของไมโทคอนเดรีย และการประกอบคอมเพล็กซ์ฟอสโฟรีเลชันแบบออกซิเดชัน^{[ 33 ]}^{[ 34 ]}
ตระกูล PA: สมาชิกมี โครงสร้างแบบ β-barrelสองชั้นคล้ายไคโมทริปซินและ กลไก การย่อยโปรตีน ที่คล้ายกัน แต่มีความเหมือนกันของลำดับน้อยกว่า 10% กลุ่มนี้ประกอบด้วยโปรตีเอสทั้งซิสเทอีนและเซริน ( นิวคลีโอไฟล์ ต่างกัน ) ^[²^]^[³⁵^]
ซูเปอร์แฟมิลี่ราส: สมาชิกมีโดเมน G ที่เร่งปฏิกิริยาร่วมกันซึ่งประกอบด้วยแผ่นเบต้า 6 สายที่ล้อมรอบด้วยเกลียวอัลฟา 5 อัน^{[ 36 ]}
ซูเปอร์แฟมิลี่ RSH: สมาชิกมีความสามารถในการไฮโดรไลซ์และ/หรือสังเคราะห์สารเตือนภัย ppGpp ใน การตอบ สนองที่เข้มงวด^[³⁷^]
ตระกูลเซอร์พิน: สมาชิกมีโครงสร้างที่มีพลังงานสูงและเครียดซึ่งสามารถเกิดการเปลี่ยนแปลงโครงสร้าง ขนาดใหญ่ได้ ซึ่งโดยทั่วไปจะใช้เพื่อยับยั้งเอนไซม์เซรินและซิสเทอีนโปรตีเอสโดยการทำลายโครงสร้างของเอนไซม์^{[ 10 ]}
ตระกูลบาร์เรล TIM สุดยิ่งใหญ่: สมาชิกมีโครงสร้างบาร์เรล α ₈ β ₈ ขนาดใหญ่ร่วมกัน เป็นหนึ่งในโครงสร้างพับโปรตีน ที่พบได้บ่อยที่สุด และความเป็นเอกพันธุ์ของซูเปอร์แฟมิลีนี้ยังคงเป็นที่ถกเถียงกันอยู่^{[ 38 ]}^{[ 39 ]}

แหล่งข้อมูลซูเปอร์แฟมิลีโปรตีน

ตัวอย่างเช่น ฐานข้อมูลทางชีววิทยาหลายแห่งได้บันทึกข้อมูลเกี่ยวกับซูเปอร์แฟมิลีของโปรตีนและโครงสร้างพับของโปรตีนไว้ดังนี้:

Pfam - ฐานข้อมูลตระกูลโปรตีนสำหรับการจัดเรียงลำดับและ HMMs
PROSITE - ฐานข้อมูลโดเมน โปรตีนตระกูล และตำแหน่งการทำงานต่างๆ
PIRSF - ระบบการจำแนกประเภทซูเปอร์แฟมิลี
PASS2 - การจัดเรียงโปรตีนในรูปแบบซูเปอร์แฟมิลีโครงสร้าง เวอร์ชัน 2
ซูเปอร์แฟมิลี - คลังข้อมูล HMM ที่แสดงถึงซูเปอร์แฟมิลี และฐานข้อมูลคำอธิบายประกอบ (ซูเปอร์แฟมิลีและแฟมิลี) สำหรับสิ่งมีชีวิตทั้งหมดที่มีการจัดลำดับจีโนมอย่างสมบูรณ์
SCOPและCATH - การจำแนกโครงสร้างโปรตีนออกเป็นซูเปอร์แฟมิลี แฟมิลี และโดเมน

ในทำนองเดียวกัน มีอัลกอริธึมที่ค้นหา โปรตีนในฐาน ข้อมูล PDBที่มีโครงสร้างคล้ายคลึงกับโครงสร้างเป้าหมาย ตัวอย่างเช่น:

DALI - การจัดเรียงโครงสร้างโดยใช้วิธีเมทริกซ์การจัดเรียงระยะทาง

ดูเพิ่มเติม

ลิงก์ภายนอก

สื่อที่เกี่ยวข้องกับกลุ่มโปรตีนขนาดใหญ่ในวิกิมีเดียคอมมอนส์

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

10 ] ด้วย

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]

[ 22 ]

[ 23 ]

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

[ 28 ]

[

[

[

[

[ 33 ]

[ 34 ]

[

[ 36 ]

[

[ 38 ]

[ 39 ]