อ่าน 5 นาที
ไฟร์
PhyreและPhyre2 ( Protein Homology/AnalogY Recognition Engine ; อ่านว่าไฟร์ ) เป็นบริการบนเว็บฟรีสำหรับการทำนายโครงสร้างโปรตีน...
ไฟร์
| ไฟร์2 | |
|---|---|
| นักพัฒนา |
|
| เวอร์ชันเสถียร | 2.0 / 23 กุมภาพันธ์ 2554 |
| เขียนเป็น | |
| มีจำหน่ายใน | ภาษาอังกฤษ |
| พิมพ์ | เครื่องมือชีวสารสนเทศ สำหรับ การทำนายโครงสร้างโปรตีน |
| ใบอนุญาต | ลิขสิทธิ์ แบบ Creative Commons Attribution-2.0 |
| เว็บไซต์ | www.sbg.bio.ic.ac.uk/phyre2 |
PhyreและPhyre2 ( Protein Homology/AnalogY Recognition Engine ; อ่านว่าไฟร์ ) เป็นบริการบนเว็บฟรีสำหรับการทำนายโครงสร้างโปรตีน [ 1 ] [ 2 ] [ 3 ] Phyreเป็นหนึ่งในวิธีการทำนายโครงสร้างโปรตีนที่ได้รับความนิยมมากที่สุด โดยมีการอ้างอิงมากกว่า 1,500 ครั้ง[ 4 ] เช่นเดียวกับเทคนิคการจดจำ ความคล้ายคลึงระยะไกลอื่นๆ(ดูprotein threading ) มันสามารถสร้างแบบจำลองโปรตีนที่เชื่อถือได้อย่างสม่ำเสมอเมื่อวิธีการอื่นๆ ที่ใช้กันอย่างแพร่หลาย เช่นPSI-BLASTไม่สามารถทำได้ Phyre2 ได้รับการออกแบบมาเพื่อให้มีอินเทอร์เฟซที่ใช้งานง่ายสำหรับผู้ใช้ที่ไม่เชี่ยวชาญในวิธีการทำนายโครงสร้างโปรตีน การพัฒนาได้รับการสนับสนุนโดย สภา วิจัยเทคโนโลยีชีวภาพและวิทยาศาสตร์ชีวภาพ[ 5 ]
คำอธิบาย
เซิร์ฟเวอร์ Phyre และ Phyre2 ทำนายโครงสร้างสามมิติของลำดับโปรตีนโดยใช้หลักการและเทคนิคของการสร้างแบบจำลองความเหมือน (homology modeling ) เนื่องจากโครงสร้างของโปรตีนได้รับการอนุรักษ์ไว้ในวิวัฒนาการมากกว่า ลำดับ กรดอะมิโนดังนั้นลำดับโปรตีนที่สนใจ (เป้าหมาย) สามารถสร้างแบบจำลองได้อย่างแม่นยำพอสมควรบนลำดับที่มีความสัมพันธ์ห่างไกลกันมากซึ่งมีโครงสร้างที่ทราบแล้ว (แม่แบบ) โดยมีเงื่อนไขว่าความสัมพันธ์ระหว่างเป้าหมายและแม่แบบสามารถระบุได้ผ่านการจัดเรียงลำดับปัจจุบันวิธีการที่มีประสิทธิภาพและแม่นยำที่สุดในการตรวจจับและจัดเรียงลำดับที่มีความสัมพันธ์ห่างไกลกันนั้นอาศัยโปรไฟล์หรือแบบจำลองมาร์คอฟที่ซ่อนอยู่ (HMMs) โปรไฟล์/HMMs เหล่านี้จะจับแนวโน้มการกลายพันธุ์ของแต่ละตำแหน่งในลำดับกรดอะมิโนโดยอิงจากการกลายพันธุ์ที่สังเกตได้ในลำดับที่เกี่ยวข้อง และสามารถคิดได้ว่าเป็น 'ลายนิ้วมือทางวิวัฒนาการ' ของโปรตีนเฉพาะนั้น ๆ
โดยทั่วไปแล้ว จะมีการรวบรวมลำดับกรดอะมิโนของโครงสร้างโปรตีนสามมิติที่รู้จักทั้งหมด และประมวลผลลำดับเหล่านี้โดยการสแกนกับฐานข้อมูลลำดับ โปรตีนขนาดใหญ่ ผลลัพธ์ที่ได้คือฐานข้อมูลของโปรไฟล์หรือ HMM หนึ่งรายการสำหรับแต่ละโครงสร้างสามมิติที่รู้จัก ลำดับที่ผู้ใช้สนใจจะถูกประมวลผลในทำนองเดียวกันเพื่อสร้างโปรไฟล์/HMM จากนั้นโปรไฟล์ของผู้ใช้นี้จะถูกสแกนกับฐานข้อมูลโปรไฟล์โดยใช้เทคนิคการจัดเรียงโปรไฟล์ต่อโปรไฟล์หรือ HMM-HMM การจัดเรียงเหล่านี้ยังสามารถพิจารณารูปแบบขององค์ประกอบโครงสร้างทุติยภูมิที่คาดการณ์หรือทราบแล้ว และสามารถให้คะแนนโดยใช้แบบจำลองทางสถิติต่างๆ ดูข้อมูลเพิ่มเติมได้ ที่ การทำนายโครงสร้างโปรตีน
เซิร์ฟเวอร์ Phyre ตัวแรกเปิดตัวในเดือนมิถุนายน พ.ศ. 2548 และใช้อัลกอริทึมการจัดเรียงโปรไฟล์ต่อโปรไฟล์โดยอิงจากเมทริกซ์การให้คะแนนเฉพาะตำแหน่งของโปรตีนแต่ละตัว[ 6 ]เซิร์ฟเวอร์Phyre2เปิดตัวสู่สาธารณะในเดือนกุมภาพันธ์ พ.ศ. 2554 เพื่อทดแทนเซิร์ฟเวอร์ Phyre เดิม และมีฟังก์ชันเพิ่มเติมมากกว่า Phyre อินเทอร์เฟซที่ทันสมัยกว่า ไลบรารีพับที่ได้รับการอัปเดตอย่างสมบูรณ์ และใช้ แพ็คเกจ HH-suite (HHpred, HHsearch) สำหรับการตรวจจับความเหมือนกัน รวมถึงการปรับปรุงอื่นๆ
การใช้งานมาตรฐาน
หลังจากวางลำดับกรดอะมิโนของโปรตีนลงในแบบฟอร์มการส่งข้อมูลของ Phyre หรือ Phyre2 แล้ว โดยทั่วไปผู้ใช้จะต้องรอประมาณ 30 นาทีถึงหลายชั่วโมง (ขึ้นอยู่กับปัจจัยต่างๆ เช่น ความยาวของลำดับ จำนวนลำดับที่คล้ายคลึงกัน และความถี่และความยาวของการแทรกและการลบ) จนกว่าการทำนายจะเสร็จสมบูรณ์ อีเมลที่มีข้อมูลสรุปและโครงสร้างที่ทำนายได้ในรูปแบบ PDBจะถูกส่งไปยังผู้ใช้พร้อมกับลิงก์ไปยังหน้าเว็บแสดงผลลัพธ์ หน้าจอแสดงผลลัพธ์ของ Phyre2 แบ่งออกเป็นสามส่วนหลัก ดังที่อธิบายไว้ด้านล่าง
การทำนายโครงสร้างทุติยภูมิและความไม่เป็นระเบียบ

ลำดับโปรตีนที่ผู้ใช้ส่งมาจะถูกสแกนกับฐานข้อมูลลำดับขนาดใหญ่โดยใช้PSI-BLASTก่อน จากนั้นโปรไฟล์ที่สร้างโดย PSI-BLAST จะถูกประมวลผลโดยโปรแกรมทำนายโครงสร้างทุติยภูมิของเครือข่ายประสาท PsiPred [ 7 ]และตัวทำนายความผิดปกติของโปรตีน Disopred [ 8 ]การทำนายการมีอยู่ของอัลฟาเฮลิกซ์ เบตาสแตรนด์ และบริเวณที่ไม่เป็นระเบียบจะแสดงเป็นกราฟพร้อมกับแถบความเชื่อมั่นที่มีรหัสสี
การวิเคราะห์โดเมน

โปรตีนหลายชนิดมี โดเมนโปรตีนหลายโดเมน Phyre2 จะแสดงตารางการจับคู่แม่แบบโดยใช้รหัสสีตามระดับความน่าเชื่อถือ และระบุบริเวณของลำดับที่ผู้ใช้เลือกซึ่งตรงกัน สิ่งนี้สามารถช่วยในการกำหนดองค์ประกอบของโดเมนในโปรตีนได้
ข้อมูลแม่แบบโดยละเอียด

ตารางผลลัพธ์หลักใน Phyre2 แสดงค่าประมาณความน่าเชื่อถือ รูปภาพ และลิงก์ไปยังแบบจำลองสามมิติที่ทำนายไว้ รวมถึงข้อมูลที่ได้จากฐานข้อมูลการจำแนกโครงสร้างโปรตีน (SCOP) หรือฐานข้อมูลโปรตีน (PDB) ขึ้นอยู่กับแหล่งที่มาของแม่แบบที่ตรวจพบ สำหรับแต่ละการจับคู่ ลิงก์จะนำผู้ใช้ไปยังมุมมองโดยละเอียดของการจัดเรียงระหว่างลำดับของผู้ใช้และลำดับของโครงสร้างสามมิติที่ทราบแล้ว
มุมมองการจัดแนว

มุมมองการจัดเรียงลำดับโดยละเอียดช่วยให้ผู้ใช้สามารถตรวจสอบสารตกค้างที่จัดเรียงแต่ละตัว การจับคู่ระหว่างองค์ประกอบโครงสร้างทุติยภูมิที่คาดการณ์ไว้และที่ทราบ และความสามารถในการสลับข้อมูลเกี่ยวกับรูปแบบการอนุรักษ์ลำดับและความน่าเชื่อถือของโครงสร้างทุติยภูมิ นอกจากนี้Jmolยังใช้เพื่อช่วยให้สามารถดูแบบจำลองโปรตีนแบบ 3 มิติแบบโต้ตอบได้
การปรับปรุงใน Phyre2
Phyre2 ใช้ไลบรารีการพับโมเลกุลที่ได้รับการอัปเดตทุกสัปดาห์เมื่อมีการค้นพบโครงสร้างใหม่ โดยมีอินเทอร์เฟซที่ทันสมัยกว่าและมีฟังก์ชันเพิ่มเติมมากกว่าเซิร์ฟเวอร์ Phyre ดังที่อธิบายไว้ด้านล่าง
ฟังก์ชันเพิ่มเติม
การประมวลผลแบบกลุ่ม
ฟังก์ชันการประมวลผลแบบกลุ่มช่วยให้ผู้ใช้สามารถส่งลำดับดีเอ็นเอมากกว่าหนึ่งลำดับไปยัง Phyre2 ได้โดยการอัปโหลดไฟล์ลำดับดีเอ็นเอในรูปแบบ FASTAโดยค่าเริ่มต้น ผู้ใช้จะมีข้อจำกัดอยู่ที่ 100 ลำดับต่อกลุ่ม ซึ่งสามารถเพิ่มขีดจำกัดนี้ได้โดยการติดต่อผู้ดูแลระบบ งานแบบกลุ่มจะถูกประมวลผลในพื้นหลังโดยใช้พลังการประมวลผลที่ว่างอยู่ ดังนั้น งานแบบกลุ่มจึงมักใช้เวลานานกว่างานที่ส่งทีละรายการ แต่เป็นสิ่งจำเป็นเพื่อให้การกระจายทรัพยากรการประมวลผลเป็นไปอย่างยุติธรรมสำหรับผู้ใช้ Phyre2 ทุกคน
การร้อยด้ายแบบหนึ่งต่อหนึ่ง
การเชื่อมโยงแบบหนึ่งต่อหนึ่งช่วยให้คุณสามารถอัปโหลดทั้งลำดับที่คุณต้องการสร้างแบบจำลองและแม่แบบที่จะใช้ในการสร้างแบบจำลองได้ บางครั้งผู้ใช้มีลำดับโปรตีนที่ต้องการสร้างแบบจำลองบนแม่แบบเฉพาะที่ตนเองเลือก ตัวอย่างเช่น อาจเป็นโครงสร้างที่เพิ่งได้รับการแก้ไขใหม่ซึ่งไม่มีอยู่ในฐานข้อมูลของ Phyre2 หรือเนื่องจากข้อมูลทางชีววิทยาเพิ่มเติมบางอย่างที่บ่งชี้ว่าแม่แบบที่เลือกจะสร้างแบบจำลองที่แม่นยำกว่าแม่แบบที่ Phyre2 เลือกโดยอัตโนมัติ
แบ็คไฟร์
แทนที่จะทำนายโครงสร้างสามมิติของลำดับโปรตีน ผู้ใช้มักจะมีโครงสร้างที่หาคำตอบได้แล้ว และพวกเขาสนใจที่จะตรวจสอบว่ามีโครงสร้างที่เกี่ยวข้องอยู่ในจีโนมที่สนใจหรือไม่ ใน Phyre2 โครงสร้างโปรตีนที่อัปโหลดสามารถแปลงเป็นแบบจำลองมาร์คอฟแบบซ่อนเร้น (Hidden Markov Model) จากนั้นจึงนำไปสแกนกับชุดจีโนม (มากกว่า 20 จีโนม ณ เดือนมีนาคม 2011) ฟังก์ชันนี้เรียกว่าBackPhyreเพื่อแสดงให้เห็นว่า Phyre2 ถูกนำไปใช้ในทางกลับกันอย่างไร
ไฟเรียลอาร์ม
บางครั้ง Phyre2 อาจไม่พบโครงสร้างที่ตรงกันอย่างมั่นใจกับโครงสร้างที่รู้จัก อย่างไรก็ตาม ฐานข้อมูลไลบรารีโครงสร้างพับ (fold library) เพิ่มขึ้นประมาณ 40-100 โครงสร้างใหม่ทุกสัปดาห์ ดังนั้นถึงแม้ว่าสัปดาห์นี้อาจไม่มีแม่แบบที่ดี แต่ก็อาจมีในสัปดาห์ต่อๆ ไป Phyrealarm อนุญาตให้ผู้ใช้ส่งลำดับโปรตีนเพื่อสแกนโดยอัตโนมัติเทียบกับรายการใหม่ที่เพิ่มเข้ามาในไลบรารีโครงสร้างพับทุกสัปดาห์ หากตรวจพบการจับคู่ที่มั่นใจได้ ผู้ใช้จะได้รับการแจ้งเตือนทางอีเมลโดยอัตโนมัติพร้อมกับผลลัพธ์ของการค้นหา Phyre2 ผู้ใช้ยังสามารถควบคุมระดับความครอบคลุมของการจัดเรียงและระดับความมั่นใจในการจับคู่ที่จำเป็นในการกระตุ้นการแจ้งเตือนทางอีเมลได้
3DLigandSite
Phyre2 เชื่อมต่อกับเซิร์ฟเวอร์ 3DLigandSite [ 9 ]สำหรับ การทำนาย ตำแหน่งการจับ โปรตีน 3DLigandSite เป็นหนึ่งในเซิร์ฟเวอร์ที่มีประสิทธิภาพสูงสุดสำหรับการทำนายตำแหน่งการจับในการประเมินโครงสร้างที่สำคัญ ( CASP ) ใน (CASP8 และ CASP9) โมเดลที่มีความน่าเชื่อถือที่สร้างโดย Phyre2 (ความน่าเชื่อถือ >90%) จะถูกส่งไปยัง 3DLigandSite โดยอัตโนมัติ
การทำนายโครงสร้างข้ามเยื่อหุ้มเซลล์
โปรแกรม memsat_svm [ 10 ]ใช้เพื่อทำนายการมีอยู่และโครงสร้างของเกลียวทรานส์เมมเบรนใดๆ ที่มีอยู่ในลำดับโปรตีนของผู้ใช้
การสร้างแบบจำลองหลายเทมเพลต
Phyre2 อนุญาตให้ผู้ใช้เลือกการสร้างแบบจำลอง 'แบบเข้มข้น' จากหน้าจอการส่งงานหลัก โหมดนี้:
- ตรวจสอบรายการผลลัพธ์และใช้หลักการเชิงอนุมานเพื่อเลือกเทมเพลตที่ให้ความครอบคลุมของลำดับและความน่าเชื่อถือสูงสุด
- สร้างแบบจำลองสำหรับแต่ละเทมเพลตที่เลือก
- ใช้โมเดลเหล่านี้เพื่อจัดเตรียมข้อจำกัดระยะทางแบบคู่ที่ป้อนเข้าสู่ เครื่องมือสร้างแบบจำลอง ab initioและ multi-template Poing [ 11 ]
- Poing สังเคราะห์โปรตีนของผู้ใช้ในบริบทของข้อจำกัดด้านระยะทางเหล่านี้ ซึ่งจำลองโดยสปริง บริเวณที่ไม่มีข้อมูลแม่แบบจะถูกจำลองโดยแบบจำลองทางฟิสิกส์แบบง่ายของ Poing ที่ คำนวณ จากหลักการพื้นฐาน
- โมเดลที่สร้างโดย Poing จะถูกรวมเข้ากับแม่แบบดั้งเดิมเพื่อใช้เป็นข้อมูลป้อนเข้าในMODELLER
แอปพลิเคชัน
การประยุกต์ใช้ Phyre และ Phyre2 ได้แก่ การทำนายโครงสร้างโปรตีน การทำนายหน้าที่ การทำนายโดเมน การทำนายขอบเขตโดเมน การจำแนกประเภทโปรตีนตามวิวัฒนาการ การนำทางการกลายพันธุ์เฉพาะจุดและการแก้โครงสร้างผลึกโปรตีนโดย วิธีการ แทนที่ โมเลกุล
มีแหล่งข้อมูลสองแหล่งที่เชื่อมโยงกัน ซึ่งใช้การคาดการณ์ของ Phyre สำหรับการวิเคราะห์โครงสร้างของตัวแปร missense ที่มักเกิดจาก โพลีมอร์ฟิ ซึม ของนิวคลีโอไทด์เดี่ยว
- PhyreRiskเป็นฐานข้อมูลที่เชื่อมโยงตัวแปรทางพันธุกรรมกับโครงสร้างโปรตีนที่ได้จากการทดลองและการคาดการณ์โดย Phyre หน้าโปรตีนจะแสดงโครงสร้างที่ได้จากการทดลองและการคาดการณ์ ผู้ใช้สามารถเชื่อมโยงตัวแปรจากพิกัดทางพันธุกรรมหรือโปรตีนก็ได้[ 12 ]
- Missense3Dเป็นเครื่องมือที่ให้รายงานสเตอริโอเคมีเกี่ยวกับผลกระทบของตัวแปรมิสเซนส์ต่อโครงสร้างโปรตีน ผู้ใช้สามารถอัปโหลดตัวแปรและพิกัดของตนเองได้ รวมถึงโครงสร้าง PDB และแบบจำลองที่ทำนายโดย Phyre [ 13 ]
ประวัติศาสตร์
Phyre และ Phyre2 เป็นระบบทำนายโครงสร้างโปรตีนรุ่นต่อจาก 3D-PSSM [ 14 ]ซึ่งมีการอ้างอิงมากกว่า 1,400 ครั้งจนถึงปัจจุบัน[ 15 ] 3D-PSSM ได้รับการออกแบบและพัฒนาโดย Lawrence Kelley [ 16 ]และ Bob MacCallum [ 17 ]ในห้องปฏิบัติการสร้างแบบจำลองชีวโมเลกุล[ 18 ]ที่Cancer Research UK Phyre และ Phyre2 ได้รับการพัฒนาโดย Lawrence Kelley ในกลุ่มชีวสารสนเทศเชิงโครงสร้าง[ 19 ] Imperial College Londonส่วนประกอบของระบบ Phyre และ Phyre2 ได้รับการพัฒนาโดย Benjamin Jefferys [ 20 ] Alex Herbert [ 21 ]และ Riccardo Bennett-Lovsey [ 22 ]การวิจัยและพัฒนาเซิร์ฟเวอร์ทั้งสองอยู่ภายใต้การดูแลของMichael Sternberg
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ไฟร์
PhyreและPhyre2 ( Protein Homology/AnalogY Recognition Engine ; อ่านว่าไฟร์ ) เป็นบริการบนเว็บฟรีสำหรับการทำนายโครงสร้างโปรตีน...
คำอธิบาย
เซิร์ฟเวอร์ Phyre และ Phyre2 ทำนายโครงสร้างสามมิติของลำดับโปรตีนโดยใช้หลักการและเทคนิคของ การสร้างแบบจำลองความเหมือน (homology modeling ) เนื่องจากโครงสร้างของโปรตีนได้รับการอนุรักษ์ไว้ในวิวัฒนาการมากกว่า ลำดับ กรดอะมิโน ดังนั้นลำดับโปรตีนที่สนใจ (เป้าหมาย)...
การใช้งานมาตรฐาน
หลังจากวางลำดับกรดอะมิโนของโปรตีนลงในแบบฟอร์มการส่งข้อมูลของ Phyre หรือ Phyre2 แล้ว โดยทั่วไปผู้ใช้จะต้องรอประมาณ 30 นาทีถึงหลายชั่วโมง (ขึ้นอยู่กับปัจจัยต่างๆ เช่น ความยาวของลำดับ จำนวนลำดับที่คล้ายคลึงกัน และความถี่และความยาวของการแทรกและการลบ)...
การทำนายโครงสร้างทุติยภูมิและความไม่เป็นระเบียบ
ลำดับโปรตีนที่ผู้ใช้ส่งมาจะถูกสแกนกับฐานข้อมูลลำดับขนาดใหญ่โดยใช้ PSI-BLAST ก่อน จากนั้นโปรไฟล์ที่สร้างโดย PSI-BLAST จะถูกประมวลผลโดยโปรแกรมทำนายโครงสร้างทุติยภูมิของเครือข่ายประสาท PsiPred [ 7 ] และตัวทำนายความผิดปกติของโปรตีน Disopred [ 8 ]...