ไฟร์

ไฟร์2
ไฟร์2
นักพัฒนา	ลอว์เรนซ์ เคลลีย์; บ็อบ แมคคัลลัม; เบนจามิน เจฟเฟอรีส์; อเล็กซ์ เฮอร์เบิร์ต; ริคคาร์โด เบนเน็ตต์-โลฟซีย์; ไมเคิล สเติร์นเบิร์ก;
เวอร์ชันเสถียร	2.0 / 23 กุมภาพันธ์ 2554
เขียนเป็น	ซี++; เพิร์ล; ไพธอน;
มีจำหน่ายใน	ภาษาอังกฤษ
พิมพ์	เครื่องมือชีวสารสนเทศ สำหรับ การทำนายโครงสร้างโปรตีน
ใบอนุญาต	ลิขสิทธิ์ แบบ Creative Commons Attribution-2.0
เว็บไซต์	www.sbg.bio.ic.ac.uk/phyre2

PhyreและPhyre2 ( Protein Homology/AnalogY Recognition Engine ; อ่านว่าไฟร์ ) เป็นบริการบนเว็บฟรีสำหรับการทำนายโครงสร้างโปรตีน [ ^{1 ] [}^{2 ] [}^{3 ] Phyre}เป็นหนึ่งในวิธีการทำนายโครงสร้างโปรตีนที่ได้รับความนิยมมากที่สุด โดยมีการอ้างอิงมากกว่า 1,500 ครั้ง^{[ 4 ]} เช่นเดียวกับเทคนิคการจดจำ ความคล้ายคลึงระยะไกลอื่นๆ(ดูprotein threading ) มันสามารถสร้างแบบจำลองโปรตีนที่เชื่อถือได้อย่างสม่ำเสมอเมื่อวิธีการอื่นๆ ที่ใช้กันอย่างแพร่หลาย เช่นPSI-BLASTไม่สามารถทำได้ Phyre2 ได้รับการออกแบบมาเพื่อให้มีอินเทอร์เฟซที่ใช้งานง่ายสำหรับผู้ใช้ที่ไม่เชี่ยวชาญในวิธีการทำนายโครงสร้างโปรตีน การพัฒนาได้รับการสนับสนุนโดย สภา วิจัยเทคโนโลยีชีวภาพและวิทยาศาสตร์ชีวภาพ^{[ 5 ]}

คำอธิบาย

เซิร์ฟเวอร์ Phyre และ Phyre2 ทำนายโครงสร้างสามมิติของลำดับโปรตีนโดยใช้หลักการและเทคนิคของการสร้างแบบจำลองความเหมือน (homology modeling ) เนื่องจากโครงสร้างของโปรตีนได้รับการอนุรักษ์ไว้ในวิวัฒนาการมากกว่า ลำดับ กรดอะมิโนดังนั้นลำดับโปรตีนที่สนใจ (เป้าหมาย) สามารถสร้างแบบจำลองได้อย่างแม่นยำพอสมควรบนลำดับที่มีความสัมพันธ์ห่างไกลกันมากซึ่งมีโครงสร้างที่ทราบแล้ว (แม่แบบ) โดยมีเงื่อนไขว่าความสัมพันธ์ระหว่างเป้าหมายและแม่แบบสามารถระบุได้ผ่านการจัดเรียงลำดับปัจจุบันวิธีการที่มีประสิทธิภาพและแม่นยำที่สุดในการตรวจจับและจัดเรียงลำดับที่มีความสัมพันธ์ห่างไกลกันนั้นอาศัยโปรไฟล์หรือแบบจำลองมาร์คอฟที่ซ่อนอยู่ (HMMs) โปรไฟล์/HMMs เหล่านี้จะจับแนวโน้มการกลายพันธุ์ของแต่ละตำแหน่งในลำดับกรดอะมิโนโดยอิงจากการกลายพันธุ์ที่สังเกตได้ในลำดับที่เกี่ยวข้อง และสามารถคิดได้ว่าเป็น 'ลายนิ้วมือทางวิวัฒนาการ' ของโปรตีนเฉพาะนั้น ๆ

โดยทั่วไปแล้ว จะมีการรวบรวมลำดับกรดอะมิโนของโครงสร้างโปรตีนสามมิติที่รู้จักทั้งหมด และประมวลผลลำดับเหล่านี้โดยการสแกนกับฐานข้อมูลลำดับ โปรตีนขนาดใหญ่ ผลลัพธ์ที่ได้คือฐานข้อมูลของโปรไฟล์หรือ HMM หนึ่งรายการสำหรับแต่ละโครงสร้างสามมิติที่รู้จัก ลำดับที่ผู้ใช้สนใจจะถูกประมวลผลในทำนองเดียวกันเพื่อสร้างโปรไฟล์/HMM จากนั้นโปรไฟล์ของผู้ใช้นี้จะถูกสแกนกับฐานข้อมูลโปรไฟล์โดยใช้เทคนิคการจัดเรียงโปรไฟล์ต่อโปรไฟล์หรือ HMM-HMM การจัดเรียงเหล่านี้ยังสามารถพิจารณารูปแบบขององค์ประกอบโครงสร้างทุติยภูมิที่คาดการณ์หรือทราบแล้ว และสามารถให้คะแนนโดยใช้แบบจำลองทางสถิติต่างๆ ดูข้อมูลเพิ่มเติมได้ ที่ การทำนายโครงสร้างโปรตีน

เซิร์ฟเวอร์ Phyre ตัวแรกเปิดตัวในเดือนมิถุนายน พ.ศ. 2548 และใช้อัลกอริทึมการจัดเรียงโปรไฟล์ต่อโปรไฟล์โดยอิงจากเมทริกซ์การให้คะแนนเฉพาะตำแหน่งของโปรตีนแต่ละตัว[ 6 ^{]เซิร์ฟเวอร์Phyre2}เปิดตัวสู่สาธารณะในเดือนกุมภาพันธ์ พ.ศ. 2554 เพื่อทดแทนเซิร์ฟเวอร์ Phyre เดิม และมีฟังก์ชันเพิ่มเติมมากกว่า Phyre อินเทอร์เฟซที่ทันสมัยกว่า ไลบรารีพับที่ได้รับการอัปเดตอย่างสมบูรณ์ และใช้ แพ็คเกจ HH-suite (HHpred, HHsearch) สำหรับการตรวจจับความเหมือนกัน รวมถึงการปรับปรุงอื่นๆ

การใช้งานมาตรฐาน

หลังจากวางลำดับกรดอะมิโนของโปรตีนลงในแบบฟอร์มการส่งข้อมูลของ Phyre หรือ Phyre2 แล้ว โดยทั่วไปผู้ใช้จะต้องรอประมาณ 30 นาทีถึงหลายชั่วโมง (ขึ้นอยู่กับปัจจัยต่างๆ เช่น ความยาวของลำดับ จำนวนลำดับที่คล้ายคลึงกัน และความถี่และความยาวของการแทรกและการลบ) จนกว่าการทำนายจะเสร็จสมบูรณ์ อีเมลที่มีข้อมูลสรุปและโครงสร้างที่ทำนายได้ในรูปแบบ PDBจะถูกส่งไปยังผู้ใช้พร้อมกับลิงก์ไปยังหน้าเว็บแสดงผลลัพธ์ หน้าจอแสดงผลลัพธ์ของ Phyre2 แบ่งออกเป็นสามส่วนหลัก ดังที่อธิบายไว้ด้านล่าง

การทำนายโครงสร้างทุติยภูมิและความไม่เป็นระเบียบ

ตัวอย่างผลลัพธ์จาก Phyre2 สำหรับการทำนายโครงสร้างทุติยภูมิและความไม่เป็นระเบียบ

ลำดับโปรตีนที่ผู้ใช้ส่งมาจะถูกสแกนกับฐานข้อมูลลำดับขนาดใหญ่โดยใช้PSI-BLASTก่อน จากนั้นโปรไฟล์ที่สร้างโดย PSI-BLAST จะถูกประมวลผลโดยโปรแกรมทำนายโครงสร้างทุติยภูมิของเครือข่ายประสาท PsiPred ^{[ 7 ]}และตัวทำนายความผิดปกติของโปรตีน Disopred ^{[ 8 ]}การทำนายการมีอยู่ของอัลฟาเฮลิกซ์ เบตาสแตรนด์ และบริเวณที่ไม่เป็นระเบียบจะแสดงเป็นกราฟพร้อมกับแถบความเชื่อมั่นที่มีรหัสสี

การวิเคราะห์โดเมน

โปรตีนหลายชนิดมี โดเมนโปรตีนหลายโดเมน Phyre2 จะแสดงตารางการจับคู่แม่แบบโดยใช้รหัสสีตามระดับความน่าเชื่อถือ และระบุบริเวณของลำดับที่ผู้ใช้เลือกซึ่งตรงกัน สิ่งนี้สามารถช่วยในการกำหนดองค์ประกอบของโดเมนในโปรตีนได้

ข้อมูลแม่แบบโดยละเอียด

ตารางผลลัพธ์หลักใน Phyre2 แสดงค่าประมาณความน่าเชื่อถือ รูปภาพ และลิงก์ไปยังแบบจำลองสามมิติที่ทำนายไว้ รวมถึงข้อมูลที่ได้จากฐานข้อมูลการจำแนกโครงสร้างโปรตีน (SCOP) หรือฐานข้อมูลโปรตีน (PDB) ขึ้นอยู่กับแหล่งที่มาของแม่แบบที่ตรวจพบ สำหรับแต่ละการจับคู่ ลิงก์จะนำผู้ใช้ไปยังมุมมองโดยละเอียดของการจัดเรียงระหว่างลำดับของผู้ใช้และลำดับของโครงสร้างสามมิติที่ทราบแล้ว

มุมมองการจัดแนว

มุมมองการจัดเรียงลำดับโดยละเอียดช่วยให้ผู้ใช้สามารถตรวจสอบสารตกค้างที่จัดเรียงแต่ละตัว การจับคู่ระหว่างองค์ประกอบโครงสร้างทุติยภูมิที่คาดการณ์ไว้และที่ทราบ และความสามารถในการสลับข้อมูลเกี่ยวกับรูปแบบการอนุรักษ์ลำดับและความน่าเชื่อถือของโครงสร้างทุติยภูมิ นอกจากนี้Jmolยังใช้เพื่อช่วยให้สามารถดูแบบจำลองโปรตีนแบบ 3 มิติแบบโต้ตอบได้

การปรับปรุงใน Phyre2

Phyre2 ใช้ไลบรารีการพับโมเลกุลที่ได้รับการอัปเดตทุกสัปดาห์เมื่อมีการค้นพบโครงสร้างใหม่ โดยมีอินเทอร์เฟซที่ทันสมัยกว่าและมีฟังก์ชันเพิ่มเติมมากกว่าเซิร์ฟเวอร์ Phyre ดังที่อธิบายไว้ด้านล่าง

ฟังก์ชันเพิ่มเติม

การประมวลผลแบบกลุ่ม

ฟังก์ชันการประมวลผลแบบกลุ่มช่วยให้ผู้ใช้สามารถส่งลำดับดีเอ็นเอมากกว่าหนึ่งลำดับไปยัง Phyre2 ได้โดยการอัปโหลดไฟล์ลำดับดีเอ็นเอในรูปแบบ FASTAโดยค่าเริ่มต้น ผู้ใช้จะมีข้อจำกัดอยู่ที่ 100 ลำดับต่อกลุ่ม ซึ่งสามารถเพิ่มขีดจำกัดนี้ได้โดยการติดต่อผู้ดูแลระบบ งานแบบกลุ่มจะถูกประมวลผลในพื้นหลังโดยใช้พลังการประมวลผลที่ว่างอยู่ ดังนั้น งานแบบกลุ่มจึงมักใช้เวลานานกว่างานที่ส่งทีละรายการ แต่เป็นสิ่งจำเป็นเพื่อให้การกระจายทรัพยากรการประมวลผลเป็นไปอย่างยุติธรรมสำหรับผู้ใช้ Phyre2 ทุกคน

การร้อยด้ายแบบหนึ่งต่อหนึ่ง

การเชื่อมโยงแบบหนึ่งต่อหนึ่งช่วยให้คุณสามารถอัปโหลดทั้งลำดับที่คุณต้องการสร้างแบบจำลองและแม่แบบที่จะใช้ในการสร้างแบบจำลองได้ บางครั้งผู้ใช้มีลำดับโปรตีนที่ต้องการสร้างแบบจำลองบนแม่แบบเฉพาะที่ตนเองเลือก ตัวอย่างเช่น อาจเป็นโครงสร้างที่เพิ่งได้รับการแก้ไขใหม่ซึ่งไม่มีอยู่ในฐานข้อมูลของ Phyre2 หรือเนื่องจากข้อมูลทางชีววิทยาเพิ่มเติมบางอย่างที่บ่งชี้ว่าแม่แบบที่เลือกจะสร้างแบบจำลองที่แม่นยำกว่าแม่แบบที่ Phyre2 เลือกโดยอัตโนมัติ

แบ็คไฟร์

แทนที่จะทำนายโครงสร้างสามมิติของลำดับโปรตีน ผู้ใช้มักจะมีโครงสร้างที่หาคำตอบได้แล้ว และพวกเขาสนใจที่จะตรวจสอบว่ามีโครงสร้างที่เกี่ยวข้องอยู่ในจีโนมที่สนใจหรือไม่ ใน Phyre2 โครงสร้างโปรตีนที่อัปโหลดสามารถแปลงเป็นแบบจำลองมาร์คอฟแบบซ่อนเร้น (Hidden Markov Model) จากนั้นจึงนำไปสแกนกับชุดจีโนม (มากกว่า 20 จีโนม ณ เดือนมีนาคม 2011) ฟังก์ชันนี้เรียกว่าBackPhyreเพื่อแสดงให้เห็นว่า Phyre2 ถูกนำไปใช้ในทางกลับกันอย่างไร

ไฟเรียลอาร์ม

บางครั้ง Phyre2 อาจไม่พบโครงสร้างที่ตรงกันอย่างมั่นใจกับโครงสร้างที่รู้จัก อย่างไรก็ตาม ฐานข้อมูลไลบรารีโครงสร้างพับ (fold library) เพิ่มขึ้นประมาณ 40-100 โครงสร้างใหม่ทุกสัปดาห์ ดังนั้นถึงแม้ว่าสัปดาห์นี้อาจไม่มีแม่แบบที่ดี แต่ก็อาจมีในสัปดาห์ต่อๆ ไป Phyrealarm อนุญาตให้ผู้ใช้ส่งลำดับโปรตีนเพื่อสแกนโดยอัตโนมัติเทียบกับรายการใหม่ที่เพิ่มเข้ามาในไลบรารีโครงสร้างพับทุกสัปดาห์ หากตรวจพบการจับคู่ที่มั่นใจได้ ผู้ใช้จะได้รับการแจ้งเตือนทางอีเมลโดยอัตโนมัติพร้อมกับผลลัพธ์ของการค้นหา Phyre2 ผู้ใช้ยังสามารถควบคุมระดับความครอบคลุมของการจัดเรียงและระดับความมั่นใจในการจับคู่ที่จำเป็นในการกระตุ้นการแจ้งเตือนทางอีเมลได้

3DLigandSite

Phyre2 เชื่อมต่อกับเซิร์ฟเวอร์ 3DLigandSite ^{[ 9 ]}สำหรับ การทำนาย ตำแหน่งการจับ โปรตีน 3DLigandSite เป็นหนึ่งในเซิร์ฟเวอร์ที่มีประสิทธิภาพสูงสุดสำหรับการทำนายตำแหน่งการจับในการประเมินโครงสร้างที่สำคัญ ( CASP ) ใน (CASP8 และ CASP9) โมเดลที่มีความน่าเชื่อถือที่สร้างโดย Phyre2 (ความน่าเชื่อถือ >90%) จะถูกส่งไปยัง 3DLigandSite โดยอัตโนมัติ

การทำนายโครงสร้างข้ามเยื่อหุ้มเซลล์

โปรแกรม memsat_svm ^{[ 10 ]}ใช้เพื่อทำนายการมีอยู่และโครงสร้างของเกลียวทรานส์เมมเบรนใดๆ ที่มีอยู่ในลำดับโปรตีนของผู้ใช้

การสร้างแบบจำลองหลายเทมเพลต

Phyre2 อนุญาตให้ผู้ใช้เลือกการสร้างแบบจำลอง 'แบบเข้มข้น' จากหน้าจอการส่งงานหลัก โหมดนี้:

ตรวจสอบรายการผลลัพธ์และใช้หลักการเชิงอนุมานเพื่อเลือกเทมเพลตที่ให้ความครอบคลุมของลำดับและความน่าเชื่อถือสูงสุด
สร้างแบบจำลองสำหรับแต่ละเทมเพลตที่เลือก
ใช้โมเดลเหล่านี้เพื่อจัดเตรียมข้อจำกัดระยะทางแบบคู่ที่ป้อนเข้าสู่ เครื่องมือสร้างแบบจำลอง ab initioและ multi-template Poing ^{[ 11 ]}
Poing สังเคราะห์โปรตีนของผู้ใช้ในบริบทของข้อจำกัดด้านระยะทางเหล่านี้ ซึ่งจำลองโดยสปริง บริเวณที่ไม่มีข้อมูลแม่แบบจะถูกจำลองโดยแบบจำลองทางฟิสิกส์แบบง่ายของ Poing ที่ คำนวณ จากหลักการพื้นฐาน
โมเดลที่สร้างโดย Poing จะถูกรวมเข้ากับแม่แบบดั้งเดิมเพื่อใช้เป็นข้อมูลป้อนเข้าในMODELLER

แอปพลิเคชัน

การประยุกต์ใช้ Phyre และ Phyre2 ได้แก่ การทำนายโครงสร้างโปรตีน การทำนายหน้าที่ การทำนายโดเมน การทำนายขอบเขตโดเมน การจำแนกประเภทโปรตีนตามวิวัฒนาการ การนำทางการกลายพันธุ์เฉพาะจุดและการแก้โครงสร้างผลึกโปรตีนโดย วิธีการ แทนที่ โมเลกุล

มีแหล่งข้อมูลสองแหล่งที่เชื่อมโยงกัน ซึ่งใช้การคาดการณ์ของ Phyre สำหรับการวิเคราะห์โครงสร้างของตัวแปร missense ที่มักเกิดจาก โพลีมอร์ฟิ ซึม ของนิวคลีโอไทด์เดี่ยว

PhyreRiskเป็นฐานข้อมูลที่เชื่อมโยงตัวแปรทางพันธุกรรมกับโครงสร้างโปรตีนที่ได้จากการทดลองและการคาดการณ์โดย Phyre หน้าโปรตีนจะแสดงโครงสร้างที่ได้จากการทดลองและการคาดการณ์ ผู้ใช้สามารถเชื่อมโยงตัวแปรจากพิกัดทางพันธุกรรมหรือโปรตีนก็ได้^{[ 12 ]}
Missense3Dเป็นเครื่องมือที่ให้รายงานสเตอริโอเคมีเกี่ยวกับผลกระทบของตัวแปรมิสเซนส์ต่อโครงสร้างโปรตีน ผู้ใช้สามารถอัปโหลดตัวแปรและพิกัดของตนเองได้ รวมถึงโครงสร้าง PDB และแบบจำลองที่ทำนายโดย Phyre ^{[ 13 ]}

ประวัติศาสตร์

Phyre และ Phyre2 เป็นระบบทำนายโครงสร้างโปรตีนรุ่นต่อจาก 3D-PSSM ^{[ 14 ]}ซึ่งมีการอ้างอิงมากกว่า 1,400 ครั้งจนถึงปัจจุบัน^{[ 15 ]} 3D-PSSM ได้รับการออกแบบและพัฒนาโดย Lawrence Kelley ^{[ 16 ]}และ Bob MacCallum ^{[ 17 ]}ในห้องปฏิบัติการสร้างแบบจำลองชีวโมเลกุล^{[ 18 ]}ที่Cancer Research UK Phyre และ Phyre2 ได้รับการพัฒนาโดย Lawrence Kelley ในกลุ่มชีวสารสนเทศเชิงโครงสร้าง^{[ 19 ]} Imperial College Londonส่วนประกอบของระบบ Phyre และ Phyre2 ได้รับการพัฒนาโดย Benjamin Jefferys ^{[ 20 ]} Alex Herbert ^{[ 21 ]}และ Riccardo Bennett-Lovsey ^{[ 22 ]}การวิจัยและพัฒนาเซิร์ฟเวอร์ทั้งสองอยู่ภายใต้การดูแลของMichael Sternberg

1 ] [

2 ] [

3 ] Phyre

[ 4 ]

[ 5 ]

]เซิร์ฟเวอร์Phyre2

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]

[ 22 ]

ไฟร์2
นักพัฒนา	ลอว์เรนซ์ เคลลีย์ บ็อบ แมคคัลลัม เบนจามิน เจฟเฟอรีส์ อเล็กซ์ เฮอร์เบิร์ต ริคคาร์โด เบนเน็ตต์-โลฟซีย์ ไมเคิล สเติร์นเบิร์ก

เวอร์ชันเสถียร	2.0 / 23 กุมภาพันธ์ 2554

เขียนเป็น	ซี++ เพิร์ล ไพธอน
มีจำหน่ายใน	ภาษาอังกฤษ
พิมพ์	เครื่องมือชีวสารสนเทศ สำหรับ การทำนายโครงสร้างโปรตีน
ใบอนุญาต	ลิขสิทธิ์ แบบ Creative Commons Attribution-2.0
เว็บไซต์	www.sbg.bio.ic.ac.uk/phyre2