การสร้างแบบจำลองโฮโมโลยี

Q: ข้อมูลสำคัญเกี่ยวกับ การสร้างแบบจำลองโฮโมโลยี

การสร้างแบบจำลองโฮโมโลยีหรือที่รู้จักกันในชื่อการสร้างแบบจำลองเปรียบเทียบของโปรตีน หมายถึงการสร้างแบบจำลองความละเอียดระดับอะตอมของโปรตีน " เป้าหมาย "

การสร้างแบบจำลองโฮโมโลยีหรือที่รู้จักกันในชื่อการสร้างแบบจำลองเปรียบเทียบของโปรตีน หมายถึงการสร้างแบบจำลองความละเอียดระดับอะตอมของโปรตีน " เป้าหมาย " จากลำดับกรดอะมิโนและโครงสร้างสามมิติเชิงทดลองของโปรตีนโฮโมล็อกที่เกี่ยวข้อง (" แม่แบบ ") การสร้างแบบจำลองโฮโมโลยีอาศัยการระบุโครงสร้างโปรตีนที่รู้จักอย่างน้อยหนึ่งโครงสร้างที่น่าจะคล้ายกับโครงสร้างของลำดับคำถาม และการสร้างการจัดเรียงลำดับที่จับคู่สารตกค้างในลำดับคำถามกับสารตกค้างในลำดับแม่แบบ พบว่าโครงสร้างโปรตีนมีการอนุรักษ์มากกว่าลำดับโปรตีนในกลุ่มโฮโมล็อก แต่ลำดับที่มีความเหมือนกันต่ำกว่า 20% อาจมีโครงสร้างที่แตกต่างกันมาก^[¹^]

โปรตีนที่มีความสัมพันธ์ทางวิวัฒนาการจะมีลำดับที่คล้ายคลึงกัน และโปรตีนโฮโมล็อกที่เกิดขึ้นตามธรรมชาติจะมีโครงสร้างโปรตีนที่คล้ายคลึงกัน มีการแสดงให้เห็นว่าโครงสร้างโปรตีนสามมิติได้รับการอนุรักษ์ทางวิวัฒนาการมากกว่าที่คาดไว้จากการอนุรักษ์ลำดับเพียงอย่างเดียว^{[ 2 ]}

จากนั้นจะใช้การจัดเรียงลำดับและโครงสร้างแม่แบบเพื่อสร้างแบบจำลองโครงสร้างของเป้าหมาย เนื่องจากโครงสร้างโปรตีนมีการอนุรักษ์ มากกว่า ลำดับ DNA และระดับความคล้ายคลึงของลำดับที่ตรวจพบได้มักจะบ่งบอกถึงความคล้ายคลึงของโครงสร้างอย่างมีนัยสำคัญ^{[ 3 ]}

คุณภาพของแบบจำลองความเหมือนขึ้นอยู่กับคุณภาพของการจัดเรียงลำดับและการสร้างโครงสร้างแม่แบบ วิธีการนี้อาจมีความซับซ้อนมากขึ้นเนื่องจากมีช่องว่างในการจัดเรียงลำดับ (โดยทั่วไปเรียกว่า indels) ซึ่งบ่งชี้ถึงบริเวณโครงสร้างที่มีอยู่ในเป้าหมายแต่ไม่มีอยู่ในแม่แบบ และเนื่องจากมีช่องว่างในโครงสร้างแม่แบบที่เกิดจากความละเอียดต่ำในกระบวนการทดลอง (โดยปกติคือการตกผลึกด้วยรังสีเอกซ์ ) ที่ใช้ในการหาโครงสร้าง คุณภาพของแบบจำลองจะลดลงเมื่อความเหมือนของลำดับ ลดลง แบบจำลองทั่วไปจะมี ค่าเบี่ยงเบนมาตรฐานประมาณ 1–2 Å ระหว่างอะตอม ^Cαที่ตรงกันที่ความเหมือนของลำดับ 70% แต่จะมีความสอดคล้องกันเพียง 2–4 Åที่ความเหมือนของลำดับ 25% อย่างไรก็ตาม ข้อผิดพลาดจะสูงขึ้นอย่างมากในบริเวณลูป ซึ่งลำดับกรดอะมิโนของโปรตีนเป้าหมายและโปรตีนแม่แบบอาจแตกต่างกันอย่างสิ้นเชิง

บริเวณของแบบจำลองที่สร้างขึ้นโดยไม่มีแม่แบบ ซึ่งมักจะสร้างโดยการสร้างแบบจำลองลูปมักจะมีความแม่นยำน้อยกว่าส่วนที่เหลือของแบบจำลองมาก ข้อผิดพลาดใน การจัดเรียงและตำแหน่งของ โซ่ข้างจะเพิ่มขึ้นเมื่อความเหมือนลดลง และความแปรผันในการกำหนดค่าการจัดเรียงเหล่านี้ได้รับการเสนอแนะว่าเป็นสาเหตุหลักที่ทำให้คุณภาพของแบบจำลองไม่ดีที่ความเหมือนต่ำ^{[ 4 ]}โดยรวมแล้ว ข้อผิดพลาดตำแหน่งอะตอมต่างๆ เหล่านี้มีความสำคัญและขัดขวางการใช้แบบจำลองความคล้ายคลึงกันเพื่อวัตถุประสงค์ที่ต้องการข้อมูลความละเอียดระดับอะตอม เช่นการออกแบบยาและ การทำนาย ปฏิสัมพันธ์ระหว่างโปรตีนกับโปรตีนแม้แต่โครงสร้างระดับควอ เทอร์นารี ของโปรตีนก็อาจยากที่จะทำนายได้จากแบบจำลองความคล้ายคลึงกันของหน่วยย่อย อย่างไรก็ตาม แบบจำลองความคล้ายคลึงกันอาจมีประโยชน์ในการ สรุป เชิงคุณภาพเกี่ยวกับชีวเคมีของลำดับคำถาม โดยเฉพาะอย่างยิ่งในการกำหนดสมมติฐานเกี่ยวกับสาเหตุที่สารตกค้างบางชนิดได้รับการอนุรักษ์ ซึ่งอาจนำไปสู่การทดลองเพื่อทดสอบสมมติฐานเหล่านั้น ตัวอย่างเช่น การจัดเรียงเชิงพื้นที่ของสารตกค้างที่ได้รับการอนุรักษ์อาจบ่งชี้ว่าสารตกค้างเฉพาะนั้นได้รับการอนุรักษ์ไว้เพื่อทำให้การพับมีเสถียรภาพ เพื่อมีส่วนร่วมในการจับโมเลกุลขนาดเล็กบางชนิด หรือเพื่อส่งเสริมการเชื่อมโยงกับโปรตีนหรือกรดนิวคลีอิกอื่น^{[ 5 ]}

การสร้างแบบจำลองโฮโมโลยีสามารถสร้างแบบจำลองโครงสร้างคุณภาพสูงได้เมื่อเป้าหมายและแม่แบบมีความสัมพันธ์กันอย่างใกล้ชิด ซึ่งเป็นแรงบันดาลใจให้เกิดการก่อตั้ง กลุ่มความร่วมมือ ด้านจีโนมิกส์เชิงโครงสร้างที่อุทิศให้กับการสร้างโครงสร้างเชิงทดลองที่เป็นตัวแทนสำหรับโปรตีนพับทุกประเภท^{[ 6 ]}ความไม่แม่นยำหลักในการสร้างแบบจำลองโฮโมโลยี ซึ่งแย่ลงเมื่อความเหมือนของลำดับ ลดลง เกิดจากข้อผิดพลาดในการจัดเรียงลำดับเริ่มต้นและการเลือกแม่แบบที่ไม่เหมาะสม^{[ 7 ]}เช่นเดียวกับวิธีการทำนายโครงสร้างอื่นๆ การปฏิบัติในปัจจุบันในการสร้างแบบจำลองโฮโมโลยีได้รับการประเมินในการทดลองขนาดใหญ่ที่จัดขึ้นทุกสองปี ซึ่งรู้จักกันในชื่อการประเมินเชิงวิพากษ์ของเทคนิคการทำนายโครงสร้างโปรตีน หรือการประเมินเชิงวิพากษ์ของการทำนายโครงสร้าง ( CASP )

แรงจูงใจ

วิธีการสร้างแบบจำลองความคล้ายคลึงกันนั้นอิงตามการสังเกตว่าโครงสร้างตติยภูมิ ของโปรตีน ได้รับการอนุรักษ์ไว้ได้ดีกว่าลำดับกรดอะมิโน [ ^{3 ] ดังนั้น}แม้แต่โปรตีนที่มีลำดับแตกต่างกันอย่างเห็นได้ชัด แต่ยังคงมีความคล้ายคลึงกันที่ตรวจพบได้ ก็จะยังคงมีคุณสมบัติโครงสร้างร่วมกัน โดยเฉพาะอย่างยิ่งการพับตัวโดยรวม เนื่องจากเป็นการยากและใช้เวลานานที่จะได้โครงสร้างเชิงทดลองจากวิธีการต่างๆ เช่นการตกผลึกด้วยรังสีเอกซ์และ การวิเคราะห์ โปรตีนด้วย NMRสำหรับโปรตีนทุกตัวที่สนใจ การสร้างแบบจำลองความคล้ายคลึงกันจึงสามารถให้แบบจำลองโครงสร้างที่เป็นประโยชน์สำหรับการสร้างสมมติฐานเกี่ยวกับหน้าที่ของโปรตีนและชี้นำงานทดลองต่อไปได้

มีข้อยกเว้นสำหรับกฎทั่วไปที่ว่าโปรตีนที่มีลำดับกรดอะมิโนเหมือนกันอย่างมีนัยสำคัญจะมีโครงสร้างพับเหมือนกัน ตัวอย่างเช่น การกลายพันธุ์ที่เลือกอย่างรอบคอบซึ่งน้อยกว่า 50% ของโปรตีนสามารถทำให้โปรตีนมีโครงสร้างพับที่แตกต่างไปอย่างสิ้นเชิงได้^{[ 8 ]}^{[ 9 ]}อย่างไรก็ตาม การเปลี่ยนแปลงโครงสร้างครั้งใหญ่เช่นนี้ไม่น่าจะเกิดขึ้นในวิวัฒนาการโดยเฉพาะอย่างยิ่งเนื่องจากโปรตีนมักอยู่ภายใต้ข้อจำกัดที่ว่ามันต้องพับตัวอย่างถูกต้องและทำหน้าที่ของมันในเซลล์ ดังนั้น โครงสร้างพับคร่าวๆ ของโปรตีน ("โทโพโลยี") จึงได้รับการอนุรักษ์ไว้นานกว่าลำดับกรดอะมิโนและนานกว่าลำดับ DNA ที่สอดคล้องกันมาก กล่าวอีกนัยหนึ่ง โปรตีนสองชนิดอาจมีโครงสร้างพับที่คล้ายกันแม้ว่าความสัมพันธ์ทางวิวัฒนาการของพวกมันจะห่างไกลมากจนไม่สามารถแยกแยะได้อย่างน่าเชื่อถือ สำหรับการเปรียบเทียบ หน้าที่ของโปรตีนได้รับการอนุรักษ์ไว้น้อยกว่าลำดับโปรตีนมาก เนื่องจากต้องมีการเปลี่ยนแปลงในลำดับกรดอะมิโนเพียงเล็กน้อยเพื่อให้มีหน้าที่ที่เกี่ยวข้อง

ขั้นตอนในการผลิตโมเดล

ขั้นตอนการสร้างแบบจำลองโฮโมโลยีสามารถแบ่งออกเป็นสี่ขั้นตอนตามลำดับ ได้แก่ การเลือกแม่แบบ การจัดเรียงแม่แบบเป้าหมาย การสร้างแบบจำลอง และการประเมินแบบจำลอง^{[ 3 ]}สองขั้นตอนแรกมักจะดำเนินการร่วมกัน เนื่องจากวิธีการระบุแม่แบบที่พบได้บ่อยที่สุดอาศัยการสร้างการจัดเรียงลำดับ อย่างไรก็ตาม การจัดเรียงเหล่านี้อาจไม่มีคุณภาพเพียงพอ เนื่องจากเทคนิคการค้นหาฐานข้อมูลให้ความสำคัญกับความเร็วมากกว่าคุณภาพการจัดเรียง กระบวนการเหล่านี้สามารถดำเนินการซ้ำๆ เพื่อปรับปรุงคุณภาพของแบบจำลองขั้นสุดท้าย แม้ว่าการประเมินคุณภาพที่ไม่ขึ้นอยู่กับโครงสร้างเป้าหมายที่แท้จริงยังอยู่ระหว่างการพัฒนา

การเพิ่มประสิทธิภาพความเร็วและความแม่นยำของขั้นตอนเหล่านี้เพื่อใช้ในการทำนายโครงสร้างอัตโนมัติขนาดใหญ่ถือเป็นองค์ประกอบสำคัญของโครงการจีโนมิกส์เชิงโครงสร้าง ส่วนหนึ่งเป็นเพราะปริมาณข้อมูลที่ได้จะมีขนาดใหญ่เกินกว่าจะประมวลผลด้วยตนเอง และอีกส่วนหนึ่งเป็นเพราะเป้าหมายของจีโนมิกส์เชิงโครงสร้างต้องการแบบจำลองที่มีคุณภาพที่เหมาะสมให้กับนักวิจัยที่ไม่ใช่ผู้เชี่ยวชาญด้านการทำนายโครงสร้าง^{[ 3 ]}

การเลือกแม่แบบและการจัดเรียงลำดับ

ขั้นตอนแรกที่สำคัญในการสร้างแบบจำลองโฮโมโลยีคือการระบุโครงสร้างแม่แบบที่ดีที่สุด หากมีอยู่จริง วิธีการระบุแม่แบบที่ง่ายที่สุดอาศัยการจัดเรียงลำดับแบบคู่ต่อเนื่องโดยใช้เทคนิคการค้นหาฐานข้อมูล เช่นFASTAและBLASTวิธีการที่ละเอียดอ่อนกว่าซึ่งอิงตามการจัดเรียงลำดับหลายลำดับ – ซึ่ง PSI-BLAST เป็นตัวอย่างที่พบได้บ่อยที่สุด – จะอัปเดตเมทริกซ์การให้คะแนนเฉพาะตำแหน่งซ้ำๆเพื่อระบุโฮโมล็อกที่เกี่ยวข้องห่างไกลมากขึ้นเรื่อยๆ วิธีการกลุ่มนี้แสดงให้เห็นว่าสามารถสร้างแม่แบบที่มีศักยภาพจำนวนมากขึ้น และระบุแม่แบบที่ดีกว่าสำหรับลำดับที่มีความสัมพันธ์ห่างไกลกับโครงสร้างที่แก้ไขแล้วเท่านั้นการร้อยโปรตีน^{[ 10 ]}หรือที่รู้จักกันในชื่อการจดจำการพับหรือการจัดเรียง 3D-1D สามารถใช้เป็นเทคนิคการค้นหาเพื่อระบุแม่แบบที่จะใช้ในวิธีการสร้างแบบจำลองโฮโมโลยีแบบดั้งเดิม^{[ 3 ]} การทดลอง CASPล่าสุดบ่งชี้ว่าวิธีการร้อยโปรตีนบางวิธี เช่นRaptorXมีความไวมากกว่าวิธีการที่ใช้ลำดับ (โปรไฟล์) อย่างเดียวเมื่อมีเพียงแม่แบบที่เกี่ยวข้องห่างไกลสำหรับโปรตีนที่กำลังทำนาย เมื่อทำการค้นหา BLAST วิธีแรกที่น่าเชื่อถือคือการระบุผลลัพธ์ที่มี ค่า E ต่ำเพียงพอ ซึ่งถือว่ามีความใกล้เคียงกันในเชิงวิวัฒนาการมากพอที่จะสร้างแบบจำลองโฮโมโลจีที่น่าเชื่อถือ ปัจจัยอื่นๆ อาจทำให้สมดุลเปลี่ยนไปในกรณีที่คลุมเครือ ตัวอย่างเช่น แม่แบบอาจมีฟังก์ชันที่คล้ายกับลำดับแบบสอบถาม หรืออาจเป็นส่วนหนึ่งของโอเปรอนโฮโมล็อกอย่างไรก็ตาม โดยทั่วไปแล้วไม่ควรเลือกแม่แบบที่มี ค่า E ต่ำ แม้ว่าจะเป็นแม่แบบเดียวที่มีอยู่ก็ตาม เนื่องจากอาจมีโครงสร้างที่ผิดพลาด ซึ่งนำไปสู่การสร้างแบบจำลองที่ผิดพลาด วิธีที่ดีกว่าคือการส่งลำดับหลักไปยังเซิร์ฟเวอร์การจดจำโครงสร้างพับ^{[ 10 ]}หรือที่ดีกว่านั้นคือเมตาเซิร์ฟเวอร์ฉันทามติ ซึ่งปรับปรุงเซิร์ฟเวอร์การจดจำโครงสร้างพับแต่ละตัวโดยการระบุความคล้ายคลึงกัน (ฉันทามติ) ระหว่างการคาดการณ์อิสระ

วิธีการเหล่านี้มักระบุโครงสร้างแม่แบบผู้สมัครหลายแบบ แม้ว่าบางวิธีจะสามารถสร้างแบบจำลองไฮบริดที่มีความแม่นยำมากขึ้นจากแม่แบบหลายแบบได้^{[ 10 ]}^{[ 11 ]}แต่ส่วนใหญ่แล้ววิธีต่างๆ จะใช้แม่แบบเพียงแบบเดียว ดังนั้น การเลือกแม่แบบที่ดีที่สุดจากผู้สมัครจึงเป็นขั้นตอนสำคัญ และอาจส่งผลต่อความแม่นยำขั้นสุดท้ายของโครงสร้างอย่างมีนัยสำคัญ การเลือกนี้ได้รับคำแนะนำจากหลายปัจจัย เช่น ความคล้ายคลึงกันของลำดับคำถามและแม่แบบ หน้าที่ของพวกมัน และโครงสร้างทุติยภูมิ ของคำถามที่คาดการณ์และแม่แบบที่สังเกตได้ ที่สำคัญที่สุดคือการครอบคลุมของบริเวณที่จัดเรียง: สัดส่วนของโครงสร้างลำดับคำถามที่สามารถคาดการณ์ได้จากแม่แบบ และความน่าจะเป็นของแบบจำลองที่ได้ ดังนั้น บางครั้งจึงมีการสร้างแบบจำลองโฮโมโลยีหลายแบบสำหรับลำดับคำถามเดียว โดยจะเลือกผู้สมัครที่มีความเป็นไปได้มากที่สุดในขั้นตอนสุดท้ายเท่านั้น

เป็นไปได้ที่จะใช้การจัดเรียงลำดับที่สร้างขึ้นโดยเทคนิคการค้นหาฐานข้อมูลเป็นพื้นฐานสำหรับการสร้างแบบจำลองในภายหลัง อย่างไรก็ตาม ยังมีการสำรวจแนวทางที่ซับซ้อนกว่านั้นอีกด้วย ข้อเสนอหนึ่งสร้างชุดของ การจัดเรียงแบบคู่ที่กำหนด แบบสุ่มระหว่างลำดับเป้าหมายและแม่แบบที่ระบุเพียงตัวเดียวเพื่อเป็นวิธีการสำรวจ "พื้นที่การจัดเรียง" ในบริเวณของลำดับที่มีความคล้ายคลึงกันในระดับท้องถิ่นต่ำ^{[ 12 ]}การจัดเรียงแบบ "โปรไฟล์-โปรไฟล์" ที่สร้างโปรไฟล์ลำดับของเป้าหมายก่อนแล้วเปรียบเทียบกับโปรไฟล์ลำดับของโครงสร้างที่แก้ไขแล้วอย่างเป็นระบบ การแบ่งส่วนหยาบที่เกิดขึ้นในการสร้างโปรไฟล์นั้นเชื่อว่าจะช่วยลดสัญญาณรบกวนที่เกิดจากการเลื่อนของลำดับในบริเวณที่ไม่สำคัญของลำดับ^{[ 13 ]}

การสร้างแบบจำลอง

เมื่อกำหนดแม่แบบและการจัดเรียงแล้ว ข้อมูลที่อยู่ในนั้นจะต้องถูกนำมาใช้เพื่อสร้างแบบจำลองโครงสร้างสามมิติของเป้าหมาย ซึ่งแสดงเป็นชุดพิกัดคาร์ทีเซียนสำหรับแต่ละอะตอมในโปรตีน มีการเสนอวิธีการสร้างแบบจำลองหลักสามประเภท^{[ 14 ]}^{[ 15 ]}

การประกอบชิ้นส่วน

วิธีการสร้างแบบจำลองโฮโมโลยีแบบดั้งเดิมอาศัยการประกอบแบบจำลองที่สมบูรณ์จาก ชิ้นส่วนโครงสร้าง ที่อนุรักษ์ไว้ซึ่งระบุในโครงสร้างที่แก้ไขแล้วที่เกี่ยวข้องอย่างใกล้ชิด ตัวอย่างเช่น การศึกษาแบบจำลองของเซรินโปรตีเอสใน สัตว์ เลี้ยงลูกด้วยนมระบุความแตกต่างที่ชัดเจนระหว่างบริเวณโครงสร้าง "แกนกลาง" ที่อนุรักษ์ไว้ในโครงสร้างทดลองทั้งหมดในกลุ่ม และบริเวณตัวแปรซึ่งโดยทั่วไปจะอยู่ในลูปซึ่งเป็นบริเวณที่ความแตกต่างของลำดับส่วนใหญ่อยู่ ดังนั้นโปรตีนที่ยังไม่ได้รับการแก้ไขจึงสามารถสร้างแบบจำลองได้โดยการสร้างแกนกลางที่อนุรักษ์ไว้ก่อน จากนั้นจึงแทนที่บริเวณตัวแปรจากโปรตีนอื่น ๆ ในชุดโครงสร้างที่แก้ไขแล้ว^{[ 16 ]}การใช้งานในปัจจุบันของวิธีนี้แตกต่างกันส่วนใหญ่ในวิธีการจัดการกับบริเวณที่ไม่ได้รับการอนุรักษ์หรือไม่มีแม่แบบ^{[ 17 ]} บริเวณตัวแปรมักถูกสร้าง ขึ้น โดยใช้ไลบรารีชิ้นส่วนโปรตีน

การจับคู่ส่วน

วิธีการจับคู่ส่วนจะแบ่งเป้าหมายออกเป็นส่วนย่อยๆ หลายส่วน โดยแต่ละส่วนจะถูกจับคู่กับแม่แบบที่เหมาะสมจากProtein Data Bankดังนั้น การจัดเรียงลำดับจึงทำกับส่วนย่อยๆ แทนที่จะทำกับโปรตีนทั้งหมด การเลือกแม่แบบสำหรับแต่ละส่วนจะขึ้นอยู่กับความคล้ายคลึงของลำดับ การเปรียบเทียบ พิกัด คาร์บอนอัลฟาและ ความขัดแย้ง เชิงสเตอริก ที่คาดการณ์ไว้ ซึ่งเกิดจากรัศมีแวนเดอร์วาลส์ของอะตอมที่แตกต่างกันระหว่างเป้าหมายและแม่แบบ^{[ 18 ]}

การปฏิบัติตามข้อจำกัดด้านพื้นที่

วิธีการสร้างแบบจำลองโฮโมโลยีที่ใช้กันทั่วไปในปัจจุบันได้รับแรงบันดาลใจจากการคำนวณที่จำเป็นในการสร้างโครงสร้างสามมิติจากข้อมูลที่สร้างขึ้นโดยสเปกโทรสโกปี NMRมีการใช้การจัดเรียงเป้าหมาย-แม่แบบหนึ่งรายการหรือมากกว่าเพื่อสร้างชุดเกณฑ์ทางเรขาคณิต จากนั้นจึงแปลงเป็นฟังก์ชันความหนาแน่นความน่าจะเป็นสำหรับข้อจำกัดแต่ละข้อ ข้อจำกัดที่ใช้กับพิกัดภายใน หลักของโปรตีน ได้แก่ ระยะทาง ของกระดูกสันหลังของโปรตีนและมุมไดเฮดรัลทำหน้าที่เป็นพื้นฐานสำหรับ กระบวนการ เพิ่มประสิทธิภาพทั่วโลกซึ่งเดิมใช้การลดพลังงาน แบบไล่ระดับคอนจูเกต เพื่อปรับตำแหน่งของอะตอมหนักทั้งหมดในโปรตีนซ้ำๆ^[¹⁹^]

วิธีการนี้ได้รับการขยายอย่างมากเพื่อนำไปใช้กับการสร้างแบบจำลองลูปโดยเฉพาะ ซึ่งอาจทำได้ยากมากเนื่องจากความยืดหยุ่นสูงของลูปในโปรตีนในสารละลายน้ำ^{[ 20 ]}การขยายล่าสุดใช้แบบจำลองข้อจำกัดเชิงพื้นที่กับ แผนที่ ความหนาแน่นของอิเล็กตรอนที่ได้จาก การศึกษา ด้วยกล้องจุลทรรศน์อิเล็กตรอนแบบไครโอซึ่งให้ข้อมูลความละเอียดต่ำซึ่งโดยปกติแล้วไม่เพียงพอที่จะสร้างแบบจำลองโครงสร้างที่มีความละเอียดระดับอะตอม^{[ 21 ]}เพื่อแก้ไขปัญหาความไม่แม่นยำในการจัดเรียงลำดับเป้าหมาย-แม่แบบเริ่มต้น จึงได้มีการนำขั้นตอนการวนซ้ำมาใช้เพื่อปรับปรุงการจัดเรียงบนพื้นฐานของความพอดีของโครงสร้างเริ่มต้น^{[ 22 ]}ซอฟต์แวร์ที่ใช้กันทั่วไปในการสร้างแบบจำลองตามข้อจำกัดเชิงพื้นที่คือMODELLERและได้มีการสร้างฐานข้อมูลที่เรียกว่าModBaseสำหรับแบบจำลองที่เชื่อถือได้ซึ่งสร้างขึ้นด้วยซอฟต์แวร์นี้^{[ 23 ]}

การสร้างแบบจำลองลูป

บริเวณของลำดับเป้าหมายที่ไม่ตรงกับแม่แบบจะถูกจำลองโดยการสร้างแบบจำลองลูปบริเวณเหล่านี้มีความเสี่ยงต่อข้อผิดพลาดในการสร้างแบบจำลองมากที่สุด และเกิดขึ้นบ่อยขึ้นเมื่อเป้าหมายและแม่แบบมีความเหมือนกันของลำดับต่ำ พิกัดของส่วนที่ไม่ตรงกันซึ่งกำหนดโดยโปรแกรมการสร้างแบบจำลองลูปโดยทั่วไปมีความแม่นยำน้อยกว่าพิกัดที่ได้จากการคัดลอกพิกัดของโครงสร้างที่ทราบแล้ว โดยเฉพาะอย่างยิ่งหากลูปมีความยาวมากกว่า 10 หน่วยย่อยมุมไดเฮดรัล ของหมู่ข้างเคียงสองมุมแรก (χ ₁และ χ ₂ ) มักจะสามารถประมาณได้ภายใน 30° สำหรับโครงสร้างกระดูกสันหลังที่แม่นยำ อย่างไรก็ตาม มุมไดเฮดรัลที่พบในหมู่ข้างเคียงที่ยาวกว่า เช่นไลซีนและอาร์จินีนนั้นยากที่จะคาดเดาได้ นอกจากนี้ ข้อผิดพลาดเล็กน้อยใน χ ₁ (และในระดับที่น้อยกว่าใน χ ₂ ) อาจทำให้เกิดข้อผิดพลาดค่อนข้างมากในตำแหน่งของอะตอมที่ปลายหมู่ข้างเคียง อะตอมดังกล่าว มักมีความสำคัญในเชิงหน้าที่ โดยเฉพาะอย่างยิ่งเมื่อตั้งอยู่ใกล้กับบริเวณ ที่เกิดปฏิกิริยา

การประเมินแบบจำลอง

มีการพัฒนาวิธีการมากมายสำหรับการเลือกโครงสร้างที่มีลักษณะคล้ายคลึงกับโครงสร้างดั้งเดิมจากชุดแบบจำลองต่างๆ ฟังก์ชันการให้คะแนนนั้นอิงตาม ฟังก์ชันพลังงาน กลศาสตร์โมเลกุล (Lazaridis and Karplus 1999; Petrey and Honig 2000; Feig and Brooks 2002; Felts et al. 2002; Lee and Duan 2004), ศักยภาพทางสถิติ (Sippl 1995; Melo and Feytmans 1998; Samudrala and Moult 1998; Rojnuckarin and Subramaniam 1999; Lu and Skolnick 2001; Wallqvist et al. 2002; Zhou and Zhou 2002), สภาพแวดล้อมของสารตกค้าง (Luthy et al. 1992; Eisenberg et al. 1997; Park et al. 1997; Summa et al. 2005) และปฏิสัมพันธ์ระหว่างหมู่ข้างเคียงและโครงสร้างหลักในระดับท้องถิ่น (Fang and Shortle) (2005), คุณสมบัติที่ขึ้นอยู่กับทิศทาง (Buchete et al. 2004a,b; Hamelryck 2005), การประมาณการการบรรจุ (Berglund et al. 2004), พลังงานการละลาย (Petrey and Honig 2000; McConkey et al. 2003; Wallner and Elofsson 2003; Berglund et al. 2004), พันธะไฮโดรเจน (Kortemme et al. 2003) และคุณสมบัติทางเรขาคณิต (Colovos and Yeates 1993; Kleywegt 2000; Lovell et al. 2003; Mihalek et al. 2003) มีหลายวิธีในการรวมศักยภาพที่แตกต่างกันเข้าด้วยกันเพื่อสร้างคะแนนโดยรวม โดยปกติจะใช้การรวมเชิงเส้นของพารามิเตอร์ (Kortemme et al. 2003; Tosatto 2005) หรือด้วยความช่วยเหลือของเทคนิคการเรียนรู้ของเครื่อง เช่น โครงข่ายประสาทเทียม (Wallner and Elofsson 2003) และเครื่องสนับสนุนเวกเตอร์ (SVM) (Eramian et al. 2006) การเปรียบเทียบโปรแกรมประเมินคุณภาพแบบจำลองโดยรวมที่แตกต่างกันสามารถพบได้ในเอกสารล่าสุดโดย Pettitt et al. (2005), Tosatto (2005) และ Eramian et al. (2006)

มีการรายงานผลงานวิจัยเกี่ยวกับการประเมินคุณภาพแบบจำลองในระดับท้องถิ่นน้อยกว่า คะแนนในระดับท้องถิ่นมีความสำคัญในบริบทของการสร้างแบบจำลอง เนื่องจากสามารถประมาณความน่าเชื่อถือของส่วนต่างๆ ของโครงสร้างที่คาดการณ์ได้ ข้อมูลนี้สามารถนำไปใช้ในการพิจารณาว่าส่วนใดควรได้รับการปรับปรุง ส่วนใดควรนำมาพิจารณาในการสร้างแบบจำลองโดยใช้แม่แบบหลายแบบ และส่วนใดควรคาดการณ์ตั้งแต่เริ่มต้น ข้อมูลเกี่ยวกับคุณภาพแบบจำลองในระดับท้องถิ่นยังสามารถใช้เพื่อลดปัญหาการจัดเรียงแบบต่างๆ ได้ ตัวอย่างเช่น การให้คะแนนแบบจำลองในระดับท้องถิ่นที่แตกต่างกันแยกกัน จะทำให้ต้องสร้างแบบจำลองน้อยลง (โดยสมมติว่าปฏิสัมพันธ์ระหว่างส่วนต่างๆ นั้นมีน้อยมากหรือสามารถประมาณแยกกันได้)

หนึ่งในวิธีการให้คะแนนเฉพาะที่ที่ใช้กันอย่างแพร่หลายที่สุดคือ Verify3D (Luthy et al. 1992; Eisenberg et al. 1997) ซึ่งรวมโครงสร้างทุติยภูมิ การเข้าถึงตัวทำละลาย และขั้วของสภาพแวดล้อมของสารตกค้าง ProsaII (Sippl 1993) ซึ่งใช้พื้นฐานจากการรวมกันของศักยภาพทางสถิติแบบคู่และเทอมการละลาย ก็ถูกนำมาใช้อย่างกว้างขวางในการประเมินแบบจำลองเช่นกัน วิธีการอื่นๆ ได้แก่ โปรแกรม Errat (Colovos and Yeates 1993) ซึ่งพิจารณาการกระจายของอะตอมที่ไม่เชื่อมต่อกันตามประเภทอะตอมและระยะทาง และวิธีการความเครียดพลังงาน (Maiorov and Abagyan 1998) ซึ่งใช้ความแตกต่างจากพลังงานเฉลี่ยของสารตกค้างในสภาพแวดล้อมต่างๆ เพื่อระบุว่าส่วนใดของโครงสร้างโปรตีนอาจมีปัญหา Melo และ Feytmans (1998) ใช้ศักยภาพแบบคู่ของอะตอมและศักยภาพการละลายแบบพื้นผิว (ทั้งสองแบบใช้ความรู้เป็นพื้นฐาน) เพื่อประเมินโครงสร้างโปรตีน นอกเหนือจากวิธีการคำนวณความเครียดจากพลังงาน ซึ่งเป็นวิธีการกึ่งเชิงประจักษ์ที่อิงตามสนามแรง ECEPP3 (Nemethy et al. 1992) แล้ว วิธีการเฉพาะที่ทั้งหมดที่กล่าวมาข้างต้นนั้นอิงตามศักยภาพทางสถิติ วิธีการที่แตกต่างออกไปในเชิงแนวคิดคือวิธีการ ProQres ซึ่งเพิ่งได้รับการแนะนำโดย Wallner และ Elofsson (2006) ProQres ใช้โครงข่ายประสาทเทียมที่รวมคุณลักษณะเชิงโครงสร้างเพื่อแยกแยะบริเวณที่ถูกต้องออกจากบริเวณที่ไม่ถูกต้อง ProQres ได้รับการพิสูจน์แล้วว่ามีประสิทธิภาพเหนือกว่าวิธีการก่อนหน้านี้ที่อิงตามแนวทางสถิติ (Verify3D, ProsaII และ Errat) ข้อมูลที่นำเสนอในงานวิจัยของ Wallner และ Elofsson ชี้ให้เห็นว่าวิธีการเรียนรู้ของเครื่องจักรที่อิงตามคุณลักษณะเชิงโครงสร้างนั้นเหนือกว่าวิธีการที่อิงตามสถิติอย่างแท้จริง อย่างไรก็ตาม วิธีการที่ใช้ความรู้เป็นพื้นฐานซึ่งได้รับการตรวจสอบในงานของพวกเขา ได้แก่ Verify3D (Luthy et al. 1992; Eisenberg et al. 1997), Prosa (Sippl 1993) และ Errat (Colovos and Yeates 1993) ไม่ได้อยู่บนพื้นฐานของศักยภาพทางสถิติที่ใหม่กว่า

การเปรียบเทียบมาตรฐาน

มีการดำเนินการ เปรียบเทียบประสิทธิภาพขนาดใหญ่หลายครั้งเพื่อประเมินคุณภาพสัมพัทธ์ของวิธีการสร้างแบบจำลองโครงสร้างโดยใช้หลักการความคล้ายคลึงกัน (homology modeling) ต่างๆ ในปัจจุบัน โครงการ Critical Assessment of Structure Prediction ( CASP ) เป็นการทดลองการทำนายโครงสร้างระดับชุมชนที่จัดขึ้นทุกสองปีในช่วงฤดูร้อน โดยท้าทายทีมทำนายให้ส่งแบบจำลองโครงสร้างสำหรับลำดับจำนวนหนึ่งซึ่งโครงสร้างได้รับการแก้ไขแล้วจากการทดลอง แต่ยังไม่ได้รับการตีพิมพ์ โครงการ Critical Assessment of Fully Automated Structure Prediction ( CAFASP ) ซึ่งเป็นโครงการคู่ขนาน ได้ดำเนินการควบคู่ไปกับ CASP แต่ประเมินเฉพาะแบบจำลองที่สร้างขึ้นผ่านเซิร์ฟเวอร์อัตโนมัติเต็มรูปแบบเท่านั้น การทดลองที่ดำเนินการอย่างต่อเนื่องโดยไม่มี "ฤดูกาล" การทำนายนั้นมุ่งเน้นไปที่การเปรียบเทียบประสิทธิภาพของเว็บเซิร์ฟเวอร์ที่เปิดให้ใช้งานสาธารณะเป็นหลักLiveBenchและ EVA ดำเนินการอย่างต่อเนื่องเพื่อประเมินประสิทธิภาพของเซิร์ฟเวอร์ที่เข้าร่วมในการทำนายโครงสร้างที่จะเผยแพร่ในเร็วๆ นี้จาก PDB CASP และ CAFASP ทำหน้าที่หลักในการประเมินสถานะของศิลปะในการสร้างแบบจำลอง ในขณะที่การประเมินอย่างต่อเนื่องมุ่งประเมินคุณภาพของแบบจำลองที่จะได้รับจากผู้ใช้ที่ไม่ใช่ผู้เชี่ยวชาญโดยใช้เครื่องมือที่เปิดให้ใช้งานสาธารณะ

ความแม่นยำ

ความแม่นยำของโครงสร้างที่สร้างขึ้นโดยการสร้างแบบจำลองโฮโมโลยีขึ้นอยู่กับความเหมือนของลำดับระหว่างเป้าหมายและแม่แบบเป็นอย่างมาก เมื่อความเหมือนของลำดับสูงกว่า 50% แบบจำลองมักจะเชื่อถือได้ โดยมีข้อผิดพลาดเพียงเล็กน้อยใน การจัดเรียง โซ่ข้างและ สถานะ โรตาเมอริกและค่าRMSD โดยรวม ระหว่างโครงสร้างที่สร้างแบบจำลองและโครงสร้างจากการทดลองจะอยู่ที่ประมาณ 1 Åข้อผิดพลาดนี้เทียบได้กับความละเอียดทั่วไปของโครงสร้างที่แก้ได้ด้วย NMR ในช่วงความเหมือน 30–50% ข้อผิดพลาดอาจรุนแรงกว่าและมักจะอยู่ในลูป เมื่อความเหมือนต่ำกว่า 30% จะเกิดข้อผิดพลาดร้ายแรง ซึ่งบางครั้งส่งผลให้การทำนายการพับพื้นฐานผิดพลาด^{[ 14 ]}บริเวณที่มีความเหมือนต่ำนี้มักถูกเรียกว่า "เขตแดนสนธยา" ซึ่งการสร้างแบบจำลองโฮโมโลยีทำได้ยากมาก และอาจไม่เหมาะสมเท่ากับวิธีการจดจำการพับ^{[ 24 ]}

ที่ความเหมือนของลำดับสูง แหล่งที่มาหลักของข้อผิดพลาดในการสร้างแบบจำลองโฮโมโลยีมาจากการเลือกแม่แบบหรือแม่แบบที่ใช้เป็นพื้นฐานของแบบจำลอง ในขณะที่ความเหมือนที่ต่ำกว่าจะแสดงข้อผิดพลาดร้ายแรงในการจัดเรียงลำดับที่ขัดขวางการสร้างแบบจำลองคุณภาพสูง^{[ 7 ]}มีการเสนอแนะว่าอุปสรรคสำคัญต่อการสร้างแบบจำลองคุณภาพสูงคือความไม่เพียงพอในการจัดเรียงลำดับ เนื่องจาก สามารถใช้ การจัดเรียงโครงสร้าง ที่ "เหมาะสมที่สุด" ระหว่างโปรตีนสองชนิดที่มีโครงสร้างที่ทราบแล้วเป็นข้อมูลป้อนเข้าสำหรับวิธีการสร้างแบบจำลองในปัจจุบันเพื่อสร้างการจำลองโครงสร้างการทดลองดั้งเดิมที่ค่อนข้างแม่นยำ^{[ 25 ]}

มีการพยายามปรับปรุงความแม่นยำของแบบจำลองโฮโมโลยีที่สร้างขึ้นด้วยวิธีการที่มีอยู่โดยการนำไปใช้กับ การจำลอง พลศาสตร์โมเลกุลเพื่อพยายามปรับปรุงค่า RMSD ให้ใกล้เคียงกับโครงสร้างจากการทดลอง อย่างไรก็ตาม การกำหนดพารามิเตอร์ ฟิลด์แรง ในปัจจุบัน อาจไม่แม่นยำเพียงพอสำหรับงานนี้ เนื่องจากแบบจำลองโฮโมโลยีที่ใช้เป็นโครงสร้างเริ่มต้นสำหรับพลศาสตร์โมเลกุลมักจะสร้างโครงสร้างที่แย่ลงเล็กน้อย^{[ 26 ]}สังเกตเห็นการปรับปรุงเล็กน้อยในกรณีที่มีการใช้ข้อจำกัดที่สำคัญในระหว่างการจำลอง^{[ 27 ]}

แหล่งที่มาของข้อผิดพลาด

แหล่งที่มาของข้อผิดพลาดที่พบบ่อยที่สุดและมีขนาดใหญ่ที่สุดสองแหล่งในการสร้างแบบจำลองโฮโมโลยีคือ การเลือกแม่แบบที่ไม่ดีและความไม่แม่นยำในการจัดเรียงลำดับเป้าหมาย-แม่แบบ^{[ 7 ]}^{[ 28 ]}การควบคุมปัจจัยทั้งสองนี้โดยใช้การจัดเรียงโครงสร้างหรือการจัดเรียงลำดับที่สร้างขึ้นบนพื้นฐานของการเปรียบเทียบโครงสร้างที่แก้ไขแล้วสองโครงสร้าง จะช่วยลดข้อผิดพลาดในแบบจำลองสุดท้ายได้อย่างมาก การจัดเรียง "มาตรฐานทองคำ" เหล่านี้สามารถใช้เป็นข้อมูลป้อนเข้าสำหรับวิธีการสร้างแบบจำลองในปัจจุบันเพื่อสร้างการจำลองโครงสร้างการทดลองดั้งเดิมที่ค่อนข้างแม่นยำ^{[ 25 ]}ผลลัพธ์จากการทดลอง CASP ล่าสุดชี้ให้เห็นว่าวิธีการ "ฉันทามติ" ที่รวบรวมผลลัพธ์ของการจดจำการพับหลายแบบและการค้นหาการจัดเรียงหลายแบบจะเพิ่มโอกาสในการระบุแม่แบบที่ถูกต้อง ในทำนองเดียวกัน การใช้แม่แบบหลายแบบในขั้นตอนการสร้างแบบจำลองอาจแย่กว่าการใช้แม่แบบที่ถูกต้องเพียงแบบเดียว แต่ดีกว่าการใช้แม่แบบที่ไม่เหมาะสมเพียงแบบเดียว^{[ 28 ]}ข้อผิดพลาดในการจัดเรียงอาจลดลงได้โดยการใช้การจัดเรียงหลายแบบแม้ว่าจะใช้แม่แบบเพียงแบบเดียว และโดยการปรับปรุงซ้ำๆ ของบริเวณท้องถิ่นที่มีความคล้ายคลึงกันต่ำ^{[ 3 ]}^{[ 12 ]} แหล่งที่มาของข้อผิดพลาดของแบบจำลองที่น้อยกว่าคือข้อผิดพลาดในโครงสร้างแม่แบบ รายงาน PDBREPORT ที่เก็บถาวรเมื่อวันที่ 31 พฤษภาคม 2550 ใน ฐานข้อมูล Wayback Machine แสดงรายการข้อผิดพลาดหลายล้านรายการ ส่วนใหญ่ มี ขนาดเล็กมาก แต่บางครั้งก็ร้ายแรง ในโครงสร้างทดลอง (แม่แบบ) ที่ถูกฝากไว้ในPDB

ข้อผิดพลาดเฉพาะที่ร้ายแรงอาจเกิดขึ้นในแบบจำลองโฮโมโลยี ซึ่ง การกลายพันธุ์แบบ แทรกหรือลบหรือช่องว่างในโครงสร้างที่แก้ไขแล้ว ส่งผลให้บริเวณลำดับเป้าหมายไม่มีแม่แบบที่สอดคล้องกัน ปัญหานี้สามารถลดลงได้โดยการใช้แม่แบบหลายตัว แต่วิธีนี้มีความซับซ้อนเนื่องจากโครงสร้างเฉพาะที่ของแม่แบบรอบช่องว่างแตกต่างกัน และเนื่องจากความเป็นไปได้ที่บริเวณที่หายไปในโครงสร้างทดลองหนึ่งโครงสร้างจะหายไปในโครงสร้างอื่น ๆ ของตระกูลโปรตีนเดียวกัน บริเวณที่หายไปมักพบได้บ่อยในลูปซึ่งความยืดหยุ่นเฉพาะที่สูงทำให้การแก้ไขบริเวณนั้นด้วยวิธีการกำหนดโครงสร้างทำได้ยากขึ้น แม้ว่าจะมีการให้คำแนะนำบ้างแม้จะมีแม่แบบเพียงตัวเดียวโดยการวางตำแหน่งปลายของบริเวณที่หายไป แต่ยิ่งช่องว่างยาวเท่าไหร่ การสร้างแบบจำลองก็จะยิ่งยากขึ้นเท่านั้น ลูปที่มีมากถึงประมาณ 9 หน่วยย่อยสามารถสร้างแบบจำลองได้ด้วยความแม่นยำปานกลางในบางกรณีหากการจัดเรียงเฉพาะที่ถูกต้อง^{[ 3 ]}บริเวณที่ใหญ่กว่ามักจะสร้างแบบจำลองทีละส่วนโดยใช้ เทคนิค การทำนายโครงสร้างแบบ ab initioแม้ว่าวิธีการนี้จะประสบความสำเร็จเพียงเล็กน้อยก็ตาม^{[ 29 ]}

สถานะโรตาเมอริกของโซ่ข้างและการจัดเรียงการบรรจุภายในยังก่อให้เกิดความยากลำบากในการสร้างแบบจำลองโฮโมโลยี แม้แต่ในเป้าหมายที่โครงสร้างกระดูกสันหลังสามารถทำนายได้ค่อนข้างง่ายก็ตาม ส่วนหนึ่งเป็นเพราะโซ่ข้างจำนวนมากในโครงสร้างผลึกไม่ได้อยู่ในสถานะโรตาเมอริกที่ "เหมาะสมที่สุด" อันเป็นผลมาจากปัจจัยด้านพลังงานในแกนไฮโดรโฟบิกและในการบรรจุของโมเลกุลแต่ละตัวในผลึกโปรตีน^{[ 30 ]}วิธีหนึ่งในการแก้ปัญหานี้คือการค้นหาไลบรารีโรตาเมอริกเพื่อระบุการรวมกันของสถานะการบรรจุที่มีพลังงานต่ำในระดับท้องถิ่น^{[ 31 ]}มีการเสนอแนะว่าเหตุผลสำคัญที่ทำให้การสร้างแบบจำลองโฮโมโลยีเป็นเรื่องยากเมื่อความเหมือนของลำดับเป้าหมาย-แม่แบบต่ำกว่า 30% คือโปรตีนดังกล่าวมีโครงสร้างพับที่คล้ายคลึงกันโดยทั่วไป แต่มีการจัดเรียงการบรรจุโซ่ข้างที่แตกต่างกันอย่างมาก^{[ 4 ]}

คุณประโยชน์

การใช้แบบจำลองโครงสร้าง ได้แก่การทำนายปฏิสัมพันธ์ระหว่างโปรตีนกับโปรตีน การเชื่อมต่อโปรตีน กับโปรตีน การเชื่อม ต่อโมเลกุลและการระบุหน้าที่ของยีนที่พบในจีโนมของ สิ่งมีชีวิต ^{[ 32 ]}แม้แต่แบบจำลองความเหมือนที่มีความแม่นยำต่ำก็ยังมีประโยชน์สำหรับวัตถุประสงค์เหล่านี้ เนื่องจากความไม่แม่นยำมักจะอยู่ที่ลูปบนพื้นผิวของโปรตีน ซึ่งโดยปกติแล้วจะมีความแปรปรวนมากกว่าแม้กระทั่งระหว่างโปรตีนที่มีความสัมพันธ์ใกล้ชิดกัน บริเวณการทำงานของโปรตีน โดยเฉพาะอย่างยิ่งบริเวณที่ออกฤทธิ์มักจะได้รับการอนุรักษ์ไว้สูงกว่าและจึงสามารถสร้างแบบจำลองได้อย่างแม่นยำมากขึ้น^{[ 14 ]}

แบบจำลองโฮโมโลยียังสามารถใช้เพื่อระบุความแตกต่างเล็กน้อยระหว่างโปรตีนที่เกี่ยวข้องซึ่งยังไม่ได้รับการแก้ไขโครงสร้างทั้งหมด ตัวอย่างเช่น วิธีนี้ถูกใช้เพื่อระบุตำแหน่งการจับ ไอออนบวก บน Na ⁺ /K ⁺ATPaseและเพื่อเสนอสมมติฐานเกี่ยวกับความสัมพันธ์ในการจับของ ATPase ต่างๆ^[³³^]เมื่อใช้ร่วมกับ การจำลอง พลศาสตร์โมเลกุลแบบจำลองโฮโมโลยียังสามารถสร้างสมมติฐานเกี่ยวกับจลนศาสตร์และพลศาสตร์ของโปรตีนได้ เช่น ในการศึกษาการเลือกไอออนของช่องโพแทสเซียม^[³⁴^]การสร้างแบบจำลองอัตโนมัติขนาดใหญ่ของบริเวณการเข้ารหัสโปรตีนที่ระบุทั้งหมดในจีโนมได้ถูกพยายามสำหรับยีสต์Saccharomyces cerevisiaeส่งผลให้ได้แบบจำลองคุณภาพเกือบ 1,000 แบบสำหรับโปรตีนที่โครงสร้างยังไม่ได้รับการกำหนดในขณะที่ทำการศึกษา และระบุความสัมพันธ์ใหม่ระหว่างโปรตีนยีสต์ 236 ชนิดกับโครงสร้างอื่นๆ ที่ได้รับการแก้ไขก่อนหน้านี้^[³⁵^]

ดูเพิ่มเติม

[

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[

[ 20 ]

[ 21 ]

[ 22 ]

[ 23 ]

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

[ 28 ]

[ 29 ]

[ 30 ]

[ 31 ]

[ 32 ]

[

[

[