อ่าน 19 นาที
การออกแบบโปรตีน
การออกแบบโปรตีน คือ การออกแบบ โมเลกุล โปรตีน ใหม่ อย่างมีเหตุผล เพื่อออกแบบกิจกรรม พฤติกรรม หรือวัตถุประสงค์ใหม่ และเพื่อพัฒนาความเข้าใจพื้นฐานเกี่ยวกับหน้าที่ของโปรตีน [ 1 ]...
การออกแบบโปรตีน
การออกแบบโปรตีนคือการออกแบบ โมเลกุล โปรตีนใหม่ อย่างมีเหตุผล เพื่อออกแบบกิจกรรม พฤติกรรม หรือวัตถุประสงค์ใหม่ และเพื่อพัฒนาความเข้าใจพื้นฐานเกี่ยวกับหน้าที่ของโปรตีน[ 1 ]โปรตีนสามารถออกแบบได้ตั้งแต่เริ่มต้น ( การออกแบบ de novo ) หรือโดยการสร้างตัวแปรที่คำนวณได้ของโครงสร้างโปรตีนที่รู้จักและลำดับของมัน (เรียกว่าการออกแบบโปรตีน ใหม่ ) แนวทาง การออกแบบโปรตีนอย่างมีเหตุผลจะทำนายลำดับโปรตีนที่จะพับตัวเป็นโครงสร้างเฉพาะ จากนั้นลำดับที่ทำนายไว้เหล่านี้สามารถตรวจสอบความถูกต้องได้ด้วยวิธีการทดลอง เช่นการสังเคราะห์เปปไทด์การกลายพันธุ์แบบกำหนดตำแหน่งหรือ การสังเคราะห์ ยีน เทียม
การออกแบบโปรตีนอย่างมีเหตุผลย้อนกลับไปในช่วงกลางทศวรรษ 1970 [ 2 ]อย่างไรก็ตาม เมื่อไม่นานมานี้ มีตัวอย่างมากมายของการออกแบบที่มีเหตุผลของเปปไทด์และโปรตีนที่ละลายน้ำได้และแม้กระทั่งโปรตีนที่ผ่านเยื่อหุ้มเซลล์ ซึ่งส่วนหนึ่งเป็นผลมาจากความเข้าใจที่ดีขึ้นเกี่ยวกับปัจจัยต่างๆ ที่มีส่วนทำให้โครงสร้างของโปรตีนมีความเสถียรและการพัฒนาวิธีการคำนวณที่ดีขึ้น
ภาพรวมและประวัติความเป็นมา
เป้าหมายในการออกแบบโปรตีนอย่างมีเหตุผลคือการทำนายลำดับกรดอะมิโน ที่จะพับตัวเป็นโครงสร้างโปรตีนที่เฉพาะเจาะจง แม้ว่าจำนวนลำดับโปรตีนที่เป็นไปได้จะมีมากมายมหาศาลและเพิ่มขึ้นแบบทวีคูณตามขนาดของสายโปรตีน แต่จะมีเพียงส่วนน้อยเท่านั้นที่จะพับตัวได้อย่างน่าเชื่อถือและรวดเร็วไปยังสถานะดั้งเดิม หนึ่ง สถานะ การออกแบบโปรตีนเกี่ยวข้องกับการระบุลำดับใหม่ภายในส่วนน้อยนี้ สถานะดั้งเดิมของโปรตีนคือ ค่าต่ำสุด ของพลังงานอิสระ เชิง โครงสร้างสำหรับสายโซ่ ดังนั้น การออกแบบโปรตีนจึงเป็นการค้นหาลำดับที่มีโครงสร้างที่เลือกเป็นค่าต่ำสุดของพลังงานอิสระ ในแง่หนึ่ง มันคือสิ่งที่ตรงกันข้ามกับการทำนายโครงสร้างโปรตีนในการออกแบบโครงสร้างระดับตติยภูมิจะถูกกำหนด และลำดับที่จะพับตัวเป็นโครงสร้างนั้นจะถูกระบุ ดังนั้นจึงเรียกว่าการพับตัวแบบผกผันการออกแบบโปรตีนจึงเป็นปัญหาการหาค่าที่เหมาะสมที่สุด: โดยใช้เกณฑ์การให้คะแนนบางอย่าง ลำดับที่เหมาะสมที่สุดที่จะพับตัวเป็นโครงสร้างที่ต้องการจะถูกเลือก
เมื่อมีการออกแบบโปรตีนอย่างมีเหตุผลเป็นครั้งแรกในช่วงทศวรรษ 1970 และ 1980 ลำดับของโปรตีนเหล่านี้ได้รับการปรับให้เหมาะสมด้วยตนเองโดยอาศัยการวิเคราะห์โปรตีนอื่นๆ ที่รู้จัก องค์ประกอบของลำดับ ประจุของกรดอะมิโน และรูปทรงเรขาคณิตของโครงสร้างที่ต้องการ[ 2 ]โปรตีนที่ออกแบบเป็นครั้งแรกนั้นเป็นผลงานของ Bernd Gutte ซึ่งออกแบบเวอร์ชันย่อของตัวเร่งปฏิกิริยาที่รู้จักกันดี คือ ไรโบเอนไซม์จากวัว และโครงสร้างตติยภูมิที่ประกอบด้วยเบต้าชีทและอัลฟาเฮลิกซ์ รวมถึงสารยึดเกาะDDTต่อมา Urry และเพื่อนร่วมงานได้ออกแบบ เปปไทด์ เส้นใยคล้ายอีลาสตินโดยอาศัยกฎเกี่ยวกับองค์ประกอบของลำดับ Richardson และเพื่อนร่วมงานได้ออกแบบโปรตีน 79 หน่วยกรดอะมิโนที่ไม่มีความคล้ายคลึงกับลำดับของโปรตีนที่รู้จัก[ 2 ]ในช่วงทศวรรษ 1990 การเกิดขึ้นของคอมพิวเตอร์ที่มีประสิทธิภาพห้องสมุดของโครงสร้างกรดอะมิโนและฟิลด์แรงที่พัฒนาขึ้นส่วนใหญ่สำหรับ การจำลอง พลศาสตร์โมเลกุลทำให้สามารถพัฒนาเครื่องมือออกแบบโปรตีนเชิงคำนวณตามโครงสร้างได้ จากการพัฒนาเครื่องมือคำนวณเหล่านี้ ความสำเร็จอย่างมากได้เกิดขึ้นในรอบ 30 ปีที่ผ่านมาในการออกแบบโปรตีน โปรตีนตัวแรกที่ได้รับการออกแบบใหม่ ทั้งหมดสำเร็จ นั้นทำโดยStephen Mayoและเพื่อนร่วมงานในปี 1997 [ 3 ]และหลังจากนั้นไม่นาน ในปี 1999 Peter S. Kim และเพื่อนร่วมงานได้ออกแบบไดเมอร์ ไตรเมอร์ และเตตระเมอร์ของ ขดเกลียวขวาที่ไม่เป็นธรรมชาติ[ 4 ] [ 5 ] ในปี 2003 ห้องปฏิบัติการของDavid Baker ได้ออกแบบโปรตีนทั้งหมดที่มีโครงสร้างที่ไม่เคยพบเห็นมาก่อนในธรรมชาติ [ 6 ]ต่อมาในปี 2008 กลุ่มของ Baker ได้ออกแบบเอนไซม์โดยใช้การคำนวณสำหรับปฏิกิริยาสองแบบที่แตกต่างกัน[ 7 ]ในปี 2010 แอนติบอดีที่มีประสิทธิภาพในการทำให้เป็นกลางอย่างกว้างขวางตัวหนึ่งถูกแยกได้จากซีรั่มของผู้ป่วยโดยใช้โพรบโปรตีนที่ออกแบบโดยใช้การคำนวณ[ 8 ] ในปี 2024 เบเกอร์ได้รับ รางวัลโนเบลสาขาเคมีครึ่งหนึ่งจากการพัฒนาการออกแบบโปรตีนด้วยคอมพิวเตอร์ โดยอีกครึ่งหนึ่งแบ่งให้กับเดมิส ฮัสซาบิสและจอห์น จัมเปอร์จากดีพมายด์สำหรับการทำนายโครงสร้างโปรตีน[ 9 ]ด้วยความสำเร็จเหล่านี้และความสำเร็จอื่นๆ (เช่น ดูตัวอย่างด้านล่าง) การออกแบบโปรตีนจึงกลายเป็นหนึ่งในเครื่องมือที่สำคัญที่สุดสำหรับการวิศวกรรมโปรตีนมีความหวังอย่างยิ่งว่าการออกแบบโปรตีนใหม่ ทั้งขนาดเล็กและขนาดใหญ่ จะมีประโยชน์ในด้านชีวการแพทย์และวิศวกรรม ชีวภาพ
แบบจำลองพื้นฐานของโครงสร้างและหน้าที่ของโปรตีน
โปรแกรมออกแบบโปรตีนใช้แบบจำลองคอมพิวเตอร์ของแรงระดับโมเลกุลที่ขับเคลื่อนโปรตีนใน สภาพแวดล้อม ภายในร่างกายเพื่อให้ปัญหาสามารถแก้ไขได้ง่ายขึ้น แรงเหล่านี้จึงถูกทำให้ง่ายขึ้นโดยแบบจำลองการออกแบบโปรตีน แม้ว่าโปรแกรมออกแบบโปรตีนจะแตกต่างกันอย่างมาก แต่ก็ต้องตอบคำถามหลักสี่ข้อเกี่ยวกับการสร้างแบบจำลอง ได้แก่ โครงสร้างเป้าหมายของการออกแบบคืออะไร ความยืดหยุ่นที่อนุญาตในโครงสร้างเป้าหมายมีมากน้อยเพียงใด ลำดับใดบ้างที่รวมอยู่ในการค้นหา และจะใช้ฟิลด์แรงใดในการให้คะแนนลำดับและโครงสร้าง
โครงสร้างเป้าหมาย

การทำงานของโปรตีนขึ้นอยู่กับโครงสร้างของโปรตีนเป็นอย่างมาก และการออกแบบโปรตีนอย่างมีเหตุผลจะใช้ความสัมพันธ์นี้ในการออกแบบการทำงานโดยการออกแบบโปรตีนที่มีโครงสร้างหรือรูปแบบการพับตัวตามเป้าหมาย ดังนั้น ตามนิยามแล้ว ในการออกแบบโปรตีนอย่างมีเหตุผล โครงสร้างเป้าหมายหรือกลุ่มของโครงสร้างจะต้องเป็นที่รู้จักมาก่อน ซึ่งแตกต่างจากการวิศวกรรมโปรตีนรูปแบบอื่น ๆ เช่นวิวัฒนาการแบบกำหนดทิศทางซึ่งใช้วิธีการที่หลากหลายในการค้นหาโปรตีนที่ทำหน้าที่เฉพาะ และการทำนายโครงสร้างโปรตีนซึ่งทราบลำดับแต่ไม่ทราบโครงสร้าง
โดยส่วนใหญ่แล้ว โครงสร้างเป้าหมายจะอิงตามโครงสร้างที่รู้จักของโปรตีนอื่น อย่างไรก็ตาม การพับแบบใหม่ที่ไม่เคยพบเห็นในธรรมชาติกำลังเป็นไปได้มากขึ้นเรื่อยๆ ปีเตอร์ เอส. คิม และเพื่อนร่วมงานได้ออกแบบไตรเมอร์และเตตระเมอร์ของขดเกลียวที่ไม่เป็นธรรมชาติ ซึ่งไม่เคยพบเห็นมาก่อนในธรรมชาติ[ 4 ] [ 5 ]โปรตีน Top7 ที่พัฒนาขึ้นในห้องปฏิบัติการของเดวิด เบเกอร์ ได้รับการออกแบบโดยใช้อัลกอริธึมการออกแบบโปรตีนอย่างสมบูรณ์ เพื่อให้ได้การพับแบบใหม่ทั้งหมด [ 6 ]เมื่อไม่นานมานี้ เบเกอร์และเพื่อนร่วมงานได้พัฒนาหลักการชุดหนึ่งเพื่อออกแบบ โครงสร้าง โปรตีนทรงกลมใน อุดมคติ โดยอิงจากช่องทางการพับโปรตีนที่เชื่อมโยงระหว่างการทำนายโครงสร้างทุติยภูมิและโครงสร้างตติยภูมิ หลักการเหล่านี้ซึ่งสร้างขึ้นจากทั้งการทำนายโครงสร้างโปรตีนและการออกแบบโปรตีน ถูกนำมาใช้ในการออกแบบโทโพโลยีโปรตีนใหม่ที่แตกต่างกันห้าแบบ[ 10 ]
พื้นที่ลำดับ

ในการออกแบบโปรตีนอย่างมีเหตุผล โปรตีนสามารถถูกออกแบบใหม่ได้จากลำดับและโครงสร้างของโปรตีนที่รู้จัก หรือออกแบบใหม่ทั้งหมดตั้งแต่เริ่มต้นใน กระบวนการออกแบบโปรตีน แบบ de novoในการออกแบบโปรตีนใหม่นั้น กรดอะมิโนส่วนใหญ่ในลำดับจะคงไว้เป็นกรดอะมิโนแบบดั้งเดิม ในขณะที่บางส่วนอาจเกิดการกลายพันธุ์ได้ ใน การออกแบบแบบ de novoนั้น ลำดับทั้งหมดจะถูกออกแบบใหม่โดยไม่ขึ้นอยู่กับลำดับก่อนหน้าใดๆ
ทั้ง การออกแบบ de novoและการออกแบบโปรตีนใหม่สามารถกำหนดกฎเกณฑ์เกี่ยวกับพื้นที่ลำดับได้ กล่าวคือ กรดอะมิโนเฉพาะที่อนุญาตในแต่ละตำแหน่งของสารตกค้างที่เปลี่ยนแปลงได้ ตัวอย่างเช่น องค์ประกอบของพื้นผิวของโพรบ RSC3เพื่อเลือกแอนติบอดีที่ทำให้ HIV เป็นกลางอย่างกว้างขวางนั้นถูกจำกัดโดยอาศัยข้อมูลวิวัฒนาการและการปรับสมดุลประจุ ความพยายามในช่วงแรกๆ ในการออกแบบโปรตีนจำนวนมากอาศัยกฎเกณฑ์ เชิงประจักษ์เกี่ยว กับพื้นที่ลำดับ เป็นอย่างมาก [ 2 ]ยิ่งไปกว่านั้น การออกแบบโปรตีนเส้นใยมักปฏิบัติตามกฎเกณฑ์ที่เข้มงวดเกี่ยวกับพื้นที่ลำดับ ตัวอย่าง เช่น โปรตีนที่ออกแบบโดยใช้ คอลลาเจนมักประกอบด้วยรูปแบบการซ้ำกันของ Gly-Pro-X [ 2 ]การเกิดขึ้นของเทคนิคการคำนวณทำให้สามารถออกแบบโปรตีนได้โดยไม่ต้องมีการแทรกแซงจากมนุษย์ในการเลือกลำดับ[ 3 ]
ความยืดหยุ่นเชิงโครงสร้าง

ในการออกแบบโปรตีน โครงสร้างเป้าหมาย (หรือหลายโครงสร้าง) ของโปรตีนนั้นเป็นที่ทราบกันดีอยู่แล้ว อย่างไรก็ตาม แนวทางการออกแบบโปรตีนอย่างมีเหตุผลจะต้องจำลองความยืดหยุ่น บางอย่าง ในโครงสร้างเป้าหมาย เพื่อเพิ่มจำนวนลำดับที่สามารถออกแบบสำหรับโครงสร้างนั้น และเพื่อลดโอกาสที่ลำดับจะพับตัวเป็นโครงสร้างที่แตกต่างออกไป ตัวอย่างเช่น ในการออกแบบโปรตีนใหม่ของกรดอะมิโนขนาดเล็กหนึ่งตัว (เช่น อะลานีน) ในแกนกลางที่อัดแน่นของโปรตีน แนวทางการออกแบบอย่างมีเหตุผลจะทำนายได้ว่าจะมีโปรตีนกลายพันธุ์เพียงไม่กี่ตัวเท่านั้นที่จะพับตัวเป็นโครงสร้างเป้าหมาย หากไม่อนุญาตให้หมู่ข้างเคียงโดยรอบถูกจัดเรียงใหม่
ดังนั้น พารามิเตอร์ที่สำคัญอย่างยิ่งของกระบวนการออกแบบใดๆ ก็คือ ปริมาณความยืดหยุ่นที่อนุญาตสำหรับทั้งโซ่ข้างและโครงสร้างหลักของโปรตีน ในแบบจำลองที่ง่ายที่สุด โครงสร้างหลักของโปรตีนจะถูกทำให้แข็งตัว ในขณะที่โซ่ข้างบางส่วนของโปรตีนได้รับอนุญาตให้เปลี่ยนรูปร่างได้ อย่างไรก็ตาม โซ่ข้างสามารถมีอิสระได้หลายระดับในความยาวพันธะ มุมพันธะ และมุมไดเฮดรัลχเพื่อลดความซับซ้อนในส่วนนี้ วิธีการออกแบบโปรตีนจึงใช้ไลบรารีโรตาเมอร์ ซึ่งกำหนดค่าที่เหมาะสมสำหรับความยาวพันธะและมุมพันธะ ในขณะที่จำกัด มุมไดเฮดรัล χไว้ที่รูปร่างพลังงานต่ำที่พบได้บ่อยไม่กี่รูปร่าง ซึ่งเรียกว่าโรตาเมอร์
ไลบรารีโรตาเมอร์ได้มาจากการวิเคราะห์ทางสถิติของโครงสร้างโปรตีนจำนวนมาก ไลบรารีโรตาเมอร์ที่ไม่ขึ้นกับโครงสร้างหลักจะอธิบายโรตาเมอร์ทั้งหมด[ 11 ] ในทางตรงกันข้าม ไลบรารีโรตาเมอร์ที่ขึ้นกับโครงสร้างหลักจะอธิบายโรตาเมอร์ตามความน่าจะเป็นที่จะปรากฏขึ้นโดยขึ้นอยู่กับการจัดเรียงโครงสร้างหลักของโปรตีนรอบโซ่ข้าง[ 12 ]โปรแกรมออกแบบโปรตีนส่วนใหญ่ใช้คอนฟอร์เมชันเดียว (เช่น ค่าโมดอลสำหรับไดเฮดรัลของโรตาเมอร์ในอวกาศ) หรือหลายจุดในบริเวณที่อธิบายโดยโรตาเมอร์ ในทางตรงกันข้าม โปรแกรมออกแบบโปรตีน OSPREY จะจำลองบริเวณต่อเนื่องทั้งหมด[ 13 ]
แม้ว่าการออกแบบโปรตีนอย่างมีเหตุผลจะต้องรักษาโครงสร้างหลักของโปรตีนไว้ แต่การอนุญาตให้โครงสร้างหลักมีความยืดหยุ่นบ้างจะช่วยเพิ่มจำนวนลำดับที่พับตัวเป็นโครงสร้างได้อย่างมีนัยสำคัญ ในขณะที่ยังคงรักษาโครงสร้างหลักของโปรตีนไว้[ 14 ]ความยืดหยุ่นของโครงสร้างหลักมีความสำคัญอย่างยิ่งในการออกแบบโปรตีนใหม่ เนื่องจากการกลายพันธุ์ของลำดับมักส่งผลให้เกิดการเปลี่ยนแปลงเล็กน้อยในโครงสร้างหลัก ยิ่งไปกว่านั้น ความยืดหยุ่นของโครงสร้างหลักยังมีความสำคัญอย่างยิ่งสำหรับการประยุกต์ใช้การออกแบบโปรตีนขั้นสูง เช่น การทำนายการจับตัวและการออกแบบเอนไซม์ แบบจำลองความยืดหยุ่นของโครงสร้างหลักในการออกแบบโปรตีนบางแบบประกอบด้วยการเคลื่อนไหวของโครงสร้างหลักโดยรวมขนาดเล็กและต่อเนื่อง ตัวอย่างโครงสร้างหลักแบบแยกส่วนรอบโครงสร้างเป้าหมาย การเคลื่อนไหวแบบ backrub และความยืดหยุ่นของลูปโปรตีน[ 14 ] [ 15 ]
ฟังก์ชันพลังงาน

เทคนิคการออกแบบโปรตีนอย่างมีเหตุผลต้องสามารถแยกแยะลำดับกรดอะมิโนที่เสถียรภายใต้โครงสร้างเป้าหมายออกจากลำดับกรดอะมิโนที่อาจมีแนวโน้มที่จะอยู่ในสถานะพลังงานต่ำอื่นๆ ได้ ดังนั้น การออกแบบโปรตีนจึงต้องการฟังก์ชันพลังงาน ที่แม่นยำ ซึ่งสามารถจัดอันดับและให้คะแนนลำดับกรดอะมิโนตามความสามารถในการพับตัวเป็นโครงสร้างเป้าหมายได้ดีเพียงใด ในขณะเดียวกัน ฟังก์ชันพลังงานเหล่านี้ต้องคำนึงถึงความท้าทาย ทางด้านการคำนวณ ที่อยู่เบื้องหลังการออกแบบโปรตีนด้วย หนึ่งในข้อกำหนดที่ท้าทายที่สุดสำหรับการออกแบบที่ประสบความสำเร็จคือฟังก์ชันพลังงานที่มีทั้งความแม่นยำและเรียบง่ายสำหรับการคำนวณ
ฟังก์ชันพลังงานที่แม่นยำที่สุดคือฟังก์ชันที่อิงตามการจำลองทางกลศาสตร์ควอนตัม อย่างไรก็ตาม การจำลองดังกล่าวช้าเกินไปและโดยทั่วไปแล้วไม่สามารถนำไปใช้ในการออกแบบโปรตีนได้ ดังนั้น อัลกอริทึมการออกแบบโปรตีนจำนวนมากจึงใช้ฟังก์ชันพลังงานตามหลักฟิสิกส์ที่ดัดแปลงมาจากโปรแกรมจำลองกลศาสตร์โมเลกุลฟังก์ชันพลังงานตามความรู้หรือการผสมผสานระหว่างทั้งสองอย่าง แนวโน้มคือการใช้ฟังก์ชันพลังงานศักย์ตามหลักฟิสิกส์มากขึ้น[ 16 ]
ฟังก์ชันพลังงานตามหลักฟิสิกส์ เช่นAMBERและCHARMMมักจะได้มาจากการจำลองทางกลศาสตร์ควอนตัม และข้อมูลการทดลองจากอุณหพลศาสตร์ ผลึกศาสตร์ และสเปกโทรสโก ปี [ 17 ]ฟังก์ชันพลังงานเหล่านี้มักจะทำให้ฟังก์ชันพลังงานทางฟิสิกส์ง่ายขึ้นและทำให้สามารถแยกส่วนเป็นคู่ได้ ซึ่งหมายความว่าพลังงานทั้งหมดของโครงสร้างโปรตีนสามารถคำนวณได้โดยการบวกพลังงานเป็นคู่ระหว่างอะตอมแต่ละคู่ ซึ่งทำให้ฟังก์ชันเหล่านี้เป็นที่น่าสนใจสำหรับอัลกอริธึมการปรับให้เหมาะสม ฟังก์ชันพลังงานตามหลักฟิสิกส์มักจะจำลอง เทอม Lennard-Jones ที่ดึงดูดและผลักกันระหว่างอะตอมและ เทอมคูลอมบ์ไฟฟ้าสถิตเป็นคู่[ 18 ]ระหว่างอะตอมที่ไม่ยึดติดกัน

ศักยภาพทางสถิติ เมื่อเปรียบเทียบกับศักยภาพตามหลักฟิสิกส์ มีข้อดีคือคำนวณได้เร็ว คำนึงถึงผลกระทบที่ซับซ้อนโดยปริยาย และมีความไวต่อการเปลี่ยนแปลงเล็กน้อยในโครงสร้างโปรตีนน้อยกว่า[ 20 ]ฟังก์ชันพลังงานเหล่านี้ขึ้นอยู่กับการหาค่าพลังงานจากความถี่ของการปรากฏในฐานข้อมูลโครงสร้าง
อย่างไรก็ตาม การออกแบบโปรตีนมีข้อกำหนดที่บางครั้งอาจถูกจำกัดในฟิลด์แรงกลศาสตร์โมเลกุล ฟิลด์แรงกลศาสตร์โมเลกุลซึ่งส่วนใหญ่ใช้ในการจำลองพลศาสตร์โมเลกุลนั้นได้รับการปรับให้เหมาะสมสำหรับการจำลองลำดับเดี่ยว แต่การออกแบบโปรตีนจะค้นหาผ่านโครงสร้างหลายรูปแบบของลำดับจำนวนมาก ดังนั้น ฟิลด์แรงกลศาสตร์โมเลกุลจึงต้องได้รับการปรับแต่งสำหรับการออกแบบโปรตีน ในทางปฏิบัติ ฟังก์ชันพลังงานการออกแบบโปรตีนมักจะรวมทั้งเทอมทางสถิติและเทอมที่อิงตามหลักฟิสิกส์ ตัวอย่างเช่น ฟังก์ชันพลังงาน Rosetta ซึ่งเป็นหนึ่งในฟังก์ชันพลังงานที่ใช้มากที่สุดนั้นรวมเอาเทอมพลังงานที่อิงตามหลักฟิสิกส์ซึ่งมาจากฟังก์ชันพลังงาน CHARMM และเทอมพลังงานทางสถิติ เช่น ความน่าจะเป็นของโรตาเมอร์และไฟฟ้าสถิตที่อิงตามความรู้ โดยทั่วไป ฟังก์ชันพลังงานจะได้รับการปรับแต่งอย่างมากระหว่างห้องปฏิบัติการ และปรับแต่งเฉพาะสำหรับแต่ละการออกแบบ[ 17 ]
ความท้าทายสำหรับการออกแบบฟังก์ชันพลังงานที่มีประสิทธิภาพ
น้ำเป็นส่วนประกอบหลักของโมเลกุลที่ล้อมรอบโปรตีนและเป็นตัวขับเคลื่อนหลักของโครงสร้างโปรตีน ดังนั้น การสร้างแบบจำลองปฏิสัมพันธ์ระหว่างน้ำและโปรตีนจึงมีความสำคัญในการออกแบบโปรตีน จำนวนโมเลกุลของน้ำที่ทำปฏิกิริยากับโปรตีนในเวลาใดเวลาหนึ่งนั้นมีมากมายมหาศาล และแต่ละโมเลกุลก็มีระดับความเป็นอิสระและคู่ปฏิสัมพันธ์จำนวนมาก ในทางกลับกัน โปรแกรมออกแบบโปรตีนจะจำลองโมเลกุลของน้ำส่วนใหญ่เป็นแบบต่อเนื่อง โดยจำลองทั้งผลกระทบจากไฮโดรโฟบิกและโพลาไรเซชันของการละลาย[ 17 ]
โมเลกุลน้ำแต่ละโมเลกุลอาจมีบทบาทสำคัญในโครงสร้างแกนกลางของโปรตีน และในการโต้ตอบระหว่างโปรตีนกับโปรตีนหรือโปรตีนกับลิแกนด์ การไม่สร้างแบบจำลองน้ำดังกล่าวอาจส่งผลให้เกิดการทำนายลำดับที่เหมาะสมที่สุดของส่วนต่อประสานระหว่างโปรตีนกับโปรตีนผิดพลาด ทางเลือกอื่นคือสามารถเพิ่มโมเลกุลน้ำลงในโรตาเมอร์ได้ [ 17 ]
ในฐานะที่เป็นปัญหาการปรับให้เหมาะสม

เป้าหมายของการออกแบบโปรตีนคือการค้นหาลำดับโปรตีนที่สามารถพับตัวเป็นโครงสร้างเป้าหมายได้ ดังนั้นอัลกอริทึมการออกแบบโปรตีนจะต้องค้นหาโครงสร้างทุกรูปแบบของแต่ละลำดับโดยสัมพันธ์กับโครงสร้างเป้าหมาย และจัดอันดับลำดับตามโครงสร้างที่มีพลังงานต่ำที่สุด โดยพิจารณาจากฟังก์ชันพลังงานของการออกแบบโปรตีน ดังนั้น ข้อมูลป้อนเข้าทั่วไปของอัลกอริทึมการออกแบบโปรตีนคือโครงสร้างเป้าหมาย พื้นที่ของลำดับ ความยืดหยุ่นของโครงสร้าง และฟังก์ชันพลังงาน ในขณะที่ข้อมูลส่งออกคือลำดับหนึ่งหรือมากกว่านั้นที่คาดว่าจะพับตัวอย่างเสถียรเป็นโครงสร้างเป้าหมาย
อย่างไรก็ตาม จำนวนลำดับโปรตีนที่เป็นไปได้จะเพิ่มขึ้นแบบทวีคูณตามจำนวนหน่วยย่อยของโปรตีน ตัวอย่างเช่น มี ลำดับโปรตีนที่มีความยาว 100 หน่วยจำนวน 20,100ลำดับ ยิ่งไปกว่านั้น แม้ว่าการจัดเรียงตัวของหมู่ข้างเคียงของกรดอะมิโนจะจำกัดอยู่เพียงไม่กี่แบบ (ดูความยืดหยุ่นเชิงโครงสร้าง ) ก็ยังส่งผลให้จำนวนการจัดเรียงตัวสำหรับแต่ละลำดับเพิ่มขึ้นแบบทวีคูณ ดังนั้น ในโปรตีนที่มีหน่วยย่อย 100 หน่วย และสมมติว่ากรดอะมิโนแต่ละตัวมีแบบจัดเรียงตัว 10 แบบพอดี อัลกอริทึมการค้นหาที่ค้นหาในพื้นที่นี้จะต้องค้นหาการจัดเรียงตัวของโปรตีน มากกว่า 200,100 แบบ
ฟังก์ชันพลังงานที่พบได้บ่อยที่สุดสามารถแยกย่อยออกเป็นพจน์แบบคู่ระหว่างโรตาเมอร์และชนิดของกรดอะมิโน ซึ่งทำให้ปัญหานี้กลายเป็นปัญหาเชิงการจัดเรียง และสามารถใช้อัลกอริธึมการเพิ่มประสิทธิภาพที่มีประสิทธิภาพในการแก้ปัญหาได้ ในกรณีเหล่านั้น พลังงานรวมของแต่ละคอนฟอร์เมชันที่อยู่ในแต่ละลำดับสามารถกำหนดได้เป็นผลรวมของพจน์เดี่ยวและพจน์แบบคู่ระหว่างตำแหน่งของสารตกค้าง หากนักออกแบบสนใจเฉพาะลำดับที่ดีที่สุด อัลกอริธึมการออกแบบโปรตีนจะต้องการเพียงคอนฟอร์เมชันที่มีพลังงานต่ำที่สุดของลำดับที่มีพลังงานต่ำที่สุด ในกรณีเหล่านี้ สามารถละเลยเอกลักษณ์ของกรดอะมิโนของแต่ละโรตาเมอร์ได้ และสามารถถือว่าโรตาเมอร์ทั้งหมดที่อยู่ในกรดอะมิโนต่างกันนั้นเหมือนกันได้ ให้r iเป็นโรตาเมอร์ที่ตำแหน่งสารตกค้างiในสายโซ่โปรตีน และE ( r i ) เป็นพลังงานศักย์ระหว่างอะตอมภายในของโรตาเมอร์ ให้E ( r i , r j ) เป็นพลังงานศักย์ระหว่างr iและโรตาเมอร์r jที่ตำแหน่งสารตกค้างj จากนั้น เรากำหนดปัญหาการหา ค่าเหมาะสมที่สุดเป็นปัญหาการค้นหาโครงสร้างที่มีพลังงานต่ำสุด ( ET ):
| 1 |
ปัญหาการลดE T ให้เหลือน้อยที่สุด เป็นปัญหาNP-hard [ 15 ] [ 21 ] [ 22 ]แม้ว่าคลาสของปัญหาจะเป็น NP-hard แต่ในทางปฏิบัติแล้ว การออกแบบโปรตีนหลายกรณีสามารถแก้ไขได้อย่างแม่นยำหรือปรับให้เหมาะสมอย่างน่าพอใจผ่านวิธีการฮิวริสติก
อัลกอริทึม
มีการพัฒนาอัลกอริทึมหลายตัวโดยเฉพาะสำหรับปัญหาการออกแบบโปรตีน อัลกอริทึมเหล่านี้สามารถแบ่งออกเป็นสองประเภทใหญ่ๆ ได้แก่ อัลกอริทึมที่แม่นยำ เช่นการกำจัดทางตันซึ่งไม่มีการรับประกันเวลาในการทำงาน แต่รับประกันคุณภาพของคำตอบ และอัลกอริทึม แบบฮิวริสติก เช่น มอนเตคาร์โล ซึ่งเร็วกว่าอัลกอริทึมที่แม่นยำ แต่ไม่มีการรับประกันความเหมาะสมที่สุดของผลลัพธ์ อัลกอริทึมที่แม่นยำรับประกันว่ากระบวนการเพิ่มประสิทธิภาพจะสร้างผลลัพธ์ที่ดีที่สุดตามแบบจำลองการออกแบบโปรตีน ดังนั้น หากการคาดการณ์ของอัลกอริทึมที่แม่นยำล้มเหลวเมื่อได้รับการตรวจสอบโดยการทดลอง แหล่งที่มาของข้อผิดพลาดสามารถระบุได้ว่าเป็นฟังก์ชันพลังงาน ความยืดหยุ่นที่อนุญาต พื้นที่ลำดับ หรือโครงสร้างเป้าหมาย (เช่น หากไม่สามารถออกแบบได้) [ 23 ]
อัลกอริทึมการออกแบบโปรตีนบางส่วนแสดงไว้ด้านล่าง แม้ว่าอัลกอริทึมเหล่านี้จะกล่าวถึงเฉพาะสูตรพื้นฐานที่สุดของปัญหาการออกแบบโปรตีน สมการ ( 1 ) เท่านั้น แต่เมื่อเป้าหมายการปรับให้เหมาะสมเปลี่ยนไปเนื่องจากนักออกแบบได้เพิ่มการปรับปรุงและส่วนขยายให้กับแบบจำลองการออกแบบโปรตีน เช่น การปรับปรุงความยืดหยุ่นของโครงสร้างที่อนุญาต (เช่น ความยืดหยุ่นของแกนหลักของโปรตีน) หรือการรวมเงื่อนไขพลังงานที่ซับซ้อน ส่วนขยายมากมายในการออกแบบโปรตีนที่ปรับปรุงการสร้างแบบจำลองนั้นสร้างขึ้นบนพื้นฐานของอัลกอริทึมเหล่านี้ ตัวอย่างเช่น Rosetta Design รวมเงื่อนไขพลังงานที่ซับซ้อนและความยืดหยุ่นของแกนหลักโดยใช้ Monte Carlo เป็นอัลกอริทึมการปรับให้เหมาะสมพื้นฐาน อัลกอริทึมของ OSPREY สร้างขึ้นบนอัลกอริทึมการกำจัดทางตันและ A* เพื่อรวมการเคลื่อนไหวของแกนหลักและโซ่ข้างอย่างต่อเนื่อง ดังนั้น อัลกอริทึมเหล่านี้จึงให้มุมมองที่ดีเกี่ยวกับอัลกอริทึมประเภทต่างๆ ที่มีอยู่สำหรับการออกแบบโปรตีน
ในปี 2020 นักวิทยาศาสตร์รายงานการพัฒนากระบวนการที่ใช้ AI โดยใช้ฐานข้อมูลจีโนมสำหรับการออกแบบโปรตีนใหม่โดยอาศัยวิวัฒนาการ พวกเขาใช้ การเรียนรู้เชิงลึกเพื่อระบุหลักเกณฑ์การออกแบบ[ 24 ] [ 25 ]ในปี 2022 การศึกษารายงานซอฟต์แวร์การเรียนรู้เชิงลึกที่สามารถออกแบบโปรตีนที่มีไซต์การทำงาน ที่กำหนดไว้ล่วงหน้า ได้[ 26 ] [ 27 ]
ด้วยการรับประกันทางคณิตศาสตร์
การกำจัดทางตัน
อัลกอริทึมการกำจัดทางตัน (DEE) ลดพื้นที่การค้นหาของปัญหาลงทีละขั้นตอนโดยการลบโรตาเมอร์ที่สามารถพิสูจน์ได้ว่าไม่ได้เป็นส่วนหนึ่งของโครงสร้างที่มีพลังงานต่ำที่สุดโดยรวม (GMEC) ในแต่ละรอบการทำงาน อัลกอริทึมการกำจัดทางตันจะเปรียบเทียบโรตาเมอร์ที่เป็นไปได้ทั้งหมดในแต่ละตำแหน่งของกรดอะมิโน และลบโรตาเมอร์r′ i แต่ละตัว ที่สามารถพิสูจน์ได้ว่ามีพลังงานสูงกว่าโรตาเมอร์r i อีกตัวเสมอ และดังนั้นจึงไม่ได้เป็นส่วนหนึ่งของ GMEC:
ส่วนขยายที่มีประสิทธิภาพอื่นๆ ของอัลกอริธึมการกำจัดทางตัน ได้แก่เกณฑ์การกำจัดคู่และเกณฑ์การกำจัดทางตันแบบทั่วไปอัลกอริธึมนี้ยังได้รับการขยายเพื่อจัดการกับโรตาเมอร์ต่อเนื่องที่มีการรับประกันที่พิสูจน์ได้อีกด้วย
แม้ว่าอัลกอริธึมการกำจัดทางตันจะทำงานในเวลาพหุนามในแต่ละรอบ แต่ก็ไม่สามารถรับประกันการบรรจบกันได้ หากหลังจากจำนวนรอบที่กำหนด อัลกอริธึมการกำจัดทางตันไม่สามารถตัดโรตาเมอร์ได้อีกต่อไป โรตาเมอร์จะต้องถูกรวมเข้าด้วยกัน หรือต้องใช้อัลกอริธึมการค้นหาอื่นเพื่อค้นหาพื้นที่การค้นหาที่เหลืออยู่ ในกรณีเช่นนี้ การกำจัดทางตันจะทำหน้าที่เป็นอัลกอริธึมการกรองเบื้องต้นเพื่อลดพื้นที่การค้นหา ในขณะที่อัลกอริธึมอื่นๆ เช่น A*, Monte Carlo, การเขียนโปรแกรมเชิงเส้น หรือ FASTER จะถูกใช้เพื่อค้นหาพื้นที่การค้นหาที่เหลืออยู่[ 15 ]
แตกกิ่งและผูกมัด
พื้นที่การออกแบบโครงสร้างโปรตีนสามารถแสดงเป็นต้นไม้ได้ โดยที่หน่วยโปรตีนจะเรียงลำดับตามอำเภอใจ และต้นไม้จะแตกแขนงที่แต่ละโรตาเมอร์ในหน่วยนั้นๆ อัลกอริทึม แบบ Branch and boundใช้การแสดงแบบนี้เพื่อสำรวจต้นไม้โครงสร้างอย่างมีประสิทธิภาพ: ที่แต่ละจุดแตกแขนงอัลกอริทึมแบบ Branch and bound จะจำกัดพื้นที่โครงสร้างและสำรวจเฉพาะแขนงที่มีแนวโน้มดีเท่านั้น[ 15 ] [ 28 ] [ 29 ]
อัลกอริทึมการค้นหาที่เป็นที่นิยมสำหรับการออกแบบโปรตีนคือ อัลกอริ ทึมการค้นหา A* [ 15 ] [ 29 ] A* คำนวณคะแนนขอบล่างบนเส้นทางต้นไม้บางส่วนแต่ละเส้นทาง ซึ่งเป็นขอบล่าง (พร้อมการรับประกัน) ของพลังงานของโรตาเมอร์ที่ขยายแล้วแต่ละตัว โครงสร้างบางส่วนแต่ละอันจะถูกเพิ่มเข้าไปในคิวลำดับความสำคัญ และในแต่ละรอบ เส้นทางบางส่วนที่มีขอบล่างต่ำที่สุดจะถูกดึงออกจากคิวและขยาย อัลกอริทึมจะหยุดเมื่อมีการแจงนับโครงสร้างที่สมบูรณ์แล้ว และรับประกันว่าโครงสร้างนั้นเป็นโครงสร้างที่เหมาะสมที่สุด
ค่า A* fในการออกแบบโปรตีนประกอบด้วยสองส่วน คือf = g + hโดยgคือพลังงานที่แน่นอนของโรตาเมอร์ที่ได้รับการกำหนดแล้วในโครงสร้างบางส่วน และhคือค่าต่ำสุดของพลังงานของโรตาเมอร์ที่ยังไม่ได้กำหนด โดยแต่ละส่วนได้รับการออกแบบดังนี้ โดยที่dคือดัชนีของสารตกค้างสุดท้ายที่ได้รับการกำหนดในโครงสร้างบางส่วน
การเขียนโปรแกรมเชิงเส้นจำนวนเต็ม
ปัญหาของการปรับE T ให้เหมาะสมที่สุด (สมการ ( 1 )) สามารถกำหนดเป็นโปรแกรมเชิงเส้นจำนวนเต็ม (ILP) ได้ อย่างง่ายดาย [ 30 ]หนึ่งในสูตรที่มีประสิทธิภาพมากที่สุดใช้ตัวแปรไบนารีเพื่อแสดงถึงการมีอยู่ของโรตาเมอร์และขอบในโซลูชันสุดท้าย และจำกัดให้โซลูชันมีโรตาเมอร์เพียงหนึ่งเดียวสำหรับแต่ละเรซิเดนซ์และปฏิสัมพันธ์แบบคู่หนึ่งเดียวสำหรับแต่ละคู่ของเรซิเดนซ์:
สต
ตัวแก้ปัญหา ILP เช่นCPLEXสามารถคำนวณหาคำตอบที่เหมาะสมที่สุดสำหรับกรณีขนาดใหญ่ของปัญหาการออกแบบโปรตีนได้ ตัวแก้ปัญหาเหล่านี้ใช้การผ่อนคลายการเขียนโปรแกรมเชิงเส้นของปัญหา โดยที่q iและq ijสามารถรับค่าต่อเนื่องได้ ร่วมกับ อัลกอริทึมแบบ แยกสาขาและตัดเพื่อค้นหาเพียงส่วนเล็ก ๆ ของพื้นที่โครงสร้างเพื่อหาคำตอบที่เหมาะสมที่สุด ตัวแก้ปัญหา ILP ได้รับการพิสูจน์แล้วว่าสามารถแก้ปัญหาการจัดวางโซ่ข้างได้หลายกรณี[ 30 ]
การประมาณค่าแบบใช้การส่งข้อความสำหรับปัญหาคู่ขนานของการเขียนโปรแกรมเชิงเส้น
ตัวแก้ปัญหา ILP ขึ้นอยู่กับอัลกอริธึมการเขียนโปรแกรมเชิงเส้น (LP) เช่น วิธีSimplexหรือ วิธีอิงตาม สิ่งกีดขวางเพื่อทำการผ่อนคลาย LP ที่แต่ละสาขา อัลกอริธึม LP เหล่านี้ได้รับการพัฒนาเป็นวิธีการเพิ่มประสิทธิภาพทั่วไป และไม่ได้ปรับให้เหมาะสมสำหรับปัญหาการออกแบบโปรตีน (สมการ ( 1 )) ผลที่ตามมาคือ การผ่อนคลาย LP กลายเป็นคอขวดของตัวแก้ปัญหา ILP เมื่อขนาดของปัญหาใหญ่[ 31 ]เมื่อเร็วๆ นี้ มีทางเลือกอื่นๆ หลายอย่างที่อิงตามอัลกอริธึมการส่งข้อความซึ่งได้รับการออกแบบขึ้นโดยเฉพาะสำหรับการเพิ่มประสิทธิภาพการผ่อนคลาย LP ของปัญหาการออกแบบโปรตีน อัลกอริธึมเหล่านี้สามารถประมาณค่าทั้งอินสแตน ซ์ คู่หรืออิน สแตนซ์ หลักของการเขียนโปรแกรมจำนวนเต็มได้ แต่เพื่อให้มั่นใจได้ว่ามีความเหมาะสมที่สุด อัลกอริธึมเหล่านี้จะมีประโยชน์มากที่สุดเมื่อใช้ในการประมาณค่าคู่ของปัญหาการออกแบบโปรตีน เนื่องจาก1การประมาณค่าคู่จะรับประกันว่าไม่มีโซลูชันใดถูกมองข้าม การประมาณค่าที่อิงตามการส่งข้อความ ได้แก่ อัลกอริธึมการส่งข้อความแบบต้นไม้ถ่วงน้ำหนักสูงสุด[ 32 ] [ 33 ]และอัลกอริธึมการเขียนโปรแกรมเชิงเส้นแบบส่งข้อความ[ 34 ]
อัลกอริทึมการปรับให้เหมาะสมโดยไม่มีการรับประกัน
มอนเตคาร์โลและการอบอ่อนจำลอง
มอนเตคาร์โลเป็นหนึ่งในอัลกอริทึมที่ใช้กันอย่างแพร่หลายที่สุดสำหรับการออกแบบโปรตีน ในรูปแบบที่ง่ายที่สุด อัลกอริทึมมอนเตคาร์โลจะเลือกสารตกค้างแบบสุ่ม และในสารตกค้างนั้น จะมีการประเมินโรตาเมอร์ที่เลือกแบบสุ่ม (ของกรดอะมิโนใดๆ) [ 22 ]พลังงานใหม่ของโปรตีนE newจะถูกเปรียบเทียบกับพลังงานเก่าE oldและโรตาเมอร์ใหม่จะได้รับการยอมรับด้วยความน่าจะเป็น:
โดยที่βคือค่าคงที่ของ BoltzmannและอุณหภูมิTสามารถเลือกได้เพื่อให้ในรอบเริ่มต้นมีค่าสูงและค่อยๆลดลงเพื่อเอาชนะค่าต่ำสุดเฉพาะที่[ 13 ]
เร็วขึ้น
อัลกอริทึม FASTER ใช้เกณฑ์ทั้งแบบกำหนดและแบบสุ่มร่วมกันเพื่อปรับลำดับกรดอะมิโนให้เหมาะสม FASTER ใช้ DEE ก่อนเพื่อกำจัดโรตาเมอร์ที่ไม่ใช่ส่วนหนึ่งของโซลูชันที่เหมาะสมที่สุด จากนั้น ขั้นตอนการวนซ้ำหลายขั้นตอนจะปรับการกำหนดโรตาเมอร์ให้เหมาะสม[ 35 ] [ 36 ]
การเผยแพร่ความเชื่อ
ใน การออกแบบโปรตีนโดยใช้ การแพร่กระจายความเชื่ออัลกอริทึมจะแลกเปลี่ยนข้อความที่อธิบายความเชื่อที่แต่ละหน่วยย่อยมีเกี่ยวกับความน่าจะเป็นของแต่ละโรตาเมอร์ในหน่วยย่อยข้างเคียง อัลกอริทึมจะอัปเดตข้อความในทุกรอบการทำงานและทำซ้ำจนกว่าจะบรรลุจุดบรรจบหรือจนกว่าจะถึงจำนวนรอบการทำงานที่กำหนดไว้ การบรรจบกันไม่ได้รับการรับประกันในการออกแบบโปรตีน ข้อความm i→ j (r jที่หน่วยย่อยiส่งไปยังโรตาเมอร์(r jที่หน่วยย่อยข้างเคียงjถูกกำหนดดังนี้:
ทั้งการแพร่กระจายความเชื่อแบบผลคูณสูงสุดและผลคูณรวมถูกนำมาใช้เพื่อเพิ่มประสิทธิภาพการออกแบบโปรตีน
การประยุกต์ใช้และตัวอย่างของโปรตีนที่ได้รับการออกแบบ
การออกแบบเอนไซม์
การออกแบบเอนไซม์ ใหม่ เป็นการใช้การออกแบบโปรตีนที่มีการประยุกต์ใช้ทางวิศวกรรมชีวภาพและการแพทย์ชีวภาพอย่างกว้างขวาง โดยทั่วไป การออกแบบโครงสร้างโปรตีนอาจแตกต่างจากการออกแบบเอนไซม์ เนื่องจากการออกแบบเอนไซม์ต้องพิจารณาสถานะต่างๆ ที่เกี่ยวข้องกับกลไกการเร่งปฏิกิริยาอย่างไรก็ตาม การออกแบบโปรตีนเป็นสิ่งจำเป็นเบื้องต้นสำหรับ การออกแบบเอนไซม์ ใหม่เนื่องจากอย่างน้อยที่สุด การออกแบบตัวเร่งปฏิกิริยาจำเป็นต้องมีโครงสร้างพื้นฐานที่สามารถแทรกกลไกการเร่งปฏิกิริยาเข้าไปได้[ 37 ]
ความก้าวหน้าอย่างมากใน การออกแบบเอนไซม์ ใหม่และการออกแบบใหม่เกิดขึ้นในช่วงทศวรรษแรกของศตวรรษที่ 21 ในการศึกษาวิจัยหลัก 3 ครั้ง David Baker และเพื่อนร่วมงานได้ ออกแบบเอนไซม์ ใหม่สำหรับปฏิกิริยา retro- aldol [ 38 ] ปฏิกิริยา Kemp-elimination [ 39 ]และปฏิกิริยาDiels-Alder [ 40 ]นอกจากนี้ Stephen Mayo และเพื่อนร่วมงานได้พัฒนาวิธีการวนซ้ำเพื่อออกแบบเอนไซม์ที่มีประสิทธิภาพมากที่สุดที่รู้จักสำหรับปฏิกิริยา Kemp-elimination [ 41 ]นอกจากนี้ ในห้องปฏิบัติการของBruce Donaldได้มีการใช้การออกแบบโปรตีนด้วยคอมพิวเตอร์เพื่อเปลี่ยนความจำเพาะของโดเมนโปรตีน หนึ่ง ของnonribosomal peptide synthetaseที่ผลิตGramicidin Sจากสารตั้งต้นตามธรรมชาติ คือ ฟีนิลอะลานีนไปเป็นสารตั้งต้นที่ไม่เข้าคู่กันอื่นๆ รวมถึงกรดอะมิโนที่มีประจุ เอนไซม์ที่ออกแบบใหม่มีกิจกรรมใกล้เคียงกับเอนไซม์ชนิดดั้งเดิม[ 42 ]
การออกแบบกึ่งเหตุผล
การออกแบบกึ่งเหตุผล (Semi-rational design) เป็นวิธีการดัดแปลงอย่างมีจุดมุ่งหมายโดยอาศัยความเข้าใจเกี่ยวกับลำดับ โครงสร้าง และกลไกการเร่งปฏิกิริยาของเอนไซม์ วิธีนี้อยู่ระหว่างการออกแบบไร้เหตุผล (Irrational design) และการออกแบบมีเหตุผล (Rational design) โดยใช้ข้อมูลและวิธีการที่ทราบอยู่แล้วเพื่อทำการดัดแปลงเชิงวิวัฒนาการต่อหน้าที่เฉพาะของเอนไซม์เป้าหมาย ลักษณะเด่นของการออกแบบกึ่งเหตุผลคือ ไม่ได้อาศัยเพียงแค่การกลายพันธุ์แบบสุ่มและการคัดกรอง แต่ผสมผสานแนวคิดของการวิวัฒนาการแบบกำหนดทิศทาง โดยสร้างคลังของตัวกลายพันธุ์แบบสุ่มที่มีลำดับที่หลากหลายผ่านการกลายพันธุ์ (mutagenesis) RCR ที่มีข้อผิดพลาด (error-prone RCR ) การรวมตัว ของ DNA (DNA recombination)และ การกลายพันธุ์แบบอิ่มตัวที่ตำแหน่ง (site-saturation mutagenesis ) ในขณะเดียวกันก็ใช้ความเข้าใจเกี่ยวกับเอนไซม์และหลักการออกแบบเพื่อคัดกรองตัวกลายพันธุ์ที่มีลักษณะที่ต้องการอย่างมีจุดมุ่งหมาย
ระเบียบวิธีออกแบบกึ่งเหตุผลเน้นความเข้าใจอย่างลึกซึ้งเกี่ยวกับเอนไซม์และการควบคุมกระบวนการวิวัฒนาการ วิธีนี้ช่วยให้นักวิจัยสามารถใช้ข้อมูลที่ทราบแล้วเพื่อชี้นำกระบวนการวิวัฒนาการ ซึ่งจะช่วยเพิ่มประสิทธิภาพและอัตราความสำเร็จ วิธีการนี้มีบทบาทสำคัญในการปรับเปลี่ยนการทำงานของโปรตีน เนื่องจากสามารถรวมข้อดีของการออกแบบที่ไม่เป็นเหตุเป็นผลและการออกแบบที่เป็นเหตุเป็นผลเข้าด้วยกัน และสามารถสำรวจพื้นที่ที่ไม่รู้จักและใช้ความรู้ที่มีอยู่เพื่อการปรับเปลี่ยนที่ตรงเป้าหมายได้
การออกแบบกึ่งเหตุผลมีขอบเขตการใช้งานที่กว้างขวาง รวมถึงแต่ไม่จำกัดเพียงการเพิ่มประสิทธิภาพเอนไซม์ การปรับเปลี่ยนเป้าหมายยา วิวัฒนาการของตัวเร่งปฏิกิริยาชีวภาพ เป็นต้น ด้วยวิธีนี้ นักวิจัยสามารถปรับปรุงคุณสมบัติการทำงานของโปรตีนได้อย่างมีประสิทธิภาพมากขึ้น เพื่อตอบสนองความต้องการด้านเทคโนโลยีชีวภาพหรือทางการแพทย์ที่เฉพาะเจาะจง แม้ว่าวิธีนี้จะมีความต้องการข้อมูลและเทคโนโลยีสูง และค่อนข้างยากที่จะนำไปใช้ แต่ด้วยการพัฒนาเทคโนโลยีการคำนวณและชีวสารสนเทศ โอกาสในการประยุกต์ใช้การออกแบบกึ่งเหตุผลในวิศวกรรมโปรตีนจึงกว้างขวางมากขึ้นเรื่อยๆ[ 43 ]
ออกแบบเพื่อความผูกพัน
ปฏิกิริยาระหว่างโปรตีนมีส่วนเกี่ยวข้องในกระบวนการทางชีวภาพส่วนใหญ่ โรคที่รักษาได้ยากหลายโรค เช่นโรคอัลไซเมอร์ มะเร็งหลายชนิด(เช่นTP53 ) และ การติดเชื้อ ไวรัสภูมิคุ้มกันบกพร่องในมนุษย์ (HIV) ล้วนเกี่ยวข้องกับปฏิกิริยาระหว่างโปรตีน ดังนั้น เพื่อรักษาโรคเหล่านี้ จึงจำเป็นต้องออกแบบโปรตีนหรือสารที่คล้ายโปรตีนเพื่อนำไปจับกับโปรตีนตัวใดตัวหนึ่งในปฏิกิริยา และขัดขวางปฏิกิริยาที่ก่อให้เกิดโรค ซึ่งต้องอาศัยการออกแบบโปรตีนบำบัดให้มีแรงดึงดูดต่อโปรตีนคู่ของมัน
ปฏิสัมพันธ์ระหว่างโปรตีนกับโปรตีนสามารถออกแบบได้โดยใช้อัลกอริทึมการออกแบบโปรตีน เนื่องจากหลักการที่ควบคุมความเสถียรของโปรตีนยังควบคุมการจับกันระหว่างโปรตีนกับโปรตีนด้วย อย่างไรก็ตาม การออกแบบปฏิสัมพันธ์ระหว่างโปรตีนกับโปรตีนนั้นมีความท้าทายที่ไม่ค่อยพบในการออกแบบโปรตีน ความท้าทายที่สำคัญที่สุดประการหนึ่งคือ โดยทั่วไปแล้ว อินเทอร์เฟซระหว่างโปรตีนจะมีขั้วมากกว่าแกนกลางของโปรตีน และการจับกันนั้นเกี่ยวข้องกับการแลกเปลี่ยนระหว่างการกำจัดตัวทำละลายและการสร้างพันธะไฮโดรเจน[ 44 ]เพื่อเอาชนะความท้าทายนี้ บรูซ ทิดอร์และเพื่อนร่วมงานได้พัฒนาวิธีการปรับปรุงความสัมพันธ์ของแอนติบอดีโดยมุ่งเน้นไปที่การมีส่วนร่วมของไฟฟ้าสถิต พวกเขาพบว่าสำหรับแอนติบอดีที่ออกแบบในการศึกษา การลดต้นทุนการกำจัดตัวทำละลายของสารตกค้างในอินเทอร์เฟซจะเพิ่มความสัมพันธ์ของคู่การจับกัน[ 44 ] [ 45 ] [ 46 ]
การทำนายการจับคะแนน
ฟังก์ชันพลังงานการออกแบบโปรตีนต้องได้รับการปรับให้เข้ากับการทำนายการจับกัน เนื่องจากกระบวนการจับกันเกี่ยวข้องกับการแลกเปลี่ยนระหว่าง โครงสร้างที่ มีพลังงาน ต่ำที่สุด ของโปรตีนอิสระ ( E PและE L ) และโครงสร้างที่มีพลังงานต่ำที่สุดของสารประกอบที่จับกันแล้ว ( E PL ):
- .
อัลกอริทึม K* ประมาณค่าคงที่การผูกมัดของอัลกอริทึมโดยการรวมเอนโทรปีของโครงสร้างเข้ากับการคำนวณพลังงานอิสระ อัลกอริทึม K* พิจารณาเฉพาะโครงสร้างที่มีพลังงานต่ำที่สุดของคอมเพล็กซ์อิสระและที่ผูกมัด (แสดงด้วยเซตP , LและPL ) เพื่อประมาณฟังก์ชันการแบ่งส่วนของแต่ละคอมเพล็กซ์: [ 15 ]
ออกแบบโดยคำนึงถึงความเฉพาะเจาะจง
การออกแบบปฏิสัมพันธ์ระหว่างโปรตีนต้องมีความเฉพาะเจาะจงสูง เนื่องจากโปรตีนสามารถโต้ตอบกับโปรตีนจำนวนมากได้ การออกแบบที่ประสบความสำเร็จต้องอาศัยตัวจับที่เลือกได้ ดังนั้น อัลกอริทึมการออกแบบโปรตีนต้องสามารถแยกแยะระหว่างการจับเป้าหมาย (หรือการออกแบบเชิงบวก ) และการจับนอกเป้าหมาย (หรือการออกแบบเชิงลบ ) ได้[ 2 ] [ 44 ]ตัวอย่างที่โดดเด่นที่สุดอย่างหนึ่งของการออกแบบเพื่อความจำเพาะคือการออกแบบ เปปไทด์ที่จับกับ bZIP โดยเฉพาะ โดย Amy Keating และเพื่อนร่วมงานสำหรับ 19 จาก 20 ตระกูล bZIP โดย 8 ใน 20 เปปไทด์เหล่านี้มีความจำเพาะต่อคู่ที่ตั้งใจไว้มากกว่าเปปไทด์คู่แข่ง[ 44 ] [ 47 ] [ 48 ]นอกจากนี้ Anderson และเพื่อนร่วมงานยังใช้การออกแบบเชิงบวกและเชิงลบเพื่อทำนายการกลายพันธุ์ในบริเวณออกฤทธิ์ของเป้าหมายยาที่ทำให้เกิดความต้านทานต่อยาใหม่ โดยใช้การออกแบบเชิงบวกเพื่อรักษาการทำงานแบบดั้งเดิม ในขณะที่การออกแบบเชิงลบใช้เพื่อขัดขวางการจับของยา[ 49 ]การออกแบบการคำนวณใหม่ล่าสุดโดย Costas Maranas และเพื่อนร่วมงานยังสามารถเปลี่ยน ความจำเพาะ ของโคแฟคเตอร์ของ เอนไซม์ไซโลสรีดักเทสของ Candida boidiniiจากNADPHเป็นNADHได้ ด้วยการทดลอง [ 50 ]
การปรับสภาพผิวโปรตีน
การปรับพื้นผิวโปรตีนประกอบด้วยการออกแบบพื้นผิวของโปรตีนในขณะที่ยังคงรักษาโครงสร้างโดยรวม แกนกลาง และบริเวณขอบเขตของโปรตีนไว้ การปรับพื้นผิวโปรตีนมีประโยชน์อย่างยิ่งในการเปลี่ยนแปลงการจับกันของโปรตีนกับโปรตีนอื่นๆ หนึ่งในการประยุกต์ใช้การปรับพื้นผิวโปรตีนที่สำคัญที่สุดคือการออกแบบโพรบ RSC3 เพื่อคัดเลือกแอนติบอดีต้านไวรัส HIV ที่มีฤทธิ์กว้างที่ศูนย์วิจัยวัคซีน NIH ขั้นแรก เลือกสารตกค้างที่อยู่นอกส่วนต่อประสานการจับกันระหว่างโปรตีนซองไวรัส HIV gp120 และแอนติบอดี b12 ที่ค้นพบก่อนหน้านี้เพื่อนำมาออกแบบ จากนั้น เลือกช่วงลำดับโดยพิจารณาจากข้อมูลวิวัฒนาการ ความสามารถในการละลาย ความคล้ายคลึงกับชนิดดั้งเดิม และปัจจัยอื่นๆ จากนั้นใช้ซอฟต์แวร์ RosettaDesign เพื่อค้นหาลำดับที่เหมาะสมที่สุดในช่วงลำดับที่เลือก ต่อมา RSC3 ถูกนำมาใช้เพื่อค้นพบแอนติบอดีต้านไวรัส VRC01 ที่มีฤทธิ์กว้างในซีรั่มของผู้ติดเชื้อ HIV ระยะยาวที่ไม่แสดงอาการ[ 51 ]
การออกแบบโปรตีนทรงกลม
โปรตีนทรงกลมเป็นโปรตีนที่มีแกนไฮโดรโฟบิกและพื้นผิวไฮโดรฟิลิก โปรตีนทรงกลมมักมีโครงสร้างที่เสถียร ต่างจากโปรตีนเส้นใยซึ่งมีหลายรูปแบบ โครงสร้างสามมิติของโปรตีนทรงกลมมักจะหาได้ง่ายกว่าโดยใช้การตกผลึกด้วยรังสีเอกซ์และการเรโซแนนซ์แม่เหล็กนิวเคลียร์มากกว่าทั้งโปรตีนเส้นใยและโปรตีนเยื่อหุ้มเซลล์ซึ่งทำให้โปรตีนทรงกลมมีความน่าสนใจมากกว่าโปรตีนประเภทอื่นๆ ในการออกแบบโปรตีน การออกแบบโปรตีนที่ประสบความสำเร็จส่วนใหญ่เกี่ยวข้องกับโปรตีนทรงกลม ทั้งRSD-1และTop7เป็นการ ออกแบบโปรตีนทรงกลม แบบใหม่กลุ่ม Baker ได้ออกแบบ สังเคราะห์ และตรวจสอบโครงสร้างโปรตีนอีก 5 โครงสร้างในปี 2012 โปรตีนใหม่เหล่านี้ไม่มีหน้าที่ทางชีวภาพ แต่โครงสร้างเหล่านี้มีจุดประสงค์เพื่อทำหน้าที่เป็นหน่วยสร้างที่สามารถขยายเพื่อรวมไซต์ที่ใช้งานที่มีฟังก์ชันได้ โครงสร้างเหล่านี้ถูกค้นพบโดยการคำนวณโดยใช้ฮิวริสติกส์ใหม่ที่อิงจากการวิเคราะห์ลูปเชื่อมต่อระหว่างส่วนต่างๆ ของลำดับที่ระบุโครงสร้างทุติยภูมิ[ 52 ]
การออกแบบโปรตีนเยื่อหุ้มเซลล์
โปรตีนทรานส์เมมเบรนหลายชนิดได้รับการออกแบบสำเร็จแล้ว[ 53 ]พร้อมกับเปปไทด์และโปรตีนที่เกี่ยวข้องกับเมมเบรนอื่นๆ อีกมากมาย[ 54 ]เมื่อเร็วๆ นี้ Costas Maranas และเพื่อนร่วมงานของเขาได้พัฒนาเครื่องมืออัตโนมัติ[ 55 ]เพื่อออกแบบขนาดรูพรุนของ Outer Membrane Porin Type-F (OmpF) จากE.coliใหม่ให้มีขนาดย่อยนาโนเมตรตามต้องการ และประกอบเข้ากับเมมเบรนเพื่อทำการแยกในระดับอังสตรอมอย่างแม่นยำ
แอปพลิเคชันอื่นๆ
หนึ่งในประโยชน์ที่น่าปรารถนาที่สุดสำหรับการออกแบบโปรตีนคือไบโอเซนเซอร์ซึ่งเป็นโปรตีนที่จะตรวจจับการมีอยู่ของสารประกอบเฉพาะ ความพยายามบางอย่างในการออกแบบไบโอเซนเซอร์รวมถึงเซนเซอร์สำหรับโมเลกุลที่ไม่เป็นธรรมชาติ เช่นTNT [ 56 ] เมื่อ ไม่นานมานี้ Kuhlman และเพื่อนร่วมงาน ได้ออกแบบไบโอเซนเซอร์ของPAK1 [ 57 ]
ในแง่หนึ่ง การออกแบบโปรตีนเป็นส่วนหนึ่งของ การ ออกแบบ แบตเตอรี่
ดูเพิ่มเติม
- วิศวกรรมโปรตีน – กระบวนการทางวิศวกรรมชีวภาพ
- ซอฟต์แวร์ออกแบบโมเลกุล
- ชีววิทยาเชิงสังเคราะห์ – สาขาสหวิทยาการระหว่างชีววิทยาและวิศวกรรม
อ่านเพิ่มเติม
- Donald, Bruce R. (2011). อัลกอริทึมในชีววิทยาโมเลกุลเชิงโครงสร้างชีววิทยาโมเลกุลเชิงคำนวณ เคมบริดจ์ แมสซาชูเซตส์: สำนักพิมพ์ MIT ISBN 9780262015592. OCLC 1200909148 .
- Jin, Wenzhen; Kambara, Ohki; Sasakawa, Hiroaki; Tamura, Atsuo & Takada, Shoji (พฤษภาคม 2546). "การออกแบบโปรตีนพับได้แบบใหม่ด้วยช่องทางการพับที่ราบรื่น: การออกแบบเชิงลบอัตโนมัติและการตรวจสอบเชิงทดลอง" . โครงสร้าง . 11 (5): 581– 590. doi : 10.1016/S0969-2126(03)00075-3 . PMID 12737823 .
- Pokala, Navin & Handel, Tracy M. (2005). "ฟังก์ชันพลังงานสำหรับการออกแบบโปรตีน: การปรับด้วยความสัมพันธ์เชิงซ้อนของโปรตีน-โปรตีน แบบจำลองสำหรับสถานะที่คลายตัว และการออกแบบเชิงลบของความสามารถในการละลายและความจำเพาะ" วารสารชีววิทยาโมเลกุล 347 ( 1): 203– 227. doi : 10.1016/j.jmb.2004.12.019 . PMID 15733929 .
- แซนเดอร์, คริส; เพื่อน, เกอร์ริท; บาซาน, เฟอร์นันโด; โฮโรวิทซ์, อัมโนน; นากามูระ, ฮารุกิ; ริบาส, หลุยส์; ฟินเกลสไตน์, อเล็กซี่ วี.; ล็อคฮาร์ต, แอนดรูว์; แมร์เคิล, ไรเนอร์; และคณะ (กุมภาพันธ์ 2535). "การออกแบบโปรตีนบนคอมพิวเตอร์ โปรตีนใหม่ 5 ชนิด: Shpilka, Grendel, Fingerclasp, Leather และ Aida" โปรตีน: โครงสร้าง หน้าที่ และชีวสารสนเทศศาสตร์ . 12 (2): 105– 110. ดอย : 10.1002/ prot.340120203 PMID 1603799 . S2CID 38986245 .
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การออกแบบโปรตีน
การออกแบบโปรตีน คือ การออกแบบ โมเลกุล โปรตีน ใหม่ อย่างมีเหตุผล เพื่อออกแบบกิจกรรม พฤติกรรม หรือวัตถุประสงค์ใหม่ และเพื่อพัฒนาความเข้าใจพื้นฐานเกี่ยวกับหน้าที่ของโปรตีน [ 1 ]...
ภาพรวมและประวัติความเป็นมา
เป้าหมายในการออกแบบโปรตีนอย่างมีเหตุผลคือการทำนาย ลำดับ กรดอะมิโน ที่จะ พับตัว เป็นโครงสร้างโปรตีนที่เฉพาะเจาะจง แม้ว่าจำนวนลำดับโปรตีนที่เป็นไปได้จะมีมากมายมหาศาลและเพิ่มขึ้นแบบทวีคูณตามขนาดของสายโปรตีน...
แบบจำลองพื้นฐานของโครงสร้างและหน้าที่ของโปรตีน
โปรแกรมออกแบบโปรตีนใช้ แบบจำลองคอมพิวเตอร์ ของแรงระดับโมเลกุลที่ขับเคลื่อนโปรตีนใน สภาพแวดล้อม ภายในร่างกาย เพื่อให้ปัญหาสามารถแก้ไขได้ง่ายขึ้น แรงเหล่านี้จึงถูกทำให้ง่ายขึ้นโดยแบบจำลองการออกแบบโปรตีน แม้ว่าโปรแกรมออกแบบโปรตีนจะแตกต่างกันอย่างมาก...
โครงสร้างเป้าหมาย
การทำงานของโปรตีนขึ้นอยู่กับโครงสร้างของโปรตีนเป็นอย่างมาก และการออกแบบโปรตีนอย่างมีเหตุผลจะใช้ความสัมพันธ์นี้ในการออกแบบการทำงานโดยการออกแบบโปรตีนที่มีโครงสร้างหรือรูปแบบการพับตัวตามเป้าหมาย ดังนั้น ตามนิยามแล้ว ในการออกแบบโปรตีนอย่างมีเหตุผล...