อ่าน 7 นาที
การเชื่อมต่อโมเลกุลขนาดใหญ่
การเชื่อมต่อโมเลกุลขนาดใหญ่เป็นการสร้างแบบจำลองเชิงคำนวณของโครงสร้างควอเทอร์นารีของสารประกอบที่เกิดจากโมเลกุลชีวภาพขนาดใหญ่ที่โต้ตอบกันตั้งแต่สองโมเลกุลขึ้น ไป สารประกอบ โปรตีน
การเชื่อมต่อโมเลกุลขนาดใหญ่
การเชื่อมต่อโมเลกุลขนาดใหญ่เป็นการสร้างแบบจำลองเชิงคำนวณของโครงสร้างควอเทอร์นารีของสารประกอบที่เกิดจากโมเลกุลชีวภาพขนาดใหญ่ที่โต้ตอบกันตั้งแต่สองโมเลกุลขึ้น ไป สารประกอบ โปรตีน -โปรตีนเป็นเป้าหมายที่นิยมสร้างแบบจำลองดังกล่าวมากที่สุด รองลงมาคือสารประกอบ โปรตีน- กรดนิวคลีอิก[ 1 ]
เป้าหมายสูงสุดของการด็อกกิ้งคือการทำนายโครงสร้างสามมิติของโมเลกุลเชิงซ้อนที่สนใจ ซึ่งจะเกิดขึ้นในสิ่งมีชีวิต การด็อกกิ้งเองนั้นให้ผลลัพธ์เป็นเพียงโครงสร้างที่เป็นไปได้เท่านั้น โครงสร้างเหล่านี้จะต้องได้รับการจัดอันดับโดยใช้วิธีต่างๆ เช่นฟังก์ชันการให้คะแนนเพื่อระบุโครงสร้างที่มีแนวโน้มที่จะเกิดขึ้นในธรรมชาติมากที่สุด
คำว่า "docking" มีต้นกำเนิดในช่วงปลายทศวรรษ 1970 โดยมีความหมายที่จำกัดกว่านั้น ในเวลานั้น "docking" หมายถึงการปรับแต่งแบบจำลองของโครงสร้างที่ซับซ้อนโดยการปรับระยะห่างระหว่างส่วนประกอบที่ทำปฏิกิริยาให้เหมาะสมที่สุด แต่คงทิศทางสัมพัทธ์ของส่วนประกอบเหล่านั้นไว้ ต่อมา ทิศทางสัมพัทธ์ของส่วนประกอบที่ทำปฏิกิริยาในแบบจำลองได้รับอนุญาตให้เปลี่ยนแปลงได้ แต่รูปทรงเรขาคณิตภายในของแต่ละส่วนประกอบยังคงที่ การสร้างแบบจำลองประเภทนี้บางครั้งเรียกว่า "rigid docking" ด้วยกำลังการคำนวณที่เพิ่มขึ้น ทำให้สามารถสร้างแบบจำลองการเปลี่ยนแปลงในรูปทรงเรขาคณิตภายในของส่วนประกอบที่ทำปฏิกิริยาซึ่งอาจเกิดขึ้นเมื่อมีการสร้างโครงสร้างที่ซับซ้อน การสร้างแบบจำลองประเภทนี้เรียกว่า "flexible docking"
พื้นหลัง
บทบาททางชีววิทยาของโปรตีนส่วนใหญ่ ซึ่งระบุได้จากโมเลกุลขนาดใหญ่อื่นๆ ที่พวกมันมีปฏิสัมพันธ์ด้วยนั้นยังไม่เป็นที่ทราบแน่ชัด แม้แต่โปรตีนที่เกี่ยวข้องกับกระบวนการทางชีววิทยา ที่ได้รับการศึกษามาอย่างดี (เช่นวัฏจักรเครบส์ ) ก็อาจมีคู่ปฏิสัมพันธ์ที่ไม่คาดคิด หรือมีหน้าที่ที่ไม่เกี่ยวข้องกับกระบวนการนั้นก็ได้
ในกรณีที่ทราบถึงปฏิกิริยาระหว่างโปรตีนแล้ว คำถามอื่นๆ ก็เกิดขึ้นตามมา โรคทางพันธุกรรม (เช่น โรค ซิสติกไฟโบรซิส ) เป็นที่ทราบกันดีว่าเกิดจากโปรตีนที่พับตัวผิดรูปหรือกลายพันธุ์และมีความต้องการที่จะเข้าใจว่าการกลายพันธุ์ใดๆ อาจก่อให้เกิดปฏิกิริยาระหว่างโปรตีนที่ผิดปกติได้หรือไม่ ในอนาคตอันไกลโพ้น โปรตีนอาจถูกออกแบบมาเพื่อทำหน้าที่ทางชีวภาพ และการกำหนดปฏิกิริยาที่อาจเกิดขึ้นระหว่างโปรตีนเหล่านั้นจะเป็นสิ่งสำคัญอย่างยิ่ง
สำหรับโปรตีนชุดใดชุดหนึ่ง คำถามต่อไปนี้อาจเป็นที่น่าสนใจจากมุมมองด้านเทคโนโลยีหรือประวัติศาสตร์ธรรมชาติ:
- โปรตีนเหล่านี้จับกันในร่างกาย หรือไม่ ?
หากพวกเขาผูกพันกัน
- การจัดเรียงเชิงพื้นที่ที่พวกมันใช้ใน สถานะผูกพันนั้นเป็นอย่างไร?
- ปฏิสัมพันธ์ของพวกเขานั้นแข็งแกร่งหรืออ่อนแอแค่ไหน?
หากพวกเขาไม่ผูกพันกัน
- สามารถทำให้พวกมันจับกันได้โดยการชักนำให้เกิดการกลายพันธุ์หรือไม่?
การจับคู่โปรตีนกับโปรตีนนั้นคาดว่าจะสามารถแก้ไขปัญหาทั้งหมดเหล่านี้ได้ในที่สุด ยิ่งไปกว่านั้น เนื่องจากวิธีการจับคู่สามารถอาศัย หลักการ ทางฟิสิกส์ ล้วนๆ แม้แต่โปรตีนที่มีหน้าที่ไม่เป็นที่รู้จัก (หรือที่ได้รับการศึกษาค่อนข้างน้อย) ก็สามารถจับคู่ได้ ข้อกำหนดเพียงอย่างเดียวคือโครงสร้างโมเลกุลของโปรตีน นั้น ต้องได้รับการกำหนดโดยการทดลอง หรือสามารถประมาณได้โดยเทคนิค การทำนายโครงสร้างโปรตีน
ปฏิสัมพันธ์ระหว่างโปรตีนและกรดนิวคลีอิกมีบทบาทสำคัญในเซลล์สิ่งมีชีวิตปัจจัยการถอดรหัส (Transcription factors ) ซึ่งควบคุมการแสดงออกของยีนและ พอลิ เมอเรส (Polymerases)ซึ่งเร่งปฏิกิริยาการจำลองแบบ (Replication)ล้วนประกอบด้วยโปรตีน และสารพันธุกรรมที่พวกมันมีปฏิสัมพันธ์ด้วยนั้นประกอบด้วยกรดนิวคลีอิก การสร้างแบบจำลองของสารประกอบเชิงซ้อนระหว่างโปรตีนและกรดนิวคลีอิกนั้นมีความท้าทายเฉพาะตัวบางประการ ดังที่อธิบายไว้ด้านล่าง
ประวัติศาสตร์
ในช่วงทศวรรษ 1970 การสร้างแบบจำลองที่ซับซ้อนนั้นเกี่ยวข้องกับการระบุคุณลักษณะบนพื้นผิวของตัวโต้ตอบด้วยตนเอง และการตีความผลที่ตามมาสำหรับการจับ การทำงาน และกิจกรรม โดยทั่วไปแล้วโปรแกรมคอมพิวเตอร์จะถูกใช้ในตอนท้ายของกระบวนการสร้างแบบจำลอง เพื่อแยกแยะระหว่างการกำหนดค่าจำนวนน้อยที่เหลืออยู่หลังจากที่ได้กำหนดข้อจำกัดเชิงฮิวริสติกทั้งหมดแล้ว การใช้คอมพิวเตอร์ครั้งแรกเกิดขึ้นในการศึกษา ปฏิสัมพันธ์ ของฮีโมโกลบินในเส้นใยเซลล์เคียว[ 2 ]ตามมาด้วยงานวิจัยเกี่ยวกับคอมเพล็กซ์ไตรปซิน-BPTIใน ปี 1978 [ 3 ]คอมพิวเตอร์แยกแยะระหว่างแบบจำลองที่ดีและไม่ดีโดยใช้ฟังก์ชันการให้คะแนนซึ่งให้รางวัลแก่พื้นที่ส่วนต่อประสานขนาดใหญ่ และคู่ของโมเลกุลที่สัมผัสกันแต่ไม่ได้อยู่ในพื้นที่เดียวกัน คอมพิวเตอร์ใช้การแสดงโปรตีนที่โต้ตอบกันแบบง่าย โดยมีศูนย์กลางการโต้ตอบหนึ่งแห่งสำหรับแต่ละเรซิเดน ซ์ ปฏิสัมพันธ์ ทางไฟฟ้าสถิต ที่เหมาะสม รวมถึงพันธะไฮโดรเจนถูกระบุด้วยมือ[ 4 ]
ในช่วงต้นทศวรรษ 1990 โครงสร้างของสารประกอบเชิงซ้อนได้รับการกำหนดมากขึ้น และกำลังการคำนวณที่มีอยู่ก็เพิ่มขึ้นอย่างมาก ด้วยการเกิดขึ้นของชีวสารสนเทศศาสตร์จุดสนใจจึงเปลี่ยนไปสู่การพัฒนาเทคนิคทั่วไปที่สามารถนำไปใช้กับชุดของสารประกอบเชิงซ้อนใดๆ ก็ได้ด้วยต้นทุนการคำนวณที่ยอมรับได้ วิธีการใหม่นี้คาดว่าจะนำไปใช้ได้แม้ในกรณีที่ไม่มีเบาะแสทางวิวัฒนาการหรือการทดลอง ความรู้ก่อนหน้าเฉพาะใดๆ ก็ยังสามารถนำมาใช้ได้ในขั้นตอนการเลือกระหว่างแบบจำลองผลลัพธ์ที่มีอันดับสูงสุด หรือสามารถกำหนดเป็นข้อมูลป้อนเข้าได้หากอัลกอริทึมรองรับ ในปี 1992 มีการตีพิมพ์วิธีการหาความสัมพันธ์[ 5 ]ซึ่งเป็นอัลกอริทึมที่ใช้การแปลงฟูริเยร์แบบเร็วเพื่อให้ได้ความสามารถในการปรับขนาดที่ดีขึ้นอย่างมากสำหรับการประเมินความสมบูรณ์ของรูปร่างหยาบในแบบจำลองวัตถุแข็ง สิ่งนี้ได้รับการขยายในปี 1997 เพื่อครอบคลุมไฟฟ้าสถิตแบบหยาบ[ 6 ]
ในปี พ.ศ. 2539 ผลการทดลองแบบปิดบังครั้งแรกได้รับการตีพิมพ์[ 7 ]ซึ่งกลุ่มวิจัยหกกลุ่มพยายามทำนายโครงสร้างที่ซับซ้อนของTEM-1 เบต้า-แลคตาเมสกับโปรตีนยับยั้ง เบต้า-แลคตาเม ส (BLIP) การทดลองนี้ทำให้เห็นถึงความจำเป็นในการรองรับการเปลี่ยนแปลงโครงสร้างและความยากลำบากในการแยกแยะระหว่างคอนฟอร์เมอร์ นอกจากนี้ยังทำหน้าที่เป็นต้นแบบสำหรับชุดการประเมิน CAPRI ซึ่งเปิดตัวในปี พ.ศ. 2544
การเชื่อมต่อแบบแข็งกับแบบยืดหยุ่น
หากมุมพันธะ ความยาวพันธะ และมุมบิดของส่วนประกอบต่างๆ ไม่เปลี่ยนแปลงในขั้นตอนใดๆ ของการสร้างสารประกอบเชิงซ้อน จะเรียกว่าการเชื่อมต่อแบบแข็ง (rigid body docking ) ประเด็นที่ถกเถียงกันคือ การเชื่อมต่อแบบแข็งนั้นเพียงพอสำหรับการเชื่อมต่อส่วนใหญ่หรือไม่ เมื่อเกิดการเปลี่ยนแปลงโครงสร้างอย่างมากภายในส่วนประกอบต่างๆ ในขณะที่เกิดการสร้างสารประกอบเชิงซ้อน การเชื่อมต่อแบบแข็งจะไม่เพียงพอ อย่างไรก็ตาม การประเมินการเปลี่ยนแปลงโครงสร้างที่เป็นไปได้ทั้งหมดนั้นใช้เวลาในการประมวลผลของคอมพิวเตอร์สูงมาก ดังนั้น ขั้นตอนการเชื่อมต่อที่อนุญาตให้มีการเปลี่ยนแปลงโครงสร้าง หรือ ขั้นตอน การเชื่อมต่อแบบยืดหยุ่นจะต้องเลือกชุดย่อยเล็กๆ ของการเปลี่ยนแปลงโครงสร้างที่เป็นไปได้มาพิจารณาอย่างชาญฉลาด
วิธีการ
การเชื่อมต่อที่ประสบความสำเร็จต้องอาศัยเกณฑ์สองประการ:
- สร้างชุดการกำหนดค่าที่รวมถึงการกำหนดค่าที่เกือบถูกต้องอย่างน้อยหนึ่งรายการอย่างน่าเชื่อถือ
- สามารถแยกแยะรูปแบบที่เกือบถูกต้องออกจากรูปแบบอื่นๆ ได้อย่างน่าเชื่อถือ
สำหรับปฏิกิริยาหลายๆ อย่าง ตำแหน่งการจับกันนั้นเป็นที่ทราบกันดีอยู่แล้วบนโปรตีนอย่างน้อยหนึ่งตัวที่จะเข้าจับคู่กัน เช่นเดียวกับแอนติบอดีและสารยับยั้งแบบแข่งขันในกรณีอื่นๆ ตำแหน่งการจับกันอาจได้รับการบ่งชี้อย่างชัดเจนจาก หลักฐาน การกลายพันธุ์หรือ หลักฐาน ทางวิวัฒนาการนอกจากนี้ การจัดเรียงตัวที่โปรตีนแทรกซึมกันอย่างรุนแรงก็อาจถูกตัดออกไปได้ตั้งแต่แรกเช่นกัน
หลังจากตัดตัวเลือกที่ไม่ถูกต้องออกไปโดยอาศัยความรู้เดิมหรือ ความขัดแย้ง ทางสเตอริโอเคมีแล้ว พื้นที่ที่เหลือของโครงสร้างเชิงซ้อนที่เป็นไปได้จะต้องถูกสุ่มตัวอย่างอย่างละเอียดถี่ถ้วน สม่ำเสมอ และครอบคลุมเพียงพอที่จะรับประกันว่าจะได้ผลลัพธ์ที่ใกล้เคียงกับที่ต้องการ แต่ละโครงสร้างจะต้องได้รับการให้คะแนนด้วยมาตรวัดที่สามารถจัดอันดับโครงสร้างที่เกือบถูกต้องเหนือกว่าตัวเลือกอื่นๆ อย่างน้อย 100,000 ตัวเลือก นี่เป็นงานที่ต้องใช้การคำนวณอย่างมาก และได้มีการพัฒนาวิธีการต่างๆ มากมาย
วิธีการปริภูมิผกผัน
โปรตีนแต่ละชนิดสามารถแสดงเป็นโครงตาข่ายลูกบาศก์อย่างง่ายได้ จากนั้น สำหรับคลาสของคะแนนซึ่งเป็นการสังเคราะห์ แบบไม่ต่อเนื่อง การกำหนดค่าที่เกี่ยวข้องซึ่งกันและกันโดยการแปลโปรตีนหนึ่งตัวด้วยเวกเตอร์โครงตาข่ายที่แน่นอน สามารถให้คะแนนได้เกือบพร้อมกันโดยการใช้ทฤษฎีบทการสังเคราะห์[ 5 ]เป็นไปได้ที่จะสร้างฟังก์ชันการให้คะแนนที่คล้ายกับการสังเคราะห์ที่สมเหตุสมผล แม้จะเป็นการประมาณ ซึ่งแสดงถึงความเหมาะสมทั้งทางสเตอริโอเคมีและไฟฟ้าสถิต
วิธีการในปริภูมิผกผันถูกนำมาใช้กันอย่างแพร่หลายเนื่องจากความสามารถในการประเมินการกำหนดค่าจำนวนมหาศาล อย่างไรก็ตาม ข้อได้เปรียบด้านความเร็วจะหายไปหากมีการเปลี่ยนแปลงการบิดตัว ข้อเสียอีกประการหนึ่งคือ เป็นไปไม่ได้ที่จะใช้ความรู้ที่มีอยู่ก่อนหน้าอย่างมีประสิทธิภาพ นอกจากนี้ ยังคงมีคำถามอยู่ว่า การแปลงแบบคอนโวลูชันเป็นฟังก์ชันการให้คะแนนที่มีขอบเขตจำกัดเกินไปหรือไม่ ที่จะใช้ระบุโครงสร้างเชิงซ้อนที่ดีที่สุดได้อย่างน่าเชื่อถือ
วิธีการมอนเตคาร์โล
ในMonte Carloการกำหนดค่าเริ่มต้นจะได้รับการปรับปรุงโดยการดำเนินการแบบสุ่ม ซึ่งจะได้รับการยอมรับหรือปฏิเสธโดยพิจารณาจากการปรับปรุงคะแนนที่เกิดขึ้น (ดูเกณฑ์ Metropolis ) จนกว่าจะได้ลองจำนวนขั้นตอนที่กำหนดไว้ สมมติฐานคือ การบรรจบกันไปสู่โครงสร้างที่ดีที่สุดควรเกิดขึ้นจากการกำหนดค่าเริ่มต้นจำนวนมาก ซึ่งจำเป็นต้องพิจารณาเพียงหนึ่งในนั้นเท่านั้น การกำหนดค่าเริ่มต้นอาจถูกสุ่มอย่างหยาบๆ และสามารถประหยัดเวลาในการคำนวณได้มาก เนื่องจากความยากลำบากในการค้นหาฟังก์ชันการให้คะแนนที่มีความสามารถในการแยกแยะการกำหนดค่าที่ถูกต้องได้อย่างแม่นยำและยังบรรจบกันไปสู่การกำหนดค่าที่ถูกต้องจากระยะไกล จึงมีการเสนอให้ใช้การปรับปรุงสองระดับด้วยฟังก์ชันการให้คะแนนที่แตกต่างกัน[ 8 ]สามารถนำ Torsion มาใช้ใน Monte Carlo ได้อย่างเป็นธรรมชาติในฐานะคุณสมบัติเพิ่มเติมของการเคลื่อนไหวแบบสุ่มแต่ละครั้ง
วิธีการมอนเตคาร์โลไม่ได้รับประกันว่าจะค้นหาได้อย่างครบถ้วน ดังนั้นอาจพลาดการจัดเรียงที่ดีที่สุดไปได้ แม้จะใช้ฟังก์ชันการให้คะแนนซึ่งในทางทฤษฎีแล้วจะสามารถระบุได้ก็ตาม ความรุนแรงของปัญหานี้ต่อการจับคู่โมเลกุลยังไม่ได้รับการยืนยันอย่างแน่ชัด
การประเมิน
ฟังก์ชันการให้คะแนน
เพื่อค้นหาคะแนนที่เป็นพื้นฐานที่สอดคล้องกันสำหรับการเลือกโครงสร้างที่ดีที่สุด จึงมีการศึกษาโดยใช้เกณฑ์มาตรฐาน (ดูด้านล่าง) ของกรณีปฏิสัมพันธ์ระหว่างโปรตีนกับโปรตีน ฟังก์ชันการให้คะแนนจะได้รับการประเมินจากอันดับที่กำหนดให้กับโครงสร้างที่ดีที่สุด (โดยอุดมคติแล้ว โครงสร้างที่ดีที่สุดควรอยู่ในอันดับที่ 1) และจากความครอบคลุม (สัดส่วนของกรณีเกณฑ์มาตรฐานที่ได้ผลลัพธ์ที่ยอมรับได้) ประเภทของคะแนนที่ศึกษา ได้แก่:
- คะแนน ฮิวริสติกส์อิงตามการสัมผัสของสารตกค้าง
- ความสมบูรณ์ของรูปทรงของพื้นผิวโมเลกุล ("สเตอริโอเคมี")
- พลังงานอิสระที่ประเมินโดยใช้พารามิเตอร์จากแบบจำลองแรงกลศาสตร์โมเลกุล เช่นCHARMMหรือAMBER
- ความเหมาะสมทางวิวัฒนาการของบริเวณที่เกิดปฏิสัมพันธ์
- สัมประสิทธิ์การจัดกลุ่ม
- สัญญาณที่อิงตามข้อมูล
โดยทั่วไปแล้ว การสร้างคะแนนแบบผสมจะทำได้โดยการรวมหมวดหมู่หนึ่งหรือมากกว่าหนึ่งหมวดหมู่ข้างต้นเข้าด้วยกันในรูปแบบผลรวมถ่วงน้ำหนัก ซึ่งน้ำหนักเหล่านั้นจะถูกปรับให้เหมาะสมที่สุดจากกรณีตัวอย่างในเกณฑ์มาตรฐาน เพื่อหลีกเลี่ยงอคติ กรณีตัวอย่างในเกณฑ์มาตรฐานที่ใช้ในการปรับน้ำหนักให้เหมาะสมที่สุดจะต้องไม่ซ้ำซ้อนกับกรณีตัวอย่างที่ใช้ในการทดสอบคะแนนขั้นสุดท้าย
เป้าหมายสูงสุดในการจับคู่โปรตีนกับโปรตีนคือการเลือกโซลูชันการจัดอันดับที่เหมาะสมที่สุดตามแผนการให้คะแนนซึ่งจะให้ข้อมูลเชิงลึกเกี่ยวกับความสัมพันธ์ของคอมเพล็กซ์ การพัฒนาดังกล่าวจะขับเคลื่อนวิศวกรรมโปรตีนในคอมพิวเตอร์ การออกแบบยาโดยใช้คอมพิวเตอร์ช่วยและ/หรือการระบุโปรตีนที่จับกันหรือไม่จับกันในปริมาณมาก (การระบุปฏิสัมพันธ์ ) มีการเสนอฟังก์ชันการให้คะแนนหลายฟังก์ชันสำหรับการทำนายความสัมพันธ์ในการจับกัน/พลังงานอิสระ[ 8 ] [ 9 ] [ 10 ] [ 11 ] [ 12 ]อย่างไรก็ตามพบว่าความสัมพันธ์ระหว่างความสัมพันธ์ในการจับกันที่กำหนดโดยการทดลองและการทำนายของฟังก์ชันการให้คะแนนที่ใช้กันทั่วไปเก้าฟังก์ชันนั้นเกือบจะเป็นตั้งฉากกัน (R 2 ~ 0) [ 13 ]นอกจากนี้ยังพบว่าส่วนประกอบบางอย่างของอัลกอริทึมการให้คะแนนอาจแสดงความสัมพันธ์ที่ดีกว่ากับพลังงานการจับกันจากการทดลองมากกว่าคะแนนทั้งหมด ซึ่งบ่งชี้ว่าอาจได้รับประสิทธิภาพที่ดีขึ้นอย่างมีนัยสำคัญโดยการรวมส่วนที่เหมาะสมจากอัลกอริทึมการให้คะแนนที่แตกต่างกัน วิธีการทดลองสำหรับการกำหนดความสัมพันธ์ในการจับ ได้แก่การเรโซแนนซ์พลาสมอนบนพื้นผิว (SPR), การถ่ายโอนพลังงานเรโซแนนซ์ของฟอร์ สเตอร์ , เทคนิคที่ใช้เร ดิโอลิแกนด์, แคลอริเมตรีไทเทรชันแบบไอโซเทอร์มอล (ITC), เทอร์โมโฟเรซิสระดับไมโคร (MST) หรือการวัดสเปกโทรสโกปีและเทคนิคการเรืองแสงอื่นๆ ข้อมูลที่เป็นข้อความจากบทความทางวิทยาศาสตร์สามารถให้เบาะแสที่เป็นประโยชน์สำหรับการให้คะแนนได้[ 14 ]
เกณฑ์มาตรฐาน
ได้มีการพัฒนาชุดข้อมูลมาตรฐานสำหรับการปฏิสัมพันธ์ระหว่างโปรตีนกับโปรตีนจำนวน 84 รายการที่มีโครงสร้างเชิงซ้อนที่ทราบแล้ว เพื่อใช้ในการทดสอบวิธีการด็อกกิ้ง[ 15 ]ชุดข้อมูลนี้ถูกเลือกเพื่อให้ครอบคลุมประเภทการปฏิสัมพันธ์ที่หลากหลาย และเพื่อหลีกเลี่ยงคุณลักษณะที่ซ้ำกัน เช่น โปรไฟล์ของตระกูลโครงสร้างของตัวโต้ตอบตาม ฐานข้อมูล SCOPองค์ประกอบของชุดข้อมูลมาตรฐานจะถูกจำแนกออกเป็นสามระดับความยาก (ระดับที่ยากที่สุดจะมีการเปลี่ยนแปลงในโครงสร้างกระดูกสันหลังมากที่สุด) ชุดข้อมูลมาตรฐานการด็อกกิ้งโปรตีนกับโปรตีนประกอบด้วยตัวอย่างของเอนไซม์-ตัวยับยั้ง แอนติเจน-แอนติบอดี และเชิงซ้อนโฮโมมัลติเมอริก
เกณฑ์มาตรฐานการจับคู่โปรตีน-โปรตีนเวอร์ชันล่าสุดประกอบด้วยคอมเพล็กซ์ 230 รายการ[ 16 ] เกณฑ์มาตรฐานการจับคู่โปรตีน-ดีเอ็นเอประกอบด้วยกรณีทดสอบ 47 กรณี[ 17 ]เกณฑ์มาตรฐานการจับคู่โปรตีน-อาร์เอ็นเอได้รับการจัดทำเป็นชุดข้อมูลของกรณีทดสอบที่ไม่ซ้ำกัน 45 กรณี[ 18 ]โดยมีคอมเพล็กซ์ที่ได้รับการแก้ไขโดยการ ตกผลึกด้วย รังสีเอกซ์เท่านั้น รวมถึงชุดข้อมูลเพิ่มเติมของกรณีทดสอบ 71 กรณีที่มีโครงสร้างที่ได้มาจากการสร้างแบบจำลองความคล้ายคลึงกันด้วย[ 19 ]เกณฑ์มาตรฐานโปรตีน-อาร์เอ็นเอได้รับการอัปเดตเพื่อรวมโครงสร้างเพิ่มเติมที่ได้รับการแก้ไขโดยการตกผลึกด้วยรังสีเอกซ์และขณะนี้ประกอบด้วยกรณีทดสอบ 126 กรณี[ 20 ]เกณฑ์มาตรฐานมีชุดข้อมูลรวมกันของคอมเพล็กซ์ 209 รายการ[ 21 ]
เกณฑ์มาตรฐานความสัมพันธ์ในการจับยึดได้รับการสร้างขึ้นจากเกณฑ์มาตรฐานการด็อกกิ้งโปรตีน-โปรตีน[ 13 ]คอมเพล็กซ์โปรตีน-โปรตีน 81 รายการที่มีความสัมพันธ์เชิงทดลองที่ทราบแล้วรวมอยู่ด้วย คอมเพล็กซ์เหล่านี้ครอบคลุมความสัมพันธ์มากกว่า 11 อันดับขนาด แต่ละรายการของเกณฑ์มาตรฐานประกอบด้วยพารามิเตอร์ทางชีวเคมีหลายตัวที่เกี่ยวข้องกับข้อมูลเชิงทดลอง พร้อมกับวิธีการที่ใช้ในการกำหนดความสัมพันธ์ เกณฑ์มาตรฐานนี้ใช้เพื่อประเมินขอบเขตที่ฟังก์ชันการให้คะแนนสามารถทำนายความสัมพันธ์ของคอมเพล็กซ์โมเลกุลขนาดใหญ่ได้
เกณฑ์มาตรฐานนี้ได้รับการตรวจสอบหลังการตีพิมพ์และขยายอย่างมีนัยสำคัญ[ 22 ]ชุดใหม่นี้มีความหลากหลายในแง่ของฟังก์ชันทางชีวภาพที่แสดง โดยมีคอมเพล็กซ์ที่เกี่ยวข้องกับโปรตีน G และโดเมนภายนอกเซลล์ของตัวรับ รวมถึงคอมเพล็กซ์แอนติเจน/แอนติบอดี เอนไซม์/ตัวยับยั้ง และเอนไซม์/ซับสเตรต นอกจากนี้ยังมีความหลากหลายในแง่ของความสัมพันธ์ระหว่างพันธมิตร โดยมีค่า K dอยู่ระหว่าง 10 −5ถึง 10 −14 M รายการเก้าคู่แสดงถึงคอมเพล็กซ์ที่เกี่ยวข้องอย่างใกล้ชิดซึ่งมีโครงสร้างคล้ายกัน แต่มีความสัมพันธ์ที่แตกต่างกันมาก โดยแต่ละคู่ประกอบด้วยการประกอบที่เข้าคู่กันและไม่เข้าคู่กัน เนื่องจากมีโครงสร้างที่ไม่ผูกพันของโปรตีนองค์ประกอบ จึงสามารถประเมินการเปลี่ยนแปลงโครงสร้างได้ การเปลี่ยนแปลงเหล่านี้มีความสำคัญในคอมเพล็กซ์ส่วนใหญ่ และมักพบการเคลื่อนไหวขนาดใหญ่หรือการเปลี่ยนจากความไม่เป็นระเบียบไปสู่ความเป็นระเบียบ ชุดนี้อาจใช้เพื่อเปรียบเทียบแบบจำลองทางชีวฟิสิกส์ที่มุ่งเชื่อมโยงความสัมพันธ์กับโครงสร้างในการโต้ตอบระหว่างโปรตีนกับโปรตีน โดยคำนึงถึงสารตั้งต้นและการเปลี่ยนแปลงโครงสร้างที่เกิดขึ้นพร้อมกับปฏิกิริยาการเชื่อมโยง แทนที่จะพิจารณาเฉพาะผลิตภัณฑ์สุดท้าย[ 22 ]
การประเมิน CAPRI
การประเมินเชิงวิพากษ์ของการคาดการณ์ปฏิสัมพันธ์[ 23 ]เป็นชุดเหตุการณ์ต่อเนื่องที่นักวิจัยทั่วทั้งชุมชนพยายามจับคู่โปรตีนเดียวกันตามที่ผู้ประเมินกำหนด รอบจะจัดขึ้นประมาณทุก 6 เดือน แต่ละรอบประกอบด้วยโปรตีน-โปรตีนเชิงซ้อนเป้าหมายระหว่างหนึ่งถึงหกตัว ซึ่งโครงสร้างได้รับการกำหนดขึ้นใหม่จากการทดลอง พิกัดและจะถูกเก็บไว้เป็นความลับโดยผู้ประเมิน โดยความร่วมมือกับนักชีววิทยาโครงสร้างที่กำหนดพิกัดเหล่านั้น การประเมินการส่งผลงานเป็นแบบปกปิดสองทาง
CAPRI ดึงดูดผู้เข้าร่วมจำนวนมาก (37 กลุ่มจากทั่วโลกเข้าร่วมในรอบที่เจ็ด) และได้รับความสนใจอย่างมากจากชุมชนชีววิทยาโดยทั่วไป แม้ว่าผลลัพธ์ของ CAPRI จะมีความสำคัญทางสถิติน้อยเนื่องจากจำนวนเป้าหมายในแต่ละรอบมีน้อย แต่บทบาทของ CAPRI ในการกระตุ้นการอภิปรายนั้นมีความสำคัญอย่างยิ่ง ( การประเมิน CASPเป็นแบบฝึกหัดที่คล้ายกันในสาขาการทำนายโครงสร้างโปรตีน)
ดูเพิ่มเติม
- สารประกอบชีวโมเลกุล – สารประกอบทางชีวภาพใดๆ ที่ประกอบด้วยโปรตีน อาร์เอ็นเอ ดีเอ็นเอ (บางครั้งอาจมีไขมันและคาร์โบไฮเดรต)
- การเชื่อมต่อโมเลกุล (Docking) – การเชื่อมต่อโมเลกุลขนาดเล็กกับโปรตีน
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การเชื่อมต่อโมเลกุลขนาดใหญ่
การเชื่อมต่อโมเลกุลขนาดใหญ่เป็นการสร้างแบบจำลองเชิงคำนวณของโครงสร้างควอเทอร์นารีของสารประกอบที่เกิดจากโมเลกุลชีวภาพขนาดใหญ่ที่โต้ตอบกันตั้งแต่สองโมเลกุลขึ้น ไป สารประกอบ โปรตีน
พื้นหลัง
บทบาท ทางชีววิทยา ของโปรตีนส่วนใหญ่ ซึ่งระบุได้จาก โมเลกุลขนาดใหญ่อื่นๆ ที่พวกมันมีปฏิสัมพันธ์ด้วยนั้น ยังไม่เป็นที่ทราบแน่ชัด แม้แต่โปรตีนที่เกี่ยวข้องกับ กระบวนการทางชีววิทยา ที่ได้รับการศึกษามาอย่างดี (เช่น วัฏจักรเครบส์ ) ก็อาจมีคู่ปฏิสัมพันธ์ที่ไม่คาดคิด...
ประวัติศาสตร์
ในช่วงทศวรรษ 1970 การสร้างแบบจำลองที่ซับซ้อนนั้นเกี่ยวข้องกับการระบุคุณลักษณะบนพื้นผิวของตัวโต้ตอบด้วยตนเอง และการตีความผลที่ตามมาสำหรับการจับ การทำงาน และกิจกรรม โดยทั่วไปแล้วโปรแกรมคอมพิวเตอร์จะถูกใช้ในตอนท้ายของกระบวนการสร้างแบบจำลอง...
การเชื่อมต่อแบบแข็ง กับ แบบยืดหยุ่น
หาก มุมพันธะ ความยาวพันธะ และมุมบิด ของส่วนประกอบต่างๆ ไม่เปลี่ยนแปลงในขั้นตอนใดๆ ของการสร้างสารประกอบเชิงซ้อน จะเรียกว่า การเชื่อมต่อแบบแข็ง (rigid body docking ) ประเด็นที่ถกเถียงกันคือ การเชื่อมต่อแบบแข็งนั้นเพียงพอสำหรับการเชื่อมต่อส่วนใหญ่หรือไม่...