อ่าน 7 นาที
ฐานข้อมูลการจำแนกโครงสร้างโปรตีน
ฐานข้อมูล การจำแนกโครงสร้างโปรตีน (SCOP)เป็นการจำแนกโครงสร้างโดเมน โปรตีนด้วยตนเองเป็นส่วนใหญ่ โดยอาศัยความคล้ายคลึงกันของโครงสร้างและลำดับกรดอะมิโน
ฐานข้อมูลการจำแนกโครงสร้างโปรตีน
![]() | |
| เนื้อหา | |
|---|---|
| คำอธิบาย | การจำแนกโครงสร้างโปรตีน |
| ติดต่อ | |
| ศูนย์วิจัย | ห้องปฏิบัติการชีววิทยาโมเลกุล |
| ผู้เขียน | Alexey G. Murzin, Steven E. Brenner, Tim JP Hubbard และ Cyrus Chothia |
| การอ้างอิงหลัก | PMID 7723011 |
| วันที่วางจำหน่าย | พ.ศ. 2537 |
| เข้าถึง | |
| เว็บไซต์ | http://scop.mrc-lmb.cam.ac.uk/scop/ |
| เบ็ดเตล็ด | |
| เวอร์ชั่น | 1.75 (มิถุนายน 2552; 110,800 โดเมนใน 38,221 โครงสร้างที่จัดอยู่ใน 3,902 ตระกูล) [ 1 ] |
| นโยบายการคัดสรร | คู่มือ |
| เนื้อหา | |
|---|---|
| คำอธิบาย | ขอบเขต - ขยาย |
| ติดต่อ | |
| ผู้เขียน | นาโอมิ เค. ฟ็อกซ์, สตีเวน อี. เบรนเนอร์ และ จอห์น-มาร์ค ชานโดเนีย |
| การอ้างอิงหลัก | PMID 24304899 |
| เข้าถึง | |
| เว็บไซต์ | https://scop.berkeley.edu |
| เบ็ดเตล็ด | |
| เวอร์ชั่น | 2.07 (มีนาคม 2018; 276,231 โดเมนใน 87,224 โครงสร้างที่จัดอยู่ใน 4,919 ตระกูล) [ 2 ] |
| นโยบายการคัดสรร | แบบแมนนวล (การจำแนกประเภทใหม่) และแบบอัตโนมัติ (โครงสร้างใหม่, BLAST ) |
ฐานข้อมูล การจำแนกโครงสร้างโปรตีน (SCOP)เป็นการจำแนกโครงสร้างโดเมน โปรตีนด้วยตนเองเป็นส่วนใหญ่ โดยอาศัยความคล้ายคลึงกันของโครงสร้างและลำดับกรดอะมิโน แรงจูงใจในการจำแนกประเภทนี้คือเพื่อหาความสัมพันธ์ทางวิวัฒนาการระหว่างโปรตีน โปรตีนที่มีรูปร่างเหมือนกันแต่มีความคล้ายคลึงกันของลำดับหรือหน้าที่น้อย จะถูกจัดอยู่ใน กลุ่มใหญ่ (superfamilies) ที่แตกต่างกัน และสันนิษฐานว่ามีบรรพบุรุษร่วมกันที่ห่างไกลมาก โปรตีนที่มีรูปร่างเหมือนกันและมีความคล้ายคลึงกันของลำดับและ/หรือหน้าที่บ้าง จะถูกจัดอยู่ใน "กลุ่ม (families)" เดียวกัน และสันนิษฐานว่ามีบรรพบุรุษร่วมกันที่ใกล้ชิดกว่า
เช่นเดียวกับ ฐานข้อมูล CATHและPfamฐานข้อมูล SCOP ให้การจำแนกประเภทของโดเมนโครงสร้าง แต่ละส่วน ของโปรตีน แทนที่จะเป็นการจำแนกประเภทของโปรตีนทั้งหมดซึ่งอาจประกอบด้วยโดเมนที่แตกต่างกันจำนวนมาก
ฐานข้อมูล SCOP สามารถเข้าถึงได้ฟรีทางอินเทอร์เน็ต SCOP ถูกสร้างขึ้นในปี 1994 ที่ศูนย์วิศวกรรมโปรตีนและห้องปฏิบัติการชีววิทยาโมเลกุล [ 3 ] ได้ รับการดูแลรักษาโดย Alexey G. Murzin และเพื่อนร่วมงานของเขาที่ศูนย์วิศวกรรมโปรตีนจนกระทั่งปิดตัวลงในปี 2010 และต่อมาที่ห้องปฏิบัติการชีววิทยาโมเลกุลในเคมบริดจ์ ประเทศอังกฤษ[ 4 ] [ 5 ] [ 6 ] [ 1 ]
การพัฒนา SCOP 1.75 ได้ยุติลงในปี 2014 นับตั้งแต่นั้นเป็นต้นมา ทีม SCOPe จาก UC Berkeley ได้รับผิดชอบในการอัปเดตฐานข้อมูลในลักษณะที่เข้ากันได้ โดยใช้การผสมผสานระหว่างวิธีการอัตโนมัติและวิธีการด้วยตนเอง ณ เดือนเมษายน 2019 เวอร์ชันล่าสุดคือ SCOPe 2.07 (มีนาคม 2018) [ 2 ]
ฐานข้อมูลการจำแนกโครงสร้างโปรตีนเวอร์ชัน 2 (SCOP2) ใหม่ได้รับการเผยแพร่เมื่อต้นปี 2020 การอัปเดตใหม่นี้มีโครงสร้างฐานข้อมูลที่ดีขึ้น API ใหม่ และส่วนติดต่อผู้ใช้บนเว็บที่ทันสมัยขึ้น นี่เป็นการอัปเดตที่สำคัญที่สุดของกลุ่มเคมบริดจ์นับตั้งแต่ SCOP 1.75 และสร้างขึ้นจากความก้าวหน้าในโครงสร้างจากต้นแบบ SCOP 2 [ 7 ]
องค์กรแบบลำดับชั้น
แหล่งที่มาของโครงสร้างโปรตีนคือProtein Data Bankหน่วยการจำแนกโครงสร้างใน SCOP คือโดเมนโปรตีนสิ่งที่ผู้เขียน SCOP หมายถึง "โดเมน" ได้รับการแนะนำจากคำกล่าวของพวกเขาที่ว่าโปรตีนขนาดเล็กและโปรตีนขนาดกลางส่วนใหญ่มีเพียงโดเมนเดียว[ 8 ]และจากการสังเกตว่าฮีโมโกลบินของมนุษย์[ 9 ]ซึ่งมีโครงสร้าง α 2 β 2ได้รับการกำหนดโดเมน SCOP สองโดเมน หนึ่งสำหรับซับยูนิต α และอีกหนึ่งสำหรับซับยูนิต β
ใน SCOP รูปทรงของโดเมนเรียกว่า "พับ" (folds) โดเมนที่อยู่ในพับเดียวกันจะมีโครงสร้างทุติยภูมิหลักเหมือนกัน จัดเรียงในลักษณะเดียวกัน และมีการเชื่อมต่อทางโทโพโลยีเหมือนกัน SCOP เวอร์ชัน 1.75 มีพับทั้งหมด 1195 แบบ พร้อมคำอธิบายสั้นๆ ของแต่ละพับ ตัวอย่างเช่น พับแบบ "คล้ายโกลบิน" อธิบายว่าแกนกลาง: 6 เฮลิกซ์; ใบพับ เปิดบางส่วนการระบุว่าโดเมนใดอยู่ในพับใดนั้น จะพิจารณาจากลักษณะที่ปรากฏ ไม่ใช่จากซอฟต์แวร์
ระดับต่างๆ ของ SCOP เวอร์ชัน 1.75 มีดังต่อไปนี้
- หมวดหมู่ : ประเภทของการพับ เช่น แผ่นเบต้าชีท
- การพับ: รูปทรงต่างๆ ของโดเมนภายในคลาส
- ซูเปอร์แฟมิลี : โดเมนต่างๆ ในกลุ่มย่อยจะถูกจัดกลุ่มเป็นซูเปอร์แฟมิลี ซึ่งอย่างน้อยที่สุดก็ต้องมีบรรพบุรุษร่วมกันในระดับห่างไกล
- กลุ่มโดเมน : โดเมนในซูเปอร์แฟมิลีจะถูกจัดกลุ่มเป็นแฟมิลี ซึ่งมีบรรพบุรุษร่วมกันในระยะใกล้กว่า
- โดเมนโปรตีน: โดเมนในตระกูลต่างๆ จะถูกจัดกลุ่มเป็นโดเมนโปรตีน ซึ่งโดยพื้นฐานแล้วคือโปรตีนชนิดเดียวกัน
- สายพันธุ์: โดเมนใน "โดเมนโปรตีน" จะถูกจัดกลุ่มตามสายพันธุ์
- โดเมน: ส่วนหนึ่งของโปรตีน สำหรับโปรตีนอย่างง่าย โดเมนอาจเป็นโปรตีนทั้งหมดก็ได้
ชั้นเรียน
กลุ่มที่กว้างที่สุดใน SCOP เวอร์ชัน 1.75 คือกลุ่มโครงสร้างโปรตีน (protein fold classes ) กลุ่มเหล่านี้จัดกลุ่มโครงสร้างที่มีองค์ประกอบโครงสร้างทุติยภูมิคล้ายกัน แต่มีโครงสร้างตติยภูมิโดยรวมและต้นกำเนิดทางวิวัฒนาการที่แตกต่างกัน นี่คือ "ราก" ระดับสูงสุดของการจัดประเภทแบบลำดับชั้นของ SCOP
- โปรตีนอัลฟาทั้งหมด [46456] (284): โดเมนที่ประกอบด้วยเกลียวอัลฟา
- โปรตีนเบต้าทั้งหมด [48724] (174): โดเมนที่ประกอบด้วยแผ่นเบต้า
- โปรตีนอัลฟาและเบตา (a/b) [51349] (147): ส่วนใหญ่เป็นแผ่นเบตาขนาน (หน่วยเบตา-อัลฟา-เบตา)
- โปรตีนอัลฟาและเบตา (a+b) [53931] (376): ส่วนใหญ่ เป็นแผ่นเบตา แบบแอนติพาราเลล (บริเวณอัลฟาและเบตาที่แยกออกจากกัน)
- โปรตีนหลายโดเมน (อัลฟาและเบตา) [56572] (66): โครงสร้างที่ประกอบด้วยโดเมนสองโดเมนขึ้นไปที่อยู่ในคลาสที่แตกต่างกัน
- โปรตีนและเปปไทด์ของเยื่อหุ้มเซลล์ และพื้นผิวเซลล์ [56835] (58): ไม่รวมโปรตีนในระบบภูมิคุ้มกัน
- โปรตีนขนาดเล็ก [56992] (90): โดยทั่วไปมักถูกครอบงำด้วยลิแกนด์โลหะโคแฟคเตอร์และ/หรือสะพานไดซัลไฟด์
- โปรตีน ขดเกลียว [57942] (7): ไม่ใช่คลาสที่แท้จริง
- โครงสร้างโปรตีนความละเอียดต่ำ [58117] (26): เปปไทด์และชิ้นส่วน ไม่ใช่คลาสที่แท้จริง
- เปปไทด์ [58231] (121): เปปไทด์และชิ้นส่วน ไม่ใช่คลาสที่แท้จริง
- โปรตีนที่ออกแบบ [58788] (44): โครงสร้างเชิงทดลองของโปรตีนที่มีลำดับที่ไม่เป็นธรรมชาติโดยพื้นฐาน ไม่ใช่คลาสที่แท้จริง
ตัวเลขในวงเล็บเหลี่ยม เรียกว่า "sunid" ซึ่งเป็น ตัวระบุ จำนวนเต็มที่ไม่ซ้ำ กัน ของ SCOP สำหรับแต่ละโหนดในลำดับชั้นของ SCOP ตัวเลขในวงเล็บแสดงจำนวนองค์ประกอบในแต่ละหมวดหมู่ ตัวอย่างเช่น มี 284 โฟลด์ในคลาส "โปรตีนอัลฟาทั้งหมด" สมาชิกแต่ละตัวในลำดับชั้นเป็นลิงก์ไปยังระดับถัดไปของลำดับชั้น
รอยพับ
แต่ละคลาสประกอบด้วยโครงสร้างพับที่แตกต่างกันหลายแบบ ระดับการจัดประเภทนี้บ่งชี้ถึงโครงสร้างตติยภูมิที่คล้ายคลึงกัน แต่ไม่จำเป็นต้องมีความสัมพันธ์ทางวิวัฒนาการ ตัวอย่างเช่น คลาส "โปรตีนอัลฟาทั้งหมด" ประกอบด้วยโครงสร้างพับที่แตกต่างกันมากกว่า 280 แบบ รวมถึง: โครงสร้างคล้าย โกลบิน (แกนกลาง: 6 เกลียว; พับเป็นรูปใบไม้ เปิดออกบางส่วน), โครงสร้างแฮร์พินอัลฟาแบบยาว (2 เกลียว; แฮร์พินแบบขนานตรงข้าม บิดซ้าย) และ โดเมน ด็อกเกอริน ประเภท I (การทำซ้ำแบบคู่ของลวดลายลูป-เกลียวที่จับแคลเซียมสองอัน ซึ่งแตกต่างจาก EF-hand)
ซูเปอร์แฟมิลี
โดเมนภายในโครงสร้างพับจะถูกจำแนกเพิ่มเติมออกเป็นซูเปอร์แฟมิลีซึ่งเป็นกลุ่มโปรตีนที่ใหญ่ที่สุดที่มีความคล้ายคลึงกันทางโครงสร้างเพียงพอที่จะบ่งชี้ถึงความสัมพันธ์ทางวิวัฒนาการและดังนั้นจึงมีบรรพบุรุษร่วมกัน อย่างไรก็ตาม สันนิษฐานว่าบรรพบุรุษนั้นอยู่ห่างไกล เนื่องจากสมาชิกที่แตกต่างกันในซูเปอร์แฟมิลีมีความเหมือนกันของลำดับ ต่ำ ตัวอย่างเช่น ซูเปอร์แฟมิลีสองกลุ่มของโครงสร้างพับแบบ "คล้ายโกลบิน" ได้แก่ซูเปอร์แฟมิลีโกลบินและซูเปอร์แฟมิลีเฟอร์เรดอกซินแบบอัลฟาเฮลิกซ์ (ประกอบด้วยคลัสเตอร์ Fe4-S4 สองคลัสเตอร์)
ครอบครัว
ตระกูลโปรตีนมีความสัมพันธ์ใกล้ชิดกันมากกว่าซูเปอร์แฟมิลี โดเมนจะถูกจัดอยู่ในตระกูลเดียวกันหากมีคุณสมบัติอย่างใดอย่างหนึ่งดังต่อไปนี้:
- ความเหมือนของลำดับมากกว่า 30%
- มีความเหมือนกันในลำดับบางส่วน (เช่น 15%) และทำหน้าที่เดียวกัน
ความคล้ายคลึงกันในลำดับและโครงสร้างเป็นหลักฐานที่แสดงว่าโปรตีนเหล่านี้มีความสัมพันธ์ทางวิวัฒนาการที่ใกล้ชิดกว่าโปรตีนในซูเปอร์แฟมิลีเดียวกัน เครื่องมือวิเคราะห์ลำดับ เช่นBLASTถูกใช้เพื่อช่วยในการจัดโดเมนเข้าสู่ซูเปอร์แฟมิลีและแฟมิลี ตัวอย่างเช่น แฟมิลีทั้งสี่ในซูเปอร์แฟมิลี "globin-like" ของโครงสร้าง "globin-like" ได้แก่ ฮีโมโกลบินแบบตัดทอน (ขาดเฮลิกซ์แรก) มินิฮีโมโกลบินเนื้อเยื่อประสาท (ขาดเฮลิกซ์แรก แต่โดยทั่วไปแล้วคล้ายกับโกลบินทั่วไปมากกว่าแบบตัดทอน) โกลบิน (โปรตีนที่จับกับฮีม) และ โปรตีน ไฟโคบิลิโซมที่คล้ายไฟโคไซยานิน (โอลิโกเมอร์ของซับยูนิตคล้ายโกลบินสองชนิดที่แตกต่างกันซึ่งมีเฮลิกซ์พิเศษสองอันที่ปลายN-terminusจับกับโครโมฟอร์บิลิิน ) แต่ละแฟมิลีใน SCOP จะได้รับการกำหนดสตริงการจำแนกประเภทที่กระชับsccsโดยที่ตัวอักษรระบุคลาสที่โดเมนนั้นเป็นของ ตัวเลขจำนวนเต็มต่อไปนี้ระบุถึงกลุ่มย่อย กลุ่มใหญ่ และตระกูล ตามลำดับ (เช่น a.1.1.2 สำหรับตระกูล "Globin") [ 10 ]
โดเมนรายการ PDB
"TaxId" คือหมายเลขประจำตัวของอนุกรมวิธาน และเชื่อมโยงไปยัง เบราว์เซอร์อนุกรมวิธาน ของ NCBIซึ่งให้ข้อมูลเพิ่มเติมเกี่ยวกับสายพันธุ์ที่โปรตีนนั้นเป็นของ การคลิกที่สายพันธุ์หรือไอโซฟอร์มจะแสดงรายการโดเมน ตัวอย่างเช่น โปรตีน "ฮีโมโกลบิน สายอัลฟาจากมนุษย์ (Homo sapiens)" มีโครงสร้างโปรตีนที่ได้รับการแก้ไขแล้วมากกว่า 190 โครงสร้าง เช่น 2dn3 (ซับซ้อนกับ cmo) และ 2dn1 (ซับซ้อนกับ hem, mbn, oxy) การคลิกที่ หมายเลข PDBควรจะแสดงโครงสร้างของโมเลกุล แต่ลิงก์ในปัจจุบันใช้งานไม่ได้ (ลิงก์ใช้งานได้ใน pre-SCOP)
ตัวอย่าง
หน้าเว็บส่วนใหญ่ใน SCOP มีช่องค้นหา การพิมพ์ "trypsin +human" จะแสดงโปรตีนหลายชนิด รวมถึงโปรตีน trypsinogen จากมนุษย์ การเลือกรายการนั้นจะแสดงหน้าเว็บที่มี "ลำดับวงศ์" ซึ่งอยู่ด้านบนสุดของหน้าเว็บส่วนใหญ่ใน SCOP
- สายพันธุ์ไตรปโซโนเจนของมนุษย์
- ราก: สโคป
- ประเภท: โปรตีนเบต้าทั้งหมด [48724]
- พับ: โปรตีเอสเซอรีนคล้ายไตรปซิน [50493]
- ทรงกระบอกปิด; n=6, S=8; ลวดลายกรีก
- การทำซ้ำ: ประกอบด้วยโดเมนสองโดเมนที่มีโครงสร้างพับแบบเดียวกัน
- ซูเปอร์แฟมิลี: โปรตีเอสเซอรีนคล้ายไตรปซิน [50494]
- ตระกูล: โปรตีเอสยูคาริโอติก [50514]
- โปรตีน: ทริปซิน (โอเจน) [50515]
- สายพันธุ์: มนุษย์ (Homo sapiens) [TaxId: 9606] [50519]
การค้นหา "Subtilisin" จะแสดงผลลัพธ์เป็นโปรตีน "Subtilisin จาก Bacillus subtilis, carlsberg" พร้อมด้วยสายพันธุ์ดังต่อไปนี้
- ซับทิลิซินจากแบคทีเรีย Bacillus subtilis สายพันธุ์คาร์ลสเบิร์ก
- ราก: สโคป
- ประเภท: โปรตีนอัลฟาและเบตา (a/b) [51349]
- ส่วนใหญ่เป็นแผ่นเบต้าแบบขนาน (หน่วยเบต้า-อัลฟา-เบต้า)
- โครงสร้างพับ: คล้ายซับทิลิซิน [52742]
- 3 ชั้น: a/b/a, แผ่นเบต้าแบบขนาน 7 เส้น, ลำดับ 2314567; การเชื่อมต่อแบบไขว้ซ้ายระหว่างเส้นที่ 2 และ 3
- ซูเปอร์แฟมิลี: คล้ายซับทิลิซิน [52743]
- วงศ์: ซับทิเลส [52744]
- โปรตีน: ซับทิลิซิน [52745]
- สายพันธุ์: Bacillus subtilis, carlsberg [TaxId: 1423] [52746]
แม้ว่าโปรตีนทั้งสองชนิดนี้จะเป็นโปรตีเอสเหมือนกัน แต่พวกมันกลับไม่ได้อยู่ในโครงสร้างพับแบบเดียวกัน ซึ่งสอดคล้องกับการที่พวกมันเป็นตัวอย่างของวิวัฒนาการแบบลู่เข้า (convergent evolution )
เมื่อเปรียบเทียบกับระบบการจำแนกประเภทอื่นๆ
การจัดกลุ่ม SCOP นั้นพึ่งพาการตัดสินใจด้วยตนเองมากกว่าการจัดกลุ่มแบบกึ่งอัตโนมัติของCATHซึ่งเป็นคู่แข่งสำคัญ ความเชี่ยวชาญของมนุษย์ถูกนำมาใช้ในการตัดสินใจว่าโปรตีนบางชนิดมี ความสัมพันธ์ ทางวิวัฒนาการกันหรือไม่ และควรถูกจัดอยู่ในซูเปอร์แฟมิลี เดียวกัน หรือความคล้ายคลึงกันนั้นเป็นผลมาจากข้อจำกัดทางโครงสร้าง และดังนั้นจึงจัดอยู่ในกลุ่มพับ เดียวกัน ฐานข้อมูลอีกแห่งหนึ่งคือFSSPนั้นสร้างขึ้นโดยอัตโนมัติทั้งหมด (รวมถึงการอัปเดตอัตโนมัติเป็นประจำ) แต่ไม่มีการจัดกลุ่ม ทำให้ผู้ใช้สามารถสรุปความสำคัญของความสัมพันธ์ทางโครงสร้างได้ด้วยตนเอง โดยพิจารณาจากการเปรียบเทียบโครงสร้างโปรตีนแต่ละคู่
ผู้สืบทอด SCOP
ในปี 2009 ฐานข้อมูล SCOP ดั้งเดิมได้จำแนกรายการ PDB จำนวน 38,000 รายการด้วยตนเองลงในโครงสร้างลำดับชั้นที่เข้มงวด ด้วยอัตราการตีพิมพ์โครงสร้างโปรตีนที่เพิ่มขึ้นอย่างรวดเร็ว ระบบอัตโนมัติในการจำแนกประเภทที่มีจำกัดจึงไม่สามารถตามทันได้ ทำให้ชุดข้อมูลไม่ครอบคลุม ฐานข้อมูล Structural Classification of Proteins extended (SCOPe) ได้รับการเผยแพร่ในปี 2012 โดยมีระบบอัตโนมัติที่มากขึ้นในระบบลำดับชั้นเดียวกัน และสามารถใช้งานร่วมกับ SCOP เวอร์ชัน 1.75 ได้อย่างสมบูรณ์ ในปี 2014 ได้มีการนำการคัดกรองด้วยตนเองกลับมาใช้ใน SCOPe อีกครั้งเพื่อรักษาความถูกต้องของการกำหนดโครงสร้าง ณ เดือนกุมภาพันธ์ 2015 SCOPe 2.05 ได้จำแนกรายการ PDB จำนวน 71,000 รายการจากทั้งหมด 110,000 รายการ[ 11 ]
ต้นแบบ SCOP2 เป็นเวอร์ชันเบต้าของการจำแนกโครงสร้างโปรตีนและระบบการจำแนกประเภทที่มุ่งเน้นความซับซ้อนเชิงวิวัฒนาการที่มีอยู่ในวิวัฒนาการโครงสร้างโปรตีน[ 12 ] ดังนั้นจึงไม่ใช่ลำดับชั้นแบบง่ายๆ แต่เป็น เครือข่าย กราฟแบบไม่มีวงจรที่เชื่อมโยงซูเปอร์แฟมิลีของโปรตีนซึ่งแสดงถึงความสัมพันธ์เชิงโครงสร้างและวิวัฒนาการ เช่นการเรียงสับเปลี่ยนแบบวงกลมการรวมโดเมนและการสลายตัวของโดเมน ด้วยเหตุนี้ โดเมนจึงไม่ได้ถูกแยกออกจากกันด้วยขอบเขตคงที่ที่เข้มงวด แต่ถูกกำหนดโดยความสัมพันธ์กับโครงสร้างอื่นๆ ที่คล้ายคลึงกันมากที่สุด ต้นแบบนี้ถูกใช้ในการพัฒนาฐานข้อมูล SCOP เวอร์ชัน 2 [ 7 ] SCOP เวอร์ชัน 2 ซึ่งเผยแพร่ในเดือนมกราคม 2020 ประกอบด้วย 5134 ตระกูลและ 2485 ซูเปอร์แฟมิลี เมื่อเทียบกับ 3902 ตระกูลและ 1962 ซูเปอร์แฟมิลีใน SCOP 1.75 ระดับการจำแนกประเภทจัดระเบียบโดเมนที่ไม่ซ้ำกันมากกว่า 41,000 โดเมน ซึ่งแสดงถึงโครงสร้างโปรตีนมากกว่า 504,000 โครงสร้าง
ฐานข้อมูล Evolutionary Classification of Protein Domains (ECOD) ที่เผยแพร่ในปี 2014 มีลักษณะคล้ายกับการขยาย SCOPe ของ SCOP เวอร์ชัน 1.75 แต่แตกต่างจาก SCOPe ที่เข้ากันได้ตรงที่ ECOD เปลี่ยนชื่อลำดับชั้น class-fold-superfamily-family เป็น architecture-X-homology-topology-family (A-XHTF) โดยระดับสุดท้ายส่วนใหญ่กำหนดโดยPfamและเสริมด้วย การจัดกลุ่ม HHsearchสำหรับลำดับที่ยังไม่ได้จัดหมวดหมู่[ 13 ] ECOD มีความครอบคลุม PDB ดีที่สุดในบรรดาผู้สืบทอดทั้งสามราย: ครอบคลุม โครงสร้าง PDB ทุกโครงสร้าง และมีการอัปเดตทุกสองสัปดาห์[ 14 ]การแมปโดยตรงกับ Pfam ได้รับการพิสูจน์แล้วว่ามีประโยชน์สำหรับผู้ดูแล Pfam ที่ใช้หมวดหมู่ระดับ homology เพื่อเสริมการจัดกลุ่ม "clan" ของพวกเขา[ 15 ]
ดูเพิ่มเติม
ลิงก์ภายนอก
- การจำแนกโครงสร้างโปรตีน (SCOP 2) - การจำแนกโดเมนตัวแทนด้วยตนเอง ซึ่งได้รับการปรับปรุงอย่างสม่ำเสมอโดยผู้เขียน SCOP
- การจำแนกโครงสร้างโปรตีน (SCOP 1.75) - เว็บไซต์ SCOP 1.75 เดิม ซึ่งไม่มีการอัปเดตอีกต่อไป
- ระบบจำแนกโครงสร้างโปรตีนแบบขยาย (SCOPe) - ระบบที่พัฒนาต่อยอดจาก SCOP เวอร์ชัน 1.75 ซึ่งเป็นระบบอัตโนมัติมากขึ้น
- การจำแนกประเภทโดเมนโปรตีนตามวิวัฒนาการ (ECOD) - การจำแนกประเภทตามวิวัฒนาการโดยใช้ SCOP เวอร์ชัน 1.75 และ Pfam
- การจำแนกโครงสร้างโปรตีน 2 (ต้นแบบ SCOP2) - เว็บไซต์เดิมของต้นแบบ SCOP 2 ซึ่งไม่มีการอัปเดตอีกต่อไป
- ซูเปอร์แฟมิลี - คลังข้อมูล HMM ที่แสดงถึงซูเปอร์แฟมิลีของ SCOP และฐานข้อมูลคำอธิบายประกอบ (ซูเปอร์แฟมิลีและแฟมิลี) สำหรับสิ่งมีชีวิตทั้งหมดที่ได้รับการจัดลำดับจีโนมอย่างสมบูรณ์
- การจำแนกโครงสร้างโปรตีน - บทหนึ่งในหนังสือที่กล่าวถึงการจำแนกประเภทโปรตีนต่างๆ อย่างละเอียด
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ฐานข้อมูลการจำแนกโครงสร้างโปรตีน
ฐานข้อมูล การจำแนกโครงสร้างโปรตีน (SCOP)เป็นการจำแนกโครงสร้างโดเมน โปรตีนด้วยตนเองเป็นส่วนใหญ่ โดยอาศัยความคล้ายคลึงกันของโครงสร้างและลำดับกรดอะมิโน
องค์กรแบบลำดับชั้น
แหล่งที่มาของโครงสร้างโปรตีนคือ Protein Data Bank หน่วยการจำแนกโครงสร้างใน SCOP คือ โดเมนโปรตีน สิ่งที่ผู้เขียน SCOP หมายถึง "โดเมน" ได้รับการแนะนำจากคำกล่าวของพวกเขาที่ว่าโปรตีนขนาดเล็กและโปรตีนขนาดกลางส่วนใหญ่มีเพียงโดเมนเดียว [ 8 ]...
ชั้นเรียน
กลุ่มที่กว้างที่สุดใน SCOP เวอร์ชัน 1.75 คือ กลุ่มโครงสร้างโปรตีน (protein fold classes ) กลุ่มเหล่านี้จัดกลุ่มโครงสร้างที่มีองค์ประกอบโครงสร้างทุติยภูมิคล้ายกัน แต่มีโครงสร้างตติยภูมิโดยรวมและต้นกำเนิดทางวิวัฒนาการที่แตกต่างกัน นี่คือ "ราก"...
รอยพับ
แต่ละคลาสประกอบด้วยโครงสร้างพับที่แตกต่างกันหลายแบบ ระดับการจัดประเภทนี้บ่งชี้ถึงโครงสร้างตติยภูมิที่คล้ายคลึงกัน แต่ไม่จำเป็นต้องมีความสัมพันธ์ทางวิวัฒนาการ ตัวอย่างเช่น คลาส "โปรตีนอัลฟาทั้งหมด" ประกอบด้วยโครงสร้างพับที่แตกต่างกันมากกว่า 280 แบบ รวมถึง:...
