ฐานข้อมูลการจำแนกโครงสร้างโปรตีน

Q: ข้อมูลสำคัญเกี่ยวกับ ฐานข้อมูลการจำแนกโครงสร้างโปรตีน

ฐานข้อมูล การจำแนกโครงสร้างโปรตีน (SCOP)เป็นการจำแนกโครงสร้างโดเมน โปรตีนด้วยตนเองเป็นส่วนใหญ่ โดยอาศัยความคล้ายคลึงกันของโครงสร้างและลำดับกรดอะมิโน

ขอบเขต
เนื้อหา
คำอธิบาย	ขอบเขต - ขยาย
ติดต่อ
ผู้เขียน	นาโอมิ เค. ฟ็อกซ์, สตีเวน อี. เบรนเนอร์ และ จอห์น-มาร์ค ชานโดเนีย
การอ้างอิงหลัก	PMID 24304899
เข้าถึง
เว็บไซต์	https://scop.berkeley.edu
เบ็ดเตล็ด
เวอร์ชั่น	2.07 (มีนาคม 2018; 276,231 โดเมนใน 87,224 โครงสร้างที่จัดอยู่ใน 4,919 ตระกูล)
นโยบายการคัดสรร	แบบแมนนวล (การจำแนกประเภทใหม่) และแบบอัตโนมัติ (โครงสร้างใหม่, BLAST )

สโคป
เนื้อหา
คำอธิบาย	การจำแนกโครงสร้างโปรตีน
ติดต่อ
ศูนย์วิจัย	ห้องปฏิบัติการชีววิทยาโมเลกุล
ผู้เขียน	Alexey G. Murzin, Steven E. Brenner, Tim JP Hubbard และ Cyrus Chothia
การอ้างอิงหลัก	PMID 7723011
วันที่วางจำหน่าย	พ.ศ. 2537
เข้าถึง
เว็บไซต์	http://scop.mrc-lmb.cam.ac.uk/scop/
เบ็ดเตล็ด
เวอร์ชั่น	1.75 (มิถุนายน 2552; 110,800 โดเมนใน 38,221 โครงสร้างที่จัดอยู่ใน 3,902 ตระกูล)
นโยบายการคัดสรร	คู่มือ

ฐานข้อมูล การจำแนกโครงสร้างโปรตีน (SCOP)เป็นการจำแนกโครงสร้างโดเมน โปรตีนด้วยตนเองเป็นส่วนใหญ่ โดยอาศัยความคล้ายคลึงกันของโครงสร้างและลำดับ กรดอะมิโน แรงจูงใจในการจำแนกประเภทนี้คือเพื่อหาความสัมพันธ์ทางวิวัฒนาการระหว่างโปรตีน โปรตีนที่มีรูปร่างเหมือนกันแต่มีความคล้ายคลึงกันของลำดับหรือหน้าที่น้อย จะถูกจัดอยู่ใน กลุ่มใหญ่ (superfamilies) ที่แตกต่างกัน และสันนิษฐานว่ามีบรรพบุรุษร่วมกันที่ห่างไกลมาก โปรตีนที่มีรูปร่างเหมือนกันและมีความคล้ายคลึงกันของลำดับและ/หรือหน้าที่บ้าง จะถูกจัดอยู่ใน "กลุ่ม (families)" เดียวกัน และสันนิษฐานว่ามีบรรพบุรุษร่วมกันที่ใกล้ชิดกว่า

เช่นเดียวกับ ฐานข้อมูล CATHและPfamฐานข้อมูล SCOP ให้การจำแนกประเภทของโดเมนโครงสร้าง แต่ละส่วน ของโปรตีน แทนที่จะเป็นการจำแนกประเภทของโปรตีนทั้งหมดซึ่งอาจประกอบด้วยโดเมนที่แตกต่างกันจำนวนมาก

ฐานข้อมูล SCOP สามารถเข้าถึงได้ฟรีทางอินเทอร์เน็ต SCOP ถูกสร้างขึ้นในปี 1994 ที่ศูนย์วิศวกรรมโปรตีนและห้องปฏิบัติการชีววิทยาโมเลกุล [ ^{3 ] ได้} รับการดูแลรักษาโดย Alexey G. Murzin และเพื่อนร่วมงานของเขาที่ศูนย์วิศวกรรมโปรตีนจนกระทั่งปิดตัวลงในปี 2010 และต่อมาที่ห้องปฏิบัติการชีววิทยาโมเลกุลในเคมบริดจ์ ประเทศอังกฤษ^{[ 4 ]}^{[ 5 ]}^{[ 6 ]}^{[ 1 ]}

การพัฒนา SCOP 1.75 ได้ยุติลงในปี 2014 นับตั้งแต่นั้นเป็นต้นมา ทีม SCOPe จาก UC Berkeley ได้รับผิดชอบในการอัปเดตฐานข้อมูลในลักษณะที่เข้ากันได้ โดยใช้การผสมผสานระหว่างวิธีการอัตโนมัติและวิธีการด้วยตนเอง ณ เดือนเมษายน 2019 เวอร์ชันล่าสุดคือ SCOPe 2.07 (มีนาคม 2018) ^{[ 2 ]}

ฐานข้อมูลการจำแนกโครงสร้างโปรตีนเวอร์ชัน 2 (SCOP2) ใหม่ได้รับการเผยแพร่เมื่อต้นปี 2020 การอัปเดตใหม่นี้มีโครงสร้างฐานข้อมูลที่ดีขึ้น API ใหม่ และส่วนติดต่อผู้ใช้บนเว็บที่ทันสมัยขึ้น นี่เป็นการอัปเดตที่สำคัญที่สุดของกลุ่มเคมบริดจ์นับตั้งแต่ SCOP 1.75 และสร้างขึ้นจากความก้าวหน้าในโครงสร้างจากต้นแบบ SCOP 2 ^{[ 7 ]}

องค์กรแบบลำดับชั้น

แหล่งที่มาของโครงสร้างโปรตีนคือProtein Data Bankหน่วยการจำแนกโครงสร้างใน SCOP คือโดเมนโปรตีนสิ่งที่ผู้เขียน SCOP หมายถึง "โดเมน" ได้รับการแนะนำจากคำกล่าวของพวกเขาที่ว่าโปรตีนขนาดเล็กและโปรตีนขนาดกลางส่วนใหญ่มีเพียงโดเมนเดียว^{[ 8 ]}และจากการสังเกตว่าฮีโมโกลบินของมนุษย์^{[ 9 ]}ซึ่งมีโครงสร้าง α ₂ β ₂ได้รับการกำหนดโดเมน SCOP สองโดเมน หนึ่งสำหรับซับยูนิต α และอีกหนึ่งสำหรับซับยูนิต β

ใน SCOP รูปทรงของโดเมนเรียกว่า "พับ" (folds) โดเมนที่อยู่ในพับเดียวกันจะมีโครงสร้างทุติยภูมิหลักเหมือนกัน จัดเรียงในลักษณะเดียวกัน และมีการเชื่อมต่อทางโทโพโลยีเหมือนกัน SCOP เวอร์ชัน 1.75 มีพับทั้งหมด 1195 แบบ พร้อมคำอธิบายสั้นๆ ของแต่ละพับ ตัวอย่างเช่น พับแบบ "คล้ายโกลบิน" อธิบายว่าแกนกลาง: 6 เฮลิกซ์; ใบพับ เปิดบางส่วนการระบุว่าโดเมนใดอยู่ในพับใดนั้น จะพิจารณาจากลักษณะที่ปรากฏ ไม่ใช่จากซอฟต์แวร์

ระดับต่างๆ ของ SCOP เวอร์ชัน 1.75 มีดังต่อไปนี้

หมวดหมู่ : ประเภทของการพับ เช่น แผ่นเบต้าชีท
การพับ: รูปทรงต่างๆ ของโดเมนภายในคลาส
ซูเปอร์แฟมิลี : โดเมนต่างๆ ในกลุ่มย่อยจะถูกจัดกลุ่มเป็นซูเปอร์แฟมิลี ซึ่งอย่างน้อยที่สุดก็ต้องมีบรรพบุรุษร่วมกันในระดับห่างไกล
กลุ่มโดเมน : โดเมนในซูเปอร์แฟมิลีจะถูกจัดกลุ่มเป็นแฟมิลี ซึ่งมีบรรพบุรุษร่วมกันในระยะใกล้กว่า
โดเมนโปรตีน: โดเมนในตระกูลต่างๆ จะถูกจัดกลุ่มเป็นโดเมนโปรตีน ซึ่งโดยพื้นฐานแล้วคือโปรตีนชนิดเดียวกัน
สายพันธุ์: โดเมนใน "โดเมนโปรตีน" จะถูกจัดกลุ่มตามสายพันธุ์
โดเมน: ส่วนหนึ่งของโปรตีน สำหรับโปรตีนอย่างง่าย โดเมนอาจเป็นโปรตีนทั้งหมดก็ได้

ชั้นเรียน

กลุ่มที่กว้างที่สุดใน SCOP เวอร์ชัน 1.75 คือกลุ่มโครงสร้างโปรตีน (protein fold classes ) กลุ่มเหล่านี้จัดกลุ่มโครงสร้างที่มีองค์ประกอบโครงสร้างทุติยภูมิคล้ายกัน แต่มีโครงสร้างตติยภูมิโดยรวมและต้นกำเนิดทางวิวัฒนาการที่แตกต่างกัน นี่คือ "ราก" ระดับสูงสุดของการจัดประเภทแบบลำดับชั้นของ SCOP

โปรตีนอัลฟาทั้งหมด [46456] (284): โดเมนที่ประกอบด้วยเกลียวอัลฟา
โปรตีนเบต้าทั้งหมด [48724] (174): โดเมนที่ประกอบด้วยแผ่นเบต้า
โปรตีนอัลฟาและเบตา (a/b) [51349] (147): ส่วนใหญ่เป็นแผ่นเบตาขนาน (หน่วยเบตา-อัลฟา-เบตา)
โปรตีนอัลฟาและเบตา (a+b) [53931] (376): ส่วนใหญ่ เป็นแผ่นเบตา แบบแอนติพาราเลล (บริเวณอัลฟาและเบตาที่แยกออกจากกัน)
โปรตีนหลายโดเมน (อัลฟาและเบตา) [56572] (66): โครงสร้างที่ประกอบด้วยโดเมนสองโดเมนขึ้นไปที่อยู่ในคลาสที่แตกต่างกัน
โปรตีนและเปปไทด์ของเยื่อหุ้มเซลล์ และพื้นผิวเซลล์ [56835] (58): ไม่รวมโปรตีนในระบบภูมิคุ้มกัน
โปรตีนขนาดเล็ก [56992] (90): โดยทั่วไปมักถูกครอบงำด้วยลิแกนด์โลหะโคแฟคเตอร์และ/หรือสะพานไดซัลไฟด์
โปรตีน ขดเกลียว [57942] (7): ไม่ใช่คลาสที่แท้จริง
โครงสร้างโปรตีนความละเอียดต่ำ [58117] (26): เปปไทด์และชิ้นส่วน ไม่ใช่คลาสที่แท้จริง
เปปไทด์ [58231] (121): เปปไทด์และชิ้นส่วน ไม่ใช่คลาสที่แท้จริง
โปรตีนที่ออกแบบ [58788] (44): โครงสร้างเชิงทดลองของโปรตีนที่มีลำดับที่ไม่เป็นธรรมชาติโดยพื้นฐาน ไม่ใช่คลาสที่แท้จริง

ตัวเลขในวงเล็บเหลี่ยม เรียกว่า "sunid" ซึ่งเป็น ตัวระบุ จำนวนเต็มที่ไม่ซ้ำ กัน ของ SCOP สำหรับแต่ละโหนดในลำดับชั้นของ SCOP ตัวเลขในวงเล็บแสดงจำนวนองค์ประกอบในแต่ละหมวดหมู่ ตัวอย่างเช่น มี 284 โฟลด์ในคลาส "โปรตีนอัลฟาทั้งหมด" สมาชิกแต่ละตัวในลำดับชั้นเป็นลิงก์ไปยังระดับถัดไปของลำดับชั้น

รอยพับ

แต่ละคลาสประกอบด้วยโครงสร้างพับที่แตกต่างกันหลายแบบ ระดับการจัดประเภทนี้บ่งชี้ถึงโครงสร้างตติยภูมิที่คล้ายคลึงกัน แต่ไม่จำเป็นต้องมีความสัมพันธ์ทางวิวัฒนาการ ตัวอย่างเช่น คลาส "โปรตีนอัลฟาทั้งหมด" ประกอบด้วยโครงสร้างพับที่แตกต่างกันมากกว่า 280 แบบ รวมถึง: โครงสร้างคล้าย โกลบิน (แกนกลาง: 6 เกลียว; พับเป็นรูปใบไม้ เปิดออกบางส่วน), โครงสร้างแฮร์พินอัลฟาแบบยาว (2 เกลียว; แฮร์พินแบบขนานตรงข้าม บิดซ้าย) และ โดเมน ด็อกเกอริน ประเภท I (การทำซ้ำแบบคู่ของลวดลายลูป-เกลียวที่จับแคลเซียมสองอัน ซึ่งแตกต่างจาก EF-hand)

ซูเปอร์แฟมิลี

โดเมนภายในโครงสร้างพับจะถูกจำแนกเพิ่มเติมออกเป็นซูเปอร์แฟมิลีซึ่งเป็นกลุ่มโปรตีนที่ใหญ่ที่สุดที่มีความคล้ายคลึงกันทางโครงสร้างเพียงพอที่จะบ่งชี้ถึงความสัมพันธ์ทางวิวัฒนาการและดังนั้นจึงมีบรรพบุรุษร่วมกัน อย่างไรก็ตาม สันนิษฐานว่าบรรพบุรุษนั้นอยู่ห่างไกล เนื่องจากสมาชิกที่แตกต่างกันในซูเปอร์แฟมิลีมีความเหมือนกันของลำดับ ต่ำ ตัวอย่างเช่น ซูเปอร์แฟมิลีสองกลุ่มของโครงสร้างพับแบบ "คล้ายโกลบิน" ได้แก่ซูเปอร์แฟมิลีโกลบินและซูเปอร์แฟมิลีเฟอร์เรดอกซินแบบอัลฟาเฮลิกซ์ (ประกอบด้วยคลัสเตอร์ Fe4-S4 สองคลัสเตอร์)

ครอบครัว

ตระกูลโปรตีนมีความสัมพันธ์ใกล้ชิดกันมากกว่าซูเปอร์แฟมิลี โดเมนจะถูกจัดอยู่ในตระกูลเดียวกันหากมีคุณสมบัติอย่างใดอย่างหนึ่งดังต่อไปนี้:

ความเหมือนของลำดับมากกว่า 30%
มีความเหมือนกันในลำดับบางส่วน (เช่น 15%) และทำหน้าที่เดียวกัน

ความคล้ายคลึงกันในลำดับและโครงสร้างเป็นหลักฐานที่แสดงว่าโปรตีนเหล่านี้มีความสัมพันธ์ทางวิวัฒนาการที่ใกล้ชิดกว่าโปรตีนในซูเปอร์แฟมิลีเดียวกัน เครื่องมือวิเคราะห์ลำดับ เช่นBLASTถูกใช้เพื่อช่วยในการจัดโดเมนเข้าสู่ซูเปอร์แฟมิลีและแฟมิลี ตัวอย่างเช่น แฟมิลีทั้งสี่ในซูเปอร์แฟมิลี "globin-like" ของโครงสร้าง "globin-like" ได้แก่ ฮีโมโกลบินแบบตัดทอน (ขาดเฮลิกซ์แรก) มินิฮีโมโกลบินเนื้อเยื่อประสาท (ขาดเฮลิกซ์แรก แต่โดยทั่วไปแล้วคล้ายกับโกลบินทั่วไปมากกว่าแบบตัดทอน) โกลบิน (โปรตีนที่จับกับฮีม) และ โปรตีน ไฟโคบิลิโซมที่คล้ายไฟโคไซยานิน (โอลิโกเมอร์ของซับยูนิตคล้ายโกลบินสองชนิดที่แตกต่างกันซึ่งมีเฮลิกซ์พิเศษสองอันที่ปลายN-terminusจับกับโครโมฟอร์บิลิิ น ) แต่ละแฟมิลีใน SCOP จะได้รับการกำหนดสตริงการจำแนกประเภทที่กระชับsccsโดยที่ตัวอักษรระบุคลาสที่โดเมนนั้นเป็นของ ตัวเลขจำนวนเต็มต่อไปนี้ระบุถึงกลุ่มย่อย กลุ่มใหญ่ และตระกูล ตามลำดับ (เช่น a.1.1.2 สำหรับตระกูล "Globin") ^[¹⁰^]

โดเมนรายการ PDB

"TaxId" คือหมายเลขประจำตัวของอนุกรมวิธาน และเชื่อมโยงไปยัง เบราว์เซอร์อนุกรมวิธาน ของ NCBIซึ่งให้ข้อมูลเพิ่มเติมเกี่ยวกับสายพันธุ์ที่โปรตีนนั้นเป็นของ การคลิกที่สายพันธุ์หรือไอโซฟอร์มจะแสดงรายการโดเมน ตัวอย่างเช่น โปรตีน "ฮีโมโกลบิน สายอัลฟาจากมนุษย์ (Homo sapiens)" มีโครงสร้างโปรตีนที่ได้รับการแก้ไขแล้วมากกว่า 190 โครงสร้าง เช่น 2dn3 (ซับซ้อนกับ cmo) และ 2dn1 (ซับซ้อนกับ hem, mbn, oxy) การคลิกที่ หมายเลข PDBควรจะแสดงโครงสร้างของโมเลกุล แต่ลิงก์ในปัจจุบันใช้งานไม่ได้ (ลิงก์ใช้งานได้ใน pre-SCOP)

ตัวอย่าง

หน้าเว็บส่วนใหญ่ใน SCOP มีช่องค้นหา การพิมพ์ "trypsin +human" จะแสดงโปรตีนหลายชนิด รวมถึงโปรตีน trypsinogen จากมนุษย์ การเลือกรายการนั้นจะแสดงหน้าเว็บที่มี "ลำดับวงศ์" ซึ่งอยู่ด้านบนสุดของหน้าเว็บส่วนใหญ่ใน SCOP

สายพันธุ์ไตรปโซโนเจนของมนุษย์

ราก: สโคป
ประเภท: โปรตีนเบต้าทั้งหมด [48724]
พับ: โปรตีเอสเซอรีนคล้ายไตรปซิน [50493]
ทรงกระบอกปิด; n=6, S=8; ลวดลายกรีก
การทำซ้ำ: ประกอบด้วยโดเมนสองโดเมนที่มีโครงสร้างพับแบบเดียวกัน
ซูเปอร์แฟมิลี: โปรตีเอสเซอรีนคล้ายไตรปซิน [50494]
ตระกูล: โปรตีเอสยูคาริโอติก [50514]
โปรตีน: ทริปซิน (โอเจน) [50515]
สายพันธุ์: มนุษย์ (Homo sapiens) [TaxId: 9606] [50519]

การค้นหา "Subtilisin" จะแสดงผลลัพธ์เป็นโปรตีน "Subtilisin จาก Bacillus subtilis, carlsberg" พร้อมด้วยสายพันธุ์ดังต่อไปนี้

ซับทิลิซินจากแบคทีเรีย Bacillus subtilis สายพันธุ์คาร์ลสเบิร์ก

ราก: สโคป
ประเภท: โปรตีนอัลฟาและเบตา (a/b) [51349]
ส่วนใหญ่เป็นแผ่นเบต้าแบบขนาน (หน่วยเบต้า-อัลฟา-เบต้า)
โครงสร้างพับ: คล้ายซับทิลิซิน [52742]
3 ชั้น: a/b/a, แผ่นเบต้าแบบขนาน 7 เส้น, ลำดับ 2314567; การเชื่อมต่อแบบไขว้ซ้ายระหว่างเส้นที่ 2 และ 3
ซูเปอร์แฟมิลี: คล้ายซับทิลิซิน [52743]
วงศ์: ซับทิเลส [52744]
โปรตีน: ซับทิลิซิน [52745]
สายพันธุ์: Bacillus subtilis, carlsberg [TaxId: 1423] [52746]

แม้ว่าโปรตีนทั้งสองชนิดนี้จะเป็นโปรตีเอสเหมือนกัน แต่พวกมันกลับไม่ได้อยู่ในโครงสร้างพับแบบเดียวกัน ซึ่งสอดคล้องกับการที่พวกมันเป็นตัวอย่างของวิวัฒนาการแบบลู่เข้า (convergent evolution )

เมื่อเปรียบเทียบกับระบบการจำแนกประเภทอื่นๆ

การจัดกลุ่ม SCOP นั้นพึ่งพาการตัดสินใจด้วยตนเองมากกว่าการจัดกลุ่มแบบกึ่งอัตโนมัติของCATHซึ่งเป็นคู่แข่งสำคัญ ความเชี่ยวชาญของมนุษย์ถูกนำมาใช้ในการตัดสินใจว่าโปรตีนบางชนิดมี ความสัมพันธ์ ทางวิวัฒนาการกันหรือไม่ และควรถูกจัดอยู่ในซูเปอร์แฟมิลี เดียวกัน หรือความคล้ายคลึงกันนั้นเป็นผลมาจากข้อจำกัดทางโครงสร้าง และดังนั้นจึงจัดอยู่ในกลุ่มพับ เดียวกัน ฐานข้อมูลอีกแห่งหนึ่งคือFSSPนั้นสร้างขึ้นโดยอัตโนมัติทั้งหมด (รวมถึงการอัปเดตอัตโนมัติเป็นประจำ) แต่ไม่มีการจัดกลุ่ม ทำให้ผู้ใช้สามารถสรุปความสำคัญของความสัมพันธ์ทางโครงสร้างได้ด้วยตนเอง โดยพิจารณาจากการเปรียบเทียบโครงสร้างโปรตีนแต่ละคู่

ผู้สืบทอด SCOP

ในปี 2009 ฐานข้อมูล SCOP ดั้งเดิมได้จำแนกรายการ PDB จำนวน 38,000 รายการด้วยตนเองลงในโครงสร้างลำดับชั้นที่เข้มงวด ด้วยอัตราการตีพิมพ์โครงสร้างโปรตีนที่เพิ่มขึ้นอย่างรวดเร็ว ระบบอัตโนมัติในการจำแนกประเภทที่มีจำกัดจึงไม่สามารถตามทันได้ ทำให้ชุดข้อมูลไม่ครอบคลุม ฐานข้อมูล Structural Classification of Proteins extended (SCOPe) ได้รับการเผยแพร่ในปี 2012 โดยมีระบบอัตโนมัติที่มากขึ้นในระบบลำดับชั้นเดียวกัน และสามารถใช้งานร่วมกับ SCOP เวอร์ชัน 1.75 ได้อย่างสมบูรณ์ ในปี 2014 ได้มีการนำการคัดกรองด้วยตนเองกลับมาใช้ใน SCOPe อีกครั้งเพื่อรักษาความถูกต้องของการกำหนดโครงสร้าง ณ เดือนกุมภาพันธ์ 2015 SCOPe 2.05 ได้จำแนกรายการ PDB จำนวน 71,000 รายการจากทั้งหมด 110,000 รายการ^{[ 11 ]}

ต้นแบบ SCOP2 เป็นเวอร์ชันเบต้าของการจำแนกโครงสร้างโปรตีนและระบบการจำแนกประเภทที่มุ่งเน้นความซับซ้อนเชิงวิวัฒนาการที่มีอยู่ในวิวัฒนาการโครงสร้างโปรตีน^{[ 12 ]} ดังนั้นจึงไม่ใช่ลำดับชั้นแบบง่ายๆ แต่เป็น เครือข่าย กราฟแบบไม่มีวงจรที่เชื่อมโยงซูเปอร์แฟมิลีของโปรตีนซึ่งแสดงถึงความสัมพันธ์เชิงโครงสร้างและวิวัฒนาการ เช่นการเรียงสับเปลี่ยนแบบวงกลมการรวมโดเมนและการสลายตัวของโดเมน ด้วยเหตุนี้ โดเมนจึงไม่ได้ถูกแยกออกจากกันด้วยขอบเขตคงที่ที่เข้มงวด แต่ถูกกำหนดโดยความสัมพันธ์กับโครงสร้างอื่นๆ ที่คล้ายคลึงกันมากที่สุด ต้นแบบนี้ถูกใช้ในการพัฒนาฐานข้อมูล SCOP เวอร์ชัน 2 ^{[ 7 ]} SCOP เวอร์ชัน 2 ซึ่งเผยแพร่ในเดือนมกราคม 2020 ประกอบด้วย 5134 ตระกูลและ 2485 ซูเปอร์แฟมิลี เมื่อเทียบกับ 3902 ตระกูลและ 1962 ซูเปอร์แฟมิลีใน SCOP 1.75 ระดับการจำแนกประเภทจัดระเบียบโดเมนที่ไม่ซ้ำกันมากกว่า 41,000 โดเมน ซึ่งแสดงถึงโครงสร้างโปรตีนมากกว่า 504,000 โครงสร้าง

ฐานข้อมูล Evolutionary Classification of Protein Domains (ECOD) ที่เผยแพร่ในปี 2014 มีลักษณะคล้ายกับการขยาย SCOPe ของ SCOP เวอร์ชัน 1.75 แต่แตกต่างจาก SCOPe ที่เข้ากันได้ตรงที่ ECOD เปลี่ยนชื่อลำดับชั้น class-fold-superfamily-family เป็น architecture-X-homology-topology-family (A-XHTF) โดยระดับสุดท้ายส่วนใหญ่กำหนดโดยPfamและเสริมด้วย การจัดกลุ่ม HHsearchสำหรับลำดับที่ยังไม่ได้จัดหมวดหมู่^{[ 13 ]} ECOD มีความครอบคลุม PDB ดีที่สุดในบรรดาผู้สืบทอดทั้งสามราย: ครอบคลุม โครงสร้าง PDB ทุกโครงสร้าง และมีการอัปเดตทุกสองสัปดาห์^{[ 14 ]}การแมปโดยตรงกับ Pfam ได้รับการพิสูจน์แล้วว่ามีประโยชน์สำหรับผู้ดูแล Pfam ที่ใช้หมวดหมู่ระดับ homology เพื่อเสริมการจัดกลุ่ม "clan" ของพวกเขา^{[ 15 ]}

ดูเพิ่มเติม

ลิงก์ภายนอก

การจำแนกโครงสร้างโปรตีน (SCOP 2) - การจำแนกโดเมนตัวแทนด้วยตนเอง ซึ่งได้รับการปรับปรุงอย่างสม่ำเสมอโดยผู้เขียน SCOP
การจำแนกโครงสร้างโปรตีน (SCOP 1.75) - เว็บไซต์ SCOP 1.75 เดิม ซึ่งไม่มีการอัปเดตอีกต่อไป
ระบบจำแนกโครงสร้างโปรตีนแบบขยาย (SCOPe) - ระบบที่พัฒนาต่อยอดจาก SCOP เวอร์ชัน 1.75 ซึ่งเป็นระบบอัตโนมัติมากขึ้น
การจำแนกประเภทโดเมนโปรตีนตามวิวัฒนาการ (ECOD) - การจำแนกประเภทตามวิวัฒนาการโดยใช้ SCOP เวอร์ชัน 1.75 และ Pfam
การจำแนกโครงสร้างโปรตีน 2 (ต้นแบบ SCOP2) - เว็บไซต์เดิมของต้นแบบ SCOP 2 ซึ่งไม่มีการอัปเดตอีกต่อไป
ซูเปอร์แฟมิลี - คลังข้อมูล HMM ที่แสดงถึงซูเปอร์แฟมิลีของ SCOP และฐานข้อมูลคำอธิบายประกอบ (ซูเปอร์แฟมิลีและแฟมิลี) สำหรับสิ่งมีชีวิตทั้งหมดที่ได้รับการจัดลำดับจีโนมอย่างสมบูรณ์
การจำแนกโครงสร้างโปรตีน - บทหนึ่งในหนังสือที่กล่าวถึงการจำแนกประเภทโปรตีนต่างๆ อย่างละเอียด

[ 1 ]

[ 2 ]

3 ] ได้

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]