อ่าน 7 นาที
บลอสซัม
ใน ชีวสารสนเทศศาสตร์ เมท ริกซ์ BLOSUM (BLOCKS SUBSTION M ATRIX ) เป็น เมท ริก ซ์การแทนที่ ที่ใช้สำหรับ การ จัด เรียงลำดับ โปรตีน เมท ริก ซ์ BLOSUM...
บลอสซัม

ในชีวสารสนเทศศาสตร์ เมท ริกซ์ BLOSUM (BLOCKS SUBSTION M ATRIX )เป็นเมทริกซ์การแทนที่ที่ใช้สำหรับ การ จัดเรียงลำดับโปรตีน เมท ริกซ์ BLOSUM ใช้ในการให้คะแนนการจัดเรียงระหว่าง ลำดับ โปรตีนที่แตกต่างกันในเชิงวิวัฒนาการโดยอิงจากการจัดเรียงแบบโลคอล เมทริกซ์ BLOSUM ได้รับการแนะนำครั้งแรกในบทความโดยSteven Henikoffและ Jorja Henikoff [ 1 ]พวกเขาสแกนฐานข้อมูล BLOCKSเพื่อหาบริเวณที่มีการอนุรักษ์ สูงมาก ของตระกูลโปรตีน (ที่ไม่มีช่องว่างในการจัดเรียงลำดับ) จากนั้นนับความถี่สัมพัทธ์ของกรดอะมิโนและความน่าจะเป็นของการแทนที่ จากนั้น พวกเขาคำนวณ คะแนน log-oddsสำหรับแต่ละคู่การแทนที่ที่เป็นไปได้ 210 คู่ของกรดอะมิโนมาตรฐาน 20 ชนิด เมทริกซ์ BLOSUM ทั้งหมดอิงจากการจัดเรียงที่สังเกตได้ ไม่ได้ขยายจากการเปรียบเทียบโปรตีนที่เกี่ยวข้องอย่างใกล้ชิดเหมือนกับ เมทริก ซ์ PAM
ภูมิหลังทางชีววิทยา
คำสั่งทางพันธุกรรมของเซลล์ ที่จำลองตัวเองทุกเซลล์ ในสิ่งมีชีวิตนั้นบรรจุอยู่ในดีเอ็นเอ[ 2 ]ตลอดช่วงชีวิตของเซลล์ ข้อมูลนี้จะถูกถอดรหัสและจำลองโดยกลไกของเซลล์เพื่อสร้างโปรตีนหรือเพื่อให้คำแนะนำแก่เซลล์ลูกในระหว่างการแบ่งเซลล์และมีความเป็นไปได้ที่ดีเอ็นเอจะถูกเปลี่ยนแปลงในระหว่างกระบวนการเหล่านี้[ 2 ] [ 3 ]ซึ่งเรียกว่าการกลายพันธุ์ในระดับโมเลกุล มีระบบควบคุมที่แก้ไขการเปลี่ยนแปลงส่วนใหญ่ — แต่ไม่ใช่ทั้งหมด — ของดีเอ็นเอก่อนที่จะถูกจำลอง[ 3 ] [ 4 ]
การทำงานของโปรตีนขึ้นอยู่กับโครงสร้างของมันเป็นอย่างมาก[ 5 ]การเปลี่ยนแปลงกรดอะมิโนเพียงตัวเดียวในโปรตีนอาจลดความสามารถในการทำงาน หรือการกลายพันธุ์อาจเปลี่ยนแปลงหน้าที่ที่โปรตีนทำอยู่ก็ได้[ 3 ]การเปลี่ยนแปลงเช่นนี้อาจส่งผลกระทบอย่างรุนแรงต่อการทำงานที่สำคัญในเซลล์ ซึ่งอาจทำให้เซลล์ — และในกรณีที่รุนแรง อาจทำให้สิ่งมีชีวิต — ตายได้[ 6 ]ในทางกลับกัน การเปลี่ยนแปลงอาจทำให้เซลล์ยังคงทำงานต่อไปได้แม้ว่าจะแตกต่างออกไป และการกลายพันธุ์สามารถส่งต่อไปยังลูกหลานของสิ่งมีชีวิตได้ หากการเปลี่ยนแปลงนี้ไม่ส่งผลให้เกิดข้อเสียทางกายภาพที่สำคัญใดๆ ต่อลูกหลาน ก็มีความเป็นไปได้ที่การกลายพันธุ์นี้จะคงอยู่ภายในประชากร นอกจากนี้ยังมีความเป็นไปได้ที่การเปลี่ยนแปลงในการทำงานจะกลายเป็นประโยชน์
กรดอะมิโน 20 ชนิดที่ถูกแปลโดยรหัสพันธุกรรม นั้น มีความแตกต่างกันอย่างมากในด้านคุณสมบัติทางกายภาพและเคมีของโซ่ข้าง[ 5 ]อย่างไรก็ตาม กรดอะมิโนเหล่านี้สามารถจัดกลุ่มได้เป็นกลุ่มที่มีคุณสมบัติทางกายภาพและเคมีที่คล้ายคลึงกัน[ 5 ]การแทนที่กรดอะมิโนด้วยกรดอะมิโนอีกชนิดหนึ่งจากกลุ่มเดียวกันมีแนวโน้มที่จะส่งผลกระทบต่อโครงสร้างและหน้าที่ของโปรตีนน้อยกว่าการแทนที่ด้วยกรดอะมิโนจากกลุ่มที่แตกต่างกัน
การจัดเรียงลำดับเป็นวิธีการวิจัยพื้นฐานสำหรับชีววิทยาสมัยใหม่ การจัดเรียงลำดับโปรตีนที่พบได้บ่อยที่สุดคือการค้นหาความคล้ายคลึงกันระหว่างลำดับที่แตกต่างกันเพื่ออนุมานหน้าที่หรือสร้างความสัมพันธ์เชิงวิวัฒนาการ ซึ่งช่วยให้นักวิจัยเข้าใจที่มาและหน้าที่ของยีนได้ดีขึ้นผ่านธรรมชาติของความเหมือนกันและการอนุรักษ์เมทริกซ์การแทนที่ถูกนำมาใช้ในอัลกอริทึมเพื่อคำนวณความคล้ายคลึงกันของลำดับโปรตีนที่แตกต่างกัน อย่างไรก็ตาม ประโยชน์ของ เมทริกซ์ Dayhoff PAMลดลงเมื่อเวลาผ่านไปเนื่องจากความต้องการลำดับที่มีความคล้ายคลึงกันมากกว่า 85% เพื่อเติมเต็มช่องว่างนี้Henikoffและ Henikoff ได้แนะนำเมทริกซ์ BLOSUM (BLOcks SUbstitution Matrix) ซึ่งนำไปสู่การปรับปรุงอย่างเห็นได้ชัดในการจัดเรียงและการค้นหาโดยใช้แบบสอบถามจากแต่ละกลุ่มของโปรตีนที่เกี่ยวข้อง[ 1 ]
ศัพท์เฉพาะ
- บลอสซัม
- เมทริกซ์การแทนที่บล็อก (Blocks Substitution Matrix ) คือเมทริกซ์ที่ใช้สำหรับการจัดเรียงลำดับของโปรตีน
- เกณฑ์การให้คะแนน (ทางสถิติเทียบกับทางชีววิทยา)
- เมื่อประเมินการจัดเรียงลำดับ เราต้องการทราบว่ามีความหมายมากน้อยเพียงใด ซึ่งต้องใช้เมทริกซ์การให้คะแนน หรือตารางค่าที่อธิบายความน่าจะเป็นของการเกิดคู่กรดอะมิโนหรือนิวคลีโอไทด์ที่มีความหมายทางชีววิทยาในการจัดเรียง คะแนนสำหรับแต่ละตำแหน่งได้มาจากความถี่ของการแทนที่ในบล็อกของการจัดเรียงลำดับโปรตีนในระดับท้องถิ่น[ 7 ]
- บลอสซัม อาร์
- เมทริกซ์ที่สร้างขึ้นจากบล็อกที่มีความคล้ายคลึงกันน้อยกว่า r%
- ตัวอย่างเช่น BLOSUM62 คือเมทริกซ์ที่สร้างขึ้นโดยใช้ลำดับที่มีความคล้ายคลึงกันน้อยกว่า 62% (ลำดับที่มีความเหมือนกัน ≥ 62% จะถูกจัดกลุ่มเข้าด้วยกัน)
- หมายเหตุ: BLOSUM 62 เป็นเมทริกซ์เริ่มต้นสำหรับ BLAST โปรตีน การทดลองแสดงให้เห็นว่าเมทริกซ์ BLOSUM-62 เป็นหนึ่งในเมทริกซ์ที่ดีที่สุดสำหรับการตรวจจับความคล้ายคลึงของโปรตีนที่อ่อนแอที่สุด[ 1 ]
มีเมทริกซ์ BLOSUM หลายชุดที่ใช้ฐานข้อมูลการจัดเรียงลำดับที่แตกต่างกัน โดยตั้งชื่อตามตัวเลข เมทริกซ์ BLOSUM ที่มีตัวเลขสูงออกแบบมาเพื่อเปรียบเทียบลำดับที่ใกล้เคียงกัน ในขณะที่เมทริกซ์ที่มีตัวเลขต่ำออกแบบมาเพื่อเปรียบเทียบลำดับที่ห่างไกลกัน ตัวอย่างเช่น BLOSUM80 ใช้สำหรับการจัดเรียงลำดับที่ใกล้เคียงกัน และ BLOSUM45 ใช้สำหรับการจัดเรียงลำดับที่ห่างไกลกันมากขึ้น เมทริกซ์เหล่านี้สร้างขึ้นโดยการรวม (จัดกลุ่ม) ลำดับทั้งหมดที่มีความคล้ายคลึงกันมากกว่าเปอร์เซ็นต์ที่กำหนดไว้เป็นลำดับเดียว จากนั้นจึงเปรียบเทียบเฉพาะลำดับเหล่านั้น (ซึ่งทั้งหมดมีความแตกต่างกันมากกว่าค่าเปอร์เซ็นต์ที่กำหนด) เท่านั้น ซึ่งจะช่วยลดการมีส่วนร่วมของลำดับที่ใกล้เคียงกันลง เปอร์เซ็นต์ที่ใช้จะถูกเพิ่มต่อท้ายชื่อ เช่น BLOSUM80 ซึ่งหมายถึงการจัดกลุ่มลำดับที่มีความเหมือนกันมากกว่า 80%
การสร้างเมทริกซ์ BLOSUM
เมทริกซ์ BLOSUM ได้รับจากการใช้บล็อกของลำดับกรดอะมิโนที่คล้ายกันเป็นข้อมูล จากนั้นใช้วิธีการทางสถิติกับข้อมูลเพื่อหาคะแนนความคล้ายคลึง ขั้นตอนวิธีการทางสถิติ: [ 8 ]
การกำจัดลำดับ
กำจัดลำดับที่มีความเหมือนกันมากกว่า r% มีสองวิธีในการกำจัดลำดับ คือ การลบลำดับออกจากบล็อก หรือการค้นหาลำดับที่คล้ายกันและแทนที่ด้วยลำดับใหม่ที่สามารถเป็นตัวแทนของคลัสเตอร์ได้ การกำจัดทำขึ้นเพื่อลบลำดับโปรตีนที่มีความคล้ายคลึงกันมากกว่าเกณฑ์ที่กำหนดไว้
การคำนวณความถี่และความน่าจะเป็น
ฐานข้อมูลที่จัดเก็บการจัดเรียงลำดับของบริเวณที่มีการอนุรักษ์มากที่สุดในตระกูลโปรตีน การจัดเรียงเหล่านี้ใช้ในการสร้างเมทริกซ์ BLOSUM โดยจะใช้เฉพาะลำดับที่มีเปอร์เซ็นต์ความเหมือนต่ำกว่าเกณฑ์เท่านั้น โดยใช้บล็อกในการนับคู่ของกรดอะมิโนในแต่ละคอลัมน์ของการจัดเรียงหลายลำดับ
อัตราส่วนลอการิทึมของอัตราต่อรอง
ค่านี้แสดงอัตราส่วนของการเกิดขึ้นของแต่ละคู่กรดอะมิโนในข้อมูลที่สังเกตได้ เทียบกับค่าที่คาดหวังของการเกิดขึ้นของคู่กรดอะมิโนนั้น ๆ โดยจะปัดเศษและนำไปใช้ในเมทริกซ์การแทนที่
โดยที่คือความน่าจะเป็นของการสังเกตเห็นคู่ดังกล่าว และคือความน่าจะเป็นที่คาดหวังของการเกิดคู่ดังกล่าว โดยพิจารณาจากความน่าจะเป็นพื้นฐานของกรดอะมิโนแต่ละชนิด
เมทริกซ์บลอสซัม
อัตราต่อรองของความสัมพันธ์ทางสายเลือดคำนวณจากอัตราส่วนลอการิทึมของอัตราต่อรอง จากนั้นจึงปัดเศษเพื่อให้ได้เมทริกซ์ทดแทนหรือเมทริกซ์ BLOSUM
คะแนนของเมทริกซ์ BLOSUM
เมทริกซ์การให้คะแนนหรือตารางค่าจำเป็นสำหรับการประเมินความสำคัญของการจัดเรียงลำดับ เช่น การอธิบายความน่าจะเป็นของการเกิดคู่กรดอะมิโนหรือนิวคลีโอไทด์ที่มีความหมายทางชีววิทยาในการจัดเรียง โดยทั่วไป เมื่อเปรียบเทียบลำดับนิวคลีโอไทด์สองลำดับ สิ่งที่ให้คะแนนคือว่าเบสสองตัวเหมือนกันหรือไม่ที่ตำแหน่งหนึ่ง การจับคู่และการไม่ตรงกันทั้งหมดจะได้รับคะแนนเดียวกัน (โดยทั่วไป +1 หรือ +5 สำหรับการจับคู่ และ -1 หรือ -4 สำหรับการไม่ตรงกัน) [ 9 ]แต่สำหรับโปรตีนนั้นแตกต่างออกไป เมทริกซ์การแทนที่สำหรับกรดอะมิโนมีความซับซ้อนมากขึ้นและโดยปริยายจะคำนึงถึงทุกสิ่งที่อาจส่งผลต่อความถี่ที่กรดอะมิโนใด ๆ ถูกแทนที่ด้วยกรดอะมิโนอื่น วัตถุประสงค์คือการกำหนดบทลงโทษที่ค่อนข้างหนักสำหรับการจัดเรียงสารตกค้างสองตัวเข้าด้วยกันหากมีความน่าจะเป็นต่ำที่จะเป็นโฮโมล็อก (จัดเรียงอย่างถูกต้องโดยการสืบเชื้อสายทางวิวัฒนาการ) แรงสำคัญสองประการที่ผลักดันอัตราการแทนที่กรดอะมิโนให้เบี่ยงเบนจากความสม่ำเสมอ ได้แก่ การแทนที่เกิดขึ้นด้วยความถี่ที่แตกต่างกัน และยอมรับการทำงานได้น้อยกว่าการแทนที่อื่นๆ ดังนั้น การแทนที่จึงถูกคัดเลือกให้ลดลง[ 7 ]
เมทริกซ์การแทนที่ที่ใช้กันทั่วไป ได้แก่ เมทริกซ์การแทนที่แบบบล็อก (BLOSUM) [ 1 ]และเมทริกซ์การกลายพันธุ์ที่ยอมรับจุด (PAM) [ 10 ] [ 11 ]ทั้งสองเมทริกซ์นี้ใช้ชุดการจัดเรียงที่มีความเชื่อมั่นสูงของโปรตีนที่คล้ายคลึงกันจำนวนมาก และประเมินความถี่ของการแทนที่ทั้งหมด แต่คำนวณโดยใช้วิธีการที่แตกต่างกัน[ 7 ]
คะแนนภายใน BLOSUM คือคะแนนลอการิทึมของอัตราส่วนความน่าจะเป็นที่กรดอะมิโนสองชนิดจะปรากฏขึ้นในความหมายทางชีววิทยาและความน่าจะเป็นที่กรดอะมิโนชนิดเดียวกันจะปรากฏขึ้นโดยบังเอิญ เมทริกซ์เหล่านี้สร้างขึ้นจากเปอร์เซ็นต์ความเหมือนขั้นต่ำของลำดับโปรตีนที่จัดเรียงที่ใช้ในการคำนวณ[ 12 ]ความเหมือนหรือการแทนที่ที่เป็นไปได้ทั้งหมดจะได้รับคะแนนตามความถี่ที่สังเกตได้ในการจัดเรียงโปรตีนที่เกี่ยวข้อง[ 13 ]คะแนนบวกจะมอบให้กับการแทนที่ที่มีโอกาสเกิดขึ้นมากกว่า ในขณะที่คะแนนลบจะมอบให้กับการแทนที่ที่มีโอกาสเกิดขึ้นน้อยกว่า
ในการคำนวณเมทริกซ์ BLOSUM จะใช้สมการต่อไปนี้:
ในที่นี้คือความน่าจะเป็นที่กรดอะมิโนสองชนิดและจะแทนที่กันในลำดับโฮโมล็อก และและคือความน่าจะเป็นพื้นฐานของการพบกรดอะมิโนและในลำดับโปรตีนใดๆ ตัวประกอบคือตัวปรับขนาด ซึ่งกำหนดไว้เพื่อให้เมทริกซ์ประกอบด้วยค่าจำนวนเต็มที่คำนวณได้ง่าย
ตัวแปร
บลอสซัม
BLOSUM80: โปรตีนที่เกี่ยวข้องเพิ่มเติม
BLOSUM62: ระดับกลาง
BLOSUM45: โปรตีนที่มีความสัมพันธ์ห่างไกลกัน
เมทริกซ์ BLOSUM62 ที่มีกรดอะมิโนในตารางจัดกลุ่มตามเคมีของโซ่ข้าง ดังใน (a) แต่ละค่าในเมทริกซ์คำนวณโดยการหารความถี่ของการเกิดคู่กรดอะมิโนในฐานข้อมูล BLOCKS ซึ่งจัดกลุ่มที่ระดับ 62% หารด้วยความน่าจะเป็นที่กรดอะมิโนสองตัวเดียวกันอาจเรียงตัวกันโดยบังเอิญ จากนั้นอัตราส่วนจะถูกแปลงเป็นลอการิทึมและแสดงเป็นคะแนนลอการิทึมของอัตราต่อรอง เช่นเดียวกับ PAM เมทริกซ์ BLOSUM มักจะถูกปรับขนาดในหน่วยครึ่งบิต[ 14 ]คะแนนศูนย์บ่งชี้ว่าความถี่ที่พบกรดอะมิโนสองตัวที่กำหนดเรียงตัวกันในฐานข้อมูลเป็นไปตามที่คาดไว้โดยบังเอิญ ในขณะที่คะแนนบวกบ่งชี้ว่าพบการเรียงตัวกันบ่อยกว่าโดยบังเอิญ และคะแนนลบบ่งชี้ว่าพบการเรียงตัวกันน้อยกว่าโดยบังเอิญ
พีเอ็มบี
PMB (Probability Matrix from Blocks) ปี 2004 ใช้คุณสมบัติการบวกของระยะทางวิวัฒนาการเพื่อปรับปรุงการวิเคราะห์ฐานข้อมูล BLOCKS ของ BLOSUM เวอร์ชัน BLOCKS ปี 2001 ที่ทันสมัยที่สุดถูกนำมาใช้เพื่อสร้างชุดเมทริกซ์ BLOSUM ใหม่ "ความถี่การแทนที่ที่สังเกตได้" ที่พบในเมทริกซ์ BLOSUM เหล่านี้ถูกนำมาใช้เพื่อประมาณความถี่การแทนที่จริง (ด้วยระยะทางวิวัฒนาการที่สูงขึ้น กล่าวคือr ที่ต่ำกว่า การแทนที่ในภายหลังบางส่วนอาจบดบังการแทนที่ก่อนหน้านี้) ดังนั้น PMB จึงกำหนดแบบจำลองวิวัฒนาการที่แท้จริงเช่นเดียวกับ PAM และ JTT มันไม่ใช่เมทริกซ์สมมาตร[ 15 ]
อาร์บโลซัม
รหัสต้นฉบับที่เขียนโดย Henikoff และ Henikoff ไม่ได้ทำงานตรงตามคำอธิบายของเอกสารของพวกเขา[ 1 ] เกี่ยวกับอัลก อริทึม BLOSUM62 จากโปรแกรมดังกล่าวถูกใช้เป็นมาตรฐานมานานหลายปีแล้ว น่าประหลาดใจที่ BLOSUM62 ที่คำนวณผิดพลาดกลับช่วยปรับปรุงประสิทธิภาพการค้นหาเมื่อเทียบกับเวอร์ชันที่แก้ไขในปี 2008 ของเอนโทรปีสัมพัทธ์เดียวกัน (RBLOSUM64) [ 16 ]
บทความปี 2018 อ้างว่า RBLOSUM ดีกว่า BLOSUM และ CorBLOSUM [ 17 ]
คอร์บลอสซัม
เอกสารปี 2016 พบข้อผิดพลาดเพิ่มเติมในโค้ดต้นฉบับที่ไม่ได้แก้ไขโดยการแก้ไข RBLOSUM ปี 2008 เวอร์ชันที่แก้ไขจากเอกสารนี้ CorBLOSUM สามารถทำการค้นหาความคล้ายคลึงได้อย่างมีประสิทธิภาพมากกว่า BLOSUM ในประมาณ 75% ของกรณี[ 18 ]
การใช้งานบางอย่างในชีวสารสนเทศ
การประยุกต์ใช้ในการวิจัย
คะแนน BLOSUM ถูกนำมาใช้เพื่อทำนายและทำความเข้าใจตัวแปรยีนพื้นผิวในผู้ติดเชื้อไวรัสตับอักเสบ B [ 19 ]และเอพิโทปของเซลล์ T [ 20 ]
ยีนผิวเซลล์ที่แตกต่างกันในผู้ติดเชื้อไวรัสตับอักเสบ บี
ลำดับดีเอ็นเอของ HBsAg ได้รับจากผู้ป่วย 180 ราย โดย 51 รายเป็นพาหะ HBV เรื้อรัง และ 129 รายเป็นผู้ป่วยที่ได้รับการวินิจฉัยใหม่ และเปรียบเทียบกับลำดับคอนเซนซัสที่สร้างขึ้นจากลำดับ HBV 168 ลำดับที่นำเข้าจากGenBankการตรวจสอบวรรณกรรมและคะแนน BLOSUM ถูกนำมาใช้เพื่อกำหนดแอนติเจนิกที่อาจเปลี่ยนแปลงไป[ 19 ]
การทำนายอีพิโทปของเซลล์ T ได้อย่างน่าเชื่อถือ
มีการพัฒนาการนำเสนอข้อมูลเข้าแบบใหม่ซึ่งประกอบด้วยการผสมผสานระหว่างการเข้ารหัสแบบเบาบาง การเข้ารหัสแบบ Blosum และข้อมูลเข้าที่ได้มาจากแบบจำลอง Markov ที่ซ่อนอยู่ วิธีนี้ทำนายอีพิโทปของเซลล์ T สำหรับจีโนมของไวรัสตับอักเสบซี และอภิปรายการประยุกต์ใช้ที่เป็นไปได้ของวิธีการทำนายเพื่อเป็นแนวทางในกระบวนการออกแบบวัคซีนอย่างมีเหตุผล[ 20 ]
ใช้ใน BLAST
เมทริกซ์ BLOSUM ยังใช้เป็นเมทริกซ์การให้คะแนนเมื่อเปรียบเทียบลำดับ DNA หรือลำดับโปรตีนเพื่อตัดสินคุณภาพของการจัดเรียง ระบบการให้คะแนนรูปแบบนี้ถูกใช้โดยซอฟต์แวร์การ จัดเรียงหลากหลายประเภท รวมถึงBLAST [ 21 ]
การเปรียบเทียบ PAM และ BLOSUM
นอกจากเมทริกซ์ BLOSUM แล้ว ยังสามารถใช้เมทริกซ์การให้คะแนนที่พัฒนาขึ้นก่อนหน้านี้ได้อีกด้วย ซึ่งเรียกว่าPAMทั้งสองให้ผลลัพธ์การให้คะแนนเหมือนกัน แต่ใช้วิธีการที่แตกต่างกัน BLOSUM พิจารณาการกลายพันธุ์ในโมทีฟของลำดับที่เกี่ยวข้องโดยตรง ในขณะที่ PAM คาดการณ์ข้อมูลวิวัฒนาการโดยอิงจากลำดับที่เกี่ยวข้องอย่างใกล้ชิด[ 1 ]
เนื่องจากทั้ง PAM และ BLOSUM เป็นวิธีการที่แตกต่างกันในการแสดงข้อมูลการให้คะแนนเดียวกัน จึงสามารถเปรียบเทียบทั้งสองได้ แต่เนื่องจากวิธีการได้มาซึ่งคะแนนนี้แตกต่างกันมาก PAM100 จึงไม่เท่ากับ BLOSUM100 [ 22 ]
| แพม | บลอสซัม |
|---|---|
| พีเอ็ม100 | บลอสซัม90 |
| พีเอ็ม120 | บลอสซัม80 |
| พีเอเอ็ม160 | บลอสซัม62 |
| พีเอเอ็ม200 | บลอสซัม50 |
| พีเอเอ็ม250 | บลอสซัม45 |
ความสัมพันธ์ระหว่าง PAM และ BLOSUM
| แพม | บลอสซัม |
|---|---|
| เพื่อเปรียบเทียบลำดับที่มีความใกล้เคียงกันมาก จึงมีการสร้างเมทริกซ์ PAM ที่มีหมายเลขน้อยกว่า | เพื่อเปรียบเทียบลำดับที่มีความใกล้เคียงกันมาก จึงมีการสร้างเมทริกซ์ BLOSUM ที่มีค่าตัวเลขสูงกว่า |
| ในการเปรียบเทียบโปรตีนที่มีความสัมพันธ์ห่างไกลกัน จะมีการสร้างเมทริกซ์ PAM ที่มีค่าสูง | ในการเปรียบเทียบโปรตีนที่มีความสัมพันธ์ห่างไกลกัน จะมีการสร้างเมทริกซ์ BLOSUM ที่มีค่าตัวเลขต่ำ |
ความแตกต่างระหว่าง PAM และ BLOSUM
| แพม | บลอสซัม |
|---|---|
| โดยอิงจากการจัดเรียงลำดับทั่วโลกของโปรตีนที่มีความสัมพันธ์ใกล้เคียงกัน | อ้างอิงจากการจัดเรียงในระดับท้องถิ่น |
| PAM1 คือเมทริกซ์ที่คำนวณจากการเปรียบเทียบลำดับที่มีความแตกต่างกันไม่เกิน 1% แต่สอดคล้องกับลำดับที่เหมือนกัน 99% | BLOSUM 62 คือเมทริกซ์ที่คำนวณจากการเปรียบเทียบลำดับที่มีความเหมือนกันเป็นคู่ๆ ไม่เกิน 62% |
| เมทริกซ์ PAM อื่นๆ ได้มาจากการประมาณค่าจาก PAM1 | ข้อมูลเหล่านี้ได้มาจากการจัดเรียงลำดับที่สังเกตได้ ไม่ได้มาจากการเปรียบเทียบโปรตีนที่มีความสัมพันธ์ใกล้เคียงกัน |
| ตัวเลขที่สูงกว่าในระบบการตั้งชื่อเมทริกซ์แสดงถึงระยะห่างทางวิวัฒนาการที่มากขึ้น | ตัวเลขที่มากขึ้นในแผนการตั้งชื่อเมทริกซ์แสดงถึงความคล้ายคลึงของลำดับที่สูงขึ้น และด้วยเหตุนี้ระยะทางวิวัฒนาการจึงน้อยลง[ 23 ] |
ความพร้อมใช้งาน
เวอร์ชัน "อ้างอิง" ของ BLOSUM พบได้ใน ชุดเครื่องมือ NCBIทั้งชุดเครื่องมือ NCBI C Toolkit รุ่นเก่า (ที่เลิกใช้แล้ว) และชุดเครื่องมือ NCBI C++ Toolkit รุ่นปัจจุบันมีเมทริกซ์ BLOSUM45, BLOSUM50, BLOSUM62, BLOSUM80 และ BLOSUM90 ทั้งสองชุดเครื่องมือยังมี API สำหรับใช้เมทริกซ์เหล่านี้ด้วย[ 24 ] [ 25 ]
ซอร์สโค้ดดั้งเดิมสำหรับการคำนวณ BLOSUM สามารถพบได้บนเว็บไซต์ NCBI ที่https://ftp.ncbi.nih.gov/repository/blocks/unix/blosum/ไฟล์เก็บถาวร "blosum.tar.Z" นี้แสดงถึงเวอร์ชันการคำนวณผิดพลาดดั้งเดิมที่มีประสิทธิภาพการค้นหาที่ดีขึ้นจากปี 1992 [ 16 ]ไฟล์เก็บถาวรนี้ยังมีผลลัพธ์ BLOSUM ที่คำนวณไว้ล่วงหน้าในระดับความคล้ายคลึงกันดังต่อไปนี้: "-2" (blosumn), 30, 40, 45, 50, 55, 60, 62, 65, 70, 75, 80, 85, 90, 95 และ 100 [ 26 ]
แพ็คเกจซอฟต์แวร์
มีซอฟต์แวร์หลายแพ็กเกจในภาษาโปรแกรมต่างๆ ที่ช่วยให้ใช้งานเมทริกซ์ Blosum ได้ง่าย นอกจากชุดเครื่องมือ NCBI ที่กล่าวมาแล้ว ยังมี:
- โมดูลblosum สำหรับ Python
- ไลบรารีBioJava สำหรับ Java
...และอีกมากมาย
ดูเพิ่มเติม
ลิงก์ภายนอก
- Sean R. Eddy (2004). "เมทริกซ์คะแนนการจัดเรียง BLOSUM62 มาจากไหน?" Nature Biotechnology . 22 (8): 1035– 6. doi : 10.1038/nbt0804-1035 . PMID 15286655 . S2CID 205269887 .
- บล็อกเซิร์ฟเวอร์ WWW
- ระบบการให้คะแนนสำหรับ BLAST ที่ NCBI
- ไฟล์ข้อมูลของเมทริกซ์ต่างๆ รวมถึง BLOSUM30–100 อยู่บนเซิร์ฟเวอร์ FTP ของ NCBI
- การแสดงภาพเครือข่าย BLOSUM แบบโต้ตอบเก็บถาวรเมื่อวันที่ 30 มกราคม 2017 ที่Wayback Machine
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ บลอสซัม
ใน ชีวสารสนเทศศาสตร์ เมท ริกซ์ BLOSUM (BLOCKS SUBSTION M ATRIX ) เป็น เมท ริก ซ์การแทนที่ ที่ใช้สำหรับ การ จัด เรียงลำดับ โปรตีน เมท ริก ซ์ BLOSUM...
ภูมิหลังทางชีววิทยา
คำสั่งทางพันธุกรรมของ เซลล์ ที่จำลองตัวเองทุกเซลล์ ในสิ่งมีชีวิตนั้นบรรจุอยู่ในดีเอ็นเอ [ 2 ] ตลอดช่วงชีวิตของเซลล์ ข้อมูลนี้จะถูกถอดรหัสและจำลองโดยกลไกของเซลล์เพื่อสร้างโปรตีนหรือเพื่อให้คำแนะนำแก่เซลล์ลูกในระหว่าง การแบ่งเซลล์...
ศัพท์เฉพาะ
มีเมทริกซ์ BLOSUM หลายชุดที่ใช้ฐานข้อมูลการจัดเรียงลำดับที่แตกต่างกัน โดยตั้งชื่อตามตัวเลข เมทริกซ์ BLOSUM ที่มีตัวเลขสูงออกแบบมาเพื่อเปรียบเทียบลำดับที่ใกล้เคียงกัน ในขณะที่เมทริกซ์ที่มีตัวเลขต่ำออกแบบมาเพื่อเปรียบเทียบลำดับที่ห่างไกลกัน ตัวอย่างเช่น...
การสร้างเมทริกซ์ BLOSUM
เมทริกซ์ BLOSUM ได้รับจากการใช้บล็อกของลำดับกรดอะมิโนที่คล้ายกันเป็นข้อมูล จากนั้นใช้วิธีการทางสถิติกับข้อมูลเพื่อหาคะแนนความคล้ายคลึง ขั้นตอนวิธีการทางสถิติ: [ 8 ]