กลับไปหน้าบทความ

อ่าน 5 นาที

สัญกรณ์กรดนิวคลีอิก

สั ญกรณ์กรดนิวคลีอิก ที่ใช้ในปัจจุบันได้รับการกำหนดอย่างเป็นทางการครั้งแรกโดย สหภาพเคมีบริสุทธิ์และประยุกต์ระหว่างประเทศ (IUPAC) ในปี พ.ศ.

สัญกรณ์กรดนิวคลีอิก

สัญกรณ์กรดนิวคลีอิกที่ใช้ในปัจจุบันได้รับการกำหนดอย่างเป็นทางการครั้งแรกโดยสหภาพเคมีบริสุทธิ์และประยุกต์ระหว่างประเทศ (IUPAC) ในปี พ.ศ. 2513 [ 1 ]สัญกรณ์ที่ได้รับการยอมรับในระดับสากลนี้ใช้อักษรโรมัน G, C, A และ T เพื่อแทนนิวคลีโอไทด์ทั้งสี่ชนิดที่พบได้ทั่วไปในกรดดีออกซีไรโบนิวคลีอิก (DNA)

เนื่องจากบทบาทของการจัดลำดับ การสังเคราะห์ และการวิเคราะห์ทางพันธุกรรมในทางชีววิทยาขยายตัวอย่างรวดเร็ว นักวิจัยบางกลุ่มจึงได้พัฒนาสัญลักษณ์ทางเลือกเพื่อสนับสนุนการวิเคราะห์และการจัดการข้อมูลทางพันธุกรรมให้ดียิ่งขึ้น โดยทั่วไปแล้ว สัญลักษณ์เหล่านี้จะใช้ขนาด รูปร่าง และความสมมาตรเพื่อบรรลุวัตถุประสงค์ดังกล่าว

นิวคลีโอเบสเดี่ยวและนิวคลีโอไซด์

สัญลักษณ์ฐานเสื่อมสภาพของ IUPAC [ 2 ]
คำอธิบาย เครื่องหมาย ฐานที่แสดง ฐาน เสริม
เลขที่เอ ซี จี ที
อะดีนีนเอ1 เอที
ไซโตซีนซีซีจี
กัวนีนจีจีซี
ไทมีนทีทีเอ
ยูราซิลยูยูเอ
อ่อนแอ 2 เอที
แข็งแกร่ง เอสซีจีเอส
อะมิโนเอ็มเอซีเค
คีโตนเคจีทีเอ็ม
พิวรีนอาร์เอจีวาย
ไพริมิดีนวายซีทีอาร์
ไม่ใช่ บี3 ซีจีทีวี
ไม่ใช่ C ดีเอจีทีชม
ไม่ใช่ G ชมเอซีทีดี
ไม่ใช่ T [ a ]วีเอซีจีบี
ฐานใดฐานหนึ่ง เอ็น4 เอซีจีทีเอ็น
ช่องว่าง -0 -
  1. ^ไม่ใช่ U สำหรับ RNA

ภายใต้ระบบ IUPAC ที่ใช้กันทั่วไปนิวคลีโอเบสจะถูกแทนด้วยอักษรตัวแรกของชื่อทางเคมี ได้แก่ กัวนีน ไซโตซีน อะดีนีน และไทมีน[ 1 ]ตัวย่อนี้ยังรวมถึงอักขระ "ความกำกวม" หรือ "ความเสื่อม" อีก 11 ตัวที่เกี่ยวข้องกับการรวมกันที่เป็นไปได้ทั้งหมดของเบส DNA ทั้งสี่[ 3 ] อักขระความกำกวมได้รับการออกแบบมาเพื่อเข้ารหัสความแปรผันของตำแหน่งเพื่อรายงานข้อ ผิดพลาดในการจัดลำดับDNA ลำดับ คอนเซนซัสหรือโพลีมอร์ฟิซึมของนิวคลีโอไทด์เดี่ยว สัญกรณ์ IUPAC รวมถึงอักขระความกำกวม แสดงอยู่ในตารางที่ 1

สัญลักษณ์ฐานที่เสื่อมสภาพในชีวเคมีคือการแสดงตำแหน่งบนลำดับ DNA ของ IUPAC [ 2 ]ที่สามารถมีทางเลือกที่เป็นไปได้หลายแบบ ไม่ควรสับสนกับฐานที่ไม่เป็นไปตามแบบแผนเนื่องจากลำดับเฉพาะแต่ละลำดับจะมีฐานปกติหนึ่งฐาน สัญลักษณ์เหล่านี้ใช้ในการเข้ารหัสลำดับที่เป็นฉันทามติของกลุ่มลำดับที่จัดเรียงกัน และใช้ในการวิเคราะห์ทางวิวัฒนาการเพื่อสรุปลำดับหลายลำดับให้เป็นลำดับเดียว หรือสำหรับ การค้นหา BLASTแม้ว่าสัญลักษณ์ที่เสื่อมสภาพของ IUPAC จะถูกปิดบังไว้ (เนื่องจากไม่ได้เข้ารหัส)

สัญลักษณ์สำหรับฐานที่เสื่อมสภาพจะถูกเลือกจากตัวอักษรที่เหลืออยู่ของอักษรโรมันโดยใช้หลักการจำที่สมเหตุสมผล ฐาน ที่แข็งแรงและอ่อนแอจะแสดงด้วยตัวอักษรตัวแรก ในขณะที่อะมิโนคีโตพิวรีนไพริมิดีนและแอนตี้จะแสดงด้วยตัวอักษรจาก พยางค์ ที่เน้นเสียงหรือพยางค์ที่เด่นกว่าตัวอักษรที่เสื่อมสภาพสามเท่า ("ไม่ใช่ X") จะใช้ตัวอักษรถัดจากตัวอักษรที่ถูกตัดออก

ฐานเพิ่มเติม

มาตรฐานปี 1970 ยังกำหนดระบบการตั้งชื่อนิวคลีโอเบสแบบสามตัวอักษร ซึ่งได้มาจากตัวอักษรสามตัวแรกของชื่อสามัญ (Ade สำหรับอะดีนีน, Hyp สำหรับไฮโปแซนทีน) ส่วนนิวคลีโอไซด์จะระบุโดยการแทนที่ตัวอักษรตัวสุดท้ายด้วยตัวอักษรอื่น โดยไม่มีรูปแบบที่เฉพาะเจาะจงมากนัก[ 1 ] : N2.1–3

มาตรฐานปี 1970 ยังรวมถึง I สำหรับอิโนซีน , X สำหรับแซนโทซีนและ Ψ สำหรับซูโดอูริดีน นอกจาก นี้ยังอนุญาตให้ใช้ตัวอักษรอื่นใดสำหรับนิวคลีโอไซด์ที่หายากหากเห็นว่าเหมาะสม แม้ว่าจะแนะนำให้สงวน B ไว้สำหรับ5-โบรโมอูริดีน , S สำหรับไทโออูริดีน , D สำหรับ5,6-ไดไฮโดรอูริดีนและ O สำหรับโอโรติดีนจากการสงวนทั้งสี่นี้ มีเพียง O และ D เท่านั้นที่ใช้กันทั่วไปในเอกสารทางวิชาการในภายหลัง[ 1 ] : N3.2.1 เบสของ DNA จะถูกระบุด้วยสัญลักษณ์เหล่านี้โดยมีคำนำหน้า "d" เช่น dA, dG [ 1 ] : N3.2.2

มาตรฐานปี 1970 ระบุไวยากรณ์ที่สมบูรณ์สำหรับเบสที่ดัดแปลง การดัดแปลงควรเขียนด้วยตัวอักษรพิมพ์เล็ก ตัวอย่างที่กำหนดไว้ล่วงหน้าบางส่วน ได้แก่ "m" สำหรับเมทิล "h" สำหรับไดไฮโดร และ "n" สำหรับอะมิโน[ 1 ] : N3.2.1 ตำแหน่งของการแทนที่เขียนเป็นตัวยก และในกรณีที่มีการแทนที่หลายตำแหน่งที่ไซต์เดียวกัน จะเขียนด้วยตัวห้อย ดังนั้น m 6 A หมายถึงN 6 -เมทิลอะดีโนซีนและ m6 2A หมายถึงN 6 -dimethyladenosine การดัดแปลงแบบเดียวกันที่ตำแหน่งต่างกันสามารถเขียนได้สองวิธี: ทั้งสองแบบ m1.6 2A และ m 1 m 6 A หมายถึง 1,N 6 -ไดเมทิลอะดีโนซีน[ 1 ] : N4.4

มาตรฐานปี 1970 ยังระบุไวยากรณ์สำหรับการดัดแปลงส่วนประกอบน้ำตาล (ไรโบสหรือดีออกซีไรโบส) การดัดแปลงภายในที่ตำแหน่ง 2' จะต้องเขียนด้วยตัวพิมพ์เล็กหลังตัวพิมพ์ใหญ่สำหรับนิวคลีโอเบส ตัวอย่างทั่วไปสองตัวอย่างคือ Cm (2'-O-เมทิลไซทิดีน) และ Gm (2'-O-เมทิลกัวโนซีน) ที่พบในtRNA [ 1 ] : N4.2 ไวยากรณ์นี้สามารถใช้ร่วมกับไวยากรณ์การดัดแปลงเบสสำหรับผลลัพธ์เช่น m 6 Am (2'-O-เมทิล- N 6 -เมทิลอะดีโนซีน) [ 1 ] : N4.4

สายโซ่กรดนิวคลีอิก

คาร์บอน ไรโบสที่มีหมายเลขกำกับบนไซทิดี

ตำแหน่งของคาร์บอนใน น้ำตาล ไรโบสซึ่งเป็นโครงสร้างหลักของสายกรดนิวคลีอิกจะถูกกำหนดหมายเลข และใช้เพื่อระบุทิศทางของกรดนิวคลีอิก (5'->3' เทียบกับ 3'->5') สิ่งนี้เรียกว่าทิศทางลำดับกรดนิวคลีอิกจะวิ่งในทิศทาง 5'->3' หากไม่ได้ระบุไว้เป็นอย่างอื่น นี่คือทิศทางตามธรรมชาติของการสังเคราะห์ DNA และ RNA และนี่คือทิศทางการอ่าน mRNA โดยไร โบโซมสามารถระบุทิศทางตรงกันข้ามได้โดยการเขียน เช่น (3'-5')ACACAC [ 1 ] : N3.3.2

สามารถเพิ่มกลุ่มดัดแปลงเพิ่มเติมได้โดยการใช้เครื่องหมายยัติภังค์ร่วมกับคำนำหน้าหรือคำต่อท้าย ในลักษณะที่เหมาะสมกับทิศทางข้างต้น สามารถใช้ตัวย่อทางเคมีมาตรฐานได้ ตัวอย่างเช่น (CNEt)-AC-(Ph) มีกลุ่มไซยาโนเอทิลที่ตำแหน่ง 5' และกลุ่มฟีนิลที่ตำแหน่ง 3' กลุ่มที่เชื่อมระหว่างตำแหน่ง 2' และ 3' จะเขียนเป็น > ตัวอย่างเช่น AC>p มีหมวกฟอสเฟตแบบวงจร 2':3' [ 1 ] : N4.2.2, N4.3

ความชัดเจน

แม้ว่าระบบ IUPAC จะได้รับการยอมรับอย่างกว้างขวางและเกือบจะทั่วโลก แต่ก็มีข้อจำกัดหลายประการ ซึ่งเกิดจากการพึ่งพาอักษรโรมัน ข้อจำกัดหลักประการหนึ่งคือความชัดเจนในการอ่านตัวอักษรโรมันตัวพิมพ์ใหญ่ ซึ่งโดยทั่วไปใช้ในการแสดงข้อมูลทางพันธุกรรม คุณค่าของส่วนยื่นภายนอกในการแยกแยะตัวอักษรได้รับการบันทึกไว้อย่างดี[ 4 ]อย่างไรก็ตาม ส่วนยื่นเหล่านี้ไม่มีอยู่ในตัวอักษรตัวพิมพ์ใหญ่ ซึ่งในบางกรณีสามารถแยกแยะได้ด้วยเบาะแสภายในที่ละเอียดอ่อนเท่านั้น ตัวอย่างเช่น ตัวอักษร C และ G ตัวพิมพ์ใหญ่ที่ใช้แทนไซโตซีนและกัวนีน ตัวอักษรเหล่านี้โดยทั่วไปประกอบเป็นครึ่งหนึ่งของตัวอักษรในลำดับทางพันธุกรรม แต่จะแตกต่างกันด้วยเครื่องหมายขีดเล็กๆ ภายใน (ขึ้นอยู่กับแบบอักษร) อย่างไรก็ตาม ตัวอักษรโรมันเหล่านี้มีอยู่ใน ชุดอักขระ ASCIIที่ใช้กันทั่วไปในการสื่อสารข้อความ ซึ่งช่วยเสริมความแพร่หลายของระบบนี้

ตัวอักษร IUPAC เวอร์ชันตัวพิมพ์เล็กใช้ในไฟล์ลำดับพันธุกรรม โดยระบุส่วนของลำดับที่ "ถูกปิดบังแบบอ่อน" ซึ่งมักจะเป็นลำดับซ้ำที่มีความยาวไม่แน่นอน[ 5 ]

สัญลักษณ์ทางเลือกที่ปรับปรุงด้านภาพ

ปัญหาด้านความชัดเจนที่เกี่ยวข้องกับข้อมูลทางพันธุกรรมที่เข้ารหัสตามมาตรฐาน IUPAC ทำให้เหล่านักชีววิทยาต้องพิจารณากลยุทธ์ทางเลือกอื่นในการแสดงข้อมูลทางพันธุกรรม แนวทางสร้างสรรค์เหล่านี้ในการแสดงภาพลำดับดีเอ็นเอโดยทั่วไปอาศัยการใช้สัญลักษณ์ที่กระจายตัวในพื้นที่และ/หรือรูปร่างที่แตกต่างกันอย่างชัดเจนเพื่อเข้ารหัสลำดับกรดนิวคลีอิกที่ยาว มีการพยายามใช้สัญลักษณ์ทางเลือกอื่นสำหรับลำดับนิวคลีโอไทด์ แต่การนำไปใช้โดยทั่วไปยังไม่แพร่หลาย แนวทางเหล่านี้บางส่วนได้สรุปไว้ด้านล่าง

การเปรียบเทียบด้านล่างนี้อ้างอิงจากการจัดเรียงลำดับหลายลำดับของส่วนหนึ่งของยีน OBจาก Jarvius และ Landegren (2006) ดังต่อไปนี้:

มนุษย์ CTTGCCCTGGGCCAGTGGCCTGGAGACCTTGGACAGCCTGGGG ลิงแรซัส TTTGCCCTTGGCCAGTGGCCTGGAGACCTTGGAGAGCCTGGGG Wolf CTTGCCCCGGGCCAGGGGCCTGGAGACCTTTGAGAGCCTGGGC การอนุรักษ์ .******. ****** ************** ** ******** 

การฉายภาพบรรทัดห้าเส้น

การฉายภาพแบบ Stave Projection ใช้จุดที่กระจายตัวอยู่ในตำแหน่งที่เหมาะสมเพื่อเพิ่มความชัดเจนในการอ่านลำดับดีเอ็นเอ

ในปี พ.ศ. 2529 Cowin และคณะได้อธิบายวิธีการใหม่สำหรับการแสดงภาพลำดับดีเอ็นเอที่เรียกว่า Stave Projection [ 6 ]กลยุทธ์ของพวกเขาคือการเข้ารหัสนิวคลีโอไทด์เป็นวงกลมบนแถบแนวนอนหลายชุดคล้ายกับโน้ตบนบรรทัดห้าเส้นของดนตรี ดังแสดงในรูปที่ 1 ช่องว่างแต่ละช่องบนบรรทัดห้าเส้นจะสอดคล้องกับเบสดีเอ็นเอหนึ่งในสี่ชนิด การกระจายตัวเชิงพื้นที่ของวงกลมทำให้การแยกแยะเบสแต่ละชนิดและการเปรียบเทียบลำดับทางพันธุกรรมง่ายกว่าข้อมูลที่เข้ารหัสโดย IUPAC มาก

ลำดับของเบส (จากบนลงล่าง G, A, T, C) ถูกเลือกเพื่อให้สามารถอ่านสายเสริมได้โดยการพลิกภาพที่ฉายกลับหัว

สัญลักษณ์ทางเรขาคณิต

Zimmerman และคณะใช้วิธีการแสดงภาพข้อมูลทางพันธุกรรมที่แตกต่างออกไป[ 7 ]แทนที่จะใช้รูปวงกลมที่กระจายตัวตามพื้นที่เพื่อเน้นคุณลักษณะทางพันธุกรรม พวกเขาใช้สัญลักษณ์ที่มีลักษณะทางเรขาคณิตแตกต่างกันสี่แบบที่พบในแบบอักษรคอมพิวเตอร์มาตรฐานเพื่อแยกแยะฐานทั้งสี่ ผู้เขียนได้พัฒนามาโคร WordPerfect อย่างง่ายเพื่อแปลงอักขระ IUPAC ให้เป็นสัญลักษณ์ที่มองเห็นได้ชัดเจนยิ่งขึ้น

ระบบ Zimmerman แมป AGCT ไปยัง █■∙♦ (สี่เหลี่ยมผืนผ้าสูง สี่เหลี่ยมจัตุรัส วงกลมเล็ก เพชร) ตามลำดับ ตัวอย่างสามารถพบได้ในบทความของ Zimmerman ปี 1993 เกี่ยวกับการวิเคราะห์ลำดับซ้ำ[ 8 ]

ตัวอย่างยีน OB ที่แสดงผลโดยใช้สัญลักษณ์ 4 ตัวจาก Windows Glyph List :

มนุษย์ ■♦♦∙■■■♦∙∙∙■■█∙♦∙∙■■♦∙∙█∙█■■♦♦∙∙█■█∙■■♦∙∙∙∙ ลิงแรซัส ♦♦♦∙■■■♦♦∙∙■■█∙♦∙∙■■♦∙∙█∙█■■♦♦∙∙█∙█∙■■♦∙∙∙∙ หมาป่า ■♦♦∙■■■■∙∙∙■■█∙∙∙∙■■♦∙∙█∙█■■♦♦♦∙█∙█∙■■♦∙∙∙■ 

ดีเอ็นเอ สกายไลน์

ด้วยความพร้อมใช้งานที่เพิ่มมากขึ้นของโปรแกรมแก้ไขแบบอักษร Jarvius และ Landegren ได้คิดค้นชุดสัญลักษณ์ทางพันธุกรรมชุดใหม่ที่เรียกว่าแบบอักษร DNA Skyline ซึ่งใช้บล็อกที่สูงขึ้นเรื่อยๆ เพื่อแสดงฐาน DNA ที่แตกต่างกัน มีแบบอักษรให้เลือกสองแบบ ได้แก่ GATC โดยที่ G สูงที่สุด และ CTAG ซึ่งเป็นแบบเสริม โดยที่ C สูงที่สุด[ 9 ]แม้ว่าจะชวนให้นึกถึง Stave Projection ที่กระจายตัวในเชิงพื้นที่ของ Cowin et al . แต่แบบอักษร DNA Skyline ก็ดาวน์โหลดได้ง่ายและอนุญาตให้แปลงไปและกลับจากสัญกรณ์ IUPAC ได้โดยการเปลี่ยนแบบอักษรในแอปพลิเคชันประมวลผลคำมาตรฐานส่วนใหญ่

ตัวอย่างยีน OB ที่แสดงผลโดยใช้Symbols for Legacy Computing :

มนุษย์ 🮅🮄🮄🮂🮅🮅🮅🮄🮂🮂🮅🮅🮃🮂🮄🮂🮂🮅🮅🮄🮂🮂🮃🮂🮃🮅🮅🮄🮄🮂🮂🮃🮅🮃🮂🮅🮅🮄🮂🮂🮂 ลิงแรซัส 🮄🮄🮄🮂🮅🮅🮅🮄🮄🮂🮂🮅🮅🮃🮂🮄🮂🮂🮅🮅🮄🮂🮂🮃🮂🮃🮅🮅🮄🮄🮂🮂🮃🮂🮃🮂🮅🮅🮄🮂🮂🮂 หมาป่า 🮅🮄🮄🮂🮅🮅🮅🮅🮂🮂🮅🮅🮃🮂🮂🮂🮂🮅🮅🮄🮂🮂🮃🮂🮃🮅🮅🮄🮄🮄🮂🮃🮂🮃🮂🮅🮅🮄🮂🮂🮅 

สัญกรณ์แอมบิกราฟิก

AmbiScript ใช้แอมบิแกรมเพื่อสะท้อนความสมมาตรของดีเอ็นเอ และสนับสนุนการจัดการและการวิเคราะห์ข้อมูลทางพันธุกรรม

แอมบิแกรม (สัญลักษณ์ที่สื่อความหมายต่างกันเมื่อมองจากทิศทางที่แตกต่างกัน) ได้รับการออกแบบมาเพื่อสะท้อนความสมมาตรเชิงโครงสร้างที่พบในเกลียวคู่ของ DNA [ 10 ]โดยการกำหนดอักขระแอมบิกราฟิกให้กับเบสที่เสริมกัน (เช่น กัวนีน: b, ไซโตซีน: q, อะดีนีน: n และไทมีน: u) ทำให้สามารถเสริมลำดับ DNA ได้โดยการหมุนข้อความ 180 องศา[ 11 ]สัญกรณ์กรดนิวคลีอิกแอมบิกราฟิกยังทำให้ง่ายต่อการระบุพาลินโดรมทางพันธุกรรม เช่น ตำแหน่งจำกัดของเอนโดนิวคลีเอส ซึ่งเป็นส่วนของข้อความที่สามารถหมุนได้ 180 องศาโดยไม่เปลี่ยนแปลงลำดับ

ตัวอย่างหนึ่งของสัญกรณ์กรดนิวคลีอิกแบบแอมบิกราฟิก คือ AmbiScript ซึ่งเป็นสัญกรณ์กรดนิวคลีอิกที่ออกแบบอย่างมีเหตุผลซึ่งรวมเอาคุณสมบัติทางภาพและฟังก์ชันหลายอย่างของรุ่นก่อนหน้าเข้าไว้ด้วยกัน [ 12 ]สัญกรณ์นี้ยังใช้ตัวอักษรที่เยื้องตำแหน่งเพื่ออำนวยความสะดวกในการตรวจสอบและวิเคราะห์ข้อมูลทางพันธุกรรมด้วยสายตา AmbiScript ยังได้รับการออกแบบมาเพื่อระบุตำแหน่งนิวคลีโอไทด์ที่ไม่ชัดเจนผ่านสัญลักษณ์ผสม กลยุทธ์นี้มีจุดมุ่งหมายเพื่อนำเสนอวิธีแก้ปัญหาที่ใช้งานง่ายยิ่งขึ้นสำหรับการใช้ตัวอักษรที่ไม่ชัดเจนซึ่งเสนอโดย IUPAC เป็นครั้งแรก[ 3 ]เช่นเดียวกับแบบอักษร DNA Skyline ของ Jarvius และ Landegren แบบอักษร AmbiScript สามารถดาวน์โหลดและนำไปใช้กับข้อมูลลำดับที่เข้ารหัสโดย IUPAC ได้

สัญลักษณ์ทางเลือกอื่นๆ

นอกจากนี้ยังมีการแสดงภาพแบบ 2 มิติและ 3 มิติของตัวอักษรกรดนิวคลีอิกแต่ละตัว รวมถึงลำดับไดนิวคลีโอไทด์และไตรนิวคลีโอไทด์ด้วย[ 13 ]

การจับคู่เบส

การจับคู่เบสระหว่างโซ่สองโซ่ควรระบุด้วยเครื่องหมาย "•" (ตัวอย่าง: A•T หรือ poly(rC)•2poly(rC)) เครื่องหมาย "-" ไม่เป็นที่ยอมรับตามมาตรฐาน IUPAC 1970 เนื่องจากบ่งชี้ถึงพันธะโควา เลน ต์ เครื่องหมาย ":" หรือ "/" ก็ไม่เป็นที่ยอมรับตามมาตรฐาน IUPAC 1970 เช่นกัน เพราะอาจทำให้เข้าใจผิดว่าเป็นอัตราส่วน การไม่ใช้สัญลักษณ์ใดๆ ก็ไม่เป็นที่ยอมรับเช่นกัน เพราะอาจทำให้สับสนกับลำดับพอลิเมอร์ได้[ 1 ] : N3.4.2 อย่างไรก็ตาม เครื่องหมาย "-", ":", "." ก็ยังคงพบเห็นได้ในทางปฏิบัติ

ในกรณีของการจับคู่เบสแบบ Hoogsteenและการจับคู่ที่คล้ายกันที่ "ด้าน" ต่างกันของเบส จำเป็นต้องแยกแยะความแตกต่างระหว่างพันธะไฮโดรเจนประเภทต่างๆ IUPAC ยังไม่ได้ให้คำแนะนำใดๆ สำหรับสถานการณ์นี้ แต่มีการใช้เครื่องหมาย "*" และ ":" แทน

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Nucleic_acid_notation&oldid=1351213289 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ สัญกรณ์กรดนิวคลีอิก

สั ญกรณ์กรดนิวคลีอิก ที่ใช้ในปัจจุบันได้รับการกำหนดอย่างเป็นทางการครั้งแรกโดย สหภาพเคมีบริสุทธิ์และประยุกต์ระหว่างประเทศ (IUPAC) ในปี พ.ศ.

นิวคลีโอเบสเดี่ยวและนิวคลีโอไซด์

ภายใต้ระบบ IUPAC ที่ใช้กันทั่วไป นิวคลีโอเบส จะถูกแทนด้วยอักษรตัวแรกของชื่อทางเคมี ได้แก่ กัวนีน ไซโตซีน อะดีนีน และไทมีน [ 1 ] ตัวย่อนี้ยังรวมถึงอักขระ "ความกำกวม" หรือ "ความเสื่อม" อีก 11 ตัวที่เกี่ยวข้องกับการรวมกันที่เป็นไปได้ทั้งหมดของเบส DNA ทั้งสี่ [ 3...

ฐานเพิ่มเติม

มาตรฐานปี 1970 ยังกำหนดระบบการตั้งชื่อนิวคลีโอเบสแบบสามตัวอักษร ซึ่งได้มาจากตัวอักษรสามตัวแรกของชื่อสามัญ (Ade สำหรับอะดีนีน, Hyp สำหรับไฮโปแซนทีน) ส่วนนิวคลีโอไซด์จะระบุโดยการแทนที่ตัวอักษรตัวสุดท้ายด้วยตัวอักษรอื่น โดยไม่มีรูปแบบที่เฉพาะเจาะจงมากนัก [ 1 ] :...

สายโซ่กรดนิวคลีอิก

ตำแหน่งของ คาร์บอน ใน น้ำตาล ไรโบส ซึ่งเป็นโครงสร้างหลักของสายกรดนิวคลีอิกจะถูกกำหนดหมายเลข และใช้เพื่อระบุทิศทางของกรดนิวคลีอิก (5'->3' เทียบกับ 3'->5') สิ่งนี้เรียกว่า ทิศทาง ลำดับกรดนิวคลีอิกจะวิ่งในทิศทาง 5'->3' หากไม่ได้ระบุไว้เป็นอย่างอื่น...