สัญกรณ์กรดนิวคลีอิก

Q: ข้อมูลสำคัญเกี่ยวกับ สัญกรณ์กรดนิวคลีอิก

สั ญกรณ์กรดนิวคลีอิก ที่ใช้ในปัจจุบันได้รับการกำหนดอย่างเป็นทางการครั้งแรกโดย สหภาพเคมีบริสุทธิ์และประยุกต์ระหว่างประเทศ (IUPAC) ในปี พ.ศ.

สัญกรณ์กรดนิวคลีอิกที่ใช้ในปัจจุบันได้รับการกำหนดอย่างเป็นทางการครั้งแรกโดยสหภาพเคมีบริสุทธิ์และประยุกต์ระหว่างประเทศ (IUPAC) ในปี พ.ศ. 2513 ^{[ 1 ]}สัญกรณ์ที่ได้รับการยอมรับในระดับสากลนี้ใช้อักษรโรมัน G, C, A และ T เพื่อแทนนิวคลีโอไทด์ทั้งสี่ชนิดที่พบได้ทั่วไปในกรดดีออกซีไรโบนิวคลีอิก (DNA)

เนื่องจากบทบาทของการจัดลำดับ การสังเคราะห์ และการวิเคราะห์ทางพันธุกรรมในทางชีววิทยาขยายตัวอย่างรวดเร็ว นักวิจัยบางกลุ่มจึงได้พัฒนาสัญลักษณ์ทางเลือกเพื่อสนับสนุนการวิเคราะห์และการจัดการข้อมูลทางพันธุกรรมให้ดียิ่งขึ้น โดยทั่วไปแล้ว สัญลักษณ์เหล่านี้จะใช้ขนาด รูปร่าง และความสมมาตรเพื่อบรรลุวัตถุประสงค์ดังกล่าว

นิวคลีโอเบสเดี่ยวและนิวคลีโอไซด์

สัญลักษณ์ฐานเสื่อมสภาพของ IUPAC ^{[ 2 ]}
คำอธิบาย	เครื่องหมาย	ฐานที่แสดง					ฐาน เสริม
คำอธิบาย	เครื่องหมาย	เลขที่	เอ	ซี	จี	ที	ฐาน เสริม
อะดีนีน	เอ	1	เอ				ที
ไซโตซีน	ซี			ซี			จี
กัวนีน	จี				จี		ซี
ไทมีน	ที					ที	เอ
ยูราซิล	ยู					ยู	เอ
อ่อนแอ	ว	2	เอ			ที	ว
แข็งแกร่ง	เอส			ซี	จี		เอส
อะมิโน	เอ็ม		เอ	ซี			เค
คีโตน	เค				จี	ที	เอ็ม
พิวรีน	อาร์		เอ		จี		วาย
ไพริมิดีน	วาย			ซี		ที	อาร์
ไม่ใช่	บี	3		ซี	จี	ที	วี
ไม่ใช่ C	ดี		เอ		จี	ที	ชม
ไม่ใช่ G	ชม		เอ	ซี		ที	ดี
ไม่ใช่ T ^{[ a ]}	วี		เอ	ซี	จี		บี
ฐานใดฐานหนึ่ง	เอ็น	4	เอ	ซี	จี	ที	เอ็น
ช่องว่าง	-	0					-
^ไม่ใช่ U สำหรับ RNA

ภายใต้ระบบ IUPAC ที่ใช้กันทั่วไปนิวคลีโอเบสจะถูกแทนด้วยอักษรตัวแรกของชื่อทางเคมี ได้แก่ กัวนีน ไซโตซีน อะดีนีน และไทมีน^{[ 1 ]}ตัวย่อนี้ยังรวมถึงอักขระ "ความกำกวม" หรือ "ความเสื่อม" อีก 11 ตัวที่เกี่ยวข้องกับการรวมกันที่เป็นไปได้ทั้งหมดของเบส DNA ทั้งสี่^{[ 3 ]} อักขระความกำกวมได้รับการออกแบบมาเพื่อเข้ารหัสความแปรผันของตำแหน่งเพื่อรายงานข้อ ผิดพลาดในการจัดลำดับDNA ลำดับ คอนเซนซัสหรือโพลีมอร์ฟิซึมของนิวคลีโอไทด์เดี่ยว สัญกรณ์ IUPAC รวมถึงอักขระความกำกวม แสดงอยู่ในตารางที่ 1

สัญลักษณ์ฐานที่เสื่อมสภาพในชีวเคมีคือการแสดงตำแหน่งบนลำดับ DNA ของ IUPAC ^{[ 2 ]}ที่สามารถมีทางเลือกที่เป็นไปได้หลายแบบ ไม่ควรสับสนกับฐานที่ไม่เป็นไปตามแบบแผนเนื่องจากลำดับเฉพาะแต่ละลำดับจะมีฐานปกติหนึ่งฐาน สัญลักษณ์เหล่านี้ใช้ในการเข้ารหัสลำดับที่เป็นฉันทามติของกลุ่มลำดับที่จัดเรียงกัน และใช้ในการวิเคราะห์ทางวิวัฒนาการเพื่อสรุปลำดับหลายลำดับให้เป็นลำดับเดียว หรือสำหรับ การค้นหา BLASTแม้ว่าสัญลักษณ์ที่เสื่อมสภาพของ IUPAC จะถูกปิดบังไว้ (เนื่องจากไม่ได้เข้ารหัส)

สัญลักษณ์สำหรับฐานที่เสื่อมสภาพจะถูกเลือกจากตัวอักษรที่เหลืออยู่ของอักษรโรมันโดยใช้หลักการจำที่สมเหตุสมผล ฐาน ที่แข็งแรงและอ่อนแอจะแสดงด้วยตัวอักษรตัวแรก ในขณะที่อะมิโนคีโตพิวรีนไพริมิดีนและแอนตี้จะแสดงด้วยตัวอักษรจาก พยางค์ ที่เน้นเสียงหรือพยางค์ที่เด่นกว่าตัวอักษรที่เสื่อมสภาพสามเท่า ("ไม่ใช่ X") จะใช้ตัวอักษรถัดจากตัวอักษรที่ถูกตัดออก

ฐานเพิ่มเติม

มาตรฐานปี 1970 ยังกำหนดระบบการตั้งชื่อนิวคลีโอเบสแบบสามตัวอักษร ซึ่งได้มาจากตัวอักษรสามตัวแรกของชื่อสามัญ (Ade สำหรับอะดีนีน, Hyp สำหรับไฮโปแซนทีน) ส่วนนิวคลีโอไซด์จะระบุโดยการแทนที่ตัวอักษรตัวสุดท้ายด้วยตัวอักษรอื่น โดยไม่มีรูปแบบที่เฉพาะเจาะจงมากนัก^{[ 1 ]}^{: N2.1–3}

มาตรฐานปี 1970 ยังรวมถึง I สำหรับอิโนซีน , X สำหรับแซนโทซีนและ Ψ สำหรับซูโดอูริดีน นอกจาก นี้ยังอนุญาตให้ใช้ตัวอักษรอื่นใดสำหรับนิวคลีโอไซด์ที่หายากหากเห็นว่าเหมาะสม แม้ว่าจะแนะนำให้สงวน B ไว้สำหรับ5-โบรโมอูริดีน , S สำหรับไทโออูริดีน , D สำหรับ5,6-ไดไฮโดรอูริดีนและ O สำหรับโอโรติดีนจากการสงวนทั้งสี่นี้ มีเพียง O และ D เท่านั้นที่ใช้กันทั่วไปในเอกสารทางวิชาการในภายหลัง^{[ 1 ]}^{: N3.2.1}เบสของ DNA จะถูกระบุด้วยสัญลักษณ์เหล่านี้โดยมีคำนำหน้า "d" เช่น dA, dG ^{[ 1 ]}^{: N3.2.2}

มาตรฐานปี 1970 ระบุไวยากรณ์ที่สมบูรณ์สำหรับเบสที่ดัดแปลง การดัดแปลงควรเขียนด้วยตัวอักษรพิมพ์เล็ก ตัวอย่างที่กำหนดไว้ล่วงหน้าบางส่วน ได้แก่ "m" สำหรับเมทิล "h" สำหรับไดไฮโดร และ "n" สำหรับอะมิโน^{[ 1 ]}^{: N3.2.1}ตำแหน่งของการแทนที่เขียนเป็นตัวยก และในกรณีที่มีการแทนที่หลายตำแหน่งที่ไซต์เดียวกัน จะเขียนด้วยตัวห้อย ดังนั้น m ⁶ A หมายถึงN ⁶ -เมทิลอะดีโนซีนและ m⁶₂A หมายถึงN ⁶ -dimethyladenosine การดัดแปลงแบบเดียวกันที่ตำแหน่งต่างกันสามารถเขียนได้สองวิธี: ทั้งสองแบบ m^1.6₂A และ m ¹ m ⁶ A หมายถึง 1,N ⁶ -ไดเมทิลอะดีโนซีน^{[ 1 ]}^{: N4.4}

มาตรฐานปี 1970 ยังระบุไวยากรณ์สำหรับการดัดแปลงส่วนประกอบน้ำตาล (ไรโบสหรือดีออกซีไรโบส) การดัดแปลงภายในที่ตำแหน่ง 2' จะต้องเขียนด้วยตัวพิมพ์เล็กหลังตัวพิมพ์ใหญ่สำหรับนิวคลีโอเบส ตัวอย่างทั่วไปสองตัวอย่างคือ Cm (2'-O-เมทิลไซทิดีน) และ Gm (2'-O-เมทิลกัวโนซีน) ที่พบในtRNA [ ^{1 ] :}^N4.2ไวยากรณ์นี้สามารถใช้ร่วมกับไวยากรณ์การดัดแปลงเบสสำหรับผลลัพธ์เช่น m ⁶ Am (2'-O-เมทิล- N ^{6 -}เมทิลอะดีโนซีน) ^{[ 1 ]}^{: N4.4}

สายโซ่กรดนิวคลีอิก

ตำแหน่งของคาร์บอนใน น้ำตาล ไรโบสซึ่งเป็นโครงสร้างหลักของสายกรดนิวคลีอิกจะถูกกำหนดหมายเลข และใช้เพื่อระบุทิศทางของกรดนิวคลีอิก (5'->3' เทียบกับ 3'->5') สิ่งนี้เรียกว่าทิศทางลำดับกรดนิวคลีอิกจะวิ่งในทิศทาง 5'->3' หากไม่ได้ระบุไว้เป็นอย่างอื่น นี่คือทิศทางตามธรรมชาติของการสังเคราะห์ DNA และ RNA และนี่คือทิศทางการอ่าน mRNA โดยไร โบโซมสามารถระบุทิศทางตรงกันข้ามได้โดยการเขียน เช่น (3'-5')ACACAC ^{[ 1 ]}^{: N3.3.2}

สามารถเพิ่มกลุ่มดัดแปลงเพิ่มเติมได้โดยการใช้เครื่องหมายยัติภังค์ร่วมกับคำนำหน้าหรือคำต่อท้าย ในลักษณะที่เหมาะสมกับทิศทางข้างต้น สามารถใช้ตัวย่อทางเคมีมาตรฐานได้ ตัวอย่างเช่น (CNEt)-AC-(Ph) มีกลุ่มไซยาโนเอทิลที่ตำแหน่ง 5' และกลุ่มฟีนิลที่ตำแหน่ง 3' กลุ่มที่เชื่อมระหว่างตำแหน่ง 2' และ 3' จะเขียนเป็น > ตัวอย่างเช่น AC>p มีหมวกฟอสเฟตแบบวงจร 2':3' ^{[ 1 ]}^{: N4.2.2, N4.3}

ความชัดเจน

แม้ว่าระบบ IUPAC จะได้รับการยอมรับอย่างกว้างขวางและเกือบจะทั่วโลก แต่ก็มีข้อจำกัดหลายประการ ซึ่งเกิดจากการพึ่งพาอักษรโรมัน ข้อจำกัดหลักประการหนึ่งคือความชัดเจนในการอ่านตัวอักษรโรมันตัวพิมพ์ใหญ่ ซึ่งโดยทั่วไปใช้ในการแสดงข้อมูลทางพันธุกรรม คุณค่าของส่วนยื่นภายนอกในการแยกแยะตัวอักษรได้รับการบันทึกไว้อย่างดี^{[ 4 ]}อย่างไรก็ตาม ส่วนยื่นเหล่านี้ไม่มีอยู่ในตัวอักษรตัวพิมพ์ใหญ่ ซึ่งในบางกรณีสามารถแยกแยะได้ด้วยเบาะแสภายในที่ละเอียดอ่อนเท่านั้น ตัวอย่างเช่น ตัวอักษร C และ G ตัวพิมพ์ใหญ่ที่ใช้แทนไซโตซีนและกัวนีน ตัวอักษรเหล่านี้โดยทั่วไปประกอบเป็นครึ่งหนึ่งของตัวอักษรในลำดับทางพันธุกรรม แต่จะแตกต่างกันด้วยเครื่องหมายขีดเล็กๆ ภายใน (ขึ้นอยู่กับแบบอักษร) อย่างไรก็ตาม ตัวอักษรโรมันเหล่านี้มีอยู่ใน ชุดอักขระ ASCIIที่ใช้กันทั่วไปในการสื่อสารข้อความ ซึ่งช่วยเสริมความแพร่หลายของระบบนี้

ตัวอักษร IUPAC เวอร์ชันตัวพิมพ์เล็กใช้ในไฟล์ลำดับพันธุกรรม โดยระบุส่วนของลำดับที่ "ถูกปิดบังแบบอ่อน" ซึ่งมักจะเป็นลำดับซ้ำที่มีความยาวไม่แน่นอน^{[ 5 ]}

สัญลักษณ์ทางเลือกที่ปรับปรุงด้านภาพ

ปัญหาด้านความชัดเจนที่เกี่ยวข้องกับข้อมูลทางพันธุกรรมที่เข้ารหัสตามมาตรฐาน IUPAC ทำให้เหล่านักชีววิทยาต้องพิจารณากลยุทธ์ทางเลือกอื่นในการแสดงข้อมูลทางพันธุกรรม แนวทางสร้างสรรค์เหล่านี้ในการแสดงภาพลำดับดีเอ็นเอโดยทั่วไปอาศัยการใช้สัญลักษณ์ที่กระจายตัวในพื้นที่และ/หรือรูปร่างที่แตกต่างกันอย่างชัดเจนเพื่อเข้ารหัสลำดับกรดนิวคลีอิกที่ยาว มีการพยายามใช้สัญลักษณ์ทางเลือกอื่นสำหรับลำดับนิวคลีโอไทด์ แต่การนำไปใช้โดยทั่วไปยังไม่แพร่หลาย แนวทางเหล่านี้บางส่วนได้สรุปไว้ด้านล่าง

การเปรียบเทียบด้านล่างนี้อ้างอิงจากการจัดเรียงลำดับหลายลำดับของส่วนหนึ่งของยีน OBจาก Jarvius และ Landegren (2006) ดังต่อไปนี้:

มนุษย์ CTTGCCCTGGGCCAGTGGCCTGGAGACCTTGGACAGCCTGGGG ลิงแรซัส TTTGCCCTTGGCCAGTGGCCTGGAGACCTTGGAGAGCCTGGGG Wolf CTTGCCCCGGGCCAGGGGCCTGGAGACCTTTGAGAGCCTGGGC การอนุรักษ์ .******. ****** ************** ** ********

การฉายภาพบรรทัดห้าเส้น

การฉายภาพแบบ Stave Projection ใช้จุดที่กระจายตัวอยู่ในตำแหน่งที่เหมาะสมเพื่อเพิ่มความชัดเจนในการอ่านลำดับดีเอ็นเอ

ในปี พ.ศ. 2529 Cowin และคณะได้อธิบายวิธีการใหม่สำหรับการแสดงภาพลำดับดีเอ็นเอที่เรียกว่า Stave Projection ^{[ 6 ]}กลยุทธ์ของพวกเขาคือการเข้ารหัสนิวคลีโอไทด์เป็นวงกลมบนแถบแนวนอนหลายชุดคล้ายกับโน้ตบนบรรทัดห้าเส้นของดนตรี ดังแสดงในรูปที่ 1 ช่องว่างแต่ละช่องบนบรรทัดห้าเส้นจะสอดคล้องกับเบสดีเอ็นเอหนึ่งในสี่ชนิด การกระจายตัวเชิงพื้นที่ของวงกลมทำให้การแยกแยะเบสแต่ละชนิดและการเปรียบเทียบลำดับทางพันธุกรรมง่ายกว่าข้อมูลที่เข้ารหัสโดย IUPAC มาก

ลำดับของเบส (จากบนลงล่าง G, A, T, C) ถูกเลือกเพื่อให้สามารถอ่านสายเสริมได้โดยการพลิกภาพที่ฉายกลับหัว

สัญลักษณ์ทางเรขาคณิต

Zimmerman และคณะใช้วิธีการแสดงภาพข้อมูลทางพันธุกรรมที่แตกต่างออกไป^{[ 7 ]}แทนที่จะใช้รูปวงกลมที่กระจายตัวตามพื้นที่เพื่อเน้นคุณลักษณะทางพันธุกรรม พวกเขาใช้สัญลักษณ์ที่มีลักษณะทางเรขาคณิตแตกต่างกันสี่แบบที่พบในแบบอักษรคอมพิวเตอร์มาตรฐานเพื่อแยกแยะฐานทั้งสี่ ผู้เขียนได้พัฒนามาโคร WordPerfect อย่างง่ายเพื่อแปลงอักขระ IUPAC ให้เป็นสัญลักษณ์ที่มองเห็นได้ชัดเจนยิ่งขึ้น

ระบบ Zimmerman แมป AGCT ไปยัง █■∙♦ (สี่เหลี่ยมผืนผ้าสูง สี่เหลี่ยมจัตุรัส วงกลมเล็ก เพชร) ตามลำดับ ตัวอย่างสามารถพบได้ในบทความของ Zimmerman ปี 1993 เกี่ยวกับการวิเคราะห์ลำดับซ้ำ^{[ 8 ]}

ตัวอย่างยีน OB ที่แสดงผลโดยใช้สัญลักษณ์ 4 ตัวจาก Windows Glyph List :

มนุษย์ ■♦♦∙■■■♦∙∙∙■■█∙♦∙∙■■♦∙∙█∙█■■♦♦∙∙█■█∙■■♦∙∙∙∙ ลิงแรซัส ♦♦♦∙■■■♦♦∙∙■■█∙♦∙∙■■♦∙∙█∙█■■♦♦∙∙█∙█∙■■♦∙∙∙∙ หมาป่า ■♦♦∙■■■■∙∙∙■■█∙∙∙∙■■♦∙∙█∙█■■♦♦♦∙█∙█∙■■♦∙∙∙■

ดีเอ็นเอ สกายไลน์

ด้วยความพร้อมใช้งานที่เพิ่มมากขึ้นของโปรแกรมแก้ไขแบบอักษร Jarvius และ Landegren ได้คิดค้นชุดสัญลักษณ์ทางพันธุกรรมชุดใหม่ที่เรียกว่าแบบอักษร DNA Skyline ซึ่งใช้บล็อกที่สูงขึ้นเรื่อยๆ เพื่อแสดงฐาน DNA ที่แตกต่างกัน มีแบบอักษรให้เลือกสองแบบ ได้แก่ GATC โดยที่ G สูงที่สุด และ CTAG ซึ่งเป็นแบบเสริม โดยที่ C สูงที่สุด^{[ 9 ]}แม้ว่าจะชวนให้นึกถึง Stave Projection ที่กระจายตัวในเชิงพื้นที่ของ Cowin et al . แต่แบบอักษร DNA Skyline ก็ดาวน์โหลดได้ง่ายและอนุญาตให้แปลงไปและกลับจากสัญกรณ์ IUPAC ได้โดยการเปลี่ยนแบบอักษรในแอปพลิเคชันประมวลผลคำมาตรฐานส่วนใหญ่

ตัวอย่างยีน OB ที่แสดงผลโดยใช้Symbols for Legacy Computing :

มนุษย์ 🮅🮄🮄🮂🮅🮅🮅🮄🮂🮂🮅🮅🮃🮂🮄🮂🮂🮅🮅🮄🮂🮂🮃🮂🮃🮅🮅🮄🮄🮂🮂🮃🮅🮃🮂🮅🮅🮄🮂🮂🮂 ลิงแรซัส 🮄🮄🮄🮂🮅🮅🮅🮄🮄🮂🮂🮅🮅🮃🮂🮄🮂🮂🮅🮅🮄🮂🮂🮃🮂🮃🮅🮅🮄🮄🮂🮂🮃🮂🮃🮂🮅🮅🮄🮂🮂🮂 หมาป่า 🮅🮄🮄🮂🮅🮅🮅🮅🮂🮂🮅🮅🮃🮂🮂🮂🮂🮅🮅🮄🮂🮂🮃🮂🮃🮅🮅🮄🮄🮄🮂🮃🮂🮃🮂🮅🮅🮄🮂🮂🮅

สัญกรณ์แอมบิกราฟิก

AmbiScript ใช้แอมบิแกรมเพื่อสะท้อนความสมมาตรของดีเอ็นเอ และสนับสนุนการจัดการและการวิเคราะห์ข้อมูลทางพันธุกรรม

แอมบิแกรม (สัญลักษณ์ที่สื่อความหมายต่างกันเมื่อมองจากทิศทางที่แตกต่างกัน) ได้รับการออกแบบมาเพื่อสะท้อนความสมมาตรเชิงโครงสร้างที่พบในเกลียวคู่ของ DNA ^{[ 10 ]}โดยการกำหนดอักขระแอมบิกราฟิกให้กับเบสที่เสริมกัน (เช่น กัวนีน: b, ไซโตซีน: q, อะดีนีน: n และไทมีน: u) ทำให้สามารถเสริมลำดับ DNA ได้โดยการหมุนข้อความ 180 องศา^{[ 11 ]}สัญกรณ์กรดนิวคลีอิกแอมบิกราฟิกยังทำให้ง่ายต่อการระบุพาลินโดรมทางพันธุกรรม เช่น ตำแหน่งจำกัดของเอนโดนิวคลีเอส ซึ่งเป็นส่วนของข้อความที่สามารถหมุนได้ 180 องศาโดยไม่เปลี่ยนแปลงลำดับ

ตัวอย่างหนึ่งของสัญกรณ์กรดนิวคลีอิกแบบแอมบิกราฟิก คือ AmbiScript ซึ่งเป็นสัญกรณ์กรดนิวคลีอิกที่ออกแบบอย่างมีเหตุผลซึ่งรวมเอาคุณสมบัติทางภาพและฟังก์ชันหลายอย่างของรุ่นก่อนหน้าเข้าไว้ด้วยกัน ^{[ 12 ]}สัญกรณ์นี้ยังใช้ตัวอักษรที่เยื้องตำแหน่งเพื่ออำนวยความสะดวกในการตรวจสอบและวิเคราะห์ข้อมูลทางพันธุกรรมด้วยสายตา AmbiScript ยังได้รับการออกแบบมาเพื่อระบุตำแหน่งนิวคลีโอไทด์ที่ไม่ชัดเจนผ่านสัญลักษณ์ผสม กลยุทธ์นี้มีจุดมุ่งหมายเพื่อนำเสนอวิธีแก้ปัญหาที่ใช้งานง่ายยิ่งขึ้นสำหรับการใช้ตัวอักษรที่ไม่ชัดเจนซึ่งเสนอโดย IUPAC เป็นครั้งแรก^{[ 3 ]}เช่นเดียวกับแบบอักษร DNA Skyline ของ Jarvius และ Landegren แบบอักษร AmbiScript สามารถดาวน์โหลดและนำไปใช้กับข้อมูลลำดับที่เข้ารหัสโดย IUPAC ได้

สัญลักษณ์ทางเลือกอื่นๆ

นอกจากนี้ยังมีการแสดงภาพแบบ 2 มิติและ 3 มิติของตัวอักษรกรดนิวคลีอิกแต่ละตัว รวมถึงลำดับไดนิวคลีโอไทด์และไตรนิวคลีโอไทด์ด้วย^{[ 13 ]}

การจับคู่เบส

การจับคู่เบสระหว่างโซ่สองโซ่ควรระบุด้วยเครื่องหมาย "•" (ตัวอย่าง: A•T หรือ poly(rC)•2poly(rC)) เครื่องหมาย "-" ไม่เป็นที่ยอมรับตามมาตรฐาน IUPAC 1970 เนื่องจากบ่งชี้ถึงพันธะโควา เลน ต์ เครื่องหมาย ":" หรือ "/" ก็ไม่เป็นที่ยอมรับตามมาตรฐาน IUPAC 1970 เช่นกัน เพราะอาจทำให้เข้าใจผิดว่าเป็นอัตราส่วน การไม่ใช้สัญลักษณ์ใดๆ ก็ไม่เป็นที่ยอมรับเช่นกัน เพราะอาจทำให้สับสนกับลำดับพอลิเมอร์ได้^{[ 1 ]}^{: N3.4.2}อย่างไรก็ตาม เครื่องหมาย "-", ":", "." ก็ยังคงพบเห็นได้ในทางปฏิบัติ

ในกรณีของการจับคู่เบสแบบ Hoogsteenและการจับคู่ที่คล้ายกันที่ "ด้าน" ต่างกันของเบส จำเป็นต้องแยกแยะความแตกต่างระหว่างพันธะไฮโดรเจนประเภทต่างๆ IUPAC ยังไม่ได้ให้คำแนะนำใดๆ สำหรับสถานการณ์นี้ แต่มีการใช้เครื่องหมาย "*" และ ":" แทน

ดูเพิ่มเติม

[not-3] ไม่ใช่ U สำหรับ RNA

[ 1 ]

[ 2 ]

[ a ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]