อ่าน 7 นาที
พื้นที่การเข้ารหัส
บริเวณรหัสของยีนหรือที่เรียกว่าลำดับดีเอ็นเอที่เข้ารหัส ( CDS ) คือส่วนของดีเอ็นเอหรืออาร์เอ็นเอ ของยีน ที่เข้ารหัสโปรตีนการศึกษาความยาว องค์ประกอบ การควบคุม การตัดต่อ โครงสร้าง
พื้นที่การเข้ารหัส
บริเวณรหัสของยีนหรือที่เรียกว่าลำดับดีเอ็นเอที่เข้ารหัส ( CDS ) คือส่วนของดีเอ็นเอหรืออาร์เอ็นเอ ของยีน ที่เข้ารหัสโปรตีน[ 1 ]การศึกษาความยาว องค์ประกอบ การควบคุม การตัดต่อ โครงสร้าง และหน้าที่ของบริเวณรหัสเมื่อเปรียบเทียบกับบริเวณที่ไม่เข้ารหัสในสายพันธุ์ต่างๆ และช่วงเวลาต่างๆ สามารถให้ข้อมูลสำคัญจำนวนมากเกี่ยวกับการจัดระเบียบยีนและวิวัฒนาการของโปรคาริโอตและยูคาริโอต [ 2 ] ซึ่งสามารถช่วยในการทำแผนที่จีโนมมนุษย์และพัฒนาการบำบัดด้วยยีน ได้ [ 3 ]
คำนิยาม
แม้ว่าบางครั้งคำนี้จะถูกใช้แทนกันได้กับคำว่า exonแต่ก็ไม่ใช่สิ่งเดียวกันเสียทีเดียว: exonสามารถประกอบด้วยบริเวณที่เข้ารหัสรวมถึงบริเวณที่ไม่ได้รับการแปล 3' และ 5' ของ RNA ดังนั้น exon จึงประกอบด้วยบริเวณที่เข้ารหัสบางส่วนบริเวณที่ไม่ได้รับ การแปล 3' และ 5' ของ RNA ซึ่งไม่ได้เข้ารหัสโปรตีน เรียกว่า บริเวณ ที่ไม่เข้ารหัสและจะไม่กล่าวถึงในหน้านี้[ 4 ]
มักเกิดความสับสนระหว่างบริเวณรหัสพันธุกรรมและเอ็กโซมแต่มีความแตกต่างที่ชัดเจนระหว่างคำสองคำนี้เอ็กโซมหมายถึงเอ็กซอนทั้งหมดในจีโนม ในขณะที่บริเวณรหัสพันธุกรรมหมายถึงส่วนของดีเอ็นเอ (หรือทรานสคริปต์หลัก ) หรือส่วนใดส่วนหนึ่งของเอ็มอาร์เอ็นเอที่ผ่านกระบวนการแล้ว ซึ่งทำหน้าที่เข้ารหัสโปรตีนชนิดใดชนิดหนึ่งโดยเฉพาะ
ประวัติศาสตร์
ในปี พ.ศ. 2521 Walter Gilbertได้ตีพิมพ์ "Why Genes in Pieces" ซึ่งเป็นจุดเริ่มต้นของการสำรวจแนวคิดที่ว่ายีนเป็นโมเสก—ว่า สาย กรดนิวคลีอิก ที่สมบูรณ์แต่ละ สายไม่ได้ถูกเข้ารหัสอย่างต่อเนื่อง แต่ถูกขัดจังหวะด้วยบริเวณที่ไม่เข้ารหัส "เงียบ" นี่เป็นข้อบ่งชี้แรกที่แสดงให้เห็นว่าจำเป็นต้องมีการแยกแยะระหว่างส่วนของจีโนมที่เข้ารหัสโปรตีน ซึ่งปัจจุบันเรียกว่าบริเวณที่เข้ารหัส และส่วนที่ไม่เข้ารหัส[ 5 ]
องค์ประกอบ

หลักฐานชี้ให้เห็นว่ามีความสัมพันธ์กันโดยทั่วไประหว่างรูปแบบองค์ประกอบเบสและความพร้อมใช้งานของบริเวณการเข้ารหัส[ 6 ]เชื่อกันว่าบริเวณการเข้ารหัสมีปริมาณ GC สูง กว่าบริเวณที่ไม่เข้ารหัส มีการวิจัยเพิ่มเติมที่ค้นพบว่ายิ่งสายการเข้ารหัสยาวเท่าใด ปริมาณ GC ก็ยิ่งสูงขึ้นเท่านั้น สายการเข้ารหัสสั้นๆ ยังคงมี GC ต่ำเมื่อเทียบกับสายอื่นๆ คล้ายกับปริมาณ GC ต่ำขององค์ประกอบเบสของรหัสหยุด การแปล เช่น TAG, TAA และ TGA [ 7 ]
บริเวณที่มี GC สูงยังเป็นบริเวณที่อัตราส่วนของ ประเภท การกลายพันธุ์แบบจุดมีการเปลี่ยนแปลงเล็กน้อย: มีการเปลี่ยนแบบทรานซิชันมากขึ้นซึ่งเป็นการเปลี่ยนแปลงจากพิวรีนเป็นพิวรีนหรือไพริมิดีนเป็นไพริมิดีน เมื่อเทียบกับ การเปลี่ยนแบบทรานส์ เวอร์ชันซึ่งเป็นการเปลี่ยนแปลงจากพิวรีนเป็นไพริมิดีนหรือไพริมิดีนเป็นพิวรีน การเปลี่ยนแบบทรานซิชันมีโอกาสน้อยที่จะเปลี่ยนแปลงกรดอะมิโนที่เข้ารหัสและยังคงเป็นการกลายพันธุ์แบบเงียบ (โดยเฉพาะอย่างยิ่งหากเกิดขึ้นในนิวคลีโอไทด์ ที่สาม ของโคดอน) ซึ่งโดยทั่วไปแล้วจะเป็นประโยชน์ต่อสิ่งมีชีวิตในระหว่างการแปลและการสร้างโปรตีน[ 8 ]
สิ่งนี้บ่งชี้ว่าบริเวณการเข้ารหัสที่จำเป็น (อุดมไปด้วยยีน) มีปริมาณ GC สูงกว่าและมีความเสถียรและทนต่อการกลายพันธุ์ มากกว่า เมื่อเทียบกับบริเวณเสริมและไม่จำเป็น (มียีนน้อย) [ 9 ]อย่างไรก็ตาม ยังไม่ชัดเจนว่าสิ่งนี้เกิดขึ้นจากการกลายพันธุ์แบบเป็นกลางและสุ่มหรือผ่านรูปแบบของการคัดเลือก[ 10 ]นอกจากนี้ยังมีการถกเถียงกันว่าวิธีการที่ใช้ เช่น หน้าต่างยีน เพื่อตรวจสอบความสัมพันธ์ระหว่างปริมาณ GC และบริเวณการเข้ารหัสมีความถูกต้องและปราศจากอคติหรือไม่[ 11 ]
โครงสร้างและหน้าที่


ในDNAบริเวณรหัสจะถูกขนาบด้วยลำดับโปรโมเตอร์ที่ปลาย 5' ของสายแม่แบบและลำดับการสิ้นสุดที่ปลาย 3' ในระหว่างการถอดรหัส RNA Polymerase (RNAP)จะจับกับลำดับโปรโมเตอร์และเคลื่อนที่ไปตามสายแม่แบบไปยังบริเวณรหัส จากนั้น RNAP จะเพิ่มนิวคลีโอไทด์ RNA ที่เสริมกับบริเวณรหัสเพื่อสร้างmRNAโดยแทนที่ยูรา ซิล ด้วยไทมีน [ 12 ] กระบวนการนี้จะดำเนินต่อไปจนกว่า RNAP จะไปถึงลำดับการสิ้นสุด[ 12 ]
หลังจากถอดรหัสและเจริญเติบโตเต็มที่แล้ว mRNAที่เกิดขึ้นจะประกอบด้วยส่วนต่างๆ ที่สำคัญต่อการแปลเป็นโปรตีน ในที่สุด บริเวณรหัสใน mRNA จะถูกล้อมรอบด้วยบริเวณที่ไม่ถูกแปล 5' (5'-UTR) และบริเวณที่ไม่ถูกแปล 3' (3'-UTR) [ 1 ]หมวก5'และหาง Poly-Aในระหว่างการแปล ไรโบโซมจะช่วยอำนวยความสะดวกในการยึดtRNAเข้ากับบริเวณรหัส ครั้งละ 3 นิวคลีโอไทด์ ( โคดอน ) [ 13 ] tRNA จะถ่ายโอนกรดอะมิโน ที่เกี่ยวข้องไปยังสาย โพลีเปปไทด์ที่กำลังเติบโตซึ่งในที่สุดจะก่อตัวเป็นโปรตีนที่กำหนดไว้ในบริเวณรหัส DNA เริ่มต้น

ระเบียบข้อบังคับ
บริเวณรหัสพันธุกรรมสามารถถูกดัดแปลงได้เพื่อควบคุมการแสดงออกของยีน
การอัลคิเลชันเป็นรูปแบบหนึ่งของการควบคุมบริเวณการเข้ารหัส[ 15 ]ยีนที่ควรจะถูกถอดรหัสสามารถถูกปิดการทำงานได้โดยการกำหนดเป้าหมายลำดับเฉพาะ เบสในลำดับนี้จะถูกปิดกั้นโดยใช้กลุ่มอัลคิลซึ่งทำให้เกิดผลการปิดการทำงาน[ 16 ]
ในขณะที่การควบคุมการแสดงออกของยีนจะจัดการปริมาณของ RNA หรือโปรตีนที่สร้างขึ้นในเซลล์ การควบคุมกลไกเหล่านี้สามารถควบคุมได้ด้วยลำดับควบคุมที่พบก่อนเฟรมการอ่านแบบเปิดจะเริ่มต้นในสาย DNA ลำดับควบคุมจะกำหนดตำแหน่งและเวลาที่การแสดงออกจะเกิดขึ้นสำหรับบริเวณการเข้ารหัสโปรตีน[ 17 ]
การตัดต่อ RNAเป็นตัวกำหนดว่าส่วนใดของลำดับจะถูกแปลและแสดงออก และกระบวนการนี้เกี่ยวข้องกับการตัดอินทรอนออกและนำเอ็กซอนมารวมกัน อย่างไรก็ตาม ตำแหน่งที่สไปโซโซม RNA ตัดนั้นจะถูกชี้นำโดยการจดจำไซต์การตัดต่อโดยเฉพาะอย่างยิ่งไซต์การตัดต่อ 5' ซึ่งเป็นหนึ่งในสารตั้งต้นสำหรับขั้นตอนแรกในการตัดต่อ[ 18 ] บริเวณการเข้ารหัสอยู่ภายในเอ็กซอน ซึ่งจะเชื่อมต่อกันด้วยพันธะโควาเลนต์ เพื่อ สร้างRNA สื่อสารที่สมบูรณ์
การกลายพันธุ์
การกลายพันธุ์ในบริเวณรหัสพันธุกรรมสามารถส่งผลกระทบต่อลักษณะภายนอกของสิ่งมีชีวิตได้อย่างหลากหลาย การกลายพันธุ์บางอย่างในบริเวณนี้ของดีเอ็นเอ/อาร์เอ็นเออาจส่งผลดี แต่บางอย่างก็อาจเป็นอันตรายและบางครั้งอาจถึงขั้นทำให้สิ่งมีชีวิตตายได้ ในทางตรงกันข้าม การเปลี่ยนแปลงในบริเวณที่ไม่ใช่รหัสพันธุกรรมอาจไม่ส่งผลให้เกิดการเปลี่ยนแปลงที่ตรวจพบได้ในลักษณะภายนอกเสมอไป
ประเภทของการกลายพันธุ์

มีการกลายพันธุ์หลายรูปแบบที่สามารถเกิดขึ้นได้ในบริเวณรหัสพันธุกรรม รูปแบบหนึ่งคือการกลายพันธุ์แบบเงียบซึ่งการเปลี่ยนแปลงของนิวคลีโอไทด์ไม่ได้ส่งผลให้เกิดการเปลี่ยนแปลงของกรดอะมิโนหลังจากการถอดรหัสและการแปล[ 20 ]นอกจากนี้ยังมีการกลายพันธุ์แบบไร้ความหมายซึ่งการเปลี่ยนแปลงของเบสในบริเวณรหัสพันธุกรรมจะเข้ารหัสเป็นรหัสหยุดก่อนกำหนด ทำให้ได้โปรตีนสุดท้ายที่สั้นลงการกลายพันธุ์แบบจุดหรือการเปลี่ยนแปลงของคู่เบสเดี่ยวในบริเวณรหัสพันธุกรรม ที่เข้ารหัสกรดอะมิโนที่แตกต่างกันในระหว่างการแปล เรียกว่าการกลายพันธุ์แบบผิดความ หมาย การกลายพันธุ์ประเภทอื่น ๆ ได้แก่การกลายพันธุ์แบบเลื่อนเฟรมเช่นการแทรกหรือการลบ[ 20 ]
การก่อตัว
การกลายพันธุ์บางรูปแบบเป็นแบบถ่ายทอดทางพันธุกรรม ( การกลายพันธุ์ของเซลล์สืบพันธุ์ ) หรือถ่ายทอดจากพ่อแม่สู่ลูกหลาน[ 21 ]บริเวณรหัสที่กลายพันธุ์ดังกล่าวมีอยู่ในเซลล์ทั้งหมดภายในสิ่งมีชีวิต การกลายพันธุ์รูปแบบอื่นเกิดขึ้น ( การกลายพันธุ์ของเซลล์ร่างกาย) ในช่วงชีวิตของสิ่งมีชีวิต และอาจไม่คงที่ในแต่ละเซลล์[ 21 ]การเปลี่ยนแปลงเหล่านี้อาจเกิดจากสารก่อกลายพันธุ์ สารก่อมะเร็งหรือตัวแทนสิ่งแวดล้อมอื่นๆ (เช่น รังสียูวี ) การกลายพันธุ์ที่เกิดขึ้นอาจเป็นผลมาจากข้อผิดพลาดในการคัดลอกระหว่างการจำลองดีเอ็นเอและจะไม่ถ่ายทอดไปยังลูกหลาน การเปลี่ยนแปลงในบริเวณรหัสอาจเกิดขึ้นใหม่ (de novo ) การเปลี่ยนแปลงดังกล่าวเชื่อว่าเกิดขึ้นไม่นานหลังจากการปฏิสนธิส่งผลให้เกิดการกลายพันธุ์ในดีเอ็นเอของลูกหลานในขณะที่ไม่มีอยู่ในเซลล์อสุจิและเซลล์ไข่[ 21 ]
การป้องกัน
มีกลไกการถอดรหัสและการแปลหลายอย่างเพื่อป้องกันการเสียชีวิตเนื่องจากการกลายพันธุ์ที่เป็นอันตรายในบริเวณการเข้ารหัส มาตรการดังกล่าวรวมถึงการตรวจสอบความถูกต้องโดยDNA Polymerase บางชนิด ในระหว่างการจำลองแบบการซ่อมแซมความผิดพลาดหลังจากการจำลองแบบ[ 22 ]และ ' สมมติฐาน Wobble ' ซึ่งอธิบายถึงความเสื่อมของเบสที่สามภายในโคดอน mRNA [ 23 ]
บริเวณการเข้ารหัสที่ถูกจำกัด (CCRs)
แม้จะเป็นที่ทราบกันดีว่าจีโนมของแต่ละบุคคลอาจมีความแตกต่างกันอย่างมากเมื่อเปรียบเทียบกับจีโนมของบุคคลอื่น แต่การวิจัยล่าสุดพบว่าบางส่วนของบริเวณการเข้ารหัสมีความจำกัดสูง หรือต้านทานต่อการกลายพันธุ์ ระหว่างบุคคลในสายพันธุ์เดียวกัน ซึ่งคล้ายกับแนวคิดเรื่องความจำกัดระหว่างสายพันธุ์ในลำดับที่อนุรักษ์ไว้นักวิจัยเรียกส่วนลำดับที่มีความจำกัดสูงเหล่านี้ว่า บริเวณการเข้ารหัสที่มีความจำกัด (CCRs) และยังค้นพบว่าบริเวณดังกล่าวอาจเกี่ยวข้องกับการคัดเลือกแบบบริสุทธิ์ สูง โดยเฉลี่ยแล้ว จะมีการกลายพันธุ์ที่เปลี่ยนแปลงโปรตีนประมาณ 1 ครั้ง ทุกๆ 7 เบสการเข้ารหัส แต่ CCRs บางส่วนอาจมีเบสมากกว่า 100 เบสในลำดับที่ไม่พบการกลายพันธุ์ที่เปลี่ยนแปลงโปรตีน บางส่วนไม่มีแม้แต่การกลายพันธุ์แบบเดียวกัน[ 24 ]รูปแบบของความจำกัดระหว่างจีโนมเหล่านี้อาจให้เบาะแสเกี่ยวกับแหล่งที่มาของโรคพัฒนาการ ที่หายาก หรืออาจถึงขั้นทำให้ตัวอ่อนตายได้ ก่อนหน้านี้มีการเชื่อมโยง ตัวแปรที่ได้รับการตรวจสอบทางคลินิกและการกลายพันธุ์ de novoใน CCR กับความผิดปกติ เช่นโรคลมชักในทารกพัฒนาการล่าช้า และโรคหัวใจรุนแรง[ 24 ]
การตรวจจับลำดับการเข้ารหัส

แม้ว่าการระบุเฟรมการอ่านแบบเปิดภายในลำดับ DNA จะทำได้ง่าย แต่การระบุลำดับการเข้ารหัสทำได้ยาก เนื่องจากเซลล์จะแปลเฟรมการอ่านแบบเปิดเพียงบางส่วนเท่านั้นให้เป็นโปรตีน[ 26 ]ปัจจุบันการทำนาย CDS ใช้การสุ่มตัวอย่างและการจัดลำดับ mRNA จากเซลล์ แม้ว่ายังคงมีปัญหาในการกำหนดว่าส่วนใดของ mRNA ที่กำหนดจะถูกแปลเป็นโปรตีนจริง ๆ การทำนาย CDS เป็นส่วนย่อยของการทำนายยีนซึ่งอย่างหลังยังรวมถึงการทำนายลำดับ DNA ที่เข้ารหัสไม่เพียงแต่โปรตีนเท่านั้น แต่ยังรวมถึงองค์ประกอบการทำงานอื่น ๆ เช่น ยีน RNA และลำดับควบคุมด้วย
ในทั้งโปรคาริโอตและยูคาริโอตการทับซ้อนของยีนเกิดขึ้นค่อนข้างบ่อยในไวรัส DNA และ RNA เพื่อเป็นข้อได้เปรียบเชิงวิวัฒนาการในการลดขนาดจีโนมในขณะที่ยังคงความสามารถในการผลิตโปรตีนต่างๆ จากบริเวณการเข้ารหัสที่มีอยู่[ 27 ] [ 28 ]สำหรับทั้ง DNA และ RNA การจัดเรียงแบบคู่สามารถตรวจจับบริเวณการเข้ารหัสที่ทับซ้อนกันได้ รวมถึงเฟรมการอ่านแบบเปิด สั้นๆ ในไวรัส แต่จะต้องมีสายการเข้ารหัสที่ทราบเพื่อเปรียบเทียบกับสายการเข้ารหัสที่อาจทับซ้อนกัน[ 29 ]วิธีการทางเลือกโดยใช้ลำดับจีโนมเดี่ยวจะไม่ต้องใช้ลำดับจีโนมหลายลำดับเพื่อดำเนินการเปรียบเทียบ แต่จะต้องมีนิวคลีโอไทด์ที่ทับซ้อนกันอย่างน้อย 50 ตัวเพื่อให้มีความไว[ 30 ]
ดูเพิ่มเติม
- สายรหัสพันธุกรรม คือสายดีเอ็นเอที่ทำหน้าที่สร้างโปรตีน
- เอ็กซอนส่วนทั้งหมดของสายดีเอ็นเอที่ถูกถอดรหัส
- เอ็มอาร์เอ็นเอที่เจริญเต็มที่ คือส่วนหนึ่งของผลิตภัณฑ์การถอดรหัสเอ็มอาร์เอ็นเอที่ถูกแปลเป็นโปรตีน
- โครงสร้างของยีนองค์ประกอบอื่นๆ ที่ประกอบกันเป็นยีน
- ยีนซ้อน:ลำดับรหัสทั้งหมดอยู่ภายในขอบเขตของยีนภายนอกที่ใหญ่กว่า
- ดีเอ็นเอที่ไม่เข้ารหัส (Non-coding DNA)คือส่วนของจีโนมที่ไม่เข้ารหัสยีนที่สร้างโปรตีน
- โมเลกุล RNAที่ไม่เข้ารหัสโปรตีน จึงไม่มี CDS
- ดีเอ็นเอที่ไม่ทำงาน (Non-functional DNA)คือส่วนของจีโนมที่ไม่มีหน้าที่ทางชีวภาพที่เกี่ยวข้อง
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ พื้นที่การเข้ารหัส
บริเวณรหัสของยีนหรือที่เรียกว่าลำดับดีเอ็นเอที่เข้ารหัส ( CDS ) คือส่วนของดีเอ็นเอหรืออาร์เอ็นเอ ของยีน ที่เข้ารหัสโปรตีนการศึกษาความยาว องค์ประกอบ การควบคุม การตัดต่อ โครงสร้าง
คำนิยาม
แม้ว่าบางครั้งคำนี้จะถูกใช้แทนกันได้กับ คำว่า exon แต่ก็ไม่ใช่สิ่งเดียวกันเสียทีเดียว: exon สามารถประกอบด้วยบริเวณที่เข้ารหัสรวมถึง บริเวณที่ไม่ได้รับการแปล 3' และ 5' ของ RNA ดังนั้น exon จึงประกอบด้วยบริเวณที่เข้ารหัสบางส่วน บริเวณที่ไม่ได้รับ การแปล 3' และ...
ประวัติศาสตร์
ในปี พ.ศ. 2521 Walter Gilbert ได้ตีพิมพ์ "Why Genes in Pieces" ซึ่งเป็นจุดเริ่มต้นของการสำรวจแนวคิดที่ว่ายีนเป็นโมเสก—ว่า สาย กรดนิวคลีอิก ที่สมบูรณ์แต่ละ สายไม่ได้ถูกเข้ารหัสอย่างต่อเนื่อง แต่ถูกขัดจังหวะด้วยบริเวณที่ไม่เข้ารหัส "เงียบ"...
องค์ประกอบ
หลักฐานชี้ให้เห็นว่ามีความสัมพันธ์กันโดยทั่วไประหว่างรูปแบบองค์ประกอบเบสและความพร้อมใช้งานของบริเวณการเข้ารหัส [ 6 ] เชื่อกันว่าบริเวณการเข้ารหัสมี ปริมาณ GC สูง กว่าบริเวณที่ไม่เข้ารหัส มีการวิจัยเพิ่มเติมที่ค้นพบว่ายิ่งสายการเข้ารหัสยาวเท่าใด ปริมาณ GC...