กลับไปหน้าบทความ

อ่าน 14 นาที

จีโนมอ้างอิง

จีโนมอ้างอิงคือชุดประกอบจีโนมที่แสดงลำดับพันธุกรรมที่สมบูรณ์ของสิ่งมีชีวิตเป็นสายต่อเนื่องของนิวคลีโอไทด์ (A, T, C และ G) โดยทั่วไปแล้ว...

จีโนมอ้างอิง

เอกสารพิมพ์ชุดแรกของจีโนมอ้างอิงมนุษย์ถูกนำเสนอในรูปแบบหนังสือหลายเล่ม และจัดแสดงอยู่ที่พิพิธภัณฑ์เวลล์คัมคอลเลคชั่น กรุงลอนดอน

จีโนมอ้างอิงคือชุดประกอบจีโนมที่แสดงลำดับพันธุกรรมที่สมบูรณ์ของสิ่งมีชีวิตเป็นสายต่อเนื่องของนิวคลีโอไทด์ (A, T, C และ G) โดยทั่วไปแล้ว ชุดประกอบจีโนมที่จะใช้เป็นจีโนมอ้างอิงจะต้องมีคำอธิบายประกอบ ซึ่งสร้างขึ้นผ่านกระบวนการที่เรียกว่าคำอธิบายประกอบดีเอ็นเอหรือจีโนมคำอธิบายประกอบจะระบุพิกัดทางจีโนม (ตำแหน่งเริ่มต้นและสิ้นสุด) ของยีนเอ็กซอนอินทรอนและmRNAและมักจะจับคู่กับลำดับทรานสคริปต์ (mRNA) และโปรตีน ที่สอดคล้องกัน (ทำนายโดยอัลกอริทึมหรือตรวจสอบโดยการทดลอง) [ 1 ]

จีโนมอ้างอิงมีอยู่สำหรับ สิ่งมีชีวิตหลากหลายชนิดรวมถึงไวรัสแบคทีเรียเชื้อราพืชและสัตว์และมีความแตกต่างกันในวิธีการสร้างและการนำเสนอ จีโนมอ้างอิงอาจได้มาจากสิ่งมีชีวิตเพียงตัวเดียวหรือจากสิ่งมีชีวิตหลายตัวที่รวมลำดับเข้าด้วยกันเป็นชุดตัวแทนเดียว - แฮพลไทป์ปัจจัยหลักสองประการที่กำหนดคุณภาพการประกอบจีโนมอ้างอิง ได้แก่เทคโนโลยีการจัดลำดับซึ่งส่งผลต่อความแม่นยำของลำดับ และระดับการประกอบซึ่งบ่งชี้ว่าการแสดงจีโนมนั้นสมบูรณ์เพียงใด[ 2 ] [ 3 ]

อุดมคติคือการประกอบในระดับโครโมโซม ซึ่งเป็นลำดับ DNA ที่สมบูรณ์สำหรับแต่ละโครโมโซมโดยไม่มีส่วนที่ไม่ได้จัดวาง อย่างไรก็ตาม การบรรลุเป้าหมายนี้ยังคงเป็นความท้าทายทางเทคนิค โดยเฉพาะอย่างยิ่งสำหรับจีโนมขนาดใหญ่หรือจีโนมที่มีองค์ประกอบซ้ำซ้อนจำนวนมาก (มีองค์ประกอบซ้ำซ้อน หนาแน่น ) เทคโนโลยีการจัดลำดับรุ่นก่อนๆ มักสร้างการประกอบใน ระดับ คอนทิก (ลำดับต่อเนื่องสั้นๆ) หรือสแคฟโฟลด์ (ชุดคอนทิกที่เรียงลำดับ) โดยมีบริบทของโครโมโซมที่จำกัด ขนาดที่แน่นอนของชิ้นส่วนเหล่านี้ขึ้นอยู่กับแพลตฟอร์มการจัดลำดับและวิธีการทางชีวสารสนเทศที่มีอยู่ในขณะนั้น[ 4 ]

สำหรับชุดประกอบที่ยังไม่สามารถระบุได้อย่างสมบูรณ์ มักใช้สถิติสรุป เช่น N50 และ L50 เพื่อบ่งบอกถึงความต่อเนื่องและการแตกตัวของชุดประกอบ ซึ่งจะมีการอธิบายตัวชี้วัดเหล่านี้ในส่วน "คอนติ๊กและสแคฟโฟลด์ "

จีโนมอ้างอิงมีความสำคัญต่อการวิจัยโอไมซ์ โดยเฉพาะอย่างยิ่ง จีโนมิกส์ จีโนมอ้างอิงเป็นข้อมูลอ้างอิงสำหรับการ "แมป" ข้อมูลลำดับดีเอ็นเอจากบุคคลจำนวนมาก ทำให้สามารถระบุตำแหน่งจีโนมของลำดับเหล่านี้ได้อย่างมีประสิทธิภาพ และตรวจจับโพลีมอร์ฟิซึม (ความแตกต่างของลำดับระหว่างบุคคล) ผ่านกระบวนการที่เรียกว่าการระบุตัวแปร[ 5 ]

ข้อจำกัดของการปฏิบัตินี้ เช่น อคติในการอ้างอิงและการเป็นตัวแทนของความหลากหลายของประชากรที่น้อยเกินไป ทำให้เกิดการพัฒนาชุดอ้างอิงระดับประชากรและแพนจีโน[ 6 ]

จีโนมอ้างอิงและคำอธิบายประกอบสามารถเข้าถึงได้โดยสาธารณะผ่านทางเบรา ว์ เซอร์จีโนมออนไลน์และคลังข้อมูล เช่นEnsembl [ 7 ] European Nucleotide Archive (ENA) ที่EMBL -EBI , UCSC Genome BrowserและNCBI

คุณสมบัติของจีโนมอ้างอิง

การวัดความยาว

ความยาวของจีโนมสามารถวัดได้หลายวิธี

วิธีง่ายๆ ในการวัดความยาวของจีโนมคือการนับจำนวนคู่เบสในชุดประกอบ[ 8 ]

เส้นทางทองคำเป็นการวัดความยาวทางเลือกที่ละเว้นบริเวณที่ซ้ำซ้อน เช่นแฮพลอไทป์และบริเวณออโตโซมเทียม [ 9 ] [ 10 ] โดยทั่วไปจะสร้างขึ้นโดยการวางข้อมูลลำดับทับซ้อนบนแผนที่ทางกายภาพเพื่อรวมข้อมูลโครงร่าง เป็น 'การประมาณที่ดีที่สุด' ของลักษณะจีโนมและโดยทั่วไปจะรวมช่องว่าง ทำให้มีความยาวมากกว่าการประกอบคู่เบสทั่วไป[ 11 ]

คอนติ๊กและสแคฟโฟลด์

แผนภาพแสดงการเรียงลำดับของลำดับดีเอ็นเอที่อ่านได้ ซึ่งก่อตัวเป็นคอนติ๊กและสามารถนำมาประกอบกันเป็นสแคฟโฟลด์ในกระบวนการลำดับและประกอบจีโนมอ้างอิงอย่างสมบูรณ์ ช่องว่างระหว่างคอนติ๊ก 1 และ 2 ระบุว่ามีการลำดับดีเอ็นเอแล้วและก่อตัวเป็นสแคฟโฟลด์ ในขณะที่ช่องว่างอีกช่องหนึ่งไม่ได้ถูกลำดับดีเอ็นเอและคั่นระหว่างสแคฟโฟลด์ 1 และ 2

การประกอบจีโนมอ้างอิงต้องใช้การอ่านที่ซ้อนทับกัน ทำให้เกิดคอนทิกส์ซึ่งเป็นบริเวณ DNA ที่ต่อเนื่องกันของลำดับคอนเซนซัส [ 12 ] หากมีช่องว่างระหว่างคอนทิกส์ ช่องว่างเหล่านี้สามารถเติมเต็มได้โดย การสร้าง โครงร่าง ไม่ ว่าจะโดยการขยายคอนทิกส์ด้วย PCR และการจัดลำดับ หรือโดยการโคลนนิ่งโครโมโซมเทียมของแบคทีเรีย (BAC) [ 13 ] [ 12 ]การเติมเต็มช่องว่างเหล่านี้ไม่สามารถทำได้เสมอไป ในกรณีนี้จะมีการสร้างโครงร่างหลายอันในการประกอบอ้างอิง[ 14 ]โครงร่างถูกจำแนกออกเป็น 3 ประเภท: 1) ระบุตำแหน่งแล้ว ซึ่งทราบโครโมโซม พิกัดจีโนม และทิศทาง 2) ไม่ระบุตำแหน่ง เมื่อทราบเฉพาะโครโมโซม แต่ไม่ทราบพิกัดหรือทิศทาง 3) ไม่ระบุตำแหน่ง ซึ่งไม่ทราบโครโมโซม[ 15 ]

จำนวนคอนทิกและสแคฟโฟลด์รวมถึงความยาวเฉลี่ยของพวกมัน เป็นพารามิเตอร์ที่เกี่ยวข้องในบรรดาพารามิเตอร์อื่นๆ อีกมากมาย สำหรับการประเมินคุณภาพการประกอบจีโนมอ้างอิง เนื่องจากให้ข้อมูลเกี่ยวกับความต่อเนื่องของการแมปขั้นสุดท้ายจากจีโนมดั้งเดิม ยิ่งจำนวนสแคฟโฟลด์ต่อโครโมโซมน้อยลง จนกระทั่งสแคฟโฟลด์เดียวครอบคลุมทั้งโครโมโซม ความต่อเนื่องของการประกอบจีโนมก็จะยิ่งมากขึ้น[ 16 ] [ 17 ] [ 18 ]พารามิเตอร์อื่นๆ ที่เกี่ยวข้อง ได้แก่N50และL50 N50 คือความยาวของคอนทิก/สแคฟโฟลด์ที่ 50% ของการประกอบพบในชิ้นส่วนที่มีความยาวนี้หรือมากกว่า ในขณะที่ L50 คือจำนวนคอนทิก/สแคฟโฟลด์ที่มีความยาวเท่ากับ N50 ยิ่งค่า N50 สูง ค่า L50 ก็จะยิ่งต่ำ และในทางกลับกัน ซึ่งบ่งชี้ถึงความต่อเนื่องสูงในการประกอบ[ 19 ] [ 20 ] [ 21 ]

จีโนมของสัตว์เลี้ยงลูกด้วยนม

จีโนมอ้างอิงของมนุษย์และหนูได้รับการดูแลและปรับปรุงโดย กลุ่มวิจัยจีโนมอ้างอิง ( Genome Reference Consortiumหรือ GRC) ซึ่งเป็นกลุ่มนักวิทยาศาสตร์ไม่ถึง 20 คนจากสถาบันวิจัยจีโนมหลายแห่ง รวมถึง สถาบันชีวสารสนเทศแห่ง ยุโรป (European Bioinformatics Institute ) ศูนย์ข้อมูลเทคโนโลยีชีวภาพแห่งชาติ (National Center for Biotechnology Information) สถาบันแซงเกอร์ (Sanger Institute ) และ สถาบัน จีโนมแม คดอนเนลล์ (McDonnell Genome Institute)ที่มหาวิทยาลัยวอชิงตันในเซนต์หลุยส์ GRC ยังคงปรับปรุงจีโนมอ้างอิงอย่างต่อเนื่องโดยการสร้างการจัดเรียงลำดับใหม่ที่มีช่องว่างน้อยลง และแก้ไขการแสดงลำดับที่ไม่ถูกต้อง

จีโนมอ้างอิงของมนุษย์

จีโนมอ้างอิงของมนุษย์ดั้งเดิมได้มาจากอาสาสมัครนิรนาม 13 คนจากเมืองบัฟฟาโล รัฐนิวยอร์กมีการรับสมัครผู้บริจาคโดยการโฆษณาในหนังสือพิมพ์The Buffalo News ในวันอาทิตย์ที่ 23 มีนาคม พ.ศ. 2540 อาสาสมัครชาย 10 คนแรกและหญิง 10 คนแรกได้รับเชิญให้นัดหมายกับ ที่ปรึกษาด้านพันธุกรรมของโครงการและบริจาคเลือดเพื่อสกัด DNA เนื่องจากวิธีการประมวลผลตัวอย่าง DNA ทำให้ประมาณ 80 เปอร์เซ็นต์ของจีโนมอ้างอิงมาจากคน 8 คน โดยผู้ชายคนหนึ่งซึ่งกำหนดให้เป็นRP11คิดเป็น 66 เปอร์เซ็นต์ของจีโนมทั้งหมดระบบหมู่เลือด ABOแตกต่างกันในมนุษย์ แต่จีโนมอ้างอิงของมนุษย์มีเพียงอัลลีล O เท่านั้น แม้ว่าอัลลี ลอื่นๆ จะถูกระบุไว้แล้ว ก็ตาม [ 22 ] [ 23 ] [ 24 ] [ 25 ] [ 26 ]

การเปลี่ยนแปลงของต้นทุนในการถอดรหัสจีโนมมนุษย์ตั้งแต่ปี 2001 ถึง 2021 เมื่อเทียบกับกฎของมัวร์

เนื่องจากต้นทุนของการจัดลำดับดีเอ็นเอลดลง และ เทคโนโลยี การจัดลำดับจีโนมแบบเต็มรูปแบบ ใหม่ๆ เกิดขึ้น ทำให้มีการสร้างลำดับจีโนมมากขึ้นเรื่อยๆ ในหลายกรณี บุคคลเช่นเจมส์ ดี. วัตสันได้รับการประกอบจีโนมโดยใช้การจัดลำดับดีเอ็นเอแบบขนานขนาดใหญ่[ 27 ] [ 28 ] การเปรียบเทียบระหว่างจีโนมอ้างอิง (การประกอบ NCBI36/hg18) และจีโนมของวัตสัน พบ ความแตกต่าง ของโพลีมอร์ฟิซึมของนิวคลีโอไทด์เดี่ยว 3.3 ล้าน ตำแหน่ง ในขณะที่ดีเอ็นเอของเขาประมาณ 1.4 เปอร์เซ็นต์ไม่สามารถจับคู่กับจีโนมอ้างอิงได้เลย[ 26 ] [ 27 ]สำหรับบริเวณที่ทราบว่ามีความแปรผันขนาดใหญ่ ชุดของโลคัส ทางเลือก จะถูกประกอบควบคู่ไปกับโลคัสอ้างอิง

แผนภาพโครโมโซมของชุดประกอบจีโนมอ้างอิงของมนุษย์ GRCh38/hg38 รูปแบบแถบลักษณะเฉพาะแสดงด้วยสีดำ เทา และขาว ในขณะที่ช่องว่างและบริเวณที่ประกอบบางส่วนแสดงด้วยสีน้ำเงินและชมพูตามลำดับ อ้างอิง: Genome Data Viewer ของ NCBI [ 29 ]

ชุดประกอบจีโนมอ้างอิงมนุษย์ล่าสุดที่เผยแพร่โดยGenome Reference Consortiumคือ GRCh38 ในปี 2017 [ 30 ]มีการเพิ่มแพตช์หลายรายการเพื่ออัปเดต โดยแพตช์ล่าสุดคือ GRCh38.p14 ซึ่งเผยแพร่เมื่อวันที่ 3 กุมภาพันธ์ 2022 [ 31 ] [ 32 ]เวอร์ชันนี้มีช่องว่างเพียง 349 ช่องตลอดทั้งชุดประกอบ ซึ่งหมายถึงการปรับปรุงที่ดีขึ้นมากเมื่อเทียบกับเวอร์ชันแรกที่มีช่องว่างประมาณ 150,000 ช่อง[ 23 ]ช่องว่างส่วนใหญ่จะอยู่ในบริเวณต่างๆ เช่นเทโลเมียร์เซนโทรเมียร์และลำดับซ้ำ ยาว โดยมีช่องว่างที่ใหญ่ที่สุดอยู่ตามแขนยาวของโครโมโซม Y ซึ่งเป็นบริเวณที่มีความยาวประมาณ 30 Mb (ประมาณ 52% ของความยาวโครโมโซม Y) [ 33 ]จำนวนไลบรารีโคลนจีโนมที่สนับสนุนข้อมูลอ้างอิงเพิ่มขึ้นอย่างต่อเนื่องเป็นมากกว่า 60 ในช่วงหลายปีที่ผ่านมา แม้ว่าRP11 แต่ละตัว จะยังคงคิดเป็น 70% ของจีโนมอ้างอิง ก็ตาม [ 34 ]การวิเคราะห์จีโนมของชายนิรนามคนนี้ชี้ให้เห็นว่าเขามีเชื้อสายแอฟริกัน-ยุโรป[ 34 ]ตามเว็บไซต์ของ GRC การเผยแพร่ชุดประกอบจีโนมมนุษย์ครั้งต่อไป (เวอร์ชัน GRCh39) ในขณะนี้ "ถูกเลื่อนออกไปอย่างไม่มีกำหนด" [ 35 ]

ในปี 2022 กลุ่มความร่วมมือ Telomere-to-Telomere (T2T) [ 36 ]ซึ่งเป็นความพยายามแบบเปิดและอิงชุมชน ได้เผยแพร่จีโนมอ้างอิงที่ประกอบเสร็จสมบูรณ์เป็นครั้งแรก (เวอร์ชัน T2T-CHM13) โดยไม่มีช่องว่างในการประกอบ โดยยังไม่มีโครโมโซม Y จนกระทั่งเวอร์ชัน 2.0 [ 37 ] [ 38 ]การประกอบนี้ทำให้สามารถตรวจสอบวิวัฒนาการของลำดับเซนโทรเมียร์และเพอริเซนโทรเมียร์ได้ กลุ่มความร่วมมือได้ใช้วิธีการที่เข้มงวดในการประกอบ ทำความสะอาด และตรวจสอบความถูกต้องของบริเวณซ้ำที่ซับซ้อนซึ่งยากต่อการจัดลำดับเป็นพิเศษ[ 39 ]โดยใช้การจัดลำดับแบบอ่านยาวพิเศษ (>100 kb) เพื่อจัด ลำดับการทำ ซ้ำของส่วนต่างๆ อย่างแม่นยำ [ 40 ]

T2T-CHM13 ได้รับการจัดลำดับจาก CHM13hTERT ซึ่งเป็นสายเซลล์จากเนื้องอกไฮดาติฟอร์ม ที่เป็นแฮพลอยด์โดยพื้นฐาน "CHM" ย่อมาจาก "Complete Hydatidiform Mole" และ "13" คือหมายเลขสายเซลล์ "hTERT" ย่อมาจาก "human Telomerase Reverse Transcriptase " สายเซลล์นี้ได้รับการถ่ายทอดยีน TERT ซึ่งมีหน้าที่ในการรักษาระดับความยาวของเทโลเมียร์และทำให้สายเซลล์นี้มีอายุยืนยาว [ 41 ] เนื้องอกไฮดาติฟอร์มมีสำเนาของจีโนมจากพ่อแม่เดียวกันสองชุด ดังนั้นจึงเป็นแฮพลอยด์โดยพื้นฐาน ซึ่งช่วยขจัดความแปรผันของอัลีและทำให้การจัดลำดับมีความแม่นยำมากขึ้น[ 40 ]

การประกอบจีโนมล่าสุดมีดังนี้: [ 42 ]

ชื่อรุ่น วันที่วางจำหน่าย เวอร์ชันเทียบเท่า UCSC
จีอาร์ช39 เลื่อนออกไปอย่างไม่มีกำหนด[ 35 ]-
ที2ที-เอชเอ็ม13 มกราคม 2565 เอชเอส1
จีอาร์ช38 ธันวาคม 2556 เอชจี38
จีอาร์ช37 กุมภาพันธ์ 2552 เอชจี19
NCBI Build 36.1 มีนาคม 2549 เอชจี18
NCBI Build 35 พฤษภาคม 2547 เอชจี17
NCBI Build 34 กรกฎาคม 2546 เอชจี16

ข้อจำกัด

สำหรับจีโนมส่วนใหญ่ จีโนมอ้างอิงจะให้ค่าประมาณที่ดีของดีเอ็นเอของแต่ละบุคคล แต่ในบริเวณที่มีความหลากหลายของอัลลีล สูง เช่นคอมเพล็กซ์ฮิสโตคอมแพติบิลิตีหลักในมนุษย์และโปรตีนในปัสสาวะหลักของหนู จีโนมอ้างอิงอาจแตกต่างจากบุคคลอื่นอย่างมีนัยสำคัญ[ 43 ] [ 44 ] [ 45 ]เนื่องจากจีโนมอ้างอิงเป็นลำดับที่แตกต่างกัน "เดียว" ซึ่งทำให้มีประโยชน์ในฐานะดัชนีหรือตัวระบุตำแหน่งของคุณลักษณะทางจีโนม จึงมีข้อจำกัดในแง่ของความถูกต้องแม่นยำในการแสดงจีโนมมนุษย์และความแปรปรวน ของมัน ตัวอย่างเริ่มต้นส่วนใหญ่ที่ใช้สำหรับการจัดลำดับจีโนมอ้างอิงมาจากผู้คนที่มีเชื้อสายยุโรป ในปี 2010 พบว่า การประกอบจีโนม ใหม่จากประชากรแอฟริกันและเอเชียโดยใช้จีโนมอ้างอิงของ NCBI (เวอร์ชัน NCBI36) ทำให้จีโนมเหล่านี้มีลำดับ ~5Mb ที่ไม่ตรงกับบริเวณใดๆ ของจีโนมอ้างอิง[ 46 ]

โครงการต่อยอดจากโครงการจีโนมมนุษย์มุ่งเน้นที่จะศึกษาลักษณะทางพันธุกรรมของมนุษย์ที่ลึกซึ้งและหลากหลายมากขึ้น ซึ่งจีโนมอ้างอิงไม่สามารถแสดงได้โครงการ HapMapซึ่งดำเนินการในช่วงปี 2002-2010 มีวัตถุประสงค์เพื่อสร้าง แผนที่ แฮพลอไทป์และรูปแบบที่พบได้บ่อยที่สุดในประชากรมนุษย์กลุ่มต่างๆ มีการศึกษาประชากรที่มีเชื้อสายแตกต่างกันถึง 11 กลุ่ม เช่น ชาวฮั่นจากจีนชาวกุจาราตีจากอินเดีย ชาว โยรูบาจากไนจีเรีย หรือชาวญี่ปุ่นเป็นต้น[ 47 ] [ 48 ] [ 49 ] [ 50 ]โครงการ1000 Genomesซึ่งดำเนินการระหว่างปี 2008 ถึง 2015 มีเป้าหมายเพื่อสร้างฐานข้อมูลที่รวมรูปแบบต่างๆ มากกว่า 95% ที่มีอยู่ในจีโนมมนุษย์ และผลลัพธ์สามารถนำไปใช้ในการศึกษาความสัมพันธ์กับโรคต่างๆ ( GWAS ) เช่น โรคเบาหวาน โรคหัวใจและหลอดเลือด หรือโรคภูมิต้านตนเอง ในโครงการนี้ มีการศึกษากลุ่มชาติพันธุ์ทั้งหมด 26 กลุ่ม ซึ่งเป็นการขยายขอบเขตของโครงการ HapMap ไปสู่กลุ่มชาติพันธุ์ใหม่ๆ เช่น ชาวเมนเดแห่งเซียร์ราลีโอนชาวเวียดนามหรือชาวเบงกาลี [ 51 ] [ 52 ] [ 53 ] [ 54 ] โครงการ Human Pangenome Projectซึ่งเริ่มต้นในระยะแรกในปี 2019 ด้วยการสร้าง Human Pangenome Reference Consortium มุ่งหวังที่จะสร้างแผนที่ความแปรผันทางพันธุกรรมของมนุษย์ที่ใหญ่ที่สุด โดยใช้ผลการศึกษาในอดีตเป็นจุดเริ่มต้น[ 55 ] [ 56 ]

จีโนมอ้างอิงของหนู

การประกอบจีโนมของหนูเมื่อเร็ว ๆ นี้มีดังต่อไปนี้: [ 42 ]

ชื่อรุ่น วันที่วางจำหน่าย เวอร์ชันเทียบเท่า UCSC
จีอาร์ซีเอ็ม39 มิถุนายน 2020 มม.39
จีอาร์ซีเอ็ม38 ธันวาคม 2554 มม.10
NCBI Build 37 กรกฎาคม 2550 มม.9
NCBI Build 36 กุมภาพันธ์ 2549 มม.8
NCBI Build 35 สิงหาคม 2548 มม.7
NCBI Build 34 มีนาคม 2548 มม.6

จีโนมอื่นๆ

นับตั้งแต่โครงการจีโนมมนุษย์เสร็จสิ้นลง โครงการระดับนานาชาติหลายโครงการได้เริ่มต้นขึ้น โดยมุ่งเน้นการประกอบจีโนมอ้างอิงสำหรับสิ่งมีชีวิตหลายชนิด สิ่งมีชีวิตต้นแบบ (เช่น ปลาซีบรา ( Danio rerio ), ไก่ ( Gallus gallus ), แบคทีเรีย Escherichia coliเป็นต้น) เป็นที่สนใจเป็นพิเศษของชุมชนวิทยาศาสตร์ เช่นเดียวกับสัตว์ใกล้สูญพันธุ์ (เช่น ปลาอะโรวาน่าเอเชีย ( Scleropages formosus )หรือกระทิงอเมริกัน ( Bison bison )) ณ เดือนสิงหาคม 2022 ฐานข้อมูล NCBI รองรับจีโนมที่ได้รับการจัดลำดับและประกอบบางส่วนหรือทั้งหมดแล้ว 71,886 จีโนมจากสายพันธุ์ต่างๆ เช่น สัตว์เลี้ยงลูกด้วยนม 676 ชนิด นก 590 ชนิดและปลา 865 ชนิด นอกจากนี้ยังมีจำนวนจีโนมแมลง 1,796 ชนิด เชื้อรา 3,747 ชนิด พืช 1,025 ชนิด แบคทีเรีย 33,724 ชนิด ไวรัส 26,004 ชนิดและอาร์เคีย 2,040 ชนิด ที่น่าสนใจอีก ด้วย[ 57 ]สายพันธุ์เหล่านี้จำนวนมากมีข้อมูลคำอธิบายประกอบที่เกี่ยวข้องกับจีโนมอ้างอิง ซึ่งสามารถเข้าถึงและแสดงผลได้ในเบราว์เซอร์จีโนม เช่นEnsemblและUCSC Genome Browser [ 58 ] [ 59 ]

ตัวอย่างบางส่วนของโครงการระหว่างประเทศเหล่านี้ ได้แก่โครงการจีโนมชิมแปนซีซึ่งดำเนินการร่วมกันระหว่างBroad InstituteและMcDonnell Genome Instituteแห่งมหาวิทยาลัยวอชิงตันในเซนต์หลุยส์ ระหว่างปี 2005 ถึง 2013 ซึ่งสร้างจีโนมอ้างอิงชุดแรกสำหรับPan troglodytes 4 สายพันธุ์ ย่อย[ 60 ] [ 61 ]โครงการจีโนมเชื้อโรค 100,000 ชนิด ซึ่งเริ่มต้นในปี 2012 โดยมีเป้าหมายหลักคือการสร้างฐานข้อมูลจีโนมอ้างอิงสำหรับจุลินทรีย์ ก่อโรค 100,000 ชนิดเพื่อใช้ในสาธารณสุข การตรวจจับการระบาด การเกษตร และสิ่งแวดล้อม[ 62 ] โครงการ Earth BioGenomeซึ่งเริ่มต้นในปี 2018 และมีเป้าหมายในการจัดลำดับและจัดทำแคตตาล็อกจีโนมของสิ่งมีชีวิตยูคาริโอตทั้งหมดบนโลก เพื่อส่งเสริมโครงการอนุรักษ์ความหลากหลายทางชีวภาพ ภายในโครงการวิทยาศาสตร์ขนาดใหญ่นี้ มีโครงการย่อยที่เกี่ยวข้องมากถึง 50 โครงการ เช่นโครงการ Africa BioGenomeหรือโครงการ1000 Fungal Genomes [ 63 ] [ 64 ] [ 65 ]

ดูเพิ่มเติม

  • กลุ่มอ้างอิงจีโนม
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Reference_genome&oldid=1353765350 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ จีโนมอ้างอิง

จีโนมอ้างอิงคือชุดประกอบจีโนมที่แสดงลำดับพันธุกรรมที่สมบูรณ์ของสิ่งมีชีวิตเป็นสายต่อเนื่องของนิวคลีโอไทด์ (A, T, C และ G) โดยทั่วไปแล้ว...

คอนติ๊กและสแคฟโฟลด์

การประกอบจีโนมอ้างอิงต้องใช้การอ่านที่ซ้อนทับกัน ทำให้เกิด คอนทิกส์ ซึ่งเป็นบริเวณ DNA ที่ต่อเนื่องกันของ ลำดับคอนเซนซัส [ 12 ] หาก มีช่องว่างระหว่างคอนทิกส์ ช่องว่างเหล่านี้สามารถเติมเต็มได้โดย การสร้าง โครงร่าง ไม่ ว่าจะโดยการขยายคอนทิกส์ด้วย PCR...

จีโนมของสัตว์เลี้ยงลูกด้วยนม

จีโนมอ้างอิงของมนุษย์และหนูได้รับการดูแลและปรับปรุงโดย กลุ่มวิจัยจีโนมอ้างอิง ( Genome Reference Consortium หรือ GRC) ซึ่งเป็นกลุ่มนักวิทยาศาสตร์ไม่ถึง 20 คนจากสถาบันวิจัยจีโนมหลายแห่ง รวมถึง สถาบันชีวสารสนเทศแห่ง ยุโรป (European Bioinformatics Institute )...

จีโนมอ้างอิงของมนุษย์

จีโนมอ้างอิงของมนุษย์ดั้งเดิมได้มาจากอาสาสมัครนิรนาม 13 คนจาก เมืองบัฟฟาโล รัฐนิวยอร์ก มีการรับสมัครผู้บริจาคโดยการโฆษณาในหนังสือพิมพ์ The Buffalo News ในวันอาทิตย์ที่ 23 มีนาคม พ.ศ.