กลับไปหน้าบทความ

อ่าน 6 นาที

dbSNP

ฐาน ข้อมูลโพลีมอร์ฟิซึมของนิวคลีโอไทด์เดี่ยว [ 1 ] ( dbSNP ) เป็นคลังข้อมูลสาธารณะฟรีสำหรับ ความแปรผันทางพันธุกรรม ภายในและระหว่าง สายพันธุ์ ต่างๆ ซึ่งพัฒนาและดูแลโดย...

dbSNP

dbSNP
เนื้อหา
คำอธิบายฐานข้อมูลโพลีมอร์ฟิซึมของนิวคลีโอไทด์เดี่ยว
สิ่งมีชีวิตโฮโมเซเปียนส์
ติดต่อ
ศูนย์วิจัยศูนย์ข้อมูลเทคโนโลยีชีวภาพแห่งชาติ
การอ้างอิงหลักPMID  21097890
วันที่วางจำหน่าย1998
เข้าถึง
รูปแบบข้อมูลASN.1 , FASTA , XML
เว็บไซต์ncbi.nlm.nih.gov/snp/
ดาวน์โหลด URLftp://ftp.ncbi.nih.gov/snp/
URL ของเว็บเซอร์วิสยูทิลโซเอป

ฐานข้อมูลโพลีมอร์ฟิซึมของนิวคลีโอไทด์เดี่ยว[ 1 ] ( dbSNP ) เป็นคลังข้อมูลสาธารณะฟรีสำหรับความแปรผันทางพันธุกรรมภายในและระหว่างสายพันธุ์ ต่างๆ ซึ่งพัฒนาและดูแลโดยศูนย์ข้อมูลเทคโนโลยีชีวภาพแห่งชาติ (NCBI) ร่วมกับสถาบันวิจัยจีโนมมนุษย์แห่งชาติ (NHGRI)

แม้ว่าชื่อของฐานข้อมูลจะบ่งบอกว่าเป็นการรวบรวมโพลีมอร์ฟิซึมของนิวคลีโอไทด์เดี่ยว (SNP) เท่านั้น แต่ในความเป็นจริงแล้วฐานข้อมูลนี้ประกอบด้วยความแปรผันทางโมเลกุลที่หลากหลาย ได้แก่ SNP, โพลีมอร์ฟิซึมการลบและการแทรกสั้น ( indel ), เครื่องหมาย ไมโครแซทเทล ไลต์ หรือลำดับซ้ำสั้น (STR), โพลีมอร์ฟิซึมของนิวคลีโอไทด์หลายตัว (MNP), ลำดับเฮเทอโรไซกัส และตัวแปรที่มีชื่อ[ 2 ] dbSNP ยอมรับโพลีมอร์ฟิซึมที่เป็นกลางอย่างเห็นได้ชัด โพลีมอร์ฟิซึมที่สอดคล้องกับฟีโนไทป์ที่รู้จัก และบริเวณที่ไม่มีความแปรผัน ฐานข้อมูลนี้ถูกสร้างขึ้นในเดือนกันยายน พ.ศ. 2541 เพื่อเสริมGenBankซึ่งเป็นคอลเลกชันของลำดับกรดนิวคลีอิกและโปรตีนที่เปิดเผยต่อสาธารณะของ NCBI [ 2 ]

ในปี 2017 NCBI ได้หยุดให้การสนับสนุนสิ่งมีชีวิตที่ไม่ใช่มนุษย์ทั้งหมดใน dbSNP [ 3 ] ณ เวอร์ชัน 153 (เผยแพร่ในเดือนสิงหาคม 2019) dbSNP ได้รวบรวมข้อมูลเกือบ 2 พันล้านรายการ ซึ่งแสดงถึงตัวแปรที่แตกต่างกันมากกว่า 675 ล้านรายการสำหรับHomo sapiens

วัตถุประสงค์

dbSNP เป็นแหล่งข้อมูลออนไลน์ที่สร้างขึ้นเพื่อช่วยเหลือ นักวิจัย ทางชีววิทยาเป้าหมายคือการทำหน้าที่เป็นฐานข้อมูล เดียว ที่รวบรวมความแปรผันทางพันธุกรรมที่ระบุทั้งหมด ซึ่งสามารถนำมาใช้ในการตรวจสอบปรากฏการณ์ทางธรรมชาติที่เกี่ยวข้องกับพันธุกรรมได้หลากหลาย โดยเฉพาะอย่างยิ่ง การเข้าถึงความแปรผันระดับโมเลกุลที่จัดทำเป็นแคตตาล็อกไว้ใน dbSNP ช่วยในการวิจัยพื้นฐาน เช่น การทำแผนที่ทางกายภาพพันธุศาสตร์ประชากรการตรวจสอบความสัมพันธ์เชิงวิวัฒนาการ ตลอดจนความสามารถในการวัดปริมาณความแปรผัน ณ ตำแหน่งที่สนใจได้อย่างรวดเร็วและง่ายดาย นอกจากนี้ dbSNP ยังเป็นแนวทางในการวิจัยประยุกต์ในด้านเภสัชพันธุศาสตร์และความสัมพันธ์ของความแปรผันทางพันธุกรรมกับลักษณะทางฟีโนไทป์[ 4 ]ตามเว็บไซต์ของ NCBI ระบุว่า “การลงทุนระยะยาวในการวิจัยที่แปลกใหม่และน่าตื่นเต้นเช่นนี้ [dbSNP] ไม่เพียงแต่จะช่วยพัฒนาชีววิทยาของมนุษย์เท่านั้น แต่ยังจะปฏิวัติวงการแพทย์สมัยใหม่ด้วย”

a) แหล่งข้อมูลต่างๆ ส่งข้อมูลเข้ามา และแต่ละความแปรผันจะได้รับหมายเลขประจำตัว SNP ที่ส่งเข้ามาที่ไม่ซ้ำกัน (ss#) b) dbSNP รวบรวมบันทึก ss# ที่เหมือนกันเข้าไว้ในคลัสเตอร์ SNP อ้างอิง (rs#) เดียว ซึ่งประกอบด้วยข้อมูลจากแต่ละ ss# c) ผู้ใช้สามารถเรียกดูข้อมูลสำหรับบันทึก rs# ที่เฉพาะเจาะจงและวิเคราะห์ความแปรผันเหล่านี้ได้ d) ข้อมูลจาก dbSNP ช่วยในการวิจัยทางคลินิกและการวิจัยประยุกต์ หมายเลข ss# และ rs# ในรูปนี้เป็นเพียงตัวอย่างเท่านั้น NCBI, ศูนย์ข้อมูลเทคโนโลยีชีวภาพแห่งชาติ; OMIM, การถ่ายทอดทางพันธุกรรมแบบเมนเดลออนไลน์ในมนุษย์; GWAS, การศึกษาความสัมพันธ์ทั่วทั้งจีโนม

การส่ง

1. แหล่งที่มา

เดิมที dbSNP รับการส่งข้อมูลสำหรับสิ่งมีชีวิต ใดๆ จากแหล่งข้อมูลที่หลากหลาย รวมถึงห้องปฏิบัติการวิจัยแต่ละแห่ง ความพยายามในการค้นพบโพลีมอร์ฟิซึมแบบร่วมมือกัน ศูนย์ลำดับจีโนมขนาดใหญ่ ฐานข้อมูล SNP อื่นๆ (เช่น SNP consortium, HapMapเป็นต้น) และธุรกิจเอกชน[ 5 ]เมื่อวันที่ 1 กันยายน 2017 dbSNP ได้หยุดรับการส่งข้อมูลตัวแปรที่ไม่ใช่ของมนุษย์ และอีกสองเดือนต่อมา เว็บไซต์แบบโต้ตอบและบริการ NCBI ที่เกี่ยวข้องได้หยุดนำเสนอข้อมูลตัวแปรที่ไม่ใช่ของมนุษย์ ปัจจุบัน dbSNP รับและนำเสนอเฉพาะข้อมูลตัวแปรของมนุษย์เท่านั้น

2. ประเภทของบันทึก

การเปลี่ยนแปลงที่ส่งเข้ามาแต่ละรายการจะได้รับหมายเลขประจำตัว SNP ที่ส่งเข้ามา (“ss#”) [ 5 ]หมายเลขการเข้าถึงนี้เป็นตัวระบุที่เสถียรและไม่ซ้ำกันสำหรับการส่งนั้น บันทึก SNP ที่ส่งเข้ามาที่ไม่ซ้ำกันจะได้รับหมายเลขประจำตัว SNP อ้างอิง (“rs#”; “กลุ่ม refSNP”) ด้วย อย่างไรก็ตาม อาจมีการส่งบันทึกการเปลี่ยนแปลงมากกว่าหนึ่งรายการไปยัง dbSNP โดยเฉพาะอย่างยิ่งสำหรับการเปลี่ยนแปลงที่มีความสำคัญทางคลินิก เพื่อรองรับสิ่งนี้ dbSNP จะรวบรวมบันทึก SNP ที่ส่งเข้ามาที่เหมือนกันเข้าเป็นบันทึก SNP อ้างอิงเดียว ซึ่งเป็นตัวระบุที่ไม่ซ้ำกันและเสถียรเช่นกัน (ดูด้านล่าง) [ 4 ]

3. วิธีการส่งเอกสาร

ในการส่งข้อมูลการเปลี่ยนแปลงไปยัง dbSNP จำเป็นต้องได้รับรหัสผู้ส่งก่อน ซึ่งระบุห้องปฏิบัติการที่รับผิดชอบในการส่งข้อมูล[ 4 ]จากนั้น ผู้เขียนจะต้องกรอกไฟล์ส่งข้อมูลที่มีข้อมูลและรายละเอียดที่เกี่ยวข้อง บันทึกที่ส่งต้องมีข้อมูลสำคัญ 10 รายการตามตารางต่อไปนี้[ 4 ]ข้อมูลอื่นๆ ที่จำเป็นสำหรับการส่งข้อมูล ได้แก่ ข้อมูลติดต่อ ข้อมูลการตีพิมพ์ (ชื่อเรื่อง วารสาร ผู้เขียน ปี) ประเภทโมเลกุล (ดีเอ็นเอจีโนมซีดีเอ็นเอ ดีเอ็นเอไมโทคอนเดรีย ดีเอ็นเอ คลอโรพลาสต์) และสิ่งมีชีวิต[ 4 ]

องค์ประกอบ คำอธิบาย
บริบทของลำดับเหตุการณ์ (จำเป็น) องค์ประกอบสำคัญของการส่งข้อมูลไปยัง dbSNP คือตำแหน่งที่ชัดเจนของความแปรผันที่กำลังส่งเข้ามา ปัจจุบัน dbSNP กำหนดให้คุณต้องส่งตำแหน่งของความแปรผันเป็นตำแหน่งที่ระบุบนลำดับ RefSeq หรือ INSDC เป็นอย่างน้อย
อัลลีล (จำเป็น) อัลลีลเป็นตัวกำหนดแต่ละประเภทของความแปรผัน dbSNP กำหนดความแปรผันของนิวคลีโอไทด์เดี่ยวในรูปแบบการส่งข้อมูลเป็น G, A, T หรือ C และไม่อนุญาตให้ใช้รหัส IUPAC ที่คลุมเครือ เช่น N ในการกำหนดอัลลีลของความแปรผัน
วิธีการ (จำเป็น) ผู้ส่งข้อมูลแต่ละรายจะกำหนดวิธีการในเอกสารที่ส่งมา โดยระบุว่าเป็นเทคนิคที่ใช้ในการตรวจสอบความแปรผัน หรือเทคนิคที่ใช้ในการประมาณความถี่ของอัลลีล dbSNP จะจัดกลุ่มวิธีการตามประเภทของวิธีการ เพื่ออำนวยความสะดวกในการค้นหาโดยใช้เทคนิคการทดลองทั่วไปเป็นช่องค้นหา ผู้ส่งข้อมูลจะให้รายละเอียดอื่นๆ ทั้งหมดของเทคนิคในคำอธิบายวิธีการแบบข้อความอิสระ
แหล่งกำเนิดอัลลีลที่ระบุ (จำเป็น) ผู้ส่งข้อมูลสามารถให้คำแถลง (ข้อกล่าวอ้าง) พร้อมหลักฐานเชิงทดลองที่สนับสนุนว่าตัวแปรนั้นมีต้นกำเนิดอัลลีลเฉพาะ ข้อกล่าวอ้างสำหรับ refSNP เดียวจะถูกสรุปและกำหนดค่าคุณลักษณะเป็น germline หรือ unknown
จำนวนประชากร (จำเป็น) ผู้ส่งข้อมูลแต่ละรายจะกำหนดกลุ่มตัวอย่างประชากรว่าเป็นกลุ่มที่ใช้ในการระบุความแปรผันในเบื้องต้น หรือเป็นกลุ่มที่ใช้ในการระบุค่าความถี่ของอัลลีลเฉพาะประชากร ในบางกรณีของการออกแบบการทดลอง ประชากรทั้งสองกลุ่มนี้อาจเป็นกลุ่มเดียวกันก็ได้
ขนาดตัวอย่าง (ไม่บังคับ) ในฐานข้อมูล dbSNP มีช่องสำหรับระบุขนาดตัวอย่างอยู่สองช่อง ช่องแรกคือ SNPASSAY SAMPLE SIZE ซึ่งระบุจำนวนโครโมโซมในตัวอย่างที่ใช้ในการตรวจสอบหรือค้นพบความแปรผันในเบื้องต้น ส่วนช่องที่สองคือ SNPPOPUSE SAMPLE SIZE ซึ่งระบุจำนวนโครโมโซมที่ใช้เป็นตัวหารในการคำนวณค่าประมาณความถี่ของอัลลีล
ความถี่ของอัลลีลเฉพาะกลุ่มประชากร (ไม่บังคับ) ข้อมูลความถี่จะถูกส่งไปยัง dbSNP ในรูปแบบจำนวนอัลลีลหรือช่วงความถี่ที่แบ่งเป็นกลุ่ม ขึ้นอยู่กับความแม่นยำของวิธีการทดลองที่ใช้ในการวัด dbSNP มีบันทึกความถี่ของอัลลีลสำหรับกลุ่มตัวอย่างประชากรเฉพาะที่ผู้ส่งข้อมูลแต่ละรายกำหนดไว้ และใช้ในการตรวจสอบความถูกต้องของความแปรผันที่ส่งเข้ามา
ความถี่ของจีโนไทป์เฉพาะกลุ่มประชากร (ไม่บังคับ) เช่นเดียวกับอัลลีล จีโนไทป์ก็มีความถี่ในประชากรที่สามารถส่งไปยัง dbSNP ได้ และใช้ในการตรวจสอบความถูกต้องของความแปรผันที่ส่งเข้ามา
จีโนไทป์ของแต่ละบุคคล dbSNP รับข้อมูลจีโนไทป์ของแต่ละบุคคลจากตัวอย่างที่ได้รับจากผู้บริจาคที่ยินยอมให้จัดเก็บลำดับดีเอ็นเอของตนไว้ในฐานข้อมูลสาธารณะ (เช่น HapMap หรือโครงการ 1000 Genomes)
ข้อมูลการตรวจสอบ (ไม่บังคับ) การทดสอบที่ได้รับการตรวจสอบความถูกต้องโดยตรงจากผู้ส่งผ่านส่วนการตรวจสอบความถูกต้อง จะแสดงประเภทของหลักฐานที่ใช้ในการยืนยันความแปรผัน

ปล่อย

ข้อมูลใหม่ที่ได้รับจาก dbSNP จะเปิดเผยต่อสาธารณะเป็นระยะๆ ในรูปแบบของ “บิลด์” (เช่น การแก้ไขและการเผยแพร่ข้อมูล) [ 4 ]ไม่มีกำหนดการสำหรับการเผยแพร่บิลด์ใหม่ แต่โดยปกติแล้วจะมีการเผยแพร่บิลด์เมื่อมีบิลด์จีโนมใหม่พร้อมใช้งาน โดยสมมติว่าจีโนมนั้นมีการเปลี่ยนแปลงที่ถูกจัดทำเป็นแคตตาล็อกไว้[ 6 ]ซึ่งจะเกิดขึ้นประมาณทุกๆ 3-4 เดือน ลำดับจีโนมอาจได้รับการปรับปรุงเมื่อเวลาผ่านไป ดังนั้น SNP อ้างอิง (“refSNP”) จากบิลด์ก่อนหน้า รวมถึง SNP ที่ส่งเข้ามาใหม่ จะถูกแมปใหม่ไปยังลำดับจีโนมที่พร้อมใช้งานใหม่ SNP ที่ส่งเข้ามาหลายรายการ หากแมปไปยังตำแหน่งเดียวกัน จะถูกจัดกลุ่มเป็นคลัสเตอร์ refSNP เดียวกันและกำหนดหมายเลข ID ของ SNP อ้างอิง อย่างไรก็ตาม หากพบว่าบันทึกคลัสเตอร์ refSNP สองรายการแมปไปยังตำแหน่งเดียวกัน (เช่น เหมือนกัน) dbSNP จะรวมบันทึกเหล่านั้นเข้าด้วยกัน ในกรณีนี้ หมายเลข refSNP ที่เล็กกว่า (เช่น บันทึกที่เก่าที่สุด) จะแทนบันทึกทั้งสองรายการ และหมายเลข refSNP ที่ใหญ่กว่าจะล้าสมัย หมายเลข refSNP ที่ล้าสมัยเหล่านี้จะไม่ถูกนำมาใช้กับบันทึกใหม่ เมื่อมีการรวมบันทึก refSNP สองรายการเข้าด้วยกัน การเปลี่ยนแปลงจะถูกติดตาม และหมายเลข refSNP เดิมยังคงสามารถใช้เป็นคำค้นหาได้ กระบวนการรวมบันทึกที่เหมือนกันนี้ช่วยลดความซ้ำซ้อนภายใน dbSNP [ 6 ]

มีข้อยกเว้นสองประการสำหรับเกณฑ์การรวมข้างต้น ประการแรก การเปลี่ยนแปลงของคลาสที่แตกต่างกัน (เช่น SNP และ DIP) จะไม่ถูกรวมเข้าด้วยกัน ประการที่สอง refSNP ที่มีความสำคัญทางคลินิกซึ่งได้รับการอ้างอิงในวรรณกรรมเรียกว่า “มีค่า” การรวมที่จะกำจัด refSNP ดังกล่าวจะไม่ถูกดำเนินการ เนื่องจากอาจทำให้เกิดความสับสนในภายหลัง[ 6 ]

การเรียกค้นข้อมูล

1. วิธีการ

สามารถค้นหา dbSNP ได้โดยใช้เครื่องมือค้นหา Entrez SNP สามารถใช้คำค้นหาได้หลากหลายรูปแบบ เช่น รหัส ss, รหัส refSNP, ชื่อยีน, วิธีการทดลอง, กลุ่มประชากร, รายละเอียดประชากร, สิ่งพิมพ์, เครื่องหมาย, อัลลีล, โครโมโซม, ตำแหน่งเบส, ช่วงเฮเทอโรไซโกซิตี หรือหมายเลขบิลด์[ 6 ] [ 7 ]นอกจากนี้ ยังสามารถดึงผลลัพธ์จำนวนมากพร้อมกันได้โดยใช้การค้นหาแบบกลุ่ม[ 6 ]การค้นหาจะส่งคืนรหัส refSNP ที่ตรงกับคำค้นหาและสรุปข้อมูลที่มีอยู่สำหรับคลัสเตอร์ refSNP นั้น

2. เครื่องมือ/ข้อมูล

ข้อมูลที่มีให้สำหรับคลัสเตอร์ refSNP ประกอบด้วยข้อมูลพื้นฐานจากแต่ละการส่งข้อมูล (ดู “การส่งข้อมูล”) รวมถึงข้อมูลที่ได้จากการรวมข้อมูลจากการส่งหลายครั้ง (เช่น ความเป็นเฮเทอโรไซกัส ความถี่ของจีโนไทป์) มีเครื่องมือมากมายที่สามารถใช้ตรวจสอบคลัสเตอร์ refSNP ได้อย่างละเอียดมากขึ้น มุมมองแผนที่แสดงตำแหน่งของความแปรผันในจีโนมและความแปรผันอื่นๆ ที่อยู่ใกล้เคียง เครื่องมืออีกอย่างหนึ่งคือ มุมมองยีน ซึ่งรายงานตำแหน่งของความแปรผันภายในยีน (หากอยู่ในยีน) โคดอนเก่าและใหม่ กรดอะมิโนที่เข้ารหัสโดยทั้งสอง และว่าการเปลี่ยนแปลงนั้นเป็นแบบซินอนิมัสหรือไม่ซินอนิมัส โปรแกรมดูซีเควนซ์แสดงตำแหน่งของตัวแปรที่สัมพันธ์กับอินทรอนเอ็กซอนและตัวแปรอื่นๆ ที่อยู่ไกลและใกล้เคียง นอกจากนี้ยังมีแผนที่โครงสร้าง 3 มิติ ซึ่งแสดงภาพ 3 มิติของโปรตีนที่เข้ารหัส

dbSNP ยังเชื่อมโยงกับแหล่งข้อมูลอื่นๆ ของ NCBI อีกมากมาย รวมถึง ฐานข้อมูลนิวคลี โอไทด์โปรตีน ยีนอนุกรมวิธานและโครงสร้างตลอดจนPubMed , UniSTS, PMC , OMIMและ UniGene ด้วย

3. สถานะการตรวจสอบ

รายการสถานะการตรวจสอบความถูกต้องจะระบุหมวดหมู่ของหลักฐานที่สนับสนุนตัวแปร ซึ่งรวมถึง: (1) การส่งข้อมูลอิสระหลายรายการ; (2) ข้อมูลความถี่หรือจีโนไทป์; (3) การยืนยันจากผู้ส่ง; (4) การสังเกตอัลลีลทั้งหมดในโครโมโซมอย่างน้อยสองโครโมโซม; (5) จีโนไทป์โดยHapMap ; และ (6) ลำดับในโครงการ 1000 Genomes Project [ 6 ]

ปัญหาเกี่ยวกับคุณภาพข้อมูล

คุณภาพของข้อมูลที่พบใน dbSNP ถูกตั้งคำถามโดยกลุ่มวิจัยหลายกลุ่ม[ 8 ] [ 9 ] [ 10 ] [ 11 ] [ 12 ] [ 13 ] ซึ่งสงสัยว่ามี อัตรา ผลบวกเท็จ สูง เนื่องจาก ข้อผิดพลาดในการกำหนด จีโนไทป์ และการเรียกเบส ข้อผิด พลาดเหล่านี้สามารถป้อนเข้าสู่ dbSNP ได้ง่ายหากผู้ส่งใช้ (1) การจัดเรียงข้อมูล ทางชีวสารสนเทศ ที่ไม่วิพากษ์วิจารณ์ ของลำดับ DNA ที่คล้ายคลึงกันมากแต่แตกต่างกัน และ/หรือ (2) PCRที่มีไพรเมอร์ที่ไม่สามารถแยกแยะระหว่างลำดับ DNA ที่คล้ายคลึงกันแต่แตกต่างกันได้[ 8 ] Mitchell et al. (2004) [ 9 ]ได้ทบทวนการศึกษา 4 เรื่อง[ 10 ] [ 11 ] [ 12 ] [ 13 ]และสรุปว่า dbSNP มีอัตราการเกิดผลบวกเท็จระหว่าง 15 ถึง 17% สำหรับ SNP และ ความถี่ของ อัลลีล รองยัง มากกว่า 10% สำหรับ SNP ประมาณ 80% ที่ไม่ใช่ผลบวกเท็จ ในทำนองเดียวกัน Musemeci et al. (2010) [ 8 ]ระบุว่า SNP ที่เข้ารหัสแบบไบอัลลีลิกใน dbSNP มากถึง 8.32% เป็นสิ่งแปลกปลอมของลำดับ DNA ที่คล้ายคลึงกันมาก (เช่น ยีนพาราโลกัส) และเรียกรายการเหล่านี้ว่าความแตกต่างของนิวคลีโอไทด์เดี่ยว (SNDs) อัตราความผิดพลาดที่สูงใน dbSNP อาจไม่น่าแปลกใจ: จากรายการ refSNP 23.7 ล้านรายการสำหรับมนุษย์ มีเพียง 14.5 ล้านรายการเท่านั้นที่ได้รับการตรวจสอบแล้ว เหลืออีก 9.2 ล้านรายการเป็น SNP ที่เป็นผู้สมัคร อย่างไรก็ตาม ตามที่ Musemeci et al. (2010) [ 8 ] ระบุไว้ แม้แต่รหัสการตรวจสอบที่ให้ไว้ในบันทึก refSNP ก็มีประโยชน์เพียงบางส่วนเท่านั้น: การตรวจสอบ HapMap เพียงอย่างเดียวช่วยลดจำนวน SND (3% เทียบกับ 8%) แต่การยอมรับวิธีการนี้เพียงอย่างเดียวจะทำให้ SNP จริงใน dbSNP หายไปมากกว่าครึ่งหนึ่ง ผู้เขียนเหล่านี้ยังตั้งข้อสังเกตอีกว่า แหล่งข้อมูลหนึ่งจากกลุ่ม Lee เต็มไปด้วยข้อผิดพลาด: 20% ของข้อมูลเหล่านี้เป็น SND (เทียบกับ 8% สำหรับข้อมูลอื่นๆ) อย่างไรก็ตาม ดังที่ผู้เขียนตั้งข้อสังเกต การเพิกเฉยต่อข้อมูลเหล่านี้ทั้งหมดจะทำให้ SNP จริงหายไปจำนวนมาก

ข้อผิดพลาดใน dbSNP อาจขัดขวางการศึกษาความสัมพันธ์ของยีนเป้าหมาย[ 14 ]และการตรวจสอบตามแฮพลอไทป์[ 15 ]ข้อผิดพลาดอาจเพิ่มข้อสรุปที่ผิดพลาดในการศึกษาความสัมพันธ์ได้เช่นกัน: [ 8 ]การเพิ่มจำนวน SNP ที่ได้รับการทดสอบโดยการทดสอบ SNP ที่ผิดพลาดต้องใช้การทดสอบสมมติฐานมากขึ้น อย่างไรก็ตาม SNP ที่ผิดพลาดเหล่านี้ไม่สามารถเชื่อมโยงกับลักษณะได้จริง ดังนั้นระดับอัลฟาจึงลดลงมากกว่าที่จำเป็นสำหรับการทดสอบที่เข้มงวด หากทดสอบเฉพาะ SNP ที่แท้จริงเท่านั้น และอัตราการเกิดผลลบเท็จจะเพิ่มขึ้น Musemeci et al. (2010) [ 8 ]แนะนำให้ผู้เขียนการศึกษาความสัมพันธ์เชิงลบตรวจสอบการศึกษาครั้งก่อนของตนเพื่อหา SNP ที่ผิดพลาด (SND) ซึ่งสามารถนำออกจากการวิเคราะห์ได้

วิธีการอ้างอิงข้อมูลจาก dbSNP

ลำดับแต่ละลำดับสามารถอ้างอิงได้โดยใช้หมายเลข ID คลัสเตอร์ refSNP (เช่น rs206437) ควรใช้การอ้างอิง dbSNP โดยใช้เอกสารของ Sherry et al. ปี 2001 : Sherry, ST, Ward, MH, Kholodov, M., Baker, J., Phan, L., Smigielski, EM, Sirotkin, K. (2001). dbSNP: ฐานข้อมูลความแปรผันทางพันธุกรรมของ NCBI Nucleic Acids Research, 29: 308–311. [ 5 ]

ดูเพิ่มเติม

  • หน้าหลัก dbSNP
  • [1] วิธีการส่งข้อมูลไปยัง dbSNP
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=DbSNP&oldid=1359588711 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ dbSNP

ฐาน ข้อมูลโพลีมอร์ฟิซึมของนิวคลีโอไทด์เดี่ยว [ 1 ] ( dbSNP ) เป็นคลังข้อมูลสาธารณะฟรีสำหรับ ความแปรผันทางพันธุกรรม ภายในและระหว่าง สายพันธุ์ ต่างๆ ซึ่งพัฒนาและดูแลโดย...

วัตถุประสงค์

dbSNP เป็นแหล่งข้อมูลออนไลน์ที่สร้างขึ้นเพื่อช่วยเหลือ นักวิจัย ทางชีววิทยา เป้าหมายคือการทำหน้าที่เป็น ฐานข้อมูล เดียว ที่รวบรวมความแปรผันทางพันธุกรรมที่ระบุทั้งหมด ซึ่งสามารถนำมาใช้ในการตรวจสอบปรากฏการณ์ทางธรรมชาติที่เกี่ยวข้องกับพันธุกรรมได้หลากหลาย...

1. แหล่งที่มา

เดิมที dbSNP รับการส่งข้อมูลสำหรับ สิ่งมีชีวิต ใดๆ จากแหล่งข้อมูลที่หลากหลาย รวมถึงห้องปฏิบัติการวิจัยแต่ละแห่ง ความพยายามในการค้นพบโพลีมอร์ฟิซึมแบบร่วมมือกัน ศูนย์ลำดับจีโนมขนาดใหญ่ ฐานข้อมูล SNP อื่นๆ (เช่น SNP consortium, HapMap เป็นต้น) และธุรกิจเอกชน [ 5...

2. ประเภทของบันทึก

การเปลี่ยนแปลงที่ส่งเข้ามาแต่ละรายการจะได้รับหมายเลขประจำตัว SNP ที่ส่งเข้ามา (“ss#”) [ 5 ] หมายเลขการเข้าถึงนี้เป็นตัวระบุที่เสถียรและไม่ซ้ำกันสำหรับการส่งนั้น บันทึก SNP ที่ส่งเข้ามาที่ไม่ซ้ำกันจะได้รับหมายเลขประจำตัว SNP อ้างอิง (“rs#”; “กลุ่ม refSNP”)...