กลับไปหน้าบทความ

อ่าน 2 นาที

SAMtools

SAMtools เป็นชุดยูทิลิตี้สำหรับการโต้ตอบและการประมวลผลหลังการจัด เรียงลำดับการอ่าน DNA สั้น ในรูป แบบ SAM (Sequence Alignment/Map), BAM (Binary Alignment/Map) และ CRAM...

SAMtools

SAMtools
ผู้เขียนต้นฉบับเฮง ลี่
นักพัฒนาจอห์น มาร์แชลล์ และปีเตอร์ ดาเนเซค และคณะ[ 1 ]
ปล่อย2009
เวอร์ชันเสถียร
1.23.1 / 18 มีนาคม 2026 [ 2 ] ( 18 มีนาคม 2026 )
เขียนเป็นซี
ระบบปฏิบัติการเหมือนยูนิก
พิมพ์ชีวสารสนเทศ
ใบอนุญาตบีเอสดี , เอ็มไอ
เว็บไซต์www.htslib.org แก้ไขข้อมูลนี้บนวิกิดาต้า
ที่เก็บข้อมูล
  • github.com/samtools/samtools

SAMtoolsเป็นชุดยูทิลิตี้สำหรับการโต้ตอบและการประมวลผลหลังการจัดเรียงลำดับการอ่าน DNA สั้นในรูป แบบ SAM (Sequence Alignment/Map), BAM (Binary Alignment/Map) และCRAMซึ่งเขียนโดยHeng Liไฟล์เหล่านี้ถูกสร้างขึ้นเป็นเอาต์พุตโดยโปรแกรมจัดเรียงลำดับการอ่านสั้นเช่นBWAมีทั้งเครื่องมือแบบง่ายและขั้นสูงให้เลือกใช้ รองรับงานที่ซับซ้อน เช่น การระบุตัวแปรและการดูการจัดเรียงลำดับ รวมถึงการจัดเรียง การจัดทำดัชนี การดึงข้อมูล และการแปลงรูปแบบ[ 3 ]ไฟล์ SAM อาจมีขนาดใหญ่มาก (หลายสิบกิกะไบต์เป็นเรื่องปกติ) ดังนั้นจึงใช้การบีบอัดเพื่อประหยัดพื้นที่ ไฟล์ SAM เป็นไฟล์ข้อความที่มนุษย์อ่านได้ และไฟล์ BAM เป็นเพียงไฟล์ไบนารีที่เทียบเท่ากัน ในขณะที่ไฟล์ CRAM เป็นรูปแบบคอนเทนเนอร์ไบนารีแบบคอลัมน์ที่มีโครงสร้างใหม่ ไฟล์ BAM มักจะถูกบีบอัดและมีประสิทธิภาพมากกว่าสำหรับซอฟต์แวร์ในการทำงานมากกว่าไฟล์ SAM SAMtools ทำให้สามารถทำงานกับไฟล์ BAM ที่บีบอัดได้โดยตรงโดยไม่ต้องคลายการบีบอัดไฟล์ทั้งหมด นอกจากนี้ เนื่องจากรูปแบบของไฟล์ SAM/BAM ค่อนข้างซับซ้อน โดยประกอบด้วยข้อมูลการอ่าน ข้อมูลอ้างอิง การจัดเรียงลำดับ ข้อมูลคุณภาพ และคำอธิบายประกอบที่ผู้ใช้กำหนด SAMtools จึงช่วยลดความยุ่งยากในการใช้งานไฟล์ SAM/BAM โดยการซ่อนรายละเอียดระดับต่ำเหล่านั้น

เนื่องจากโครงการของบุคคลที่สามพยายามใช้โค้ดจาก SAMtools ทั้งๆ ที่ไม่ได้ออกแบบมาให้ฝังในลักษณะนั้น จึงมีการตัดสินใจในเดือนสิงหาคม 2557 ที่จะแยกแพ็กเกจ SAMtools ออกเป็นไลบรารีซอฟต์แวร์แบบสแตนด์อะโลนที่มีAPI ที่กำหนดไว้อย่างดี (HTSlib) [ 4 ]โครงการสำหรับการเรียกตัวแปรและการจัดการข้อมูลตัวแปร (BCFtools) และแพ็กเกจ SAMtools แบบสแตนด์อะโลนสำหรับการทำงานกับข้อมูลการจัดเรียงลำดับ[ 5 ]

วิธีใช้งานและคำสั่งต่างๆ

เช่นเดียวกับคำสั่ง Unixหลายๆคำสั่ง คำสั่ง SAMtool ใช้ โมเดลแบบ สตรีมโดยข้อมูลจะไหลผ่านแต่ละคำสั่งราวกับถูกลำเลียงบนสายพานลำเลียงวิธีนี้ช่วยให้สามารถรวมหลายคำสั่งเข้าด้วยกันเป็นไปป์ไลน์การประมวลผลข้อมูลได้ แม้ว่าผลลัพธ์สุดท้ายอาจซับซ้อนมาก แต่ก็ใช้เพียงคำสั่งง่ายๆ จำนวนจำกัดเท่านั้นในการสร้างผลลัพธ์นั้น หากไม่ได้ระบุไว้ จะถือว่าใช้ สตรีมมาตรฐาน (stdin, stdout และ stderr) ข้อมูลที่ส่งไปยัง stdout จะถูกพิมพ์ลงบนหน้าจอโดยค่าเริ่มต้น แต่สามารถเปลี่ยนเส้นทางไปยังไฟล์อื่นได้ง่ายๆ โดยใช้ตัวเปลี่ยนเส้นทาง Unix ทั่วไป (> และ >>) หรือไปยังคำสั่งอื่นผ่านไปป์ (|)

คำสั่ง SAMtools

SAMtools มีคำสั่งต่อไปนี้ ซึ่งแต่ละคำสั่งเรียกใช้งานดังนี้samtools <subcommand>:

ดู
คำ สั่ง `view`ใช้สำหรับกรองข้อมูลในรูปแบบ SAM หรือ BAM โดยใช้ตัวเลือกและอาร์กิวเมนต์เพื่อเข้าใจว่าต้องการเลือกข้อมูลส่วนใด (อาจเลือกทั้งหมด) และส่งผ่านเฉพาะข้อมูลที่เลือกไว้เท่านั้น โดยปกติแล้ว ข้อมูลนำเข้าจะเป็นไฟล์ SAM หรือ BAM ที่ระบุเป็นอาร์กิวเมนต์ แต่ก็อาจเป็นข้อมูล SAM หรือ BAM ที่ส่งมาจากคำสั่งอื่นก็ได้ การใช้งานที่เป็นไปได้ ได้แก่ การดึงข้อมูลย่อยไปยังไฟล์ใหม่ การแปลงระหว่างรูปแบบ BAM และ SAM และการดูเนื้อหาไฟล์ดิบ ลำดับของข้อมูลที่ดึงออกมาจะยังคงอยู่
เรียงลำดับ
คำ สั่ง sortจะเรียงลำดับไฟล์ BAM ตามตำแหน่งในข้อมูลอ้างอิง โดยพิจารณาจากการจัดเรียงลำดับ องค์ประกอบ + พิกัดในข้อมูลอ้างอิงที่เบสตัวแรกที่ตรงกันในลำดับการอ่านจัดเรียงลำดับนั้น จะถูกใช้เป็นคีย์ในการเรียงลำดับ [TODO: ตรวจสอบ] โดยค่าเริ่มต้น ผลลัพธ์ที่เรียงลำดับแล้วจะถูกบันทึกไปยังไฟล์ใหม่ แต่สามารถกำหนดให้แสดงผลออกทาง stdout ได้ (โดยใช้ตัวเลือก -o) เนื่องจากการเรียงลำดับใช้หน่วยความจำมากและไฟล์ BAM อาจมีขนาดใหญ่ คำสั่งนี้จึงรองรับโหมดการแบ่งส่วน (ด้วยตัวเลือก -m) เพื่อใช้หน่วยความจำให้น้อยที่สุดตามที่กำหนดและสร้างไฟล์เอาต์พุตหลายไฟล์ จากนั้นสามารถรวมไฟล์เหล่านี้เข้าด้วยกันเพื่อสร้างไฟล์ BAM ที่เรียงลำดับแล้วอย่างสมบูรณ์ [TODO - ตรวจสอบรายละเอียดเพิ่มเติมอย่างละเอียด]
ดัชนี
คำ สั่ง indexจะสร้างไฟล์ดัชนีใหม่ ซึ่งช่วยให้ค้นหาข้อมูลในไฟล์ SAM หรือ BAM (ที่เรียงลำดับแล้ว) ได้อย่างรวดเร็ว เช่นเดียวกับดัชนีในฐานข้อมูล ไฟล์ *.sam.saiหรือ*.bam.bai ที่สร้างขึ้น จะช่วยให้โปรแกรมที่สามารถอ่านไฟล์นั้นทำงานกับข้อมูลในไฟล์ที่เกี่ยวข้องได้อย่างมีประสิทธิภาพมากขึ้น
tview
คำ สั่ง tviewเริ่มโปรแกรมดูข้อมูลแบบโต้ตอบที่ใช้ ASCII ซึ่งสามารถใช้แสดงภาพว่าการอ่านถูกจัดเรียงอย่างไรกับบริเวณเล็กๆ ที่ระบุของจีโนมอ้างอิง เมื่อเปรียบเทียบกับโปรแกรมดูข้อมูลแบบกราฟิก เช่น IGV [ 6 ]มันมีคุณสมบัติน้อยกว่า ภายในโปรแกรมดูข้อมูลนี้ สามารถกระโดดไปยังตำแหน่งต่างๆ ตามองค์ประกอบอ้างอิง (โดยใช้ 'g') และแสดงข้อมูลช่วยเหลือ ('?') ได้
มไพล์อัพ
คำ สั่ง mpileupจะสร้าง ไฟล์รูป แบบ pileup (หรือ BCF) ซึ่งแสดงข้อมูลเบสที่ทับซ้อนกันและอินเดลในแต่ละพิกัดจีโนมในไฟล์ BAM ที่ป้อนเข้ามา ไฟล์นี้สามารถนำไปใช้ในการระบุ SNP ได้เป็นต้น
แฟลกสแตท

ดูเพิ่มเติม

  • เว็บไซต์อย่างเป็นทางการ
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=SAMtools&oldid=1355171376 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ SAMtools

SAMtools เป็นชุดยูทิลิตี้สำหรับการโต้ตอบและการประมวลผลหลังการจัด เรียงลำดับการอ่าน DNA สั้น ในรูป แบบ SAM (Sequence Alignment/Map), BAM (Binary Alignment/Map) และ CRAM...

วิธีใช้งานและคำสั่งต่างๆ

เช่นเดียวกับคำสั่ง Unix หลายๆคำสั่ง คำสั่ง SAMtool ใช้ โมเดลแบบ สตรีม โดยข้อมูลจะไหลผ่านแต่ละคำสั่งราวกับถูกลำเลียงบน สายพานลำเลียง วิธีนี้ช่วยให้สามารถรวมหลายคำสั่งเข้าด้วยกันเป็นไปป์ไลน์การประมวลผลข้อมูลได้ แม้ว่าผลลัพธ์สุดท้ายอาจซับซ้อนมาก...

คำสั่ง SAMtools

SAMtools มีคำสั่งต่อไปนี้ ซึ่งแต่ละคำสั่งเรียกใช้งานดังนี้ samtools :

ลิงก์ภายนอก

Wikibooks มีข้อมูลเพิ่มเติมเกี่ยวกับหัวข้อ: SAMtools เว็บไซต์อย่างเป็นทางการ ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=SAMtools&oldid=1355171376 "