อ่าน 2 นาที
SAMtools
SAMtools เป็นชุดยูทิลิตี้สำหรับการโต้ตอบและการประมวลผลหลังการจัด เรียงลำดับการอ่าน DNA สั้น ในรูป แบบ SAM (Sequence Alignment/Map), BAM (Binary Alignment/Map) และ CRAM...
SAMtools
| SAMtools | |
|---|---|
| ผู้เขียนต้นฉบับ | เฮง ลี่ |
| นักพัฒนา | จอห์น มาร์แชลล์ และปีเตอร์ ดาเนเซค และคณะ[ 1 ] |
| ปล่อย | 2009 |
| เวอร์ชันเสถียร | |
| เขียนเป็น | ซี |
| ระบบปฏิบัติการ | เหมือนยูนิก |
| พิมพ์ | ชีวสารสนเทศ |
| ใบอนุญาต | บีเอสดี , เอ็มไอ |
| เว็บไซต์ | www.htslib.org |
| ที่เก็บข้อมูล |
|
SAMtoolsเป็นชุดยูทิลิตี้สำหรับการโต้ตอบและการประมวลผลหลังการจัดเรียงลำดับการอ่าน DNA สั้นในรูป แบบ SAM (Sequence Alignment/Map), BAM (Binary Alignment/Map) และCRAMซึ่งเขียนโดยHeng Liไฟล์เหล่านี้ถูกสร้างขึ้นเป็นเอาต์พุตโดยโปรแกรมจัดเรียงลำดับการอ่านสั้นเช่นBWAมีทั้งเครื่องมือแบบง่ายและขั้นสูงให้เลือกใช้ รองรับงานที่ซับซ้อน เช่น การระบุตัวแปรและการดูการจัดเรียงลำดับ รวมถึงการจัดเรียง การจัดทำดัชนี การดึงข้อมูล และการแปลงรูปแบบ[ 3 ]ไฟล์ SAM อาจมีขนาดใหญ่มาก (หลายสิบกิกะไบต์เป็นเรื่องปกติ) ดังนั้นจึงใช้การบีบอัดเพื่อประหยัดพื้นที่ ไฟล์ SAM เป็นไฟล์ข้อความที่มนุษย์อ่านได้ และไฟล์ BAM เป็นเพียงไฟล์ไบนารีที่เทียบเท่ากัน ในขณะที่ไฟล์ CRAM เป็นรูปแบบคอนเทนเนอร์ไบนารีแบบคอลัมน์ที่มีโครงสร้างใหม่ ไฟล์ BAM มักจะถูกบีบอัดและมีประสิทธิภาพมากกว่าสำหรับซอฟต์แวร์ในการทำงานมากกว่าไฟล์ SAM SAMtools ทำให้สามารถทำงานกับไฟล์ BAM ที่บีบอัดได้โดยตรงโดยไม่ต้องคลายการบีบอัดไฟล์ทั้งหมด นอกจากนี้ เนื่องจากรูปแบบของไฟล์ SAM/BAM ค่อนข้างซับซ้อน โดยประกอบด้วยข้อมูลการอ่าน ข้อมูลอ้างอิง การจัดเรียงลำดับ ข้อมูลคุณภาพ และคำอธิบายประกอบที่ผู้ใช้กำหนด SAMtools จึงช่วยลดความยุ่งยากในการใช้งานไฟล์ SAM/BAM โดยการซ่อนรายละเอียดระดับต่ำเหล่านั้น
เนื่องจากโครงการของบุคคลที่สามพยายามใช้โค้ดจาก SAMtools ทั้งๆ ที่ไม่ได้ออกแบบมาให้ฝังในลักษณะนั้น จึงมีการตัดสินใจในเดือนสิงหาคม 2557 ที่จะแยกแพ็กเกจ SAMtools ออกเป็นไลบรารีซอฟต์แวร์แบบสแตนด์อะโลนที่มีAPI ที่กำหนดไว้อย่างดี (HTSlib) [ 4 ]โครงการสำหรับการเรียกตัวแปรและการจัดการข้อมูลตัวแปร (BCFtools) และแพ็กเกจ SAMtools แบบสแตนด์อะโลนสำหรับการทำงานกับข้อมูลการจัดเรียงลำดับ[ 5 ]
วิธีใช้งานและคำสั่งต่างๆ
เช่นเดียวกับคำสั่ง Unixหลายๆคำสั่ง คำสั่ง SAMtool ใช้ โมเดลแบบ สตรีมโดยข้อมูลจะไหลผ่านแต่ละคำสั่งราวกับถูกลำเลียงบนสายพานลำเลียงวิธีนี้ช่วยให้สามารถรวมหลายคำสั่งเข้าด้วยกันเป็นไปป์ไลน์การประมวลผลข้อมูลได้ แม้ว่าผลลัพธ์สุดท้ายอาจซับซ้อนมาก แต่ก็ใช้เพียงคำสั่งง่ายๆ จำนวนจำกัดเท่านั้นในการสร้างผลลัพธ์นั้น หากไม่ได้ระบุไว้ จะถือว่าใช้ สตรีมมาตรฐาน (stdin, stdout และ stderr) ข้อมูลที่ส่งไปยัง stdout จะถูกพิมพ์ลงบนหน้าจอโดยค่าเริ่มต้น แต่สามารถเปลี่ยนเส้นทางไปยังไฟล์อื่นได้ง่ายๆ โดยใช้ตัวเปลี่ยนเส้นทาง Unix ทั่วไป (> และ >>) หรือไปยังคำสั่งอื่นผ่านไปป์ (|)
คำสั่ง SAMtools
SAMtools มีคำสั่งต่อไปนี้ ซึ่งแต่ละคำสั่งเรียกใช้งานดังนี้samtools <subcommand>:
- ดู
- คำ สั่ง `view`ใช้สำหรับกรองข้อมูลในรูปแบบ SAM หรือ BAM โดยใช้ตัวเลือกและอาร์กิวเมนต์เพื่อเข้าใจว่าต้องการเลือกข้อมูลส่วนใด (อาจเลือกทั้งหมด) และส่งผ่านเฉพาะข้อมูลที่เลือกไว้เท่านั้น โดยปกติแล้ว ข้อมูลนำเข้าจะเป็นไฟล์ SAM หรือ BAM ที่ระบุเป็นอาร์กิวเมนต์ แต่ก็อาจเป็นข้อมูล SAM หรือ BAM ที่ส่งมาจากคำสั่งอื่นก็ได้ การใช้งานที่เป็นไปได้ ได้แก่ การดึงข้อมูลย่อยไปยังไฟล์ใหม่ การแปลงระหว่างรูปแบบ BAM และ SAM และการดูเนื้อหาไฟล์ดิบ ลำดับของข้อมูลที่ดึงออกมาจะยังคงอยู่
- เรียงลำดับ
- คำ สั่ง sortจะเรียงลำดับไฟล์ BAM ตามตำแหน่งในข้อมูลอ้างอิง โดยพิจารณาจากการจัดเรียงลำดับ องค์ประกอบ + พิกัดในข้อมูลอ้างอิงที่เบสตัวแรกที่ตรงกันในลำดับการอ่านจัดเรียงลำดับนั้น จะถูกใช้เป็นคีย์ในการเรียงลำดับ [TODO: ตรวจสอบ] โดยค่าเริ่มต้น ผลลัพธ์ที่เรียงลำดับแล้วจะถูกบันทึกไปยังไฟล์ใหม่ แต่สามารถกำหนดให้แสดงผลออกทาง stdout ได้ (โดยใช้ตัวเลือก -o) เนื่องจากการเรียงลำดับใช้หน่วยความจำมากและไฟล์ BAM อาจมีขนาดใหญ่ คำสั่งนี้จึงรองรับโหมดการแบ่งส่วน (ด้วยตัวเลือก -m) เพื่อใช้หน่วยความจำให้น้อยที่สุดตามที่กำหนดและสร้างไฟล์เอาต์พุตหลายไฟล์ จากนั้นสามารถรวมไฟล์เหล่านี้เข้าด้วยกันเพื่อสร้างไฟล์ BAM ที่เรียงลำดับแล้วอย่างสมบูรณ์ [TODO - ตรวจสอบรายละเอียดเพิ่มเติมอย่างละเอียด]
- ดัชนี
- คำ สั่ง indexจะสร้างไฟล์ดัชนีใหม่ ซึ่งช่วยให้ค้นหาข้อมูลในไฟล์ SAM หรือ BAM (ที่เรียงลำดับแล้ว) ได้อย่างรวดเร็ว เช่นเดียวกับดัชนีในฐานข้อมูล ไฟล์ *.sam.saiหรือ*.bam.bai ที่สร้างขึ้น จะช่วยให้โปรแกรมที่สามารถอ่านไฟล์นั้นทำงานกับข้อมูลในไฟล์ที่เกี่ยวข้องได้อย่างมีประสิทธิภาพมากขึ้น
- tview
- คำ สั่ง tviewเริ่มโปรแกรมดูข้อมูลแบบโต้ตอบที่ใช้ ASCII ซึ่งสามารถใช้แสดงภาพว่าการอ่านถูกจัดเรียงอย่างไรกับบริเวณเล็กๆ ที่ระบุของจีโนมอ้างอิง เมื่อเปรียบเทียบกับโปรแกรมดูข้อมูลแบบกราฟิก เช่น IGV [ 6 ]มันมีคุณสมบัติน้อยกว่า ภายในโปรแกรมดูข้อมูลนี้ สามารถกระโดดไปยังตำแหน่งต่างๆ ตามองค์ประกอบอ้างอิง (โดยใช้ 'g') และแสดงข้อมูลช่วยเหลือ ('?') ได้
- มไพล์อัพ
- คำ สั่ง mpileupจะสร้าง ไฟล์รูป แบบ pileup (หรือ BCF) ซึ่งแสดงข้อมูลเบสที่ทับซ้อนกันและอินเดลในแต่ละพิกัดจีโนมในไฟล์ BAM ที่ป้อนเข้ามา ไฟล์นี้สามารถนำไปใช้ในการระบุ SNP ได้เป็นต้น
- แฟลกสแตท
ดูเพิ่มเติม
ลิงก์ภายนอก
- เว็บไซต์อย่างเป็นทางการ
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ SAMtools
SAMtools เป็นชุดยูทิลิตี้สำหรับการโต้ตอบและการประมวลผลหลังการจัด เรียงลำดับการอ่าน DNA สั้น ในรูป แบบ SAM (Sequence Alignment/Map), BAM (Binary Alignment/Map) และ CRAM...
วิธีใช้งานและคำสั่งต่างๆ
เช่นเดียวกับคำสั่ง Unix หลายๆคำสั่ง คำสั่ง SAMtool ใช้ โมเดลแบบ สตรีม โดยข้อมูลจะไหลผ่านแต่ละคำสั่งราวกับถูกลำเลียงบน สายพานลำเลียง วิธีนี้ช่วยให้สามารถรวมหลายคำสั่งเข้าด้วยกันเป็นไปป์ไลน์การประมวลผลข้อมูลได้ แม้ว่าผลลัพธ์สุดท้ายอาจซับซ้อนมาก...
คำสั่ง SAMtools
SAMtools มีคำสั่งต่อไปนี้ ซึ่งแต่ละคำสั่งเรียกใช้งานดังนี้ samtools :
ลิงก์ภายนอก
Wikibooks มีข้อมูลเพิ่มเติมเกี่ยวกับหัวข้อ: SAMtools เว็บไซต์อย่างเป็นทางการ ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=SAMtools&oldid=1355171376 "