อ่าน 10 นาที
รายชื่อซอฟต์แวร์การจัดเรียงลำดับ
รายชื่อซอฟต์แวร์จัดเรียงลำดับ นี้เป็นการรวบรวมเครื่องมือซอฟต์แวร์และพอร์ทัลบนเว็บที่ใช้ในการจัดเรียงลำดับแบบ คู่...
รายชื่อซอฟต์แวร์การจัดเรียงลำดับ
รายชื่อซอฟต์แวร์จัดเรียงลำดับ นี้เป็นการรวบรวมเครื่องมือซอฟต์แวร์และพอร์ทัลบนเว็บที่ใช้ในการจัดเรียงลำดับแบบ คู่ และการจัดเรียงลำดับหลายลำดับดูซอฟต์แวร์จัดเรียงลำดับโครงสร้างสำหรับการจัดเรียงลำดับโครงสร้างของโปรตีน
ค้นหาในฐานข้อมูลเท่านั้น
| ชื่อ | คำอธิบาย | ประเภทลำดับ* | ผู้เขียน | ปี |
|---|---|---|---|---|
| ระเบิด | การค้นหาแบบโลคอลด้วยฮิวริสติก k-tuple ที่รวดเร็ว (เครื่องมือค้นหาการจัดเรียงแบบโลคอลพื้นฐาน) | ทั้งคู่ | Altschul SF , Gish W , Miller W , Myers EW , Lipman DJ [ 1 ] | 1990 |
| เอชพีซี-เบลสต์ | ตัวห่อ BLAST แบบหลายโหนดและหลายคอร์ที่สอดคล้องกับ NCBI แจกจ่ายพร้อมกับ BLAST เวอร์ชันล่าสุด ตัวห่อนี้อำนวยความสะดวกในการประมวลผลแบบขนานของอัลกอริทึมบนสถาปัตยกรรมไฮบริดสมัยใหม่ที่มีหลายโหนดและหลายคอร์ภายในแต่ละโหนด[ 2 ] | โปรตีน | เบอร์ดีชอว์ ซีอี , ซอว์เยอร์ เอส , ฮอร์ตัน เอ็มดี , บรู๊ค อาร์จี , เรคาปัลลี บี | 2017 |
| ซีเอส-บลาสต์ | BLAST ที่จำเพาะต่อบริบทของลำดับ มีความไวมากกว่า BLAST, FASTA และ SSEARCH CSI-BLAST เวอร์ชันวนซ้ำที่จำเพาะต่อตำแหน่ง มีความไวมากกว่า PSI-BLAST | โปรตีน | Angermueller C, บีเกิร์ต เอ, โซดิง เจ[ 3 ] | 2013 |
| CUDASW++ | อัลกอริทึม Smith Waterman ที่เร่งความเร็วด้วย GPU สำหรับ GPU หลายตัวที่ใช้งานร่วมกัน | โปรตีน | หลิว วาย, มาสเคลล์ ดีแอล และ ชมิดท์ บี | 2009/2010 |
| เพชร | โปรแกรมจัดเรียงลำดับ BLASTX และ BLASTP ที่ใช้การจัดทำดัชนีแบบคู่ | โปรตีน | Buchfink B, Xie C, Huson DH, Reuter K, Drost HG [ 4 ] [ 5 ] | 2015/2021 |
| ฟาสต้า | การค้นหาในพื้นที่โดยใช้ ฮิวริสติก k -tuple ที่รวดเร็ว ช้ากว่าแต่มีความไวมากกว่า BLAST | ทั้งคู่ | ||
| จีจีซีเสิร์ช, จีแอลซีเสิร์ช | การจัดเรียงแบบ Global:Global (GG) และ Global:Local (GL) โดยใช้สถิติ | โปรตีน | ||
| นักมายากลจีโนม | ซอฟต์แวร์สำหรับการค้นหารูปแบบลำดับดีเอ็นเอเฉพาะที่อย่างรวดเร็วเป็นพิเศษ และการจัดเรียงลำดับแบบคู่สำหรับข้อมูล NGS (FASTA, FASTQ) | ดีเอ็นเอ | เฮปเปอร์เล ดี (www.sequentix.de) | 2020 |
| จีโนเกิล | Genoogle ใช้เทคนิคการจัดทำดัชนีและการประมวลผลแบบขนานในการค้นหาลำดับดีเอ็นเอและโปรตีน พัฒนาด้วยภาษา Java และเป็นโอเพนซอร์ส | ทั้งคู่ | อัลเบรชต์ เอฟ | 2015 |
| ฮัมเมอร์ | การค้นหาทั้งในระดับท้องถิ่นและระดับโลกด้วยโปรไฟล์แบบจำลองมาร์คอฟที่ซ่อนอยู่ ซึ่งมีความไวมากกว่า PSI-BLAST | ทั้งคู่ | Durbin R , Eddy SR , Krogh A , Mitchison G [ 6 ] | 1998 |
| ห้องสวีทเอชเอช | การเปรียบเทียบแบบคู่ระหว่างแบบจำลอง Hidden Markov Model; มีความไวสูงมาก | โปรตีน | Söding J [ 7 ] [ 8 ] | 2005/2012 |
| กองทัพอิสราเอล | ความถี่เอกสารผกผัน | ทั้งคู่ | ||
| นรก | การค้นหาโปรไฟล์SCFG | อาร์เอ็นเอ | เอ็ดดี้ เอส | |
| คลาสท์ | เครื่องมือค้นหาความคล้ายคลึงลำดับประสิทธิภาพสูงสำหรับใช้งานทั่วไป | ทั้งคู่ | 2009/2014 | |
| แลมบ์ดา | เครื่องจัดฟันเฉพาะที่ประสิทธิภาพสูง ใช้งานร่วมกับ BLAST ได้ แต่เร็วกว่ามาก รองรับ SAM/BAM | โปรตีน | ฮันเนส เฮาส์เวเดลล์, โจเชน ซิงเกอร์, คนุต ไรเนิร์ต[ 9 ] | 2014 |
| MMseqs2 | ชุดซอฟต์แวร์สำหรับค้นหาและจัดกลุ่มชุดลำดับขนาดใหญ่ มีความไวใกล้เคียงกับ BLAST และ PSI-BLAST แต่เร็วกว่าหลายเท่าตัว | โปรตีน | Steinegger M, Mirdita M, Galiez C, Söding J [ 10 ] | 2017 |
| ค้นหา | เครื่องมือวิเคราะห์ลำดับความเร็วสูงพิเศษ | ทั้งคู่ | Edgar, RC (2010). "การค้นหาและการจัดกลุ่มเร็วกว่า BLAST หลายเท่า" . Bioinformatics . 26 (19): 2460– 2461. doi : 10.1093/bioinformatics/btq461 . PMID 20709691 .สิ่งพิมพ์ | 2010 |
| ออสวาลด์ | OpenCL Smith-Waterman บน FPGA ของ Altera สำหรับฐานข้อมูลโปรตีนขนาดใหญ่ | โปรตีน | รุชชี่ อี, การ์เซีย ซี, โบเทลล่า จี, เด จิอุสติ เอ, นายูฟ เอ็ม, พริเอโต-มาเทียส เอ็ม[ 11 ] | 2016 |
| พาราเซล | การค้นหาแบบ Smith-Waterman ที่รวดเร็วโดยใช้การประมวลผลแบบขนาน SIMD | ทั้งคู่ | เดลี่ เจ | 2015 |
| พีเอสไอ-บลาสต์ | BLAST แบบวนซ้ำเฉพาะตำแหน่ง การค้นหาเฉพาะที่ด้วยเมทริกซ์การให้คะแนนเฉพาะตำแหน่งมีความไวมากกว่า BLAST มาก | โปรตีน | Altschul SF , Madden TL, Schäffer AA, Zhang J, Zhang Z, Miller W , Lipman DJ [ 12 ] | 1997 |
| พีเอสไอ-เสิร์ช | การผสมผสานอัลกอริธึมการค้นหาของสมิธ-วอเตอร์แมนเข้ากับ กลยุทธ์การสร้างโปรไฟล์ PSI-BLASTเพื่อค้นหาลำดับโปรตีนที่มีความสัมพันธ์ห่างไกล และป้องกันข้อผิดพลาดจากการขยายความคล้ายคลึงกันมากเกินไป | โปรตีน | Li W, McWilliam H, Goujon M, Cowley A, Lopez R, Pearson WR [ 13 ] | 2012 |
| พักผ่อนและฟื้นฟู | Retrieve and Relate (R&R) เป็นเครื่องมือค้นหาแบบหลายฐานข้อมูลที่มีประสิทธิภาพสูงแต่มีความละเอียดอ่อน สามารถค้นหาแบบขนานในลำดับดีเอ็นเอ อาร์เอ็นเอ และโปรตีนได้ | ทั้งคู่ | 2019 | |
| สกาลาบลาสต์ | BLAST ที่ปรับขนาดได้และขนานสูง | ทั้งคู่ | Oehmen et al. [ 14 ] | 2011 |
| เซควิลาบ | การเชื่อมโยงและวิเคราะห์ข้อมูลการจัดเรียงลำดับจากผลลัพธ์ NCBI-BLAST กับเซิร์ฟเวอร์/บริการวิเคราะห์ลำดับหลักๆ | นิวคลีโอไทด์, เปปไทด์ | 2010 | |
| แซม | การค้นหาทั้งในระดับท้องถิ่นและระดับโลกด้วยโปรไฟล์แบบจำลองมาร์คอฟที่ซ่อนอยู่ ซึ่งมีความไวมากกว่า PSI-BLAST | ทั้งคู่ | Karplus K , Krogh A [ 15 ] | 1999 |
| ค้นหา | การค้นหาแบบ Smith-Waterman ช้ากว่าแต่มีความไวมากกว่าการค้นหาแบบ FASTA | ทั้งคู่ | ||
| สวาฟี | อัลกอริทึมแบบขนานตัวแรกที่ใช้โปรเซสเซอร์ Intel Xeon Phi รุ่นใหม่ เพื่อเร่งความเร็วในการค้นหาฐานข้อมูลโปรตีน Smith-Waterman | โปรตีน | หลิว วาย และ ชมิดท์ บี | 2014 |
| สวาฟี-แอลเอส | อัลกอริทึม Smith-Waterman แบบขนานตัวแรกที่ใช้คลัสเตอร์ Intel Xeon Phi เพื่อเร่งความเร็วในการจัดเรียงลำดับ DNA ยาวๆ | ดีเอ็นเอ | Liu Y, Tran TT, Lauenroth F, Schmidt B | 2014 |
| ว่ายน้ำ | การใช้งาน Smith-Waterman สำหรับสถาปัตยกรรม Intel Multicore และ Manycore | โปรตีน | รุชชี อี, การ์เซีย ซี, โบเทลลา จี, เด จิอุสติ เอ, นายูฟ เอ็ม และ พริเอโต-มาเทียส เอ็ม[ 16 ] | 2015 |
| สวิมม์2.0 | อัลกอริทึม Smith-Waterman ที่ได้รับการปรับปรุงบนสถาปัตยกรรม Multicore และ Manycore ของ Intel โดยใช้ส่วนขยายเวกเตอร์ AVX-512 | โปรตีน | รุชชี อี, การ์เซีย ซี, โบเทลลา จี, เด จิอุสติ เอ, นายูฟ เอ็ม และ พริเอโต-มาเทียส เอ็ม[ 17 ] | 2018 |
| ปัด | การค้นหาแบบ Smith-Waterman ที่รวดเร็วโดยใช้การประมวลผลแบบขนาน SIMD | ทั้งคู่ | โรเนส ที | 2011 |
* ประเภทลำดับ:โปรตีนหรือนิวคลีโอไทด์
การจัดเรียงแบบคู่
| ชื่อ | คำอธิบาย | ประเภทลำดับ* | ประเภทการจัดเรียง** | ผู้เขียน | ปี |
|---|---|---|---|---|---|
| อาคานา | การจัดเรียงแบบคู่โดยใช้จุดยึดฮิวริสติกที่รวดเร็ว | ทั้งคู่ | ทั้งคู่ | หวง, อุมบาค, ลี | 2548 |
| จัดเรียงฉัน | การจัดเรียงลำดับโปรตีนเยื่อหุ้มเซลล์ | โปรตีน | ทั้งคู่ | เอ็ม. สตัมม์, เค. คาฟิซอฟ, อาร์. สตาริทซ์บิชเลอร์, แอลอาร์ ฟอเรสต์ | 2013 |
| อัลลาไลน์ | สำหรับโมเลกุล DNA, RNA และโปรตีนที่มีขนาดไม่เกิน 32MB ระบบจะจัดเรียงลำดับทั้งหมดที่มีขนาด K หรือมากกว่า การจัดเรียงลำดับที่คล้ายกันจะถูกจัดกลุ่มเข้าด้วยกันเพื่อการวิเคราะห์ มีระบบกรองลำดับซ้ำอัตโนมัติ | ทั้งคู่ | ท้องถิ่น | อี. วาชเทล | 2017 |
| ไบโอคอนดักเตอร์ไบโอสตริงส์::การจัดตำแหน่งแบบคู่ | การเขียนโปรแกรมแบบไดนามิก | ทั้งคู่ | ทั้งสองแบบ + ปลายสุดฟรี | พี. อะโบยูน | 2008 |
| BioPerl dpAlign | การเขียนโปรแกรมแบบไดนามิก | ทั้งคู่ | ทั้งสองแบบ + ปลายสุดฟรี | YM Chan | 2003 |
| บลาสต์ซ ลาสต์ซ | การจับคู่รูปแบบที่กำหนดโดยเมล็ดพันธุ์ | นิวคลีโอไทด์ | ท้องถิ่น | Schwartz และคณะ[ 18 ] [ 19 ] | 2004, 2009 |
| ตัวจัดตำแหน่งโคดอนโค้ด | การจัดเรียงลำดับคู่และหลายลำดับอย่างรวดเร็วด้วยอัลกอริธึมหลายแบบ | นิวคลีโอไทด์ | ทั้งคู่ | บริษัท โคดอนโค้ด | 2003-2025 |
| CUDAlign | การจัดเรียงลำดับดีเอ็นเอที่มีขนาดไม่จำกัดบน GPU ตัวเดียวหรือหลายตัว | นิวคลีโอไทด์ | ท้องถิ่น, กึ่งโลก, โลก | อี. แซนเดส[ 20 ] [ 21 ] [ 22 ] | 2011-2015 |
| ดีเอ็นเอดอท | เครื่องมือสร้างแผนภาพจุดแบบเว็บ | นิวคลีโอไทด์ | ทั่วโลก | อาร์. โบเวน | 1998 |
| จุด | เครื่องมือสร้างแผนภาพจุดโดยใช้ภาษา Java | ทั้งคู่ | ทั่วโลก | เอ็ม. ปาญี และ ที. จูเนียร์ | 1998 |
| งานเลี้ยง | การขยายเฉพาะที่ตามฐานด้านหลังด้วยแบบจำลองวิวัฒนาการเชิงพรรณนา | นิวคลีโอไทด์ | ท้องถิ่น | เอเค ฮูเดค และ ดีจี บราวน์ | 2010 |
| โปรแกรมคอมไพเลอร์จีโนม โปรแกรมคอมไพเลอร์จีโนม | จัดเรียงไฟล์โครมาโตแกรม (.ab1, .scf) ให้ตรงกับลำดับแม่แบบ ค้นหาข้อผิดพลาด และแก้ไขได้ทันที | นิวคลีโอไทด์ | ท้องถิ่น | บริษัท จีโนม คอมไพเลอร์ | 2014 |
| จี-พีเอเอส | การเขียนโปรแกรมเชิงพลวัตบน GPU พร้อมการย้อนกลับ | ทั้งคู่ | ท้องถิ่น, กึ่งโลก, โลก | ดับเบิลยู. โฟรห์มเบิร์ก, เอ็ม. เคียร์ซินกา และคณะ | 2011 |
| แก๊ปมิส | การจัดเรียงลำดับแบบคู่โดยมีช่องว่างหนึ่งช่อง | ทั้งคู่ | เซมิโกลบอล | เค. ฟรูซิออส, ต. ฟลอริ, ซีเอส อิลิโอปูลอส, เค. พาร์ค, เอสพี พิสซิส, ก. ทิชเลอร์ | 2012 |
| นักมายากลจีโนม | ซอฟต์แวร์สำหรับการค้นหารูปแบบลำดับดีเอ็นเอเฉพาะที่อย่างรวดเร็วเป็นพิเศษ และการจัดเรียงลำดับแบบคู่สำหรับข้อมูล NGS (FASTA, FASTQ) | ดีเอ็นเอ | ท้องถิ่น, กึ่งโลก, โลก | เฮปเปอร์เล ดี (www.sequentix.de) | 2020 |
| จีจีซีเสิร์ช, จีแอลซีเสิร์ช | การจัดเรียงแบบ Global:Global (GG) และ Global:Local (GL) โดยใช้สถิติ | โปรตีน | ทั่วโลกในการสอบถาม | ดับเบิลยู. เพียร์สัน | 2007 |
| เจไลเนอร์ | การใช้งาน Smith-Waterman แบบโอเพนซอร์สในภาษา Java | ทั้งคู่ | ท้องถิ่น | เอ. มุสตาฟา | 2548 |
| เค*ซิงค์ | การจัดเรียงลำดับโปรตีนให้เข้ากับโครงสร้าง ซึ่งรวมถึงโครงสร้างทุติยภูมิ การอนุรักษ์โครงสร้าง โปรไฟล์ลำดับที่ได้จากโครงสร้าง และคะแนนการจัดเรียงที่เป็นเอกฉันท์ | โปรตีน | ทั้งคู่ | ดี. ชิเวียน และ ดี. เบเกอร์[ 23 ] | 2003 |
| ลาลิกน์ | ความคล้ายคลึงเฉพาะที่หลายจุดที่ไม่ทับซ้อนกัน (ใช้อัลกอริทึมเดียวกับ SIM) | ทั้งคู่ | พื้นที่ที่ไม่ทับซ้อนกัน | ดับเบิลยู. เพียร์สัน | 1991 (อัลกอริทึม) |
| แนว NW | อัลกอริธึมการเขียนโปรแกรมไดนามิกมาตรฐาน Needleman-Wunsch | โปรตีน | ทั่วโลก | วาย จาง | 2012 |
| แมตช์ | การจัดแนวท้องถิ่นแบบ Waterman-Eggert (อ้างอิงจาก LALIGN) | ทั้งคู่ | ท้องถิ่น | ไอ. ลองเดน (ดัดแปลงจาก ดับเบิลยู. เพียร์สัน) | 1999 |
| แมคคาลิกน์2 | แบบจำลองที่ชัดเจนของการวิวัฒนาการของอินเดล | ดีเอ็นเอ | ทั่วโลก | เจ. หวังและคณะ | 2006 |
| MegAlign Pro (Lasergene Molecular Biology) | ซอฟต์แวร์สำหรับจัดเรียงลำดับ DNA, RNA, โปรตีน หรือ DNA + โปรตีน โดยใช้อัลกอริธึมการจัดเรียงลำดับแบบคู่และแบบหลายลำดับ รวมถึง MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson และการวิเคราะห์ Dotplot | ทั้งคู่ | ทั้งคู่ | ดีเอ็นเอสตาร์ | พ.ศ. 2536-2559 |
| คุณแม่ | อิง ตามต้นไม้คำต่อท้าย | นิวคลีโอไทด์ | ทั่วโลก | เอส. เคิร์ตซ์และคณะ | 2004 |
| เข็ม | การเขียนโปรแกรมแบบไดนามิกของ Needleman-Wunsch | ทั้งคู่ | เซมิโกลบอล | เอ. เบลสบี้ | 1999 |
| งิลา | ต้นทุนช่องว่างแบบลอการิทึมและเชิงเส้น และแบบจำลองที่ชัดเจนของการวิวัฒนาการของอินเดล | ทั้งคู่ | ทั่วโลก | อาร์. คาร์ทไรท์ | 2007 |
| ตะวันตกเฉียงเหนือ | การเขียนโปรแกรมแบบไดนามิกของ Needleman-Wunsch | ทั้งคู่ | ทั่วโลก | เอซีอาร์ มาร์ติน | พ.ศ. 2533-2558 |
| พาราเซล | ไลบรารีการเขียนโปรแกรมแบบไดนามิก SIMD สำหรับ C/C++/Python/Java สำหรับ SSE และ AVX2 | ทั้งคู่ | ทั่วโลก ไม่จำกัดขอบเขต ในท้องถิ่น | เจ.เดลี่ | 2015 |
| เส้นทาง | Smith-Watermanบนกราฟการแปลย้อนกลับของโปรตีน (ตรวจจับการเลื่อนเฟรมในระดับโปรตีน) | โปรตีน | ท้องถิ่น | M. Gîrdea และคณะ[ 24 ] | 2009 |
| แพทเทิร์นฮันเตอร์ | การจับคู่รูปแบบที่กำหนดโดยเมล็ดพันธุ์ | นิวคลีโอไทด์ | ท้องถิ่น | บี. มาและคณะ[ 25 ] [ 26 ] | พ.ศ. 2545–2547 |
| ProbA (หรือ propA) | การสุ่มตัวอย่างฟังก์ชันพาร์ติชันแบบสุ่มผ่านการเขียนโปรแกรมแบบไดนามิก | ทั้งคู่ | ทั่วโลก | ยู. มุคสไตน์ | 2002 |
| ไพโมล | คำสั่ง "align" จะจัดเรียงลำดับและนำไปใช้กับโครงสร้าง | โปรตีน | ทั่วโลก (โดยการเลือก) | ดับเบิลยูแอล เดลาโน | 2007 |
| รีพูเตอร์ | อิง ตามต้นไม้คำต่อท้าย | นิวคลีโอไทด์ | ท้องถิ่น | เอส. เคิร์ตซ์และคณะ | 2001 |
| เขี้ยวเสือเขี้ยวดาบ | การจัดเรียงโดยใช้โปรไฟล์การเชื่อมต่อที่คาดการณ์ไว้ | โปรตีน | ทั่วโลก | เอฟ. ไทเชิร์ต, เจ. มินนิ่ง, ยู. บาสโตลลา และเอ็ม. ปอร์โต้ | 2009 |
| ซัตสึมะ | การจัดเรียงความสัมพันธ์ทางพันธุกรรมของจีโนมทั้งหมดแบบขนาน | ดีเอ็นเอ | ท้องถิ่น | เอ็มจี แกร็บเฮอร์และคณะ | 2010 |
| เซคาลน์ | การเขียนโปรแกรมแบบไดนามิกต่างๆ | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | เอ็มเอส วอเตอร์แมน และ พี. ฮาร์ดี้ | พ.ศ. 2539 |
| ซิม, แก๊ป, แน๊ป, แลป | ความคล้ายคลึงในระดับท้องถิ่นกับการจัดการช่องว่างที่แตกต่างกัน | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | เอ็กซ์. หวง และ ดับเบิลยู. มิลเลอร์ | 1990-6 |
| ซิม | ความคล้ายคลึงในระดับท้องถิ่น | ทั้งคู่ | ท้องถิ่น | เอ็กซ์. หวง และ ดับเบิลยู. มิลเลอร์ | 1991 |
| SPA: การจัดเรียงคู่ที่ยอดเยี่ยม | การจัดเรียงลำดับทั่วโลกแบบคู่ที่รวดเร็ว | นิวคลีโอไทด์ | ทั่วโลก | เซิน, หยาง, เหยา, ฮวาง | 2002 |
| ค้นหา | การจัดเรียงตามสถิติ ในระดับท้องถิ่น ( สมิธ-วอเตอร์แมน ) | โปรตีน | ท้องถิ่น | ดับเบิลยู. เพียร์สัน | 1981 (อัลกอริทึม) |
| สตูดิโอซีเควนซ์ | แอปเพล็ต Java สาธิตอัลกอริธึมต่างๆ จาก[ 27 ] | ลำดับทั่วไป | ระดับท้องถิ่นและระดับโลก | เอ.เมสเคาส์กัส | 1997 (หนังสืออ้างอิง) |
| สวิโฟลด์ | การเร่งความเร็วแบบ Smith-Waterman บน FPGA ของ Intel ด้วย OpenCL สำหรับลำดับ DNA ยาว | นิวคลีโอไทด์ | ท้องถิ่น | อี. รุชชี[ 28 ] [ 29 ] | 2017-2018 |
| ชุดสูทสวิฟท์ | การค้นหาการจัดตำแหน่งท้องถิ่นอย่างรวดเร็ว | ดีเอ็นเอ | ท้องถิ่น | K. Rasmussen, [ 30 ] W. Gerlach | 2005, 2008 |
| เปลหาม | การเขียนโปรแกรมเชิงพลวัตNeedleman-Wunschที่ปรับให้เหมาะสมกับหน่วยความจำ | ทั้งคู่ | ทั่วโลก | ไอ. ลองเดน (ดัดแปลงจาก จี. ไมเยอร์ส และ ดับเบิลยู. มิลเลอร์) | 1999 |
| ทรานลาไลน์ | จัดเรียงลำดับกรดนิวคลีอิกโดยใช้การจัดเรียงโปรตีนเป็นข้อมูลอ้างอิง | นิวคลีโอไทด์ | เอ็นเอ | จี. วิลเลียมส์ (ดัดแปลงจาก บี. เพียร์สัน) | 2002 |
| ยูจีน | Opensource Smith-Waterman สำหรับ SSE/CUDA, ตัวค้นหาซ้ำตามอาร์เรย์คำต่อท้าย & dotplot | ทั้งคู่ | ทั้งคู่ | ยูนิโปร | 2010 |
| น้ำ | การเขียนโปรแกรมแบบไดนามิกของสมิธ-วอเตอร์แมน | ทั้งคู่ | ท้องถิ่น | เอ. เบลสบี้ | 1999 |
| การจับคู่คำ | การจับคู่แบบคู่k -tuple | ทั้งคู่ | เอ็นเอ | ไอ. ลองเดน | 1998 |
| ยัสส์ | การจับคู่รูปแบบที่กำหนดโดยเมล็ดพันธุ์ | นิวคลีโอไทด์ | ท้องถิ่น | L. Noe และ G. Kucherov [ 31 ] | 2004 |
* ประเภทลำดับ:โปรตีนหรือนิวคลีโอไทด์ ** ประเภทการจัดเรียง:เฉพาะที่หรือโดยรวม
การจัดเรียงลำดับหลายลำดับ
| ชื่อ | คำอธิบาย | ประเภทลำดับ* | ประเภทการจัดเรียง** | ผู้เขียน | ปี | ใบอนุญาต |
|---|---|---|---|---|---|---|
| เอบีเอ | การจัดเรียงแบบ A-Bruijn | โปรตีน | ทั่วโลก | บี.ราฟาเอลและคณะ | 2004 | ซอฟต์แวร์กรรมสิทธิ์ใช้งานฟรีสำหรับด้านการศึกษา การวิจัย และองค์กรไม่แสวงหาผลกำไร |
| เบียร์ | การจัดตำแหน่งด้วยตนเอง; มีการใช้ซอฟต์แวร์ช่วยบ้าง | นิวคลีโอไทด์ | ท้องถิ่น | เจ. แบลนดี และ เค. โฟเกล | ปี 1994 (เวอร์ชันล่าสุดปี 2007) | ฟรี, GPL 2 |
| อัลลาไลน์ | สำหรับโมเลกุล DNA, RNA และโปรตีนที่มีขนาดไม่เกิน 32MB โปรแกรมจะจัดเรียงลำดับทั้งหมดที่มีขนาด K หรือมากกว่า ไม่ว่าจะเป็น MSA หรือภายในโมเลกุลเดียว การจัดเรียงลำดับที่คล้ายกันจะถูกจัดกลุ่มเข้าด้วยกันเพื่อการวิเคราะห์ มีระบบกรองลำดับซ้ำอัตโนมัติ | ทั้งคู่ | ท้องถิ่น | อี. วาชเทล | 2017 | ฟรี |
| อามาป | การอบอ่อนลำดับ | ทั้งคู่ | ทั่วโลก | เอ. ชวาร์ตซ์ และแอล. แพคเตอร์ | 2006 | |
| บาลี-ไฟ | การจัดเรียงลำดับแบบต้นไม้+หลายแนว; แบบเบย์เซียนเชิงความน่าจะเป็น; การประมาณค่าร่วม | ทั้งคู่ + โคดอน | ทั่วโลก | บีดี เรเดลิงส์ และ เอ็มเอ ซูชาร์ด | ปี 2005 (เวอร์ชันล่าสุดปี 2018) | ฟรี, GPL |
| ฐานต่อฐาน | โปรแกรมแก้ไขการจัดเรียงลำดับหลายลำดับแบบ Java พร้อมเครื่องมือวิเคราะห์ในตัว | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | อาร์. โบรดี้และคณะ | 2004 | ซอฟต์แวร์กรรมสิทธิ์ , ซอฟต์แวร์ฟรี , ต้องลงทะเบียน |
| ความโกลาหล, ไดอะไลน์ | การจัดเรียงแบบวนซ้ำ | ทั้งคู่ | ในพื้นที่ (แนะนำ) | เอ็ม. บรูดโน และ บี. มอร์เกนสเติร์น | 2003 | |
| คลัสทัล | การจัดเรียงแบบก้าวหน้า | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | ทอมป์สันและคณะ | พ.ศ. 2537 | ฟรี, LGPL |
| ตัวจัดตำแหน่งโคดอนโค้ด | การจัดเรียงหลายแนว; รองรับกล้ามเนื้อ กลุ่มกระดูก และส่วนปลายของร่างกาย | นิวคลีโอไทด์ | ระดับท้องถิ่นหรือระดับโลก | พี. ริชเทอริชและคณะ | 2003 (เวอร์ชันล่าสุด 2024) | |
| เข็มทิศ | การเปรียบเทียบการจัดเรียงลำดับโปรตีนหลายรายการพร้อมการประเมินนัยสำคัญทางสถิติ | โปรตีน | ทั่วโลก | RI Sadreyev และคณะ | 2009 | |
| ถอดรหัส | การจัดเรียงแบบก้าวหน้าและวนซ้ำ | ทั้งคู่ | ทั่วโลก | เอริก เอส. ไรท์ | 2014 | ฟรี, GPL |
| DIALIGN-TX และ DIALIGN-T | วิธีการแบ่งส่วน | ทั้งคู่ | ระดับท้องถิ่น (แนะนำ) หรือระดับโลก | ARSubramanian | ปี 2005 (เวอร์ชันล่าสุดปี 2008) | |
| การจัดเรียงดีเอ็นเอ | วิธีการจัดเรียงลำดับภายในสายพันธุ์โดยใช้ส่วนย่อย | ทั้งคู่ | ระดับท้องถิ่น (แนะนำ) หรือระดับโลก | เอ.โรห์ล | ปี 2005 (เวอร์ชันล่าสุดปี 2008) | |
| ตัวประกอบลำดับเบส DNA | การจัดเรียงลำดับหลายลำดับ; การจัดเรียงลำดับอัตโนมัติเต็มรูปแบบ; การแก้ไขความกำกวมอัตโนมัติ; ตัวระบุเบสภายใน; การจัดเรียงลำดับผ่านบรรทัดคำสั่ง | นิวคลีโอไทด์ | ระดับท้องถิ่นหรือระดับโลก | เฮราเคิล ไบโอซอฟต์ เอสอาร์แอล | ปี 2006 (เวอร์ชันล่าสุดปี 2018) | เชิงพาณิชย์ (บางโมดูลเป็นซอฟต์แวร์ฟรี) |
| DNADynamo | เชื่อมโยง DNA กับการจัดเรียงลำดับหลายรายการ ของโปรตีน ด้วยMUSCLE , Clustalและ Smith-Waterman | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | DNADynamo | ปี 2004 (เวอร์ชันล่าสุดปี 2017) | |
| อีดีเอ็นเอ | การจัดเรียงลำดับหลายลำดับโดยอาศัยพลังงานสำหรับตำแหน่งการจับของ DNA | นิวคลีโอไทด์ | ระดับท้องถิ่นหรือระดับโลก | ซาลามา, อาร์.เอ. และคณะ | 2013 | |
| เอฟเอ็มเอสเอ | การจัดเรียงลำดับแบบก้าวหน้าสำหรับตระกูลโปรตีนขนาดใหญ่มาก (สมาชิกหลายแสนตัว) | โปรตีน | ทั่วโลก | เดโอโรวิชและคณะ | 2016 | ฟรี, GPL 3 |
| เอฟเอสเอ | การอบอ่อนลำดับ | ทั้งคู่ | ทั่วโลก | อาร์เค แบรดลีย์ และคณะ | 2008 | |
| อัจฉริยะ | การจัดเรียงแบบก้าวหน้า-วนซ้ำ; ปลั๊กอิน ClustalW | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | เอเจ ดรัมมอนด์และคณะ | ปี 2005 (เวอร์ชันล่าสุดปี 2017) | |
| คำแนะนำ | การควบคุมคุณภาพและการกรองการจัดเรียงลำดับหลายลำดับ | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | โอ. เพนน์และคณะ | 2010 (เวอร์ชันล่าสุด 2015) | |
| คาลิน | การจัดเรียงแบบก้าวหน้า | ทั้งคู่ | ทั่วโลก | ที. ลาสส์มันน์ | 2548 | |
| แม็คซี | การจัดเรียงลำดับแบบวนซ้ำอย่างต่อเนื่อง การจัดเรียงลำดับรหัสพันธุกรรมหลายลำดับโดยคำนึงถึงการเลื่อนเฟรมและรหัสหยุด | นิวคลีโอไทด์ | ทั่วโลก | วี. รันเวซและคณะ | 2011 (เวอร์ชันล่าสุด v2.07 2023) | |
| แมฟท์ | การจัดเรียงแบบก้าวหน้าและวนซ้ำ | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | เค. คาโตะและคณะ | 2548 | ฟรีบีเอสดี |
| มาร์นา | การจัดเรียงอาร์เอ็นเอหลายแนว | อาร์เอ็นเอ | ท้องถิ่น | เอส. ซีเบิร์ตและคณะ | 2548 | |
| มาวิด | การจัดเรียงแบบก้าวหน้า | ทั้งคู่ | ทั่วโลก | เอ็น. เบรย์ และแอล. แพคเตอร์ | 2004 | |
| MegAlign Pro (Lasergene Molecular Biology) | ซอฟต์แวร์สำหรับจัดเรียงลำดับ DNA, RNA, โปรตีน หรือ DNA + โปรตีน โดยใช้อัลกอริธึมการจัดเรียงลำดับแบบคู่และแบบหลายลำดับ รวมถึง MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson และการวิเคราะห์ Dotplot | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | ดีเอ็นเอสตาร์ | พ.ศ. 2536-2566 | |
| เอ็มเอสเอ | การเขียนโปรแกรมแบบไดนามิก | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | ดีเจ ลิปแมนและคณะ | พ.ศ. 2532 (แก้ไขเพิ่มเติม พ.ศ. 2538) | |
| เอ็มเอสเอพร็อพส์ | การเขียนโปรแกรมแบบไดนามิก | โปรตีน | ทั่วโลก | วาย.หลิว, บี.ชมิดท์, ดี.มาสเคลล์ | 2010 | |
| มุลทาลิน | การจัดกลุ่มแบบไดนามิก | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | เอฟ. คอร์เพ็ต | 1988 | |
| มัลติ-ลากัน | การจัดเรียงการเขียนโปรแกรมแบบไดนามิกเชิงก้าวหน้า | ทั้งคู่ | ทั่วโลก | เอ็ม. บรูดโนและคณะ | 2003 | |
| กล้ามเนื้อ | การจัดเรียงแบบวนซ้ำอย่างต่อเนื่อง (v3), ความน่าจะเป็น/ความสอดคล้อง (v5) | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | อาร์. เอ็ดการ์ | 2004 | สาธารณสมบัติ |
| โอปอล | การจัดเรียงแบบก้าวหน้าและวนซ้ำ | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | ที. วีลเลอร์ และ เจ. เคเซซิโอกลู | 2007 (เวอร์ชันเสถียรล่าสุด 2013, เวอร์ชันเบต้าล่าสุด 2016) | |
| พีแคน | ความสอดคล้องเชิงความน่าจะเป็น | ดีเอ็นเอ | ทั่วโลก | บี. พาเทนและคณะ | 2008 | |
| ฟิโล | กรอบการทำงานการคำนวณโดยมนุษย์สำหรับจีโนมิกส์เชิงเปรียบเทียบเพื่อแก้ปัญหาการจัดเรียงลำดับหลายรายการ | นิวคลีโอไทด์ | ระดับท้องถิ่นหรือระดับโลก | ชีวสารสนเทศศาสตร์ มหาวิทยาลัยแมคกิลล์ | 2010 | |
| พีเอ็มฟาสต์อาร์ | การจัดเรียงที่คำนึงถึงโครงสร้างแบบก้าวหน้า | อาร์เอ็นเอ | ทั่วโลก | ดี. เดอบลาซิโอ, เจ. บราวน์, เอส. จาง | 2009 | |
| พราลีน | การจัดเรียงลำดับความสอดคล้องแบบก้าวหน้า-วนซ้ำ-ความคล้ายคลึง-ขยายด้วยการสร้างโปรไฟล์เบื้องต้นและการทำนายโครงสร้างทุติยภูมิ | โปรตีน | ทั่วโลก | เจ. เฮริงกา | ปี 1999 (เวอร์ชันล่าสุดปี 2009) | |
| PicXAA | การจัดตำแหน่งแบบไม่ก้าวหน้า ความแม่นยำสูงสุดที่คาดหวัง | ทั้งคู่ | ทั่วโลก | SME Sahraeian และ BJ Yoon | 2010 | |
| พีโอเอ | แบบจำลองมาร์คอฟลำดับบางส่วน/ซ่อนเร้น | โปรตีน | ระดับท้องถิ่นหรือระดับโลก | ซี. ลี | 2002 | |
| โปรบาลีน | ความน่าจะเป็น/ความสอดคล้องกับความน่าจะเป็นของฟังก์ชันการแบ่งส่วน | โปรตีน | ทั่วโลก | โรชันและไลฟ์เซย์ | 2006 | ฟรีเป็นสาธารณสมบัติ |
| ข้อดีข้อเสีย | ความน่าจะเป็น/ความสอดคล้อง | โปรตีน | ระดับท้องถิ่นหรือระดับโลก | ซี.โดและคณะ | 2548 | ฟรีเป็นสาธารณสมบัติ |
| โปรมาลส์3ดี | การจัดเรียงแบบก้าวหน้า/แบบจำลองมาร์คอฟที่ซ่อนอยู่/โครงสร้างทุติยภูมิ/โครงสร้าง 3 มิติ | โปรตีน | ทั่วโลก | เจ. เป่ยและคณะ | 2008 | |
| พีอาร์เอ็น/พีอาร์อาร์พี | การจัดเรียงแบบวนซ้ำ (โดยเฉพาะการปรับปรุง) | โปรตีน | ระดับท้องถิ่นหรือระดับโลก | ย. โทโทกิ (อ้างอิงจาก โอ. โกโตะ) | ตั้งแต่ปี 1991 เป็นต้นไป | |
| PSAlign | การรักษาแนวการจัดเรียงโดยไม่ใช้ฮิวริสติก | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | SH Sze, Y. Lu, Q. Yang. | 2006 | |
| รีฟทรานสิต | เป็นการผสมผสานการจัดเรียงลำดับของ DNA และโปรตีน โดยการแปลงการจัดเรียงลำดับของโปรตีนกลับไปเป็น DNA | ดีเอ็นเอ/โปรตีน (พิเศษ) | ระดับท้องถิ่นหรือระดับโลก | เวอร์เนอร์สันและเปเดอร์เซน | ปี 2003 (เวอร์ชันล่าสุดปี 2005) | |
| ซาก้า | การจัดเรียงลำดับโดยใช้อัลกอริทึมทางพันธุกรรม | โปรตีน | ระดับท้องถิ่นหรือระดับโลก | ซี. นอเทรดามและคณะ | 1996 (ฉบับปรับปรุงใหม่ 1998) | |
| แซม | แบบจำลองมาร์คอฟที่ซ่อนอยู่ | โปรตีน | ระดับท้องถิ่นหรือระดับโลก | เอ. โครห์และคณะ | ปี 1994 (เวอร์ชันล่าสุดปี 2002) | |
| ผนึก | การจัดตำแหน่งด้วยตนเอง | ทั้งคู่ | ท้องถิ่น | เอ. แรมโบต์ | 2002 | |
| StatAlign | การประมาณค่าร่วมแบบเบย์เซียนของการจัดเรียงลำดับและวิวัฒนาการ (MCMC) | ทั้งคู่ | ทั่วโลก | เอ. โนวัคและคณะ | 2008 | |
| สเต็มล็อก | การจัดเรียงหลายแบบและการทำนายโครงสร้างทุติยภูมิ | อาร์เอ็นเอ | ระดับท้องถิ่นหรือระดับโลก | ไอ. โฮล์มส์ | 2548 | ฟรี, GPL 3 (parte de DART ) |
| ที-คอฟฟี่ | การจัดเรียงแบบก้าวหน้าที่ไวต่อความรู้สึกมากขึ้น | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | ซี. นอเทรดามและคณะ | ปี 2000 (เวอร์ชันล่าสุดปี 2008) | ฟรี, GPL 2 |
| ยูจีน | รองรับการจัดแนวหลายรายการด้วยปลั๊กอินMUSCLE , KAlign, ClustalและMAFFT | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | ทีม UGENE | 2010 (เวอร์ชันล่าสุด 2020) | ฟรี, GPL 2 |
| VectorFriends | VectorFriends Aligner, ปลั๊กอิน MUSCLEและปลั๊กอินClustal W | ทั้งคู่ | ระดับท้องถิ่นหรือระดับโลก | ทีมไบโอเฟรนด์ส | 2013 | ซอฟต์แวร์กรรมสิทธิ์ใช้งานฟรีสำหรับใช้ในเชิงวิชาการ |
| GLProbs | แนวทางการปรับตัวตามแบบจำลอง Hidden Markov Model (HMI) | โปรตีน | ทั่วโลก | วาย. เยและคณะ | 2013 |
* ประเภทลำดับ:โปรตีนหรือนิวคลีโอไทด์ ** ประเภทการจัดเรียง:เฉพาะที่หรือโดยรวม
การวิเคราะห์จีโนมิกส์
| ชื่อ | คำอธิบาย | ประเภทลำดับ* | |
|---|---|---|---|
| นกอินทรี[ 32 ] | เครื่องมือความเร็วสูงพิเศษสำหรับค้นหาคำที่หายไปในข้อมูลจีโนม | นิวคลีโอไทด์ | |
| ACT (เครื่องมือเปรียบเทียบอาร์เทมิส) | ความสัมพันธ์ทางพันธุกรรมและจีโนมิกส์เชิงเปรียบเทียบ | นิวคลีโอไทด์ | |
| มักมาก | การจัดเรียงลำดับทั่วโลกแบบจับคู่กับจีโนมทั้งหมด | นิวคลีโอไทด์ | |
| บลัท | การจัดเรียงลำดับ cDNA ให้ตรงกับจีโนม | นิวคลีโอไทด์ | |
| ถอดรหัส | การจัดเรียงจีโนมที่จัดเรียงใหม่โดยใช้การแปลแบบ 6 เฟรม | นิวคลีโอไทด์ | |
| แฟลก | การจัดเรียงและการวิเคราะห์จีโนมทั้งหมดแบบฟัซซี | นิวคลีโอไทด์ | |
| จีแมป | การจัดเรียงลำดับ cDNA ให้ตรงกับจีโนม ระบุตำแหน่งการเชื่อมต่อของไซต์การตัดต่อด้วยความแม่นยำสูง | นิวคลีโอไทด์ | |
| สปลิญ | การจัดเรียงลำดับ cDNA ให้ตรงกับจีโนม ระบุตำแหน่งการเชื่อมต่อของจุดตัดต่อได้อย่างแม่นยำสูง สามารถจดจำและแยกยีนที่ซ้ำกันได้ | นิวคลีโอไทด์ | |
| สีม่วงอมชมพู | การจัดเรียงลำดับจีโนมที่จัดเรียงใหม่หลายลำดับ | นิวคลีโอไทด์ | |
| เอ็มจีเอ | โปรแกรมจัดเรียงลำดับจีโนมหลายชุด | นิวคลีโอไทด์ | |
| มู่หลาน | การจัดเรียงลำดับหลายลำดับในระดับท้องถิ่นของลำดับความยาวจีโนม | นิวคลีโอไทด์ | |
| มัลติซ | การจัดเรียงจีโนมหลายชุด | นิวคลีโอไทด์ | |
| พลาสท์-เอ็นซีอาร์เอ็นเอ | ค้นหา ncRNA ในจีโนมโดยใช้การจัดเรียงลำดับเฉพาะที่ตามฟังก์ชันการแบ่งส่วน | นิวคลีโอไทด์ | |
| เซเคอโรเม | การวิเคราะห์ข้อมูลการจัดเรียงลำดับด้วยเซิร์ฟเวอร์/บริการหลักๆ | นิวคลีโอไทด์, เปปไทด์ | |
| เซควิลาบ | การวิเคราะห์ข้อมูลการจัดเรียงลำดับจากผลลัพธ์ NCBI-BLAST ด้วยเซิร์ฟเวอร์และบริการหลักๆ | นิวคลีโอไทด์, เปปไทด์ | |
| ชัฟเฟิล-ลากัน | การจัดเรียงลำดับทั่วโลกแบบคู่ของบริเวณจีโนมที่สมบูรณ์แล้ว | นิวคลีโอไทด์ | |
| SIBsim4, Sim4 | โปรแกรมที่ออกแบบมาเพื่อจัดเรียงลำดับดีเอ็นเอที่แสดงออกให้ตรงกับลำดับจีโนม โดยคำนึงถึงอินทรอนด้วย | นิวคลีโอไทด์ | |
| สแลม | การค้นหายีน การจัดเรียงลำดับ การระบุคำอธิบายประกอบ (การระบุความคล้ายคลึงกันระหว่างมนุษย์และหนู) | นิวคลีโอไทด์ | |
| SRPRISM | โปรแกรมจัดเรียงลำดับที่มีประสิทธิภาพสำหรับชุดประกอบที่มีการรับประกันอย่างชัดเจน โดยจัดเรียงลำดับการอ่านโดยไม่มีการต่อเชื่อม | นิวคลีโอไทด์ |
* ประเภทลำดับ:โปรตีนหรือนิวคลีโอไทด์
การค้นหารูปแบบ
| ชื่อ | คำอธิบาย | ประเภทลำดับ* |
|---|---|---|
| อาการก่อนมีประจำเดือน (PMS) | การค้นหาและการค้นพบรูปแบบ | ทั้งคู่ |
| เอฟเอ็มเอ็ม | การค้นหาและการค้นพบรูปแบบ (สามารถรับลำดับบวกและลบเป็นข้อมูลป้อนเข้าสำหรับการค้นหารูปแบบที่สมบูรณ์ยิ่งขึ้นได้) | นิวคลีโอไทด์ |
| บล็อก | การระบุรูปแบบที่ไม่มีช่องว่างจากฐานข้อมูล BLOCKS | ทั้งคู่ |
| อีโมติฟ | การสกัดและการระบุลวดลายที่สั้นกว่า | ทั้งคู่ |
| ตัวอย่างลวดลายของกิบบส์ | การสกัดลวดลายแบบสุ่มโดยใช้ความน่าจะเป็นทางสถิติ | ทั้งคู่ |
| เอชเอ็มเอ็มท็อป | การทำนายเกลียวทรานส์เมมเบรนและโครงสร้างทางทอพอโลยีของโปรตีน | โปรตีน |
| ไอไซต์ | คลังลวดลายโครงสร้างท้องถิ่น | โปรตีน |
| เจคอยล์ | การทำนายโครงสร้างเกลียวคู่และโครงสร้างซิปเปอร์ลิวซีน | โปรตีน |
| มีม / มาสเตอร์ | การค้นพบและการค้นหารูปแบบ | ทั้งคู่ |
| คูดา-มีม | อัลกอริทึม MEME (v4.4.0) ที่เร่งความเร็วด้วย GPU สำหรับคลัสเตอร์ GPU | ทั้งคู่ |
| ขอบคุณ | การค้นพบและการค้นหารูปแบบการจำแนก | ทั้งคู่ |
| พีเอชไอ-บลาสต์ | เครื่องมือค้นหาและจัดเรียงลวดลาย | ทั้งคู่ |
| ฟิโลสกัน | เครื่องมือค้นหาลวดลาย | นิวคลีโอไทด์ |
| แพรตต์ | การสร้างรูปแบบเพื่อใช้กับ ScanProsite | โปรตีน |
| สแกนโปรไซต์ | เครื่องมือค้นหาฐานข้อมูลลวดลาย | โปรตีน |
| ไทเรเซียส | การสกัดลวดลายและการค้นหาในฐานข้อมูล | ทั้งคู่ |
| หินบะซอลต์ | การค้นหารูปแบบหลายแบบและนิพจน์ปกติ | ทั้งคู่ |
* ประเภทลำดับ:โปรตีนหรือนิวคลีโอไทด์
การเปรียบเทียบมาตรฐาน
| ชื่อ | ผู้เขียน |
|---|---|
| PFAM 30.0 (2016) | |
| สมาร์ท (2015) | เลทูนิค, คอปเลย์, ชมิดต์, ซิคาเรลลี, ดอร์คส์, ชูลทซ์, พอนติง, บอร์ค |
| บาหลีเบส 3 (2015) | ทอมป์สัน, เพลวนิแอค, โพช |
| อ็อกซ์เบนช์ (2011) | รากาวา, เซียร์ล, ออดลีย์, บาร์เบอร์, บาร์ตัน |
| ชุดข้อมูลมาตรฐาน (2009) | เอ็ดการ์ |
| โฮมสแตรด (2005) | มิซึกุจิ |
| PREFAB 4.0 (2005) | เอ็ดการ์ |
| SABmark (2004) | แวน วอลล์, ลาสเตอร์ส, วินส์ |
การจัดเรียงผู้ชม บรรณาธิการ
โปรดดูรายชื่อซอฟต์แวร์สำหรับการแสดงภาพการจัดเรียง
การจัดเรียงลำดับการอ่านสั้น
| ชื่อ | คำอธิบาย | ตัวเลือกปลายคู่ | ใช้คุณภาพ FASTQ | ช่องว่าง | มัลติเธรด | ใบอนุญาต | อ้างอิง | ปี | |
|---|---|---|---|---|---|---|---|---|---|
| อาริโอค | ประมวลผลการจัดเรียงลำดับแบบมีช่องว่างของ Smith-Waterman และคุณภาพการจับคู่บน GPU หนึ่งตัวหรือมากกว่า รองรับการจัดเรียงลำดับ BS-seq ประมวลผลได้ 100,000 ถึง 500,000 อ่านต่อวินาที (แตกต่างกันไปตามข้อมูล ฮาร์ดแวร์ และความไวที่กำหนดค่าไว้) | ใช่ | เลขที่ | ใช่ | ใช่ | ฟรีบีเอสดี | [ 33 ] | 2015 | |
| บาร์ราคูดา | โปรแกรมจัดเรียงลำดับการอ่านสั้นแบบ Burrows–Wheeler transform (FM-index) ที่เร่งความเร็วด้วย GPGPU โดยใช้ BWA รองรับการจัดเรียงลำดับอินเดลที่มีการเปิดและขยายช่องว่าง | ใช่ | เลขที่ | ใช่ | ใช่แล้วPOSIX ThreadsและCUDA | ฟรี, GPL | |||
| แผนที่บีบี | ใช้ kmer สั้นๆ เพื่อสร้างดัชนีจีโนมอย่างรวดเร็ว ไม่มีข้อจำกัดด้านขนาดหรือจำนวน scaffold มีความไวและความจำเพาะสูงกว่าโปรแกรมจัดเรียงลำดับแบบ Burrows–Wheeler แต่มีความเร็วใกล้เคียงหรือมากกว่า ทำการจัดเรียงลำดับทั่วโลกที่ปรับให้เหมาะสมด้วยการแปลงแบบ affine ซึ่งช้ากว่าแต่แม่นยำกว่าแบบ Smith-Waterman รองรับข้อมูลจาก Illumina, 454, PacBio, Sanger และ Ion Torrent คำนึงถึงการเชื่อมต่อของยีน สามารถประมวลผล indel ยาวๆ และ RNA-seq ได้ เขียนด้วยภาษา Java บริสุทธิ์ ทำงานได้บนทุกแพลตฟอร์ม ใช้โดยสถาบัน Joint Genome Institute | ใช่ | ใช่ | ใช่ | ใช่ | ฟรีบีเอสดี | 2010 | ||
| บีฟาสต์ | มีการแลกเปลี่ยนระหว่างเวลาและความแม่นยำอย่างชัดเจน โดยมีการประมาณความแม่นยำล่วงหน้า ซึ่งได้รับการสนับสนุนโดยการสร้างดัชนีให้กับลำดับอ้างอิง บีบอัดดัชนีได้อย่างเหมาะสม สามารถจัดการกับลำดับอ่านสั้นได้หลายพันล้านรายการ สามารถจัดการกับการแทรก การลบ SNP และข้อผิดพลาดด้านสี (สามารถแมปอ่านในพื้นที่สี ABI SOLiD ได้) ดำเนินการจัดเรียงลำดับแบบ Smith Waterman อย่างสมบูรณ์ | ใช่แล้วPOSIX Threads | ฟรี, GPL | [ 34 ] | 2009 | ||||
| บิ๊กบีดับบลิว | รัน โปรแกรมจัดเรียงลำดับ ดีเอ็นเอแบบ Burrows–Wheeler Aligner (BWA) บน คลัสเตอร์ Hadoopรองรับอัลกอริธึม BWA-MEM, BWA-ALN และ BWA-SW โดยทำงานได้ทั้งกับข้อมูลอ่านคู่และข้อมูลอ่านเดี่ยว การทำงานบนคลัสเตอร์ Hadoop ช่วยลดเวลาในการคำนวณได้อย่างมาก เพิ่มความสามารถในการปรับขนาดและความทนทานต่อข้อผิดพลาด | ใช่ | การตัดแต่งฐานคุณภาพต่ำ | ใช่ | ใช่ | ฟรี, GPL 3 | [ 35 ] | 2015 | |
| บลาสต์เอ็น | โปรแกรมจัดเรียงลำดับนิวคลีโอไทด์ของ BLAST ทำงานช้าและไม่แม่นยำสำหรับลำดับสั้นๆ และใช้ฐานข้อมูลลำดับ (EST, ลำดับ Sanger) แทนที่จะใช้จีโนมอ้างอิง | ||||||||
| บลัท | สร้างโดยจิม เคนท์สามารถรับมือกับความคลาดเคลื่อนหนึ่งจุดในขั้นตอนการจัดเรียงเริ่มต้นได้ | ใช่ ระบบไคลเอ็นต์-เซิร์ฟเวอร์ | ซอฟต์แวร์ลิขสิทธิ์ใช้งานได้ฟรีสำหรับการศึกษาและการใช้งานที่ไม่ใช่เชิงพาณิชย์ | [ 36 ] | 2002 | ||||
| โบว์ไท | ใช้การแปลง Burrows–Wheelerเพื่อสร้างดัชนีจีโนมแบบถาวรและนำกลับมาใช้ใหม่ได้ ใช้พื้นที่หน่วยความจำ 1.3 GB สำหรับจีโนมมนุษย์ จัดเรียงลำดับการอ่านของ Illumina มากกว่า 25 ล้านรายการใน 1 ชั่วโมง CPU รองรับนโยบายการจัดเรียงแบบ Maq และ SOAP | ใช่ | ใช่ | เลขที่ | ใช่แล้วPOSIX Threads | อิสระ, ศิลปะ | [ 37 ] | 2009 | |
| บีดับเบิลยูเอ | ใช้การแปลง Burrows–Wheelerเพื่อสร้างดัชนีของจีโนม วิธีนี้ช้ากว่า Bowtie เล็กน้อย แต่ช่วยให้สามารถแทรกหรือลบลำดับดีเอ็นเอในการจัดเรียงลำดับได้ | ใช่ | การตัดแต่งฐานคุณภาพต่ำ | ใช่ | ใช่ | ฟรี, GPL | [ 38 ] | 2009 | |
| บีดับบลิวเอ-พีเอสเอ็ม | ตัวจัดเรียงลำดับการอ่านสั้นแบบความน่าจะเป็นโดยอาศัยการใช้เมทริกซ์การให้คะแนนเฉพาะตำแหน่ง (PSSM) ตัวจัดเรียงลำดับนี้สามารถปรับเปลี่ยนได้ในแง่ที่ว่าสามารถคำนึงถึงคะแนนคุณภาพของการอ่านและแบบจำลองของอคติเฉพาะข้อมูล เช่น ที่พบใน Ancient DNA, ข้อมูล PAR-CLIP หรือจีโนมที่มีองค์ประกอบนิวคลีโอไทด์ที่มีอคติ[ 39 ] | ใช่ | ใช่ | ใช่ | ใช่ | ฟรี, GPL | [ 39 ] | 2014 | |
| เงินสด | วิเคราะห์และจัดการข้อมูลลำดับนิวคลีโอไทด์แบบอ่านสั้นจำนวนมาก ไปป์ไลน์ CASHX ประกอบด้วยชุดเครื่องมือที่สามารถใช้งานร่วมกันหรือแยกกันเป็นโมดูลได้ อัลกอริทึมนี้มีความแม่นยำสูงสำหรับการจับคู่ที่สมบูรณ์แบบกับจีโนมอ้างอิง | เลขที่ | ซอฟต์แวร์ลิขสิทธิ์ใช้งานได้ฟรีสำหรับการศึกษาและการใช้งานที่ไม่ใช่เชิงพาณิชย์ | ||||||
| ฝนตกหนัก | การแมปข้อมูลแบบอ่านสั้นโดยใช้ Hadoop MapReduce | ใช่Hadoop MapReduce | อิสระ, ศิลปะ | ||||||
| ตัวจัดตำแหน่งโคดอนโค้ด | การประกอบลำดับดีเอ็นเอที่รวดเร็วและแม่นยำ พร้อมรองรับการให้คะแนนคุณภาพ เปรียบเทียบ Contigs โดยใช้โปรแกรม Phred, Phrap และ Bowtie สร้าง Contigs แยกต่างหากสำหรับโคลนที่แตกต่างกันหลายร้อยตัว หรือสร้าง Contig เดียวที่มีลำดับดีเอ็นเอหลายพันลำดับ | ใช่ | ใช่ | ใช่ | ใช่ | กรรมสิทธิ์ทางการค้า | |||
| คูดา-อีซี | การแก้ไขข้อผิดพลาดในการจัดเรียงลำดับการอ่านแบบสั้นโดยใช้ GPU | ใช่ เปิดใช้งาน GPU แล้ว | |||||||
| คูชอว์ | โปรแกรมจัดเรียงลำดับดีเอ็นเอขนาดสั้นที่เข้ากันได้กับ CUDA สำหรับจีโนมขนาดใหญ่ โดยใช้การแปลง Burrows–Wheeler | ใช่ | ใช่ | เลขที่ | ใช่ (เปิดใช้งาน GPU แล้ว) | ฟรี, GPL | [ 40 ] | 2012 | |
| คูชอว์2 | การจัดเรียงลำดับแบบเว้นช่องว่างสำหรับลำดับสั้นและลำดับยาว โดยอิงจากจุดเริ่มต้นการจับคู่ที่แม่นยำสูงสุด โปรแกรมจัดเรียงลำดับนี้รองรับทั้งการจัดเรียงลำดับแบบเบสสเปซ (เช่น จากเครื่องจัดลำดับ Illumina, 454, Ion Torrent และ PacBio) และแบบสีสเปซ ABI SOLiD | ใช่ | เลขที่ | ใช่ | ใช่ | ฟรี, GPL | 2014 | ||
| คูชอว์2-จีพียู | โปรแกรมจัดเรียงลำดับการอ่านสั้น CUSHAW2 ที่เร่งความเร็วด้วย GPU | ใช่ | เลขที่ | ใช่ | ใช่ | ฟรี, GPL | |||
| คูชอว์3 | การจัดตำแหน่งลำดับเบสและพื้นที่สีแบบสั้นที่มีความไวและแม่นยำด้วยการสร้างเมล็ดพันธุ์แบบไฮบริด | ใช่ | เลขที่ | ใช่ | ใช่ | ฟรี, GPL | [ 41 ] | 2012 | |
| ดรฟาสต์ | ซอฟต์แวร์จัดเรียงลำดับดีเอ็นเอแบบแมปปิ้งที่ใช้หลักการไม่คำนึงถึงแคชเพื่อลดการถ่ายโอนข้อมูลระหว่างหน่วยความจำหลักและแคช เช่น mrFAST และ mrsFAST แต่ได้รับการออกแบบมาสำหรับแพลตฟอร์มการจัดลำดับดีเอ็นเอ SOLiD (การอ่านแบบสี) นอกจากนี้ยังส่งคืนตำแหน่งแมปที่เป็นไปได้ทั้งหมดเพื่อการค้นพบความแปรผันทางโครงสร้างที่ดีขึ้น | ใช่ | ใช่ สำหรับการเปลี่ยนแปลงโครงสร้าง | ใช่ | เลขที่ | ฟรีบีเอสดี | |||
| อีแลนด์ | พัฒนาและใช้งานโดย Illumina ประกอบด้วยการจัดเรียงลำดับแบบไม่มีช่องว่าง (ungapped alignment) ที่มีความยาวลำดับอ่านจำกัด | ||||||||
| เออร์เน่ | โปรแกรมจัดเรียงลำดับเชิงตัวเลขแบบสุ่มขั้นสูง (Extended Randomized Numerical alignEr) สำหรับการจัดเรียงลำดับข้อมูล NGS อย่างแม่นยำ สามารถจับคู่ลำดับข้อมูลที่ผ่านการบำบัดด้วยไบซัลไฟต์ได้ | ใช่ | การตัดแต่งฐานคุณภาพต่ำ | ใช่ | การทำงานแบบมัลติเธรดและการเปิดใช้งาน MPI | ฟรี, GPL 3 | |||
| แก๊สสท์ | ค้นหาการจัดเรียงลำดับดีเอ็นเอสั้นๆ ทั่วโลกเทียบกับคลังดีเอ็นเอขนาดใหญ่ | มัลติเธรดดิ้ง | ใบอนุญาต CeCILLเวอร์ชัน 2 | [ 42 ] | 2011 | ||||
| อัญมณี | โปรแกรมจัดเรียงลำดับคุณภาพสูง (การจับคู่แบบละเอียดพร้อมการแทนที่และการแทรก/ลบ) แม่นยำกว่าและเร็วกว่า BWA หรือ Bowtie 1/2 หลายเท่า มีแอปพลิเคชันทางชีววิทยาแบบสแตนด์อโลนมากมาย (ตัวจับคู่, ตัวจับคู่แบบแยกส่วน, ความสามารถในการจับคู่ และอื่นๆ) ให้ใช้งาน | ใช่ | ใช่ | ใช่ | ใช่ | ฟรี, GPL 3 | [ 43 ] | 2012 | |
| เจนาลิซ แผนที่ | โปรแกรมจัดเรียงลำดับการอ่าน NGS ที่รวดเร็วและครอบคลุมเป็นพิเศษ พร้อมความแม่นยำสูงและใช้พื้นที่จัดเก็บข้อมูลน้อย | ใช่ | การตัดแต่งฐานคุณภาพต่ำ | ใช่ | ใช่ | กรรมสิทธิ์ทางการค้า | |||
| แอสเซมเบลอร์อัจฉริยะ | โปรแกรมประกอบลำดับดีเอ็นเอแบบซ้อนทับที่รวดเร็วและแม่นยำ พร้อมความสามารถในการจัดการกับเทคโนโลยีการจัดลำดับดีเอ็นเอ ความยาวของลำดับอ่าน ทิศทางการจับคู่ใดๆ ขนาดของตัวคั่นสำหรับการจับคู่ใดๆ ทั้งที่มีและไม่มีจีโนมอ้างอิง | ใช่ | กรรมสิทธิ์ทางการค้า | ||||||
| เจนเสิร์ชเอ็นจีเอส | กรอบการทำงานที่สมบูรณ์แบบพร้อม GUI ที่ใช้งานง่ายสำหรับการวิเคราะห์ข้อมูล NGS โดยผสานรวมอัลกอริทึมการจัดเรียงลำดับคุณภาพสูงที่เป็นกรรมสิทธิ์ และความสามารถในการเชื่อมต่อปลั๊กอินเพื่อรวมโปรแกรมจัดเรียงลำดับสาธารณะต่างๆ เข้ากับกรอบการทำงาน ทำให้สามารถนำเข้าข้อมูลลำดับสั้น จัดเรียงลำดับ ตรวจจับความแปรผัน และสร้างรายงานได้ สร้างขึ้นสำหรับโครงการจัดลำดับดีเอ็นเอใหม่ โดยเฉพาะอย่างยิ่งในบริบทการวินิจฉัยโรค | ใช่ | เลขที่ | ใช่ | ใช่ | กรรมสิทธิ์ทางการค้า | |||
| จีแมปและจีเอสเอ็นเอพี | การจัดเรียงลำดับดีเอ็นเอแบบสั้นที่มีประสิทธิภาพและรวดเร็ว GMAP: สำหรับลำดับดีเอ็นเอที่ยาวกว่า มีการแทรกหรือลบดีเอ็นเอหลายตำแหน่ง และมีการต่อเชื่อมดีเอ็นเอหลายจุด (ดูรายละเอียดเพิ่มเติมในหัวข้อการวิเคราะห์จีโนมิกส์ด้านบน); GSNAP: สำหรับลำดับดีเอ็นเอที่สั้นกว่า มีการแทรกหรือลบดีเอ็นเอหนึ่งตำแหน่ง หรือมีการต่อเชื่อมดีเอ็นเอได้สูงสุดสองตำแหน่งต่อลำดับ เหมาะสำหรับการวิเคราะห์การแสดงออกของยีนแบบดิจิทัล การระบุ SNP และการแทรกหรือลบดีเอ็นเอ พัฒนาโดย Thomas Wu ที่ Genentech และใช้งานโดยศูนย์ทรัพยากรจีโนมแห่งชาติ (NCGR) ใน Alpheus | ใช่ | ใช่ | ใช่ | ใช่ | ซอฟต์แวร์ลิขสิทธิ์ใช้งานได้ฟรีสำหรับการศึกษาและการใช้งานที่ไม่ใช่เชิงพาณิชย์ | |||
| จีนูแมป | ทำการจัดเรียงลำดับข้อมูลที่ได้จากเครื่องจัดลำดับรุ่นใหม่ (โดยเฉพาะของ Solexa-Illumina) กลับไปยังจีโนมขนาดใดก็ได้ด้วยความแม่นยำ โดยมีช่องว่างระหว่างข้อมูล รวมถึงการตัดแต่งอะแดปเตอร์ การระบุ SNP และการวิเคราะห์ลำดับด้วยวิธีไบซัลไฟต์ | ใช่แล้ว รองรับไฟล์ Illumina *_int.txt และ *_prb.txt พร้อมคะแนนคุณภาพทั้ง 4 ระดับสำหรับแต่ละฐานด้วย | การทำงานแบบมัลติเธรดและการเปิดใช้งาน MPI | [ 44 ] | 2009 | ||||
| รังหกเหลี่ยม | ใช้ตารางแฮชและเมทริกซ์บลูมเพื่อสร้างและกรองตำแหน่งที่เป็นไปได้บนจีโนม เพื่อประสิทธิภาพที่สูงขึ้น จะใช้ความคล้ายคลึงกันระหว่างลำดับอ่านสั้น ๆ และหลีกเลี่ยงการจัดเรียงลำดับซ้ำที่ไม่ซ้ำกัน เร็วกว่า Bowtie และ BWA และรองรับการจัดเรียงที่ไวต่อการแทรกหรือลบ (indels) และความแตกต่าง (divergent) บนไวรัส แบคทีเรีย และการจัดเรียงยูคาริโอตที่อนุรักษ์นิยมมากกว่า | ใช่ | ใช่ | ใช่ | ใช่ | ซอฟต์แวร์กรรมสิทธิ์ใช้งานได้ฟรีสำหรับนักวิชาการและผู้ใช้งานที่ไม่ใช่เชิงพาณิชย์ที่ลงทะเบียนใช้งานในระบบ HIVE | [ 45 ] | 2014 | |
| ไอโมส | ปรับปรุง Meta-aligner และ Minimap2 บน Spark ระบบจัดเรียงลำดับแบบกระจายสำหรับข้อมูลอ่านยาวบนแพลตฟอร์ม Apache Spark ที่มีความสามารถในการปรับขนาดเชิงเส้นเมื่อเทียบกับการทำงานบนโหนดเดียว | ใช่ | ใช่ | ใช่ | ฟรี | ||||
| ไอแซค | ใช้พลังการประมวลผลทั้งหมดที่มีอยู่บนโหนดเซิร์ฟเวอร์เดียวอย่างเต็มที่ ดังนั้นจึงสามารถปรับขนาดได้ดีกับสถาปัตยกรรมฮาร์ดแวร์ที่หลากหลาย และประสิทธิภาพการจัดเรียงจะดีขึ้นตามความสามารถของฮาร์ดแวร์ | ใช่ | ใช่ | ใช่ | ใช่ | ฟรี, GPL | |||
| ล่าสุด | ใช้ seed ที่ปรับเปลี่ยนได้และรับมือกับลำดับที่มีข้อมูลซ้ำจำนวนมาก (เช่น จีโนม) ได้อย่างมีประสิทธิภาพมากขึ้น ตัวอย่างเช่น สามารถจัดเรียงลำดับการอ่านไปยังจีโนมโดยไม่ต้องปิดบังข้อมูลซ้ำ โดยไม่เกิดปัญหาจากข้อมูลซ้ำซ้อนมากเกินไป | ใช่ | ใช่ | ใช่ | ใช่ | ฟรี, GPL | [ 46 ] | 2011 | |
| เอ็มเอคิว | การจัดเรียงที่ไม่มีช่องว่างซึ่งคำนึงถึงคะแนนคุณภาพสำหรับแต่ละเบส | ฟรี, GPL | |||||||
| มิสเตอร์ฟาสต์, มิสซิสฟาสต์ | ซอฟต์แวร์การจัดเรียงลำดับแบบมีช่องว่าง (mrFAST) และแบบไม่มีช่องว่าง (mrsFAST) ที่ใช้หลักการไม่คำนึงถึงแคชเพื่อลดการถ่ายโอนข้อมูลระหว่างหน่วยความจำหลักและแคชให้น้อยที่สุด ซอฟต์แวร์เหล่านี้ได้รับการออกแบบมาสำหรับแพลตฟอร์มการจัดลำดับดีเอ็นเอของ Illumina และสามารถส่งคืนตำแหน่งแผนที่ที่เป็นไปได้ทั้งหมดเพื่อการค้นพบความแปรผันทางโครงสร้างที่ดีขึ้น | ใช่ | ใช่ สำหรับการเปลี่ยนแปลงโครงสร้าง | ใช่ | เลขที่ | ฟรีบีเอสดี | |||
| แม่ | MOM หรือ Maximum Oligonucleotide Mapping คือเครื่องมือจับคู่ลำดับนิวคลีโอไทด์ที่ค้นหาลำดับที่มีความยาวสูงสุดภายในลำดับสั้นๆ | ใช่ | |||||||
| โมไซค์ | โปรแกรม จัดเรียงลำดับดีเอ็นเอแบบมีช่องว่างและประกอบลำดับดีเอ็นเอโดยใช้ข้อมูลอ้างอิง ทำงานโดยใช้ อัลกอริทึม Smith-Waterman แบบแบ่งช่วง โดยใช้ผลลัพธ์จากวิธีการแฮช k-mer เป็นจุดเริ่มต้น รองรับลำดับดีเอ็นเอที่มีขนาดตั้งแต่สั้นมากไปจนถึงยาวมาก | ใช่ | |||||||
| เอ็มพีสแกน | โปรแกรมจัดเรียงลำดับอย่างรวดเร็วโดยใช้กลยุทธ์การกรอง (ไม่มีการสร้างดัชนี ใช้คิวแกรมและ การจับคู่ DAWG แบบไม่กำหนดทิศทางย้อนกลับ ) | [ 47 ] | 2009 | ||||||
| โนโวอะไลน์ และ โนโวอะไลน์ซีเอส | การจัดเรียงลำดับแบบมีช่องว่างของข้อมูลการอ่านแบบปลายเดี่ยวและปลายคู่จาก Illumina GA I & II, ABI Colour space และ ION Torrent มีความไวและความจำเพาะสูง โดยใช้คุณภาพของเบสในทุกขั้นตอนของการจัดเรียงลำดับ รวมถึงการตัดแต่งอะแดปเตอร์ การปรับเทียบคุณภาพของเบส การจัดเรียงลำดับ Bi-Seq และตัวเลือกสำหรับการรายงานการจัดเรียงลำดับหลายรายการต่อการอ่านหนึ่งครั้ง การใช้รหัส IUPAC ที่คลุมเครือในการอ้างอิงสำหรับ SNP ทั่วไปสามารถปรับปรุงการเรียกคืน SNP และขจัดอคติของอัลลีลได้ | ใช่ | ใช่ | ใช่ | มีเวอร์ชันมัลติเธรดดิ้งและ MPI ให้เลือกใช้เมื่อซื้อใบอนุญาต | ซอฟต์แวร์กรรมสิทธิ์ แบบ ฟรีแวร์เวอร์ชันเธรดเดียว สำหรับการใช้งานทางวิชาการและที่ไม่ใช่เชิงพาณิชย์ | |||
| เน็กซ์เจน | พัฒนาขึ้นเพื่อใช้โดยนักชีววิทยาในการวิเคราะห์ข้อมูลลำดับดีเอ็นเอรุ่นใหม่จากเครื่อง Roche Genome Sequencer FLX, Illumina GA/HiSeq, ระบบ SOLiD ของ Life Technologies Applied BioSystems, PacBio และแพลตฟอร์ม Ion Torrent | ใช่ | ใช่ | ใช่ | ใช่ | กรรมสิทธิ์ทางการค้า | |||
| แผนที่รุ่นต่อไป | โปรแกรมจับคู่ลำดับดีเอ็นเอที่ยืดหยุ่นและรวดเร็ว (เร็วกว่า BWA สองเท่า) ให้ความไวในการจับคู่เทียบเท่า Stampy ภายในใช้โครงสร้างดัชนีที่มีประสิทธิภาพด้านหน่วยความจำ (ตารางแฮช) เพื่อจัดเก็บตำแหน่งของ 13-mer ทั้งหมดที่มีอยู่ในจีโนมอ้างอิง บริเวณการจับคู่ที่ต้องการการจัดเรียงแบบคู่จะถูกกำหนดแบบไดนามิกสำหรับแต่ละลำดับ ใช้คำสั่ง SIMD ที่รวดเร็ว (SSE) เพื่อเร่งการคำนวณการจัดเรียงบน CPU หากมี การจัดเรียงจะถูกคำนวณบน GPU (โดยใช้ OpenCL/CUDA) ซึ่งช่วยลดเวลาการทำงานลงอีก 20-50% | ใช่ | เลขที่ | ใช่ | ใช่แล้วPOSIX Threads , OpenCL/ CUDA , SSE | ฟรี | [ 48 ] | 2013 | |
| ชุดเครื่องมือตัวแปร Omixon | ชุดเครื่องมือนี้ประกอบด้วยเครื่องมือที่มีความไวสูงและแม่นยำสูงสำหรับการตรวจจับ SNP และ indel โดยนำเสนอโซลูชันสำหรับการแมปข้อมูลลำดับดีเอ็นเอแบบสั้น (NGS) ที่มีระยะห่างปานกลาง (ความแตกต่างของลำดับไม่เกิน 30%) จากจีโนมอ้างอิง ไม่มีข้อจำกัดเกี่ยวกับขนาดของจีโนมอ้างอิง ซึ่งเมื่อรวมกับความไวสูง ทำให้ Variant Toolkit เหมาะอย่างยิ่งสำหรับโครงการลำดับดีเอ็นเอแบบเจาะจงเป้าหมายและการวินิจฉัยโรค | ใช่ | ใช่ | ใช่ | ใช่ | กรรมสิทธิ์ทางการค้า | |||
| ปาล์มแมปเปอร์ | คำนวณการจัดเรียงลำดับทั้งแบบที่มีการเชื่อมต่อและไม่มีการเชื่อมต่อได้อย่างมีประสิทธิภาพและแม่นยำสูง โดยอาศัยกลยุทธ์การเรียนรู้ของเครื่องร่วมกับการจับคู่ที่รวดเร็วโดยใช้อัลกอริธึมแบบ Smith-Waterman ที่มีโครงสร้างเป็นแถบ ทำให้สามารถจัดเรียงลำดับได้ประมาณ 7 ล้านลำดับต่อชั่วโมงบนซีพียูตัวเดียว และปรับปรุงวิธีการ QPALMA ที่เสนอไว้แต่เดิมให้ดียิ่งขึ้น | ใช่ | ฟรี, GPL | ||||||
| พาร์เทค โฟลว์ | สำหรับนักชีววิทยาและนักชีวสารสนเทศ โปรแกรมนี้รองรับการจัดเรียงลำดับแบบไม่มีช่องว่าง มีช่องว่าง และจุดเชื่อมต่อการตัดต่อ จากข้อมูลดิบแบบอ่านเดี่ยวและแบบอ่านคู่จาก Illumina, Life technologies Solid ™, Roche 454 และ Ion Torrent (มีหรือไม่มีข้อมูลคุณภาพ) โปรแกรมนี้ผสานรวมการควบคุมคุณภาพที่มีประสิทธิภาพในระดับ FASTQ/Qual และข้อมูลที่จัดเรียงแล้ว ฟังก์ชันเพิ่มเติม ได้แก่ การตัดแต่งและกรองข้อมูลดิบ การตรวจจับ SNP และ InDel การหาปริมาณ mRNA และ microRNA และการตรวจจับยีนลูกผสม | ใช่ | ใช่ | ใช่ | สามารถติดตั้งแบบมัลติโปรเซสเซอร์คอร์ และแบบไคลเอ็นต์เซิร์ฟเวอร์ได้ | ลิขสิทธิ์เฉพาะ , เชิงพาณิชย์ , เวอร์ชันทดลองใช้ฟรี | |||
| ผ่าน | จัดทำดัชนีจีโนม จากนั้นขยายจุดเริ่มต้นโดยใช้การจัดเรียงคำที่คำนวณไว้ล่วงหน้า ทำงานได้กับพื้นที่เบส พื้นที่สี (SOLID) และสามารถจัดเรียงลำดับจีโนมและลำดับ RNA ที่ผ่านการตัดต่อได้ | ใช่ | ใช่ | ใช่ | ใช่ | ซอฟต์แวร์ลิขสิทธิ์ใช้งานได้ฟรีสำหรับการศึกษาและการใช้งานที่ไม่ใช่เชิงพาณิชย์ | |||
| เพอร์เอ็ม | โปรแกรมนี้สร้างดัชนีจีโนมโดยใช้ค่าเริ่มต้นเป็นระยะเพื่อค้นหาการจัดเรียงลำดับได้อย่างรวดเร็วด้วยความไวเต็มที่สูงสุดถึงสี่ตำแหน่งที่ไม่ตรงกัน สามารถแมปข้อมูลการอ่านจาก Illumina และ SOLiD ได้ และแตกต่างจากโปรแกรมแมปส่วนใหญ่ ความเร็วจะเพิ่มขึ้นเมื่อความยาวของการอ่านเพิ่มขึ้น | ใช่ | ฟรี, GPL | [ 49 ] | |||||
| ไพรเม็กซ์ | โปรแกรมนี้สร้างดัชนีจีโนมด้วยตารางค้นหา k-mer ที่มีความไวสูงถึงจำนวนความคลาดเคลื่อนที่ปรับได้ เหมาะที่สุดสำหรับการจับคู่ลำดับ 15-60 bp กับจีโนม | เลขที่ | เลขที่ | ใช่ | ไม่ มีกระบวนการหลายอย่างต่อการค้นหาหนึ่งครั้ง | [1] | 2003 | ||
| คิวพาลมา | สามารถใช้คะแนนคุณภาพ ความยาวของอินทรอน และการทำนายตำแหน่งการเชื่อมต่อของยีนด้วยการคำนวณ เพื่อทำการจัดเรียงลำดับอย่างเป็นกลาง สามารถฝึกฝนให้เข้ากับรายละเอียดเฉพาะของการทดลอง RNA-seq และจีโนมได้ มีประโยชน์สำหรับการค้นหาตำแหน่งการเชื่อมต่อของยีน/อินทรอน และสำหรับการสร้างแบบจำลองยีน (ดู PALMapper สำหรับเวอร์ชันที่เร็วกว่า) | ใช่ ระบบไคลเอ็นต์-เซิร์ฟเวอร์ | ฟรี, GPL 2 | ||||||
| เรเซอร์ส | ไม่มีการจำกัดความยาวของลำดับอ่าน การจับคู่ระยะทางแฮมมิงหรือระยะทางแก้ไขพร้อมอัตราข้อผิดพลาดที่กำหนดค่าได้ ความไวที่กำหนดค่าได้และคาดการณ์ได้ (การแลกเปลี่ยนระหว่างเวลาทำงาน/ความไว) รองรับการจับคู่ลำดับอ่านแบบคู่ปลาย | ฟรี, LGPL | |||||||
| ของจริง ของจริง | REAL เป็นเครื่องมือที่มีประสิทธิภาพ แม่นยำ และละเอียดอ่อนสำหรับการจัดเรียงลำดับดีเอ็นเอสั้นๆ ที่ได้จากการจัดลำดับดีเอ็นเอรุ่นใหม่ โปรแกรมนี้สามารถจัดการกับลำดับดีเอ็นเอแบบปลายเดียวจำนวนมหาศาลที่สร้างขึ้นโดยเครื่องวิเคราะห์จีโนม Illumina/Solexa รุ่นใหม่ได้ cREAL เป็นส่วนขยายที่ง่ายกว่าของ REAL สำหรับการจัดเรียงลำดับดีเอ็นเอสั้นๆ ที่ได้จากการจัดลำดับดีเอ็นเอรุ่นใหม่ไปยังจีโนมที่มีโครงสร้างเป็นวงกลม | ใช่ | ใช่ | ฟรี, GPL | |||||
| อาร์แมป | สามารถแมปข้อมูลการอ่านได้ทั้งแบบมีและไม่มีข้อมูลความน่าจะเป็นของข้อผิดพลาด (คะแนนคุณภาพ) และรองรับการอ่านแบบคู่ปลายหรือการแมปข้อมูลการอ่านที่ผ่านการบำบัดด้วยไบซัลไฟต์ ไม่มีข้อจำกัดเกี่ยวกับความยาวของการอ่านหรือจำนวนความไม่ตรงกัน | ใช่ | ใช่ | ใช่ | ฟรี, GPL 3 | ||||
| อาร์เอ็นเอ | โปรแกรมจัดเรียงลำดับเชิงตัวเลขแบบสุ่มสำหรับการจัดเรียงลำดับ NGS ที่แม่นยำ | ใช่ | การตัดแต่งฐานคุณภาพต่ำ | ใช่ | การทำงานแบบมัลติเธรดและการเปิดใช้งาน MPI | ฟรี, GPL 3 | |||
| นักวิจัย RTG | รวดเร็วเป็นพิเศษ ทนทานต่อจำนวนการแทรก/ลบ และการแทนที่สูง รวมถึงการจัดเรียงลำดับการอ่านแบบสมบูรณ์ ผลิตภัณฑ์นี้มีไปป์ไลน์ที่ครอบคลุมสำหรับการตรวจจับความแปรผันและการวิเคราะห์เมตาจีโนมิกส์ด้วยข้อมูล Illumina, Complete Genomics และ Roche 454 ในทุกรูปแบบ | ใช่ | ใช่ สำหรับการเรียกหาความแปรผัน | ใช่ | ใช่ | ซอฟต์แวร์ ลิขสิทธิ์ เฉพาะ ใช้ งานได้ฟรีสำหรับนักสืบแต่ละคน | |||
| เซเกเมล | สามารถจัดการกับการแทรก การลบ และความไม่ตรงกันได้ โดยใช้ชุดคำต่อท้ายที่ได้รับการปรับปรุง | ใช่ | เลขที่ | ใช่ | ใช่ | ซอฟต์แวร์ลิขสิทธิ์ใช้งานได้ฟรีสำหรับการใช้งานที่ไม่ใช่เชิงพาณิชย์ | [ 50 ] | 2009 | |
| แผนที่ลำดับ | สามารถทำการแทนที่และแทรก/ลบข้อมูลได้สูงสุด 5 รูปแบบผสมกัน มีตัวเลือกการปรับแต่งและรูปแบบการรับส่งข้อมูลที่หลากหลาย | ซอฟต์แวร์ลิขสิทธิ์ใช้งานได้ฟรีสำหรับการศึกษาและการใช้งานที่ไม่ใช่เชิงพาณิชย์ | |||||||
| ชเร็ค | การแก้ไขข้อผิดพลาดในการอ่านแบบสั้นด้วยโครงสร้างข้อมูล แบบต้นไม้ต่อท้าย | ใช่แล้วภาษาจาวา | |||||||
| กุ้ง | สร้างดัชนีจีโนมอ้างอิงตั้งแต่เวอร์ชัน 2 เป็นต้นไป ใช้มาสก์เพื่อสร้างคีย์ที่เป็นไปได้ สามารถแมปข้อมูลการอ่านจากระบบสี ABI SOLiD ได้ | ใช่ | ใช่ | ใช่ | ใช่OpenMP | ใบอนุญาต BSD ฟรี | ฟรี, อนุพันธ์ BSD ]] | พ.ศ. 2552-2554 | |
| สไลเดอร์ | Slider เป็นแอปพลิเคชันสำหรับผลลัพธ์จาก Illumina Sequence Analyzer ซึ่งใช้ไฟล์ "ความน่าจะเป็น" แทนไฟล์ลำดับเป็นข้อมูลป้อนเข้าสำหรับการจัดเรียงลำดับกับลำดับอ้างอิงหรือชุดของลำดับอ้างอิง | ใช่ | ใช่ | เลขที่ | เลขที่ | [ 53 ] [ 54 ] | ปี 2009-2010 | ||
| SOAP, SOAP2, SOAP3, SOAP3-dp | SOAP: มีความทนทานต่อช่องว่างและความไม่ตรงกันจำนวนน้อย (1-3) มีการปรับปรุงความเร็วเมื่อเทียบกับ BLAT โดยใช้ตารางแฮช 12 ตัวอักษร SOAP2: ใช้ BWT แบบสองทิศทางในการสร้างดัชนีอ้างอิง และเร็วกว่าเวอร์ชันแรกมาก SOAP3: เวอร์ชันเร่งความเร็วด้วย GPU ที่สามารถค้นหาการจัดเรียงที่มีความไม่ตรงกัน 4 ตำแหน่งได้ทั้งหมดในเวลาไม่กี่สิบวินาทีต่อการอ่านหนึ่งล้านครั้ง SOAP3-dp ซึ่งเร่งความเร็วด้วย GPU เช่นกัน รองรับจำนวนความไม่ตรงกันและช่องว่างได้ตามต้องการ โดยขึ้นอยู่กับคะแนนค่าปรับช่องว่างแบบเชิงเส้น | ใช่ | เลขที่ | ใช่ SOAP3-dp | ใช่แล้วPOSIX Threads ; SOAP3, SOAP3-dp ต้องการ GPU ที่รองรับ CUDA | ฟรี, GPL | [ 55 ] [ 56 ] | ||
| โซซีเอส | สำหรับเทคโนโลยี ABI SOLiD ช่วยลดเวลาในการจับคู่ลำดับดีเอ็นเอที่มีความไม่ตรงกัน (หรือข้อผิดพลาดด้านสี) ได้อย่างมาก โดยใช้ขั้นตอนวิธีค้นหาสตริงแบบ Rabin-Karp เวอร์ชันวนซ้ำ | ใช่ | ฟรี, GPL | ||||||
| สปาร์คบีดับบลิวเอ | โปรแกรมนี้ผสานรวมBurrows–Wheeler Aligner (BWA) เข้ากับ เฟรมเวิร์ก Apache Sparkที่ทำงานบนHadoopเวอร์ชัน 0.2 ตุลาคม 2016 รองรับอัลกอริธึม BWA-MEM, BWA-backtrack และ BWA-ALN ซึ่งทั้งหมดทำงานได้กับทั้งลำดับดีเอ็นเอแบบอ่านเดี่ยวและแบบอ่านคู่ | ใช่ | การตัดแต่งฐานคุณภาพต่ำ | ใช่ | ใช่ | ฟรี, GPL 3 | [ 57 ] | 2016 | |
| เอสซาฮา, เอสซาฮา2 | รวดเร็วสำหรับตัวแปรจำนวนน้อย | ซอฟต์แวร์ลิขสิทธิ์ใช้งานได้ฟรีสำหรับการศึกษาและการใช้งานที่ไม่ใช่เชิงพาณิชย์ | |||||||
| สแตมปี้ | สำหรับข้อมูลการอ่านจาก Illumina มีความจำเพาะสูงและไวต่อข้อมูลการอ่านที่มี indel, การเปลี่ยนแปลงโครงสร้าง หรือ SNP จำนวนมาก กระบวนการค่อนข้างช้า แต่ความเร็วเพิ่มขึ้นอย่างมากโดยใช้ BWA สำหรับการจัดเรียงลำดับครั้งแรก | ใช่ | ใช่ | ใช่ | เลขที่ | ซอฟต์แวร์ลิขสิทธิ์ใช้งานได้ฟรีสำหรับการศึกษาและการใช้งานที่ไม่ใช่เชิงพาณิชย์ | [ 58 ] | 2010 | |
| พายุ | สำหรับข้อมูลการอ่านจาก Illumina หรือ ABI SOLiD ที่มี เอาต์พุต SAMดั้งเดิม มีความไวสูงต่อข้อมูลการอ่านที่มีข้อผิดพลาดจำนวนมาก เช่น การแทรกหรือลบ (indels) (รองรับตั้งแต่ 0 ถึง 15 รายการ และรองรับเพิ่มเติมในกรณีอื่นๆ) ใช้ seed แบบเว้นระยะ (single hit) และ ตัวกรองการจัดเรียงแบบแถบ SSE - SSE2 - AVX2 - AVX-512 ที่รวดเร็วมาก สำหรับข้อมูลการอ่านที่มีความยาวคงที่เท่านั้น ผู้เขียนแนะนำให้ใช้ SHRiMP2 สำหรับข้อมูลการอ่านประเภทอื่น | เลขที่ | ใช่ | ใช่ | ใช่OpenMP | ฟรี | [ 59 ] | 2010 | |
| ซับรีด, ซับจุน | โปรแกรมจัดเรียงลำดับการอ่านที่รวดเร็วและแม่นยำเป็นพิเศษ Subread สามารถใช้ในการจับคู่ลำดับการอ่านทั้ง gDNA-seq และ RNA-seq ได้ ส่วน Subjunc ตรวจจับจุดเชื่อมต่อระหว่างเอ็กซอนและจับคู่ลำดับการอ่าน RNA-seq โดยใช้กระบวนการจับคู่แบบใหม่ที่เรียกว่าseed-and- vote | ใช่ | ใช่ | ใช่ | ใช่ | ฟรี, GPL 3 | |||
| ไทปัน | แอสเซมเบลอร์ De-novo สำหรับ Illumina อ่าน | ซอฟต์แวร์ลิขสิทธิ์ใช้งานได้ฟรีสำหรับการศึกษาและการใช้งานที่ไม่ใช่เชิงพาณิชย์ | |||||||
| ยูจีน | อินเทอร์เฟซแบบกราฟิกสำหรับทั้ง Bowtie และ BWA รวมถึงตัวจัดตำแหน่งแบบฝังตัว | ใช่ | ใช่ | ใช่ | ใช่ | ฟรี, GPL | |||
| เวโลซีแมปเปอร์ | เครื่องมือจับคู่ลำดับอ้างอิงที่เร่งความเร็วด้วย FPGA จากTimeLogicเร็วกว่า อัลกอริธึมที่ใช้ การแปลง Burrows–Wheelerเช่น BWA และ Bowtie รองรับความไม่ตรงกันและ/หรือการแทรก/ลบได้สูงสุด 7 ตำแหน่งโดยไม่ลดประสิทธิภาพ สร้างการจัดเรียงแบบมีช่องว่าง Smith–Waterman ที่ละเอียดอ่อน | ใช่ | ใช่ | ใช่ | ใช่ | กรรมสิทธิ์ทางการค้า | |||
| เอ็กซ์เพรสอัลไลน์ | ตัวจัดเรียงลำดับการอ่านสั้นแบบเลื่อนหน้าต่างบน FPGA ซึ่งใช้ประโยชน์จากคุณสมบัติการประมวลผลแบบขนานอย่างง่ายดายของการจัดเรียงลำดับการอ่านสั้น ประสิทธิภาพเพิ่มขึ้นเป็นเส้นตรงตามจำนวนทรานซิสเตอร์บนชิป (กล่าวคือ ประสิทธิภาพรับประกันว่าจะเพิ่มขึ้นเป็นสองเท่าในแต่ละรอบของกฎของมัวร์โดยไม่ต้องแก้ไขอัลกอริทึม) การใช้พลังงานต่ำเป็นประโยชน์สำหรับอุปกรณ์ในศูนย์ข้อมูล เวลาทำงานที่คาดการณ์ได้ ราคา/ประสิทธิภาพดีกว่าตัวจัดเรียงลำดับแบบเลื่อนหน้าต่างที่ใช้ซอฟต์แวร์บนฮาร์ดแวร์ปัจจุบัน แต่ยังไม่ดีกว่าตัวจัดเรียงลำดับแบบ BWT ที่ใช้ซอฟต์แวร์ในปัจจุบัน สามารถจัดการกับจำนวนความไม่ตรงกันจำนวนมาก (>2) จะค้นหาตำแหน่งที่ตรงกันทั้งหมดสำหรับทุก seed เวอร์ชันทดลองใช้ FPGA ตัวเดียว ต้องพัฒนาเพิ่มเติมเพื่อเป็นเวอร์ชันใช้งานจริงแบบหลาย FPGA | ซอฟต์แวร์ลิขสิทธิ์ใช้งานได้ฟรีสำหรับการศึกษาและการใช้งานที่ไม่ใช่เชิงพาณิชย์ | |||||||
| ซูม | มีความไว 100% สำหรับการอ่านค่าระหว่าง 15 ถึง 240 bp พร้อมความคลาดเคลื่อนที่ยอมรับได้ รวดเร็วมาก รองรับการแทรกและการลบ ใช้งานได้กับเครื่องมือ Illumina และ SOLiD ไม่รองรับ 454 | ใช่ (GUI), ไม่ใช่ (CLI) | กรรมสิทธิ์ทางการค้า | [ 60 ] |
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ รายชื่อซอฟต์แวร์การจัดเรียงลำดับ
รายชื่อซอฟต์แวร์จัดเรียงลำดับ นี้เป็นการรวบรวมเครื่องมือซอฟต์แวร์และพอร์ทัลบนเว็บที่ใช้ในการจัดเรียงลำดับแบบ คู่...
การจัดเรียงแบบคู่
* ประเภทลำดับ: โปรตีนหรือนิวคลีโอไทด์ ** ประเภทการจัดเรียง: เฉพาะที่หรือโดยรวม
การจัดเรียงลำดับหลายลำดับ
* ประเภทลำดับ: โปรตีนหรือนิวคลีโอไทด์ ** ประเภทการจัดเรียง: เฉพาะที่หรือโดยรวม
การเปรียบเทียบมาตรฐาน
ชื่อ ผู้เขียน PFAM 30.0 (2016) สมาร์ท (2015) เลทูนิค, คอปเลย์, ชมิดต์, ซิคาเรลลี, ดอร์คส์, ชูลทซ์, พอนติง, บอร์ค บาหลีเบส 3 (2015) ทอมป์สัน, เพลวนิแอค, โพช อ็อกซ์เบนช์ (2011) รากาวา, เซียร์ล, ออดลีย์, บาร์เบอร์, บาร์ตัน ชุดข้อมูลมาตรฐาน (2009) เอ็ดการ์...