อ่าน 6 นาที
คลัสทัล
Clustalเป็นโปรแกรมคอมพิวเตอร์ที่ใช้สำหรับการจัดเรียงลำดับหลายลำดับในชีวสารสนเทศ เป็นหนึ่งในซอฟต์แวร์ชีวสารสนเทศที่มีการอ้างอิงมากที่สุด โดยมีผลงานตีพิมพ์ทางวิชาการสองฉบับอยู่ใน...
คลัสทัล
| คลัสเตอร์ | |
|---|---|
| นักพัฒนา |
|
| เวอร์ชันเสถียร | 1.2.4 / 20 ธันวาคม 2559 |
| เขียนเป็น | ซี++ |
| ระบบปฏิบัติการ | ยูนิกซ์ , ลินุกซ์ , แมคโอเอส , วินโดวส์ , ฟรีบีเอสดี , เดเบียน |
| พิมพ์ | เครื่องมือชีวสารสนเทศ |
| ใบอนุญาต | ใบอนุญาตสาธารณะทั่วไปของ GNUเวอร์ชัน 2 [ 1 ] |
| เว็บไซต์ | www.clustal.org/omega/ |

Clustalเป็นโปรแกรมคอมพิวเตอร์ที่ใช้สำหรับการจัดเรียงลำดับหลายลำดับในชีวสารสนเทศ [ 2 ] เป็นหนึ่งในซอฟต์แวร์ชีวสารสนเทศที่มีการอ้างอิงมากที่สุด โดยมีผลงานตีพิมพ์ทางวิชาการสองฉบับอยู่ใน 100 บทความที่มีการอ้างอิงมากที่สุดตลอดกาล ตามรายงานของNatureในปี 2014 [ 3 ]
นับตั้งแต่ตีพิมพ์ครั้งแรกในปี 1988 ซอฟต์แวร์และอัลกอริทึมของมันได้รับการพัฒนามาหลายรุ่น โดย ClustalΩ (Omega) เป็นเวอร์ชันล่าสุด ณ ปี 2011 สามารถใช้งานได้ทั้งในรูปแบบซอฟต์แวร์แบบติดตั้งบนเครื่อง ผ่านทางเว็บอินเทอร์เฟซและผ่านทางเซิร์ฟเวอร์ที่ดูแลโดยสถาบันชีวสารสนเทศแห่งยุโรป (European Bioinformatics Institute )
ประวัติศาสตร์
แผนผังต้นไม้ในเวอร์ชันเริ่มต้นของ Clustal ถูกสร้างขึ้นผ่าน การวิเคราะห์คลัสเตอร์ UPGMAของการจัดเรียงแบบคู่ ดังนั้นจึงได้ชื่อว่า CLUSTAL [ 4 ]ดู[ 5 ]เวอร์ชันสี่เวอร์ชันแรกของ Clustal ใช้เลขอารบิก (1 ถึง 4) ในขณะที่เวอร์ชันที่ห้าใช้เลขโรมัน V [ 4 ]ดู[ 6 ] [ 7 ]เวอร์ชันสองเวอร์ชันถัดไปใช้ตัวอักษรละติน โดย W หมายถึง weighted และ X หมายถึงX Windowเพื่อแสดงถึงการเปลี่ยนแปลงที่เกิดขึ้น[ 4 ]ดู[ 8 ] [ 9 ]ชื่อ Omega ถูกเลือกเพื่อแสดงถึงการเปลี่ยนแปลงจากเวอร์ชันก่อนหน้า[ 4 ]
ประวัติเวอร์ชัน
- Clustal : ซอฟต์แวร์ดั้งเดิมสำหรับการจัดเรียงลำดับหลายลำดับ สร้างโดยDes Higginsในปี 1988 โดยอาศัยการสร้างแผนผังนำทางจากลำดับคู่ของกรดอะมิโนหรือ นิว คลีโอไทด์[ 10 ]
- ClustalV : Clustal รุ่นที่สอง เปิดตัวในปี 1992 โดยนำเสนอความสามารถในการสร้างการจัดเรียงลำดับใหม่จากการจัดเรียงลำดับที่มีอยู่แล้วในกระบวนการที่เรียกว่าการสร้างแผนภูมิวิวัฒนาการ ClustalV ยังเพิ่มตัวเลือกในการสร้างแผนภูมิโดยใช้วิธีการเชื่อมต่อเพื่อนบ้าน[ 7 ]
- ClustalW : รุ่นที่สาม เปิดตัวในปี 1994 โดยปรับปรุงอัลกอริทึมการจัดเรียงแบบก้าวหน้า รวมถึง ตัวเลือก การถ่วงน้ำหนัก ลำดับ ตามความคล้ายคลึงและความแตกต่างนอกจากนี้ยังเพิ่มตัวเลือกในการเรียกใช้ Clustal ในโหมดแบตช์จาก บรรทัด คำสั่ง[ 11 ]
- ClustalX : เปิดตัวในปี 1997 ซึ่งเป็นเวอร์ชันแรกที่มีอินเทอร์เฟซผู้ใช้แบบกราฟิก[ 9 ]
- Clustal2 : เวอร์ชันนี้ได้รับการปรับปรุงจากทั้ง ClustalW และ ClustalX ให้มีความแม่นยำและประสิทธิภาพที่สูงขึ้นในปี 2550 [ 12 ]
- ClustalΩ (โอเมก้า) : เวอร์ชันปัจจุบัน เปิดตัวในปี 2011 [ 13 ] [ 14 ]
การทำงาน

Clustal จัดเรียงลำดับโดยใช้ฮิวริสติกที่ สร้างการจัดเรียงลำดับหลาย ลำดับจากชุดการจัดเรียงแบบคู่ทีละคู่ วิธีนี้ทำงานโดยการวิเคราะห์ลำดับทั้งหมดและใช้วิธี UPGMA/neighbor-joining เพื่อสร้างเมทริกซ์ระยะทางต้นไม้แนะนำจะถูกคำนวณจากคะแนนของลำดับในเมทริกซ์ จากนั้นจึงใช้เพื่อสร้างการจัดเรียงลำดับหลายลำดับโดยการจัดเรียงลำดับตามลำดับความคล้ายคลึงกันทีละน้อย[ 15 ]
Clustal สร้างการจัดเรียงลำดับหลายลำดับผ่านสามขั้นตอนหลัก:
- ทำการจัดเรียงลำดับแบบคู่โดยใช้วิธีการจัดเรียงลำดับแบบก้าวหน้า
- สร้างแผนผังแนะนำ (หรือใช้แผนผังที่ผู้ใช้กำหนดเอง)
- ใช้แผนผังต้นไม้เป็นแนวทางในการจัดเรียงลำดับหลายรายการ
ขั้นตอนเหล่านี้จะดำเนินการโดยอัตโนมัติด้วยฟังก์ชัน "ทำการจัดเรียงลำดับทั้งหมด" ตัวเลือกอื่นๆ ได้แก่ "ทำการจัดเรียงลำดับจากแผนภูมินำทางและแผนภูมิวิวัฒนาการ" และ "สร้างแผนภูมินำทางเท่านั้น"
อินพุต/เอาต์พุต
โปรแกรมนี้รองรับรูปแบบข้อมูลนำเข้าที่หลากหลาย รวมถึง NBRF/ PIR , FASTA , EMBL/ Swiss-Prot , Clustal, GCC/MSF, GCG9 RSF และ GDE
รูปแบบผลลัพธ์สามารถเป็นรูปแบบใดรูปแบบหนึ่งหรือหลายรูปแบบต่อไปนี้: Clustal, NBRF/ PIR , GCG /MSF, PHYLIP , GDE หรือ NEXUS
| เครื่องหมาย | คำนิยาม | ความหมาย |
|---|---|---|
| * | เครื่องหมายดอกจัน | ตำแหน่งที่มีสารตกค้างเพียงหนึ่งเดียวและได้รับการอนุรักษ์ไว้อย่างสมบูรณ์ |
| : | ลำไส้ใหญ่ | อนุรักษ์ไว้: การอนุรักษ์ระหว่างกลุ่มที่มีคุณสมบัติคล้ายคลึงกันอย่างมาก (คะแนน > 0.5 ใน เมทริกซ์ PAM 250 ) |
| . | ระยะเวลา | กึ่งอนุรักษ์: การอนุรักษ์ระหว่างกลุ่มที่มีคุณสมบัติคล้ายคลึงกันน้อย (คะแนน ≤ 0.5 บนเมทริกซ์ PAM 250) |
| ว่างเปล่า | ไม่ได้รับการอนุรักษ์ |
สัญลักษณ์ที่แสดงนั้นเหมือนกันทั้งสำหรับ การจัดเรียงลำดับ DNA / RNAและ การจัดเรียงลำดับ โปรตีนดังนั้นในขณะที่สัญลักษณ์ * (ดอกจัน) มีประโยชน์สำหรับทั้งสองกรณี สัญลักษณ์ฉันทามติอื่นๆ ควรถูกละเลยสำหรับการจัดเรียงลำดับ DNA/RNA
การตั้งค่า
ผู้ใช้สามารถปรับค่าพารามิเตอร์บทลงโทษสำหรับการเปิดช่องว่างและการขยายช่องว่างได้
คลัสทัลและคลัสทัลวี
ซอฟต์แวร์ Clustal ดั้งเดิมได้รับการพัฒนาขึ้นในปี 1988 ในฐานะวิธีการคำนวณสำหรับการสร้างการจัดเรียงลำดับหลายลำดับบนคอมพิวเตอร์ส่วนบุคคล ClustalV ซึ่งเปิดตัวในอีก 4 ปีต่อมา เป็นการเขียนใหม่ทั้งหมด โดยใช้ภาษา Cแทนภาษา Fortran
อัลกอริทึม
ทั้งสองเวอร์ชันใช้ อัลกอริทึมประมาณค่าที่รวดเร็วแบบเดียวกันในการคำนวณคะแนนความคล้ายคลึงกันระหว่างลำดับ ซึ่งจะสร้างการจัดเรียงแบบคู่ อัลกอริทึมทำงานโดยการคำนวณคะแนนความคล้ายคลึงกันเป็นจำนวนการจับคู่k-tupleระหว่างสองลำดับ โดยคำนึงถึงค่าปรับสำหรับช่องว่าง ยิ่งลำดับมีความคล้ายคลึงกันมากเท่าใด คะแนนก็จะยิ่งสูงขึ้นเท่านั้น เมื่อให้คะแนนลำดับแล้ว จะมีการสร้าง เดนโดแกรมผ่าน UPGMA เพื่อสร้างลำดับของการจัดเรียงลำดับหลายลำดับ ลำดับจะถูกจัดเรียงตามลำดับจากมากไปน้อยตามลำดับที่กำหนด อัลกอริทึมนี้รองรับชุดข้อมูลขนาดใหญ่มากและมีความเร็ว อย่างไรก็ตาม ความเร็วขึ้นอยู่กับช่วงของการจับคู่ k-tuple ที่เลือกสำหรับประเภทลำดับเฉพาะ[ 16 ]
การปรับปรุงที่โดดเด่นของ ClustalV
ส่วนเพิ่มเติมที่โดดเด่นที่สุดบางส่วนใน ClustalV ได้แก่ การจัดเรียงโปรไฟล์ และตัวเลือกอินเทอร์เฟซบรรทัดคำสั่งแบบเต็มรูปแบบ ความสามารถในการใช้การจัดเรียงโปรไฟล์ช่วยให้ผู้ใช้สามารถจัดเรียงการจัดเรียงหรือลำดับก่อนหน้าสองรายการขึ้นไปเข้ากับการจัดเรียงใหม่ และย้ายลำดับที่ไม่ตรงกัน (คะแนนต่ำ) ลงไปในลำดับการจัดเรียงต่อไป ซึ่งทำให้ผู้ใช้สามารถสร้างการจัดเรียงลำดับหลายรายการทีละน้อยและเป็นระบบด้วยการควบคุมที่มากกว่าตัวเลือกพื้นฐาน[ 15 ]ตัวเลือกในการเรียกใช้จากบรรทัดคำสั่งช่วยเร่งกระบวนการจัดเรียงลำดับหลายรายการ สามารถเรียกใช้ลำดับได้ด้วยคำสั่งง่ายๆ
clustalv nameoffile . seqหรือ
clustalv / infile = nameoffile . seqและโปรแกรมจะกำหนดประเภทของลำดับที่กำลังวิเคราะห์ เมื่อโปรแกรมเสร็จสิ้น ผลลัพธ์ของการจัดเรียงลำดับหลายลำดับรวมถึงเดนโดแกรมจะถูกบันทึกในไฟล์ที่มีนามสกุล .aln และ .dnd ตามลำดับ อินเทอร์เฟซบรรทัดคำสั่งใช้พารามิเตอร์เริ่มต้น และไม่อนุญาตให้ใช้ตัวเลือกอื่น[ 16 ]
คลัสทัลดับเบิลยู

ClustalW ใช้ระเบียบวิธีจัดเรียงลำดับแบบก้าวหน้า ซึ่งจะจัดลำดับความสำคัญของลำดับเพื่อจัดเรียงตามความคล้ายคลึงกันจนกว่าจะได้การจัดเรียงโดยรวม นอกจากนี้ยังเป็น อัลกอริทึม แบบเมทริกซ์ในขณะที่เครื่องมืออย่างT-CoffeeและDialignใช้หลักการความสอดคล้อง โปรแกรมนี้ต้องการลำดับอย่างน้อยสามลำดับขึ้นไปเพื่อคำนวณการจัดเรียงโดยรวม สำหรับการจัดเรียงลำดับแบบไบนารี ควรใช้ เครื่องมืออื่น เช่นEMBOSS หรือ LALIGN

อัลกอริทึม
ClustalW ใช้ขั้นตอนวิธีจัดเรียงลำดับแบบก้าวหน้า โดยเรียงลำดับจากคะแนนการจัดเรียงลำดับมากที่สุดไปน้อยที่สุด วิธีการนี้จำเป็นเพื่อจำกัดเวลาและความซับซ้อนของหน่วยความจำที่จำเป็นในการค้นหาคำตอบที่เหมาะสมที่สุดโดยรวม
ขั้นแรก อัลกอริทึมจะคำนวณเมทริกซ์ระยะทางแบบคู่ระหว่างลำดับทั้งหมด ( การจัดเรียงลำดับแบบคู่ ) ต่อไปวิธี Neighbor-joiningจะใช้การกำหนดรากที่จุดกึ่งกลางเพื่อสร้างต้นไม้นำทางโดยรวม[ 17 ]แผนภาพของวิธีนี้แสดงไว้ทางด้านขวา สุดท้าย ต้นไม้นำทางจะถูกใช้เป็นแม่แบบโดยประมาณเพื่อสร้างการจัดเรียงทั่วโลก
ความซับซ้อนเชิงเวลา
ClustalW มีความซับซ้อนเชิงเวลาเนื่องจากใช้เมธอด neighbor-joining
ClustalW2 เพิ่มตัวเลือกให้ใช้ UPGMA แทน ซึ่งเร็วกว่าสำหรับข้อมูลขนาดใหญ่ คำสั่งบรรทัดคำสั่งที่จะใช้แทนวิธี Neighbor-Joining คือ:
- การจัดกลุ่ม= UPGMAยกตัวอย่างเช่น หากใช้เทคนิค Neighbor-Joining กับข้อมูลลำดับ 10,000 ชุด จะใช้เวลามากกว่าหนึ่งชั่วโมง แต่เทคนิค UPGMA จะเสร็จสิ้นภายในเวลาไม่ถึงหนึ่งนาที
นอกจากนี้ ClustalW2 ยังเพิ่มฟังก์ชันความแม่นยำในการจัดเรียงลำดับแบบวนซ้ำ ตัวเลือกนี้ไม่ได้เพิ่มประสิทธิภาพ แต่ช่วยเพิ่มความแม่นยำในการจัดเรียงลำดับ ซึ่งมีประโยชน์อย่างยิ่งสำหรับชุดข้อมูลขนาดเล็ก
ตัวเลือกต่อไปนี้จะเปิดใช้งานการจัดเรียงแบบวนซ้ำ:
- การวนซ้ำ= การจัดแนว- การวนซ้ำ= ต้นไม้- จำนวนตัวเลือกแรกจะปรับปรุงการจัดเรียงขั้นสุดท้าย ตัวเลือกที่สองจะรวมแผนการในขั้นตอนการจัดเรียงแบบก้าวหน้า ตัวเลือกที่สามจะระบุจำนวนรอบการวนซ้ำ โดยค่าเริ่มต้นจะตั้งไว้ที่ 3 [ 18 ]
ความแม่นยำและผลลัพธ์
อัลกอริทึมที่ ClustalW ใช้เกือบจะสมบูรณ์แบบแล้ว มันมีประสิทธิภาพมากที่สุดสำหรับชุดข้อมูลที่มีความแปรปรวนสูง ในชุดข้อมูลดังกล่าว กระบวนการสร้างแผนผังนำทางจะมีความไวต่อสัญญาณรบกวนน้อยลง ClustalW เป็นหนึ่งในอัลกอริทึมการจัดเรียงลำดับหลายลำดับแรกๆ ที่รวมการจัดเรียงแบบคู่และการจัดเรียงแบบทั่วโลกเข้าด้วยกันเพื่อเพิ่มความเร็ว แต่การตัดสินใจนี้ลดความแม่นยำของผลลัพธ์ลง
เมื่อมีการเปรียบเทียบอัลกอริทึมการจัดเรียงลำดับหลายลำดับในปี 2014 ClustalW เป็นหนึ่งในอัลกอริทึมที่เร็วที่สุดที่สามารถสร้างผลลัพธ์ได้ในระดับความแม่นยำที่ต้องการ อย่างไรก็ตาม มันไม่แม่นยำเท่ากับคู่แข่งที่ใช้ความสอดคล้อง เช่น T-Coffee [ 19 ]ในบรรดา MAFFT, T-Coffee และ Clustal Omega นั้น ClustalW มีความแม่นยำต่ำที่สุดสำหรับลำดับความยาวเต็ม แต่ความแม่นยำของมันยังคงถือว่ายอมรับได้ นอกจากนี้ ClustalW ยังเป็นอัลกอริทึมที่มีประสิทธิภาพด้านหน่วยความจำมากที่สุดในบรรดาอัลกอริทึมที่ศึกษา[ 19 ]การอัปเดตซอฟต์แวร์อย่างต่อเนื่องทำให้ ClustalW2 มีความแม่นยำมากขึ้นในขณะที่ยังคงรักษาความเร็วนี้ไว้[ 18 ]
คลัสทัล โอเมก้า

ClustalΩ (หรือเขียนอีกแบบว่า Clustal O และ Clustal Omega) เขียนด้วยภาษา C และC++โดยใช้ไกด์ทรีแบบมีเมล็ดและ เอนจิน HMM ใหม่ ที่เน้นโปรไฟล์สองโปรไฟล์เพื่อสร้างการจัดเรียงเหล่านี้[ 20 ] [ 21 ]โปรแกรมต้องการลำดับอย่างน้อยสามลำดับขึ้นไปเพื่อคำนวณการจัดเรียงลำดับหลายลำดับ Clustal Omega ใช้หลักการความสอดคล้องและได้รับการยกย่องอย่างกว้างขวางว่าเป็นหนึ่งในเครื่องมือจัดเรียงลำดับหลายลำดับที่เร็วที่สุดแบบออนไลน์ และยังคงมีความแม่นยำสูงทั้งในกลุ่มอัลกอริธึมแบบใช้หลักการความสอดคล้องและแบบใช้เมทริกซ์
อัลกอริทึม

Clustal Omega มีขั้นตอนหลักห้าขั้นตอนในการสร้าง การ จัด เรียงลำดับหลายลำดับ
- การจัดเรียงแบบคู่จะถูกสร้างขึ้นโดยใช้วิธี k-tuple ซึ่งเป็นวิธีการเชิงฮิวริสติกที่ไม่รับประกันว่าจะได้คำตอบที่ดีที่สุด แต่มีประสิทธิภาพมากกว่าการใช้ การเขียนโปรแกรม แบบไดนามิก
- ลำดับจะถูกจัดกลุ่มโดยใช้วิธี mBed ที่แก้ไขแล้ว[ 22 ]วิธี mBed คำนวณระยะทางแบบคู่โดยใช้การฝังลำดับ
- ใช้วิธี การจัดกลุ่มแบบ k -means
- มีการสร้างแผนผังนำทางโดยใช้วิธี UPGMAในภาพด้านขวา แสดงให้เห็นถึงขั้นตอนการสร้างแผนผังนำทางหลายขั้นตอนซึ่งนำไปสู่การสร้างแผนผังนำทางขั้นสุดท้ายเพียงแผนผังเดียว เนื่องจากลักษณะการรวมกลุ่มของ UPGMA ในแต่ละขั้นตอน (รูปเพชรในแผนผัง) กลุ่มคลัสเตอร์ที่อยู่ใกล้กันที่สุดสองกลุ่มจะถูกรวมเข้าด้วยกัน กระบวนการนี้จะทำซ้ำจนกว่าจะสามารถประเมินแผนผังโดยรวมขั้นสุดท้ายได้
- การจัดเรียงลำดับหลายลำดับขั้นสุดท้ายจะถูกสร้างขึ้นด้วยแพ็คเกจ HHAlign จากHH-Suite โดยใช้ HMMโปรไฟล์สองตัวHMM โปรไฟล์เป็นเครื่องสถานะเชิงเส้นที่ประกอบด้วยชุดของโหนด ซึ่งแต่ละโหนดจะสอดคล้องกับตำแหน่ง (คอลัมน์) ในการจัดเรียงที่สร้างขึ้นโดยประมาณ[ 23 ]
ความซับซ้อนเชิงเวลา
ความซับซ้อนของเวลาในการคำนวณการจัดเรียงลำดับที่เหมาะสมที่สุดของลำดับที่มีความยาวนั้นสูงมาก จนเกินไป แม้แต่กับลำดับจำนวนน้อยก็ตาม เพื่อจัดการกับปัญหานี้ Clustal Omega จึงใช้ mBed เวอร์ชันที่ปรับปรุงแล้ว ซึ่งมีความซับซ้อนอยู่ที่[ 22 ] [ 24 ] และสร้างต้นไม้นำทางที่มีความแม่นยำเท่ากับวิธีการทั่วไป ความเร็วและความแม่นยำของต้นไม้นำทางใน Clustal Omega เกิดจากการนำอัลกอริทึม mBed ที่ปรับปรุงแล้วมาใช้ นอกจากนี้ยังช่วยลดเวลาในการคำนวณและความต้องการหน่วยความจำในการจัดเรียงลำดับบนชุดข้อมูลขนาดใหญ่อีกด้วย
ความแม่นยำและผลลัพธ์
ความแม่นยำของ Clustal Omega บนลำดับจำนวนน้อยโดยเฉลี่ยแล้วคล้ายคลึงกับสิ่งที่ถือว่าเป็นตัวจัดเรียงลำดับคุณภาพสูง บนชุดข้อมูลขนาดใหญ่มากที่มีลำดับอินพุตหลายแสนรายการ Clustal Omega มีประสิทธิภาพเหนือกว่าอัลกอริทึมอื่นๆ ทั้งหมดในด้านเวลา หน่วยความจำ และความแม่นยำของผลลัพธ์[ 25 ]สามารถประมวลผลลำดับมากกว่า 100,000 รายการบนโปรเซสเซอร์ตัวเดียวได้ภายในไม่กี่ชั่วโมง
Clustal Omega ใช้แพ็คเกจ HHAlign ของ HH-Suite ซึ่งจัดเรียง Hidden Markov Model สองโปรไฟล์แทนที่จะเปรียบเทียบโปรไฟล์ต่อโปรไฟล์ วิธีนี้ช่วยปรับปรุงคุณภาพของความไวและการจัดเรียงอย่างมีนัยสำคัญ[ 25 ]เมื่อรวมกับวิธี mBed แล้ว Clustal Omega จึงมีข้อได้เปรียบเหนือโปรแกรมจัดเรียงลำดับอื่นๆ
ในชุดข้อมูลที่มีฐานเทอร์มินัลที่ไม่ได้รับการอนุรักษ์ Clustal Omega อาจมีความแม่นยำมากกว่าProbconsหรือT-Coffeeแม้ว่าทั้งสองจะเป็นอัลกอริธึมที่อิงตามความสอดคล้องก็ตาม ในการทดสอบประสิทธิภาพด้วยโปรแกรมที่ให้คะแนนความแม่นยำสูงMAFFTเร็วที่สุด ตามมาด้วย Clustal Omega อย่างใกล้ชิด ทั้งสองเร็วกว่า T-Coffee อย่างไรก็ตามMAFFTและ Clustal Omega ต้องการหน่วยความจำในการทำงานมากกว่า[ 19 ]
Clustal2 (ClustalW/ClustalX)
Clustal2คือเวอร์ชันที่รวมเอาทั้ง ClustalW เวอร์ชันใช้งานผ่านบรรทัดคำสั่ง และ Clustal X เวอร์ชันกราฟิกเข้าไว้ด้วยกัน ทั้งสองโปรแกรมไม่ใช่เครื่องมือใหม่ แต่เป็นเวอร์ชันที่ได้รับการปรับปรุงและพัฒนาจากเวอร์ชันก่อนหน้า ไฟล์ดาวน์โหลดทั้งสองเวอร์ชันได้รับการคอมไพล์ไว้ล่วงหน้าสำหรับระบบปฏิบัติการหลายระบบ เช่น Linux, Mac OS X และ Windows (ทั้ง XP และ Vista) การเปิดตัวครั้งนี้มีจุดประสงค์เพื่อให้เว็บไซต์มีความเป็นระเบียบและใช้งานง่ายยิ่งขึ้น รวมถึงการอัปเดตซอร์สโค้ดให้เป็นเวอร์ชันล่าสุด Clustal2 คือเวอร์ชัน 2 ของทั้ง ClustalW และ ClustalX ซึ่งเป็นที่มาของชื่อ เวอร์ชันก่อนหน้ายังคงสามารถพบได้บนเว็บไซต์ แต่ไฟล์ที่คอมไพล์ไว้ล่วงหน้าทั้งหมดได้รับการอัปเดตเป็นเวอร์ชันล่าสุดแล้ว
ดูเพิ่มเติม
เอกสารอ้างอิง
- ^ดูไฟล์ COPYING ในคลังเก็บต้นฉบับ [1] เก็บถาวรเมื่อ 2021-06-12 ที่ Wayback Machineเข้าถึงเมื่อ 2014-01-15
- ^ Chenna R, Sugawara H, Koike T, Lopez R, Gibson TJ , Higgins DG , Thompson JD (กรกฎาคม 2546). "การจัดเรียงลำดับหลายลำดับด้วยชุดโปรแกรม Clustal" . Nucleic Acids Research . 31 (13): 3497– 500. doi : 10.1093/nar/gkg500 . PMC 168907 . PMID 12824352 .
- ^ Van Noorden R, Maher B, Nuzzo R (ตุลาคม 2014). "บทความ 100 อันดับแรก" Nature . 514 (7524): 550– 3. Bibcode : 2014Natur.514..550V . doi : 10.1038/514550a . PMID 25355343 .
- ^ a b c d Des Higgins การนำเสนอในการประชุม SMBE 2012 ที่ดับลิน
- ^ Higgins DG, Sharp PM (ธันวาคม 1988). "CLUSTAL: แพ็กเกจสำหรับการจัดเรียงลำดับหลายลำดับบนไมโครคอมพิวเตอร์" Gene . 73 (1): 237– 44. doi : 10.1016/0378-1119(88)90330-7 . PMID 3243435 .
- ^ Higgins DG, Sharp PM (เมษายน 1989). "การจัดเรียงลำดับหลายลำดับที่รวดเร็วและแม่นยำบนไมโครคอมพิวเตอร์" Computer Applications in the Biosciences . 5 (2): 151– 3. doi : 10.1093/bioinformatics/5.2.151 . PMID 2720464 .
- ^ a b Higgins DG, Bleasby AJ, Fuchs R (เมษายน 1992). "CLUSTAL V: ซอฟต์แวร์ปรับปรุงสำหรับการจัดเรียงลำดับหลายลำดับ" Computer Applications in the Biosciences . 8 (2): 189– 91. doi : 10.1093/bioinformatics/8.2.189 . PMID 1591615 .
- ^ Thompson JD, Higgins DG, Gibson TJ (พฤศจิกายน 1994). "CLUSTAL W: การปรับปรุงความไวของการจัดเรียงลำดับหลายลำดับแบบก้าวหน้าผ่านการถ่วงน้ำหนักลำดับ ค่าปรับช่องว่างเฉพาะตำแหน่ง และการเลือกเมทริกซ์น้ำหนัก" . Nucleic Acids Research . 22 (22): 4673– 80. doi : 10.1093/nar/22.22.4673 . PMC 308517 . PMID 7984417 .
- ^ a b Thompson JD, Gibson TJ , Plewniak F, Jeanmougin F, Higgins DG (ธันวาคม 1997). "อินเทอร์เฟซ CLUSTAL_X สำหรับ Windows: กลยุทธ์ที่ยืดหยุ่นสำหรับการจัดเรียงลำดับหลายลำดับโดยใช้เครื่องมือวิเคราะห์คุณภาพ" . Nucleic Acids Research . 25 (24): 4876– 82. doi : 10.1093/nar/25.24.4876 . PMC 147148 . PMID 9396791 .
- ^ Higgins DG, Sharp PM (ธันวาคม 1988). "CLUSTAL: แพ็กเกจสำหรับการจัดเรียงลำดับหลายลำดับบนไมโครคอมพิวเตอร์" Gene . 73 (1): 237– 44. doi : 10.1016/0378-1119(88)90330-7 . PMID 3243435 .
- ^ Thompson, JD; Higgins, DG; Gibson, TJ (1994-11-11). "CLUSTAL W: การปรับปรุงความไวของการจัดเรียงลำดับหลายลำดับแบบก้าวหน้าผ่านการถ่วงน้ำหนักลำดับ ค่าปรับช่องว่างเฉพาะตำแหน่ง และการเลือกเมทริกซ์น้ำหนัก" . Nucleic Acids Research . 22 (22): 4673– 4680. doi : 10.1093/nar/22.22.4673 . ISSN 0305-1048 . PMC 308517 . PMID 7984417 .
- ^ Dineen, David. "การจัดเรียงลำดับหลายลำดับด้วย Clustal W และ Clustal X" . www.clustal.org . เก็บถาวรจากต้นฉบับเมื่อ 2018-04-16 . เรียกดูเมื่อ2018-04-24 .
- ^ Sievers F, Higgins DG (2014-01-01). "Clustal Omega การจัดเรียงลำดับที่แม่นยำของลำดับจำนวนมาก" ใน Russell DJ (บรรณาธิการ). วิธีการจัดเรียงลำดับหลายลำดับ วิธีการในชีววิทยาโมเลกุล เล่มที่ 1079 สำนักพิมพ์Humana Press หน้า 105–116 doi : 10.1007/978-1-62703-646-7_6 ISBN 9781627036450. PMID 24170397 .
- ^ Sievers F, Higgins DG (2002-01-01). Clustal Omega . Vol. 48. John Wiley & Sons, Inc. หน้า 3.13.1–16. doi : 10.1002/0471250953.bi0313s48 . ISBN 9780471250951. PMID 25501942 . S2CID 1762688 .
{{cite book}}:|journal=ละเลย ( ช่วยเหลือ ) - ^ a b "อัลกอริทึม CLUSTAL W" . เก็บถาวรจากต้นฉบับเมื่อ 2016-12-01 . เรียกดูเมื่อ2018-04-24 .
- ^ a b Higgins, Des (มิถุนายน 1991). "การจัดเรียงลำดับหลายลำดับด้วย Clustal V เอกสารประกอบ (การติดตั้งและการใช้งาน)" . www.aua.gr . เก็บถาวรจากต้นฉบับเมื่อ 2023-04-12 . เรียกดูเมื่อ2022-08-27 .
- ^ "เกี่ยวกับ CLUSTALW" . www.megasoftware.net . เก็บถาวรจากต้นฉบับเมื่อ 2018-04-24 . เรียกดูเมื่อ2018-04-24 .
- ^ a b Larkin, MA; Blackshields, G.; Brown, NP; Chenna, R.; McGettigan, PA; McWilliam, H.; Valentin, F.; Wallace, IM; Wilm, A. (2007-09-10). "Clustal W และ Clustal X เวอร์ชัน 2.0" . Bioinformatics . 23 (21): 2947– 2948. doi : 10.1093/bioinformatics/btm404 . ISSN 1367-4803 . PMID 17846036 .
- ^ a b c Pais FS, Ruy PC, Oliveira G, Coimbra RS (มีนาคม 2014). "การประเมินประสิทธิภาพของโปรแกรมการจัดเรียงลำดับหลายลำดับ" . Algorithms for Molecular Biology . 9 (1) 4. doi : 10.1186/1748-7188-9-4 . PMC 4015676 . PMID 24602402 .
- ^ EMBL-EBI. "Clustal Omega < การจัดเรียงลำดับหลายลำดับ < EMBL-EBI" . www.ebi.ac.uk . เก็บถาวรจากต้นฉบับเมื่อ 2018-04-29 . เรียกดูเมื่อ2018-04-18 .
- ^ Dineen, David. "การจัดเรียงลำดับหลายลำดับด้วย Clustal Omega, ClustalW และ ClustalX" . www.clustal.org . เก็บถาวรจากต้นฉบับเมื่อ 2010-05-29 . เรียกดูเมื่อ2018-04-18 .
- ^ a b Blackshields G, Sievers F, Shi W, Wilm A, Higgins DG (พฤษภาคม 2010). "การฝังลำดับเพื่อสร้างแผนผังนำทางอย่างรวดเร็วสำหรับการจัดเรียงลำดับหลายลำดับ" . Algorithms for Molecular Biology . 5 21. doi : 10.1186/1748-7188-5-21 . PMC 2893182 . PMID 20470396 .
- ^ "การวิเคราะห์โปรไฟล์ HMM" . www.biology.wustl.edu . เก็บถาวรจากต้นฉบับเมื่อ 2019-07-24 . เรียกดูเมื่อ2018-05-01 .
- ^ Sievers F, Wilm A, Dineen D, Gibson TJ, Karplus K, Li W, Lopez R, McWilliam H, Remmert M, Söding J, Thompson JD, Higgins DG (ตุลาคม 2011). "การสร้างการจัดเรียงลำดับโปรตีนหลายลำดับคุณภาพสูงอย่างรวดเร็วและปรับขนาดได้โดยใช้ Clustal Omega" . Molecular Systems Biology . 7 (1) 539. doi : 10.1038/msb.2011.75 . PMC 3261699 . PMID 21988835 .
- ^ a b Daugelaite J, O' Driscoll A, Sleator RD (2013). "ภาพรวมของการจัดเรียงลำดับหลายลำดับและการประมวลผลบนคลาวด์ในชีวสารสนเทศ" . ISRN Biomathematics . 2013 : 1– 14. doi : 10.1155/2013/615630 . ISSN 2090-7702 .
ลิงก์ภายนอก
- หน้าแรกของ Clustal (ดาวน์โหลดฟรีสำหรับ Unix/Linux, Mac และ Windows)
- Clustal Omega mirror ที่ EBI
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ คลัสทัล
Clustalเป็นโปรแกรมคอมพิวเตอร์ที่ใช้สำหรับการจัดเรียงลำดับหลายลำดับในชีวสารสนเทศ เป็นหนึ่งในซอฟต์แวร์ชีวสารสนเทศที่มีการอ้างอิงมากที่สุด โดยมีผลงานตีพิมพ์ทางวิชาการสองฉบับอยู่ใน...
ประวัติศาสตร์
แผนผังต้นไม้ในเวอร์ชันเริ่มต้นของ Clustal ถูกสร้างขึ้นผ่าน การวิเคราะห์คลัสเตอร์ UPGMAของการจัดเรียงแบบคู่ ดังนั้นจึงได้ชื่อว่า CLUSTAL [ 4 ]ดู[ 5 ]เวอร์ชันสี่เวอร์ชันแรกของ Clustal ใช้เลขอารบิก (1 ถึง 4) ในขณะที่เวอร์ชันที่ห้าใช้เลขโรมัน V [ 4 ]ดู[ 6 ] [ 7...
ประวัติเวอร์ชัน
Clustal : ซอฟต์แวร์ดั้งเดิมสำหรับการจัดเรียงลำดับหลายลำดับ สร้างโดยDes Higginsในปี 1988 โดยอาศัยการสร้างแผนผังนำทางจากลำดับคู่ของกรดอะมิโนหรือ นิว คลีโอไทด์[ 10 ]ClustalV : Clustal รุ่นที่สอง เปิดตัวในปี 1992...
การทำงาน
การจัดเรียงลำดับ โปรตีน CDK4หลายลำดับโดยใช้ ClustalW ลูกศรชี้ตำแหน่งการกลายพันธุ์แบบจุดClustal จัดเรียงลำดับโดยใช้ฮิวริสติกที่ สร้างการจัดเรียงลำดับหลาย ลำดับจากชุดการจัดเรียงแบบคู่ทีละคู่ วิธีนี้ทำงานโดยการวิเคราะห์ลำดับทั้งหมดและใช้วิธี...