กลับไปหน้าบทความ

อ่าน 57 นาที

การอนุมานการถ่ายทอดยีนในแนวนอน

การถ่ายทอดยีนในแนวนอนหรือด้านข้าง (HGT หรือ LGT) คือการส่งผ่านส่วนของดีเอ็นเอ จี โนม ระหว่างสิ่งมีชีวิตผ่านกระบวนการที่แยกออกจาก การถ่ายทอดทางพันธุกรรมในแนวดิ่ง...

การอนุมานการถ่ายทอดยีนในแนวนอน

บทความนี้ได้รับการตีพิมพ์ในวารสารวิชาการที่ผ่านการตรวจสอบโดยผู้ทรงคุณวุฒิ PLOS Computational Biology (2015) คลิกเพื่อดูฉบับที่ตีพิมพ์แล้ว

การถ่ายทอดยีนในแนวนอนหรือด้านข้าง (HGT หรือ LGT) คือการส่งผ่านส่วนของดีเอ็นเอจี โนม ระหว่างสิ่งมีชีวิตผ่านกระบวนการที่แยกออกจากการถ่ายทอดทางพันธุกรรมในแนวดิ่งในกรณีที่มีเหตุการณ์ HGT เกิดขึ้น ชิ้นส่วนต่างๆ ของจีโนมจะเป็นผลมาจาก ประวัติ วิวัฒนาการ ที่แตกต่างกัน ดังนั้นจึงอาจทำให้การตรวจสอบความสัมพันธ์ทางวิวัฒนาการของสายพันธุ์และสปีชีส์มีความซับซ้อนมากขึ้น นอกจากนี้ เนื่องจาก HGT สามารถนำจีโนไทป์ ที่แตกต่างกันอย่างสิ้นเชิง จากสายพันธุ์ที่ห่างไกล หรือแม้แต่ยีน ใหม่ ที่มีหน้าที่ใหม่ เข้ามาในจีโนมได้ จึงเป็นแหล่งสำคัญของ นวัตกรรม ฟีโนไทป์และเป็นกลไกของการปรับตัวให้เข้ากับสภาพแวดล้อม ตัวอย่างเช่น การถ่ายทอดยีน ต้านทานยาปฏิชีวนะและ ตัวกำหนดความสามารถใน การก่อโรคในแนวนอน ซึ่งนำไปสู่การเกิดขึ้นของสายพันธุ์ที่ก่อโรคมีความเกี่ยวข้องกับสุขภาพของมนุษย์เป็นอย่างมาก[ 1 ]

การอนุมานการถ่ายทอดยีนในแนวนอน (HGT) ผ่าน การระบุเหตุการณ์ HGT ด้วย วิธีการคำนวณนั้น อาศัยการตรวจสอบองค์ประกอบของลำดับหรือประวัติวิวัฒนาการของยีน วิธีการที่ใช้องค์ประกอบของลำดับ ("แบบพาราเมตริก") จะค้นหาความเบี่ยงเบนจากค่าเฉลี่ยของจีโนม ในขณะที่วิธีการที่ใช้ประวัติวิวัฒนาการ (" แบบไฟโลเจเนติก ") จะระบุยีนที่มีประวัติวิวัฒนาการแตกต่างอย่างมีนัยสำคัญจากสายพันธุ์ เจ้าบ้าน การประเมินและการเปรียบเทียบวิธีการอนุมาน HGT โดยทั่วไปจะอาศัยจีโนมจำลอง ซึ่งทราบประวัติที่แท้จริง ในข้อมูลจริง วิธีการต่างๆ มักจะอนุมานเหตุการณ์ HGT ที่แตกต่างกัน และเป็นผลให้ยากที่จะตรวจสอบเหตุการณ์ HGT ทั้งหมด ยกเว้นเหตุการณ์ที่ง่ายและชัดเจนเท่านั้น

ภาพรวม

ภาพรวมเชิงแนวคิดของวิธีการอนุมาน HGT (1) วิธีการแบบพาราเมตริกอนุมาน HGT โดยการคำนวณสถิติ ในที่นี้คือปริมาณ GC สำหรับหน้าต่างเลื่อน และเปรียบเทียบกับช่วงทั่วไปทั่วทั้งจีโนม ซึ่งในที่นี้แสดงไว้ระหว่างเส้นแนวนอนสีแดงสองเส้น บริเวณที่มีค่าผิดปกติจะถูกอนุมานว่ามีการถ่ายโอนในแนวนอน (2) วิธีการทางวิวัฒนาการเชิงสายวิวัฒนาการอาศัยความแตกต่างระหว่างยีนและวิวัฒนาการของต้นไม้สายพันธุ์ที่เกิดจาก HGT วิธีการทางวิวัฒนาการเชิงสายวิวัฒนาการแบบชัดเจนจะสร้างต้นไม้ยีนขึ้นใหม่และอนุมานเหตุการณ์ HGT ที่น่าจะส่งผลให้เกิดต้นไม้ยีนนั้นๆ วิธีการทางวิวัฒนาการเชิงสายวิวัฒนาการแบบไม่ชัดเจนจะข้ามการสร้างต้นไม้ยีนขึ้นใหม่ เช่น โดยการดูความคลาดเคลื่อนระหว่างระยะทางแบบคู่ระหว่างยีนและสายพันธุ์ที่เกี่ยวข้อง

การถ่ายทอดยีนในแนวนอนถูกสังเกตครั้งแรกในปี พ.ศ. 2461 ในการทดลองของFrederick Griffithซึ่งแสดงให้เห็นว่าความรุนแรงสามารถถ่ายทอดจากสายพันธุ์ที่ก่อโรคไปยังสายพันธุ์ที่ไม่ก่อโรคของStreptococcus pneumoniaeได้ Griffith แสดงให้เห็นว่าข้อมูลทางพันธุกรรมสามารถถ่ายทอดในแนวนอนระหว่างแบคทีเรียผ่านกลไกที่เรียกว่าการเปลี่ยนแปลง[ 2 ]การสังเกตที่คล้ายกันในช่วงปี พ.ศ. 2483 [ 3 ]และ พ.ศ. 2493 [ 4 ]แสดงให้เห็นหลักฐานว่า การถ่ายทอดยีนแบบ คอนจูเกชันและการถ่ายทอดยีนแบบทรานสดักชันเป็นกลไกเพิ่มเติมของการถ่ายทอดยีนในแนวนอน[ 5 ]

เพื่ออนุมานเหตุการณ์ HGT ซึ่งอาจไม่จำเป็นต้องส่งผลให้เกิด การเปลี่ยนแปลง ทางฟีโนไทป์ วิธีการร่วมสมัยส่วนใหญ่จึงอาศัยการวิเคราะห์ข้อมูลลำดับจีโนม วิธีการเหล่านี้สามารถแบ่งออกเป็นสองกลุ่มใหญ่ๆ ได้แก่ วิธีการเชิงพารามิเตอร์และวิธีการเชิงวิวัฒนาการ วิธีการเชิงพารามิเตอร์จะค้นหาส่วนของจีโนมที่แตกต่างจากค่าเฉลี่ยของจีโนมอย่างมีนัยสำคัญ เช่นปริมาณ GCหรือการใช้โคดอน [ 6 ] วิธีการเชิงวิวัฒนาการจะตรวจสอบประวัติวิวัฒนาการของยีนที่เกี่ยวข้องและระบุแผนภูมิวิวัฒนาการที่ขัดแย้งกัน วิธีการเชิงวิวัฒนาการสามารถแบ่งย่อยได้อีกเป็นสองประเภท คือ ประเภทที่สร้างและเปรียบเทียบแผนภูมิวิวัฒนาการอย่างชัดเจน และประเภทที่ใช้การวัดแบบทดแทนแทนแผนภูมิวิวัฒนาการ[ 7 ]

คุณลักษณะหลักของวิธีการพาราเมตริกคือ พวกมันอาศัยเพียงจีโนมที่กำลังศึกษาเพื่ออนุมานเหตุการณ์ HGT ที่อาจเกิดขึ้นในสายพันธุ์ของมัน ซึ่งเป็นข้อได้เปรียบอย่างมากในช่วงแรกของยุคการจัดลำดับจีโนม เมื่อมีจีโนมที่ใกล้เคียงกันไม่มากนักสำหรับวิธีการเปรียบเทียบ อย่างไรก็ตาม เนื่องจากพวกมันอาศัยความสม่ำเสมอของลายเซ็นของโฮสต์เพื่ออนุมานเหตุการณ์ HGT การไม่คำนึงถึงความแปรปรวนภายในจีโนมของโฮสต์จะส่งผลให้เกิดการทำนายเกินจริงการระบุส่วนของจีโนมดั้งเดิมว่าเป็นเหตุการณ์ HGT ที่เป็นไปได้[ 8 ]ในทำนองเดียวกัน ส่วนของจีโนมที่ถ่ายโอนจะต้องแสดงลายเซ็นของผู้ให้และแตกต่างจากผู้รับอย่างมีนัยสำคัญ[ 6 ] นอกจากนี้ ส่วนของจีโนมที่มีต้นกำเนิดจากต่างถิ่นจะอยู่ภายใต้กระบวนการ กลายพันธุ์เช่นเดียวกับส่วนที่เหลือของจีโนมโฮสต์ ดังนั้นความแตกต่างระหว่างทั้งสองจึงมีแนวโน้มที่จะหายไปเมื่อเวลาผ่านไป ซึ่งเป็นกระบวนการที่เรียกว่าการปรับปรุง[ 9 ]สิ่งนี้จำกัดความสามารถของวิธีการพาราเมตริกในการตรวจจับ HGT โบราณ

วิธีการทางวิวัฒนาการเชิงสายสัมพันธ์ได้รับประโยชน์จากการที่มีข้อมูลจีโนมที่ได้รับการจัดลำดับจำนวนมาก ในปัจจุบัน ที่จริงแล้ว เช่นเดียวกับวิธี การเปรียบเทียบทั้งหมดวิธีการทางวิวัฒนาการเชิงสายสัมพันธ์สามารถบูรณาการข้อมูลจากจีโนมหลายๆ จีโนมได้ โดยเฉพาะอย่างยิ่งการบูรณาการโดยใช้แบบจำลองวิวัฒนาการ สิ่งนี้ทำให้วิธีการเหล่านี้สามารถระบุลักษณะของเหตุการณ์การถ่ายโอนยีนในแนวนอน (HGT) ที่อนุมานได้ดียิ่งขึ้น โดยเฉพาะอย่างยิ่งโดยการระบุชนิดของผู้ให้และเวลาของการถ่ายโอน อย่างไรก็ตาม แบบจำลองมีข้อจำกัดและจำเป็นต้องใช้อย่างระมัดระวัง ตัวอย่างเช่น แผนภูมิวิวัฒนาการที่ขัดแย้งกันอาจเป็นผลมาจากเหตุการณ์ที่แบบจำลองไม่ได้คำนึงถึง เช่นพาราโลจี ที่ไม่ได้รับการยอมรับ เนื่องจากการเพิ่มจำนวนตามด้วย การ สูญเสียยีนนอกจากนี้ วิธีการหลายอย่างอาศัยแผนภูมิวิวัฒนาการของชนิดพันธุ์อ้างอิงที่คาดว่าทราบแล้ว ในขณะที่ในหลายกรณีอาจเป็นเรื่องยากที่จะได้แผนภูมิที่เชื่อถือได้ สุดท้าย ค่าใช้จ่ายในการคำนวณสำหรับการสร้างแผนภูมิยีน/ชนิดพันธุ์จำนวนมากอาจมีราคาแพงมากเกินไป วิธีการทางวิวัฒนาการมักถูกนำไปใช้กับยีนหรือลำดับโปรตีนในฐานะหน่วยวิวัฒนาการพื้นฐาน ซึ่งจำกัดความสามารถในการตรวจจับการถ่ายทอดยีนในแนวนอน (HGT) ในบริเวณนอกหรือข้ามขอบเขตของยีน

เนื่องจากวิธีการเสริมกันและชุดผู้สมัคร HGT ที่ไม่ทับซ้อนกันบ่อยครั้งการรวมการคาดการณ์จากวิธีการพาราเมตริกและวิธีการทางวิวัฒนาการสามารถให้ชุดยีนผู้สมัคร HGT ที่ครอบคลุมมากขึ้น อันที่จริง มีรายงานว่าการรวมวิธีการพาราเมตริกที่แตกต่างกันช่วยปรับปรุงคุณภาพของการคาดการณ์ได้อย่างมีนัยสำคัญ[ 10 ] [ 11 ]ยิ่งไปกว่านั้น ในกรณีที่ไม่มีชุดยีนที่ถ่ายโอนในแนวนอนที่แท้จริงที่ครอบคลุม ความไม่สอดคล้องกันระหว่างวิธีการต่างๆ[ 12 ] [ 13 ]อาจได้รับการแก้ไขโดยการรวมวิธีการพาราเมตริกและวิธีการทางวิวัฒนาการ อย่างไรก็ตาม การรวมการอนุมานจากหลายวิธีก็มีความเสี่ยงที่จะเกิดอัตราการเกิดผลบวกเท็จเพิ่มขึ้นเช่นกัน[ 14 ]

วิธีการเชิงพารามิเตอร์

วิธีการเชิงพารามิเตอร์ในการอนุมาน HGT ใช้ลักษณะเฉพาะของลำดับจีโนมที่เฉพาะเจาะจงกับสายพันธุ์หรือกลุ่มสายพันธุ์ซึ่งเรียกอีกอย่างว่าลายเซ็นทางจีโนมหากชิ้นส่วนของจีโนมเบี่ยงเบนอย่างมากจากลายเซ็นทางจีโนม นี่เป็นสัญญาณของการถ่ายโอนแนวนอนที่อาจเกิดขึ้นได้ ตัวอย่างเช่น เนื่องจากปริมาณ GC ของแบคทีเรียอยู่ในช่วงกว้าง ปริมาณ GC ของส่วนจีโนมจึงเป็นลายเซ็นทางจีโนมที่ง่าย ลายเซ็นทางจีโนมที่ใช้กันทั่วไป ได้แก่องค์ประกอบของนิวคลีโอ ไทด์ [ 15 ] ความถี่ ของโอลิโกนิ วคลีโอไทด์[ 16 ]หรือลักษณะโครงสร้างของจีโนม[ 17 ]

ในการตรวจจับ HGT โดยใช้วิธีการแบบพาราเมตริก ลายเซ็นจีโนมของโฮสต์จะต้องสามารถจดจำได้อย่างชัดเจน อย่างไรก็ตาม จีโนมของโฮสต์ไม่ได้มีความสม่ำเสมอเสมอไปเมื่อพิจารณาจากลายเซ็นจีโนม ตัวอย่างเช่น ปริมาณ GC ของตำแหน่งโคดอนที่สามจะต่ำกว่าเมื่ออยู่ใกล้กับจุดสิ้นสุดของการจำลองแบบ[ 18 ]และปริมาณ GC มักจะสูงกว่าในยีนที่มีการแสดงออก สูง [ 19 ]การไม่คำนึงถึงความแปรปรวนภายในจีโนมในโฮสต์อาจส่งผลให้เกิดการคาดการณ์เกินจริง โดยระบุส่วนดั้งเดิมว่าเป็นผู้สมัคร HGT [ 8 ]หน้าต่างเลื่อนขนาดใหญ่ขึ้นสามารถคำนึงถึงความแปรปรวนนี้ได้ แต่ต้องแลกมาด้วยความสามารถในการตรวจจับบริเวณ HGT ที่เล็กกว่าลดลง[ 12 ]

ที่สำคัญไม่แพ้กันคือ เซ็กเมนต์ที่ถ่ายโอนในแนวนอนจำเป็นต้องแสดงลายเซ็นจีโนมของผู้บริจาค ซึ่งอาจไม่ใช่กรณีสำหรับการถ่ายโอนในอดีตที่ลำดับที่ถ่ายโอนนั้นอยู่ภายใต้กระบวนการกลายพันธุ์แบบเดียวกันกับส่วนที่เหลือของจีโนมโฮสต์ ซึ่งอาจทำให้ลายเซ็นที่แตกต่างกันของพวกมัน "อ่อนตัวลง" [ 9 ]และตรวจไม่พบด้วยวิธีการพาราเมตริก ตัวอย่างเช่นBdellovibrio bacteriovorus ซึ่งเป็น δ-Proteobacteriumที่เป็นผู้ล่ามีเนื้อหา GC ที่เป็นเนื้อเดียวกัน และอาจสรุปได้ว่าจีโนมของมันทนต่อ HGT [ 20 ]อย่างไรก็ตาม การวิเคราะห์ในภายหลังโดยใช้วิธีการทางวิวัฒนาการระบุเหตุการณ์ HGT โบราณจำนวนหนึ่งในจีโนมของB. bacteriovorus [ 21 ] ใน ทำนอง เดียวกัน หากเซ็กเมนต์ที่แทรกเข้าไปนั้นได้รับการปรับปรุงให้เข้ากับจีโนมของโฮสต์ก่อนหน้านี้ เช่นเดียวกับกรณีของการแทรกโปรฟาจ[ 22 ]วิธีการพาราเมตริกอาจพลาดการทำนายเหตุการณ์ HGT เหล่านี้ นอกจากนี้ องค์ประกอบของผู้บริจาคจะต้องแตกต่างจากผู้รับอย่างมีนัยสำคัญจึงจะถือว่าผิดปกติ ซึ่งเป็นเงื่อนไขที่อาจถูกมองข้ามในกรณีของ HGT ระยะสั้นถึงปานกลาง ซึ่งเป็นกรณีที่พบได้บ่อยที่สุด ยิ่งไปกว่านั้น มีรายงานว่ายีนที่ได้รับมาใหม่มีแนวโน้มที่จะมีATมากกว่าค่าเฉลี่ยของผู้รับ[ 15 ]ซึ่งบ่งชี้ว่าความแตกต่างในลักษณะเฉพาะของปริมาณ GC อาจเกิดจากกระบวนการกลายพันธุ์หลังการได้รับที่ไม่ทราบสาเหตุมากกว่าจากจีโนมของผู้บริจาค

องค์ประกอบของนิวคลีโอไทด์

ปริมาณ GC เฉลี่ยของบริเวณรหัสพันธุกรรมเมื่อเทียบกับขนาดจีโนมของแบคทีเรียที่เลือกมา พบว่าปริมาณ GC เฉลี่ยมีความแตกต่างกันอย่างมากในแต่ละสายพันธุ์ ซึ่งทำให้มีความสำคัญในฐานะตัวบ่งชี้ทางพันธุกรรม

ปริมาณ GC ของแบคทีเรียอยู่ในช่วงกว้าง โดยCa. Zinderia insecticolaมีปริมาณ GC 13.5% [ 23 ]และAnaeromyxobacter dehalogenansมีปริมาณ GC 75% [ 24 ]แม้แต่ในกลุ่มα-Proteobacteriaที่มีความสัมพันธ์ใกล้ชิดกัน ค่าก็ยังอยู่ในช่วงประมาณ 30% ถึง 65% [ 25 ]ความแตกต่างเหล่านี้สามารถนำมาใช้ประโยชน์ในการตรวจจับเหตุการณ์ HGT ได้ เนื่องจากปริมาณ GC ที่แตกต่างกันอย่างมีนัยสำคัญสำหรับส่วนของจีโนมสามารถบ่งชี้ถึงต้นกำเนิดจากภายนอกได้[ 15 ]

สเปกตรัมโอลิโกนิวคลีโอไทด์

สเปกตรัมของโอลิโกนิวคลีโอไทด์ (หรือ ความถี่ k-mer ) วัดความถี่ของลำดับนิวคลีโอไทด์ที่เป็นไปได้ทั้งหมดที่มีความยาวเฉพาะในจีโนม มีแนวโน้มที่จะแปรผันน้อยกว่าภายในจีโนมมากกว่าระหว่างจีโนม ดังนั้นจึงสามารถใช้เป็นลายเซ็นทางจีโนมได้เช่นกัน[ 26 ]การเบี่ยงเบนจากลายเซ็นนี้บ่งชี้ว่าส่วนของจีโนมอาจมาถึงผ่านการถ่ายโอนแนวนอน

สเปกตรัมของโอลิโกนิวคลีโอไทด์ได้รับพลังในการจำแนกส่วนใหญ่มาจากจำนวนโอลิโกนิวคลีโอไทด์ที่เป็นไปได้: ถ้า n คือขนาดของคำศัพท์และ w คือขนาดของโอลิโกนิวคลีโอไทด์ จำนวนโอลิโกนิวคลีโอไทด์ที่แตกต่างกันที่เป็นไปได้คือ n w ; ตัวอย่างเช่น มีเพนทานิวคลีโอไทด์ที่เป็นไปได้ 4 5 = 1024 ตัว วิธีการบางอย่างสามารถจับสัญญาณที่บันทึกไว้ในโมทีฟที่มีขนาดแปรผันได้[ 27 ]จึงสามารถจับทั้งโมทีฟที่หายากและจำแนกได้พร้อมกับโมทีฟที่พบบ่อยแต่พบได้ทั่วไปมากกว่า

ความลำเอียงในการใช้โคดอนซึ่งเป็นการวัดที่เกี่ยวข้องกับ ความถี่ ของโคดอนเป็นหนึ่งในวิธีการตรวจจับแรกๆ ที่ใช้ในการประเมิน HGT อย่างเป็นระบบ[ 16 ]แนวทางนี้ต้องการจีโนมของโฮสต์ที่มีความลำเอียงต่อโคดอนที่มีความหมายเหมือนกันบางอย่าง (โคดอนที่แตกต่างกันซึ่งเข้ารหัสกรดอะมิโนเดียวกัน) ซึ่งแตกต่างอย่างชัดเจนจากความลำเอียงที่พบในจีโนมของผู้ให้ โอลิโกนิวคลีโอไทด์ที่ง่ายที่สุดที่ใช้เป็นลายเซ็นทางจีโนมคือไดนิวคลีโอไทด์ ตัวอย่างเช่น นิวคลีโอไทด์ตัวที่สามในโคดอนและนิวคลีโอไทด์ตัวแรกในโคดอนถัดไปแสดงถึงไดนิวคลีโอไทด์ที่ถูกจำกัดน้อยที่สุดโดย ความชอบ ของกรดอะมิโนและการใช้โคดอน[ 28 ]

สิ่งสำคัญคือต้องปรับขนาดของหน้าต่างเลื่อนให้เหมาะสมเพื่อใช้ในการนับความถี่ของโอลิโกนิวคลีโอไทด์: หน้าต่างเลื่อนที่ใหญ่กว่าจะช่วยลดความแปรปรวนในจีโนมของโฮสต์ได้ดีกว่า แต่จะทำให้การตรวจจับบริเวณ HGT ขนาดเล็กแย่ลง[ 29 ]มีการรายงานถึงการประนีประนอมที่ดีโดยใช้ความถี่ของเตตระนิวคลีโอไทด์ในหน้าต่างเลื่อนขนาด 5 กิโลเบสโดยมีขั้นตอน 0.5 กิโลเบส[ 30 ] 

วิธีที่สะดวกในการจำลองลายเซ็นจีโนมของโอลิโกนิวคลีโอไทด์คือการใช้โซ่ Markovเมทริกซ์ความน่าจะเป็นการเปลี่ยนผ่านสามารถหาได้สำหรับยีนภายในเทียบกับยีนที่ได้มา[ 31 ]จากนั้นความน่าจะเป็นภายหลังแบบ เบย์เซียน สำหรับส่วนของ DNA ที่เฉพาะเจาะจงสามารถหาได้[ 32 ]

ลักษณะโครงสร้าง

เช่นเดียวกับที่องค์ประกอบนิวคลีโอไทด์ของโมเลกุล DNA สามารถแสดงได้ด้วยลำดับของตัวอักษร คุณลักษณะเชิงโครงสร้างก็สามารถเข้ารหัสได้ด้วยลำดับตัวเลข คุณลักษณะเชิงโครงสร้างประกอบด้วยพลังงานปฏิสัมพันธ์ระหว่างคู่เบสที่อยู่ใกล้เคียง[ 33 ]มุมบิดที่ทำให้เบสสองตัวของคู่ไม่อยู่ในระนาบเดียวกัน [ 34 ]หรือความสามารถในการเปลี่ยนรูปของ DNA ที่เกิดจากโปรตีนที่สร้างรูปร่างโครมาติ[ 35 ]

การ วิเคราะห์ความสัมพันธ์ อัตโนมัติของลำดับตัวเลขบางส่วนเหล่านี้แสดงให้เห็นถึงความเป็นคาบที่มีลักษณะเฉพาะในจีโนมที่สมบูรณ์[ 36 ]ในความเป็นจริง หลังจากตรวจพบ ภูมิภาคที่คล้ายกับ อาร์เคียในแบคทีเรียเทอร์โมฟิลิกThermotoga maritima [ 37 ]สเปกตรัมความเป็นคาบของภูมิภาคเหล่านี้ถูกนำมาเปรียบเทียบกับสเปกตรัมความเป็นคาบของ ภูมิภาค ที่คล้ายคลึงกันในอาร์เคียPyrococcus horikoshii [ 17 ] ความคล้ายคลึงกันที่เปิดเผยในความเป็นคาบเป็นหลักฐานสนับสนุนที่แข็งแกร่งสำหรับกรณีของการถ่ายโอนยีนแนวนอนจำนวนมากระหว่างอาณาจักร แบคทีเรียและอาร์เคี ย[ 17 ]

บริบททางจีโนม

การมีอยู่ของเกาะจีโนมซึ่งเป็นบริเวณสั้นๆ (โดยทั่วไปยาว 10–200 กิโลเบส) ของจีโนมที่ได้รับมาในแนวนอน สนับสนุนความสามารถในการระบุยีนที่ไม่ใช่ของดั้งเดิมโดยพิจารณาจากตำแหน่งในจีโนม[ 38 ]ตัวอย่างเช่น ยีนที่มีต้นกำเนิดไม่ชัดเจนซึ่งเป็นส่วนหนึ่งของโอเปรอน ที่ไม่ใช่ ของดั้งเดิม อาจถือได้ว่าเป็นยีนที่ไม่ใช่ของดั้งเดิม หรืออีกทางหนึ่งลำดับการทำซ้ำที่ อยู่รอบข้าง หรือการมีอยู่ของอินทิเกรสหรือทรานสโพเซส ที่อยู่ใกล้เคียง สามารถบ่งชี้ถึงบริเวณที่ไม่ใช่ของดั้งเดิมได้[ 39 ] มีรายงานว่าวิธี การเรียนรู้ของเครื่องที่รวมการสแกนความถี่ของโอลิโกนิวคลีโอไทด์เข้ากับข้อมูลบริบทนั้นมีประสิทธิภาพในการระบุเกาะจีโนม[ 40 ]ในการศึกษาอื่น บริบทถูกใช้เป็นตัวบ่งชี้รอง หลังจากลบยีนที่คิดว่าเป็นของดั้งเดิมหรือไม่ใช่ของดั้งเดิมออกไปโดยใช้วิธีการพารามิเตอร์อื่นๆ[ 10 ]

วิธีการทางวิวัฒนาการชาติพันธุ์

การใช้การวิเคราะห์ทางวิวัฒนาการในการตรวจจับการถ่ายทอดยีนแนวนอน (HGT) ได้รับการพัฒนาขึ้นเนื่องจากการมีจีโนมที่ได้รับการจัดลำดับใหม่จำนวนมาก วิธีการทางวิวัฒนาการตรวจจับความไม่สอดคล้องกันในประวัติวิวัฒนาการของยีนและสายพันธุ์ได้สองวิธี: โดยชัดเจน โดยการสร้างแผนภูมิวิวัฒนาการของยีนขึ้นใหม่และเปรียบเทียบกับแผนภูมิวิวัฒนาการของสายพันธุ์อ้างอิง หรือโดยปริยาย โดยการตรวจสอบลักษณะที่สัมพันธ์กับประวัติวิวัฒนาการของยีนที่เกี่ยวข้อง เช่น รูปแบบการปรากฏ/ไม่ปรากฏของยีนในสายพันธุ์ต่างๆ หรือระยะทางวิวัฒนาการระหว่างคู่ยีนที่สั้นหรือไกลผิดปกติ

วิธีการทางวิวัฒนาการที่ชัดเจน

จุดมุ่งหมายของวิธีการทางวิวัฒนาการแบบชัดเจนคือการเปรียบเทียบแผนภูมิวิวัฒนาการของยีนกับแผนภูมิวิวัฒนาการของสปีชีส์ที่เกี่ยวข้อง ความแตกต่างที่ได้รับการสนับสนุนอย่างอ่อนระหว่างแผนภูมิวิวัฒนาการของยีนและสปีชีส์อาจเกิดจากความไม่แน่นอนในการอนุมาน แต่ ความแตกต่าง ที่มีนัยสำคัญทางสถิติอาจบ่งชี้ถึงเหตุการณ์การถ่ายโอนยีนในแนวนอน (HGT) ตัวอย่างเช่น หากยีนสองยีนจากสปีชีส์ที่แตกต่างกันมีโหนดเชื่อมต่อบรรพบุรุษล่าสุดร่วมกันในแผนภูมิวิวัฒนาการของยีน แต่สปีชีส์เหล่านั้นอยู่ห่างกันในแผนภูมิวิวัฒนาการของสปีชีส์ ก็สามารถบ่งชี้ถึงเหตุการณ์ HGT ได้ วิธีการดังกล่าวสามารถให้ผลลัพธ์ที่ละเอียดกว่าวิธีการเชิงพารามิเตอร์ เนื่องจากสามารถระบุสปีชีส์ที่เกี่ยวข้อง เวลา และทิศทางการถ่ายโอนได้

ดังที่ได้กล่าวไว้โดยละเอียดด้านล่าง วิธีการทางวิวัฒนาการชาติพันธุ์มีตั้งแต่แบบง่ายๆ ที่เพียงแค่ระบุความไม่สอดคล้องกันระหว่างแผนภูมิยีนและแผนภูมิสายพันธุ์ ไปจนถึงแบบจำลองเชิงกลไกที่อนุมานลำดับที่เป็นไปได้ของเหตุการณ์การถ่ายโอนยีนในแนวนอน (HGT) กลยุทธ์ระดับกลางเกี่ยวข้องกับการแยกแผนภูมิยีนออกเป็นส่วนเล็กๆ จนกว่าแต่ละส่วนจะตรงกับแผนภูมิสายพันธุ์ (วิธีการสเปกตรัมจีโนม)

วิธีการทางวิวัฒนาการแบบชัดเจนอาศัยความถูกต้องของต้นไม้ทางพันธุกรรมและสายพันธุ์ที่ป้อนเข้ามา แต่การสร้างต้นไม้เหล่านี้อาจเป็นเรื่องท้าทาย[ 41 ]แม้ว่าจะไม่มีข้อสงสัยในต้นไม้ที่ป้อนเข้ามา แต่แผนภูมิวิวัฒนาการที่ขัดแย้งกันอาจเป็นผลมาจากกระบวนการวิวัฒนาการอื่นนอกเหนือจาก HGT เช่น การทำซ้ำและการสูญเสีย ทำให้วิธีการเหล่านี้อนุมานเหตุการณ์ HGT อย่างผิดพลาด ในขณะที่พาราโลจีเป็นคำอธิบายที่ถูกต้อง ในทำนองเดียวกัน ในกรณีที่มีการเรียงลำดับสายพันธุ์ไม่สมบูรณ์วิธีการทางวิวัฒนาการแบบชัดเจนอาจอนุมานเหตุการณ์ HGT อย่างผิดพลาด[ 42 ]นั่นเป็นเหตุผลว่าทำไมวิธีการแบบจำลองที่ชัดเจนบางวิธีจึงทดสอบสถานการณ์วิวัฒนาการหลายแบบที่เกี่ยวข้องกับเหตุการณ์ประเภทต่างๆ และเปรียบเทียบความเหมาะสมกับข้อมูลที่กำหนดโดยเกณฑ์ความประหยัดหรือความน่าจะเป็น

การทดสอบโทโพโลยี

เพื่อตรวจจับชุดยีนที่ไม่เหมาะสมกับต้นไม้แบบอ้างอิง สามารถใช้การทดสอบทางสถิติของโทโพโลยี เช่น การทดสอบ Kishino–Hasegawa (KH) [ 43 ] Shimodaira–Hasegawa (SH) [ 44 ]และการทดสอบ Approximately Unbiased (AU) [ 45 ]การทดสอบเหล่านี้ประเมินความน่าจะเป็นของการจัดเรียงลำดับ ยีน เมื่อโทโพโลยีแบบอ้างอิงถูกกำหนดให้เป็นสมมติฐานว่าง

การปฏิเสธโครงสร้าง ทางพันธุกรรมอ้างอิง บ่งชี้ว่าประวัติวิวัฒนาการของกลุ่มยีน นั้น ไม่สอดคล้องกับแผนภูมิอ้างอิง เมื่อความไม่สอดคล้องกันเหล่านี้ไม่สามารถอธิบายได้ด้วยเหตุการณ์ที่ไม่ใช่แนวนอนจำนวนน้อย เช่น การสูญเสียและการเพิ่มจำนวนยีน ก็จะอนุมานได้ว่าเกิดเหตุการณ์การถ่ายโอนยีนแนวนอน (HGT) ขึ้น

การวิเคราะห์ดังกล่าวตรวจสอบ HGT ในกลุ่มโฮโมล็อกของสายพันธุ์γ-Proteobacterial [ 46 ]มีการสร้างแผนภูมิอ้างอิงขึ้นใหม่ 6 แผนภูมิ โดยใช้ ลำดับ RNA ไรโบโซม หน่วยย่อยขนาดเล็กที่มีการอนุรักษ์สูง แผนภูมิยีนที่เป็นเอกฉันท์ หรือการจัดเรียงออร์โธล็อก ที่เชื่อมต่อกัน การที่ไม่สามารถปฏิเสธโทโพโลยีที่ประเมินทั้ง 6 แบบ และการปฏิเสธโทโพโลยีทางเลือกอีก 7 แบบ ถูกตีความว่าเป็นหลักฐานของการเกิด HGT จำนวนเล็กน้อยในกลุ่มที่เลือก

การทดสอบทางด้านโทโพโลยีระบุความแตกต่างในโทโพโลยีของต้นไม้โดยคำนึงถึงความไม่แน่นอนในการอนุมานต้นไม้ แต่ไม่ได้พยายามอนุมานว่าความ แตกต่างเหล่านั้นเกิดขึ้นได้ อย่างไรในการอนุมานรายละเอียดเฉพาะของเหตุการณ์ต่างๆจำเป็นต้องใช้วิธี สเปกตรัมของจีโนม หรือ การตัดแต่งกิ่งและการเชื่อมต่อกิ่งย่อยของต้นไม้

แนวทางการวิเคราะห์สเปกตรัมของจีโนม

เพื่อระบุตำแหน่งของเหตุการณ์ HGT วิธีการวิเคราะห์สเปกตรัมของจีโนมจะแยกแผนผังยีนออกเป็นโครงสร้างย่อย (เช่นการแบ่งเป็นสองส่วนหรือสี่ส่วน) และระบุโครงสร้างย่อยที่สอดคล้องหรือไม่สอดคล้องกับแผนผังสายพันธุ์

การแบ่งส่วนแบบไบพาร์ติชั่น การลบ ขอบ หนึ่ง เส้นออก จากต้นไม้อ้างอิงจะทำให้เกิดต้นไม้ย่อยสองต้นที่ไม่เชื่อมต่อกัน โดยแต่ละต้นเป็นเซตของโหนดที่ไม่ซ้ำกัน— เรียกว่าไบพาร์ติชั่น หากมีไบพาร์ติชั่นอยู่ในทั้งต้นไม้ของยีนและต้นไม้ของสปีชีส์ แสดงว่าเข้ากันได้ มิฉะนั้นจะขัดแย้งกัน ความขัดแย้งเหล่านี้อาจบ่งชี้ถึงเหตุการณ์ HGT หรืออาจเป็นผลมาจากความไม่แน่นอนในการอนุมานต้นไม้ของยีน เพื่อลดความไม่แน่นอน การวิเคราะห์ไบพาร์ติชั่นมักจะมุ่งเน้นไปที่ไบพาร์ติชั่นที่ได้รับการสนับสนุนอย่างแข็งแกร่ง เช่น ไบพาร์ติชั่นที่เกี่ยวข้องกับกิ่งที่มี ค่า บูตสแตรปหรือความน่าจะเป็นภายหลังที่สูงกว่าเกณฑ์ที่กำหนด ตระกูลยีนใดๆ ที่พบว่ามีไบพาร์ติชั่นที่ขัดแย้งกันหนึ่งรายการหรือมากกว่า แต่ได้รับการสนับสนุนอย่างแข็งแกร่ง จะถือว่าเป็นผู้สมัคร HGT [ 47 ] [ 48 ] [ 49 ]

การแยกส่วน ควอเต็ต ควอเต็ตคือต้นไม้ที่ประกอบด้วยใบสี่ใบ ในต้นไม้แบบแยกสาขา (ที่ได้รับการแก้ไขอย่างสมบูรณ์) แต่ละสาขาภายในจะเหนี่ยวนำให้เกิดควอเต็ตซึ่งใบของควอเต็ตนั้นเป็นได้ทั้งต้นไม้ย่อยของต้นไม้ดั้งเดิมหรือใบจริงของต้นไม้ดั้งเดิม หากโทโพโลยีของควอเต็ตที่สกัดจากต้นไม้สายพันธุ์อ้างอิงถูกฝังอยู่ในต้นไม้ของยีน ควอเต็ตนั้นจะเข้ากันได้กับต้นไม้ของยีน ในทางกลับกัน ควอเต็ตที่ไม่เข้ากันแต่ได้รับการสนับสนุนอย่างแข็งแกร่งบ่งชี้ถึงเหตุการณ์ HGT ที่อาจเกิดขึ้น[ 50 ] วิธีการแมปควอเต็ต มีประสิทธิภาพในการคำนวณมากกว่าและจัดการกับการแสดงแทนของแท็กซาที่แตกต่างกันในหมู่ตระกูลยีนได้อย่างเป็นธรรมชาติ ทำให้เป็นพื้นฐานที่ดีสำหรับการพัฒนาการสแกนขนาดใหญ่สำหรับ HGT เพื่อค้นหาทางหลวงของการแบ่งปันยีนในฐานข้อมูลของจีโนมที่สมบูรณ์หลายร้อยรายการ[ 51 ] [ 52 ]

การตัดแต่งกิ่งและต่อกิ่งบริเวณโคนต้น

วิธีการเชิงกลไกในการจำลองเหตุการณ์ HGT บนต้นไม้อ้างอิงคือการตัดกิ่งภายในก่อน—กล่าวคือ ตัดแต่งต้นไม้—แล้วจึงต่อกิ่งนั้นเข้ากับขอบอื่น ซึ่งเป็นการดำเนินการที่เรียกว่าการตัดแต่งและต่อกิ่งย่อย (SPR) [ 53 ]หากต้นไม้ของยีนมีความสอดคล้องทางโทโพโลยีกับต้นไม้อ้างอิงเดิม การแก้ไขจะส่งผลให้เกิดความไม่สอดคล้อง ในทำนองเดียวกัน เมื่อต้นไม้ของยีนเดิมไม่สอดคล้องกับต้นไม้อ้างอิง ก็สามารถสร้างโทโพโลยีที่สอดคล้องกันได้โดยการดำเนินการตัดแต่งและต่อกิ่งอย่างน้อยหนึ่งครั้งกับต้นไม้อ้างอิง โดยการตีความเส้นทางการแก้ไขของการตัดแต่งและต่อกิ่ง โหนดผู้สมัคร HGT สามารถถูกทำเครื่องหมายและอนุมานจีโนมโฮสต์และผู้บริจาคได้[ 49 ] [ 48 ] [ 54 ]เพื่อหลีกเลี่ยงการรายงานเหตุการณ์ HGT ที่เป็นผลบวกเท็จเนื่องจากโทโพโลยีของต้นไม้ของยีนที่ไม่แน่นอน สามารถเลือก "เส้นทาง" ที่เหมาะสมที่สุดของการดำเนินการ SPR ได้จากชุดค่าผสมที่เป็นไปได้หลายชุดโดยพิจารณาจากการสนับสนุนกิ่งในต้นไม้ของยีน ขอบต้นไม้ยีนที่ได้รับการสนับสนุนอย่างอ่อนสามารถละเลยได้ตั้งแต่แรก[ 55 ]หรือสามารถใช้การสนับสนุนเพื่อคำนวณเกณฑ์ความเหมาะสม[ 49 ] [ 56 ] [ 57 ] [ 58 ]

เนื่องจากการแปลงต้นไม้หนึ่งไปยังอีกต้นไม้หนึ่งโดยใช้การดำเนินการ SPR จำนวนน้อยที่สุดนั้นเป็นปัญหาNP-Hard [ 59 ]การแก้ปัญหาจึงยากขึ้นอย่างมากเมื่อพิจารณาโหนดมากขึ้น ความท้าทายในการคำนวณอยู่ที่การค้นหาเส้นทางการแก้ไขที่เหมาะสมที่สุด นั่นคือเส้นทางที่ต้องใช้ขั้นตอนน้อยที่สุด[ 60 ] [ 61 ] และมีการใช้กลยุทธ์ที่แตกต่างกันในการแก้ปัญหา ตัวอย่างเช่น อัลกอริทึม HorizStory ช่วยลดปัญหาโดยการกำจัดโหนดที่สอดคล้องกันก่อน[ 62 ]การตัดแต่งกิ่งแบบวนซ้ำและการปลูกถ่ายใหม่จะปรับต้นไม้อ้างอิงให้เข้ากับต้นไม้ของยีน และการแก้ไขที่เหมาะสมที่สุดจะถูกตีความว่าเป็นเหตุการณ์ HGT วิธีการ SPR ที่รวมอยู่ในแพ็คเกจการสร้างซูเปอร์ทรี SPRSupertrees ช่วยลดเวลาในการค้นหาชุดการดำเนินการ SPR ที่เหมาะสมที่สุดลงอย่างมากโดยการพิจารณาปัญหาย่อยเฉพาะที่หลายปัญหาในต้นไม้ขนาดใหญ่ผ่านวิธีการจัดกลุ่ม[ 63 ] T -REX (เว็บเซิร์ฟเวอร์)ประกอบด้วยวิธีการตรวจจับ HGT หลายวิธี[ 56 ] (ส่วนใหญ่ใช้ SPR) และอนุญาตให้ผู้ใช้คำนวณการสนับสนุนบูตสแตรปของการถ่ายโอนที่อนุมานได้[ 49 ]

วิธีการกระทบยอดตามแบบจำลอง

การประสานความสัมพันธ์ระหว่างต้นไม้ของยีนและสายพันธุ์เกี่ยวข้องกับการทำแผนที่เหตุการณ์วิวัฒนาการลงบนต้นไม้ของยีนในลักษณะที่สอดคล้องกับต้นไม้ของสายพันธุ์ มีแบบจำลองการประสานความสัมพันธ์ที่แตกต่างกัน โดยแตกต่างกันในประเภทของเหตุการณ์ที่นำมาพิจารณาเพื่ออธิบายความไม่สอดคล้องกันระหว่างโครงสร้างต้นไม้ของยีนและสายพันธุ์ วิธีการในยุคแรกๆ จำลองเฉพาะการถ่ายโอนแนวนอน (T) เท่านั้น[ 53 ] [ 57 ] [ 56 ]วิธีการที่ใหม่กว่ายังคำนึงถึงการทำซ้ำ (D) การสูญเสีย (L) การจัดเรียงสายพันธุ์ที่ไม่สมบูรณ์ (ILS) หรือ เหตุการณ์ การรวมตัวกันของโฮโมโลกัส (HR) ความยากลำบากอยู่ที่ว่าการอนุญาตให้มีเหตุการณ์หลายประเภททำให้จำนวนการประสานความสัมพันธ์ที่เป็นไปได้เพิ่มขึ้นอย่างรวดเร็ว ตัวอย่างเช่น โครงสร้างต้นไม้ของยีนที่ขัดแย้งกันอาจอธิบายได้ในแง่ของเหตุการณ์ HGT เพียงครั้งเดียวหรือเหตุการณ์การทำซ้ำและการสูญเสียหลายครั้ง ทั้งสองทางเลือกสามารถพิจารณาได้ว่าเป็นการประสานความสัมพันธ์ที่สมเหตุสมผลขึ้นอยู่กับความถี่ของเหตุการณ์เหล่านั้นตามลำดับในต้นไม้ของสายพันธุ์

วิธีการประนีประนอมสามารถอาศัย กรอบงาน ที่ประหยัดหรือกรอบงานเชิงความน่าจะเป็นเพื่ออนุมานสถานการณ์ที่เป็นไปได้มากที่สุด โดยที่ต้นทุน/ความน่าจะเป็นสัมพัทธ์ของเหตุการณ์ D, T, L สามารถกำหนดไว้ล่วงหน้าหรือประมาณจากข้อมูลได้[ 64 ]พื้นที่ของการประนีประนอม DTL และต้นทุนความประหยัด ซึ่งอาจมีขนาดใหญ่มากสำหรับต้นไม้ตระกูลยีนหลายสำเนาขนาดใหญ่ สามารถสำรวจได้อย่างมีประสิทธิภาพผ่านอัลกอริธึมการเขียนโปรแกรมแบบไดนามิก[ 64 ] [ 65 ] [ 66 ]ในบางโปรแกรม โครงสร้างต้นไม้ของยีนสามารถปรับปรุงได้ในกรณีที่ไม่แน่ใจว่าจะเข้ากับสถานการณ์วิวัฒนาการที่ดีกว่า รวมถึงการจัดเรียงลำดับเริ่มต้น[ 65 ] [ 67 ] [ 68 ]แบบจำลองที่ละเอียดขึ้นจะคำนึงถึงความถี่ของ HGT ที่มีอคติระหว่างสายพันธุ์ที่ใกล้เคียงกัน[ 69 ]ซึ่งสะท้อนถึงการสูญเสียประสิทธิภาพของHRตามระยะทางทางวิวัฒนาการ[ 70 ]สำหรับILS [ 71 ]หรือข้อเท็จจริงที่ว่าผู้บริจาค HGT ส่วนใหญ่เป็นสายพันธุ์ที่สูญพันธุ์ไปแล้วหรือไม่ได้สุ่มตัวอย่าง[ 72 ] การขยายแบบจำลอง DTL เพิ่มเติมกำลังได้รับการพัฒนาเพื่ออธิบาย กระบวนการ วิวัฒนาการของจีโนม แบบบูรณาการ โดยเฉพาะอย่างยิ่ง แบบจำลองบางส่วนพิจารณาแนวนอนในหลายระดับการจำลองวิวัฒนาการอิสระของชิ้นส่วนยีน[ 73 ]หรือการรับรู้ถึงวิวัฒนาการร่วมของยีนหลายตัว (เช่น เนื่องจากการถ่ายโอนร่วม) ภายในและระหว่างจีโนม[ 74 ] [ 75 ] [ 76 ]

วิธีการทางวิวัฒนาการโดยปริยาย

ตรงกันข้ามกับวิธีการทางวิวัฒนาการแบบชัดเจน ซึ่งเปรียบเทียบความสอดคล้องกันระหว่างแผนภูมิวิวัฒนาการของยีนและสปีชีส์ วิธีการทางวิวัฒนาการแบบไม่ชัดเจนจะเปรียบเทียบระยะทางวิวัฒนาการหรือความคล้ายคลึงกันของลำดับดีเอ็นเอ ในกรณีนี้ ระยะทางที่สั้นหรือยาวผิดปกติจากค่าอ้างอิงที่กำหนดเมื่อเทียบกับค่าเฉลี่ย อาจบ่งชี้ถึงเหตุการณ์การถ่ายทอดยีนในแนวนอน (HGT) เนื่องจากไม่จำเป็นต้องสร้างแผนภูมิวิวัฒนาการ วิธีการแบบไม่ชัดเจนจึงมักง่ายกว่าและเร็วกว่าวิธีการแบบชัดเจน

อย่างไรก็ตาม วิธีการโดยนัยอาจมีข้อจำกัดเนื่องจากความแตกต่างระหว่างแผนภูมิวิวัฒนาการที่ถูกต้องพื้นฐานและระยะทางวิวัฒนาการที่พิจารณา ตัวอย่างเช่น ลำดับที่คล้ายคลึงที่สุดที่ได้จากการค้นหาBLASTที่มีคะแนนสูงสุดนั้น ไม่ได้เป็นลำดับที่ใกล้เคียงที่สุดในเชิงวิวัฒนาการเสมอไป[ 77 ]

การจับคู่ลำดับสูงสุดในสายพันธุ์ที่อยู่ห่างไกล

วิธีง่ายๆ ในการระบุเหตุการณ์ HGT คือการมองหาการจับคู่ลำดับที่มีคะแนนสูงในสายพันธุ์ที่มีความสัมพันธ์ห่างไกลกัน ตัวอย่างเช่น การวิเคราะห์ผลลัพธ์ BLAST สูงสุดของลำดับโปรตีนในแบคทีเรียThermotoga maritimaเผยให้เห็นว่าผลลัพธ์ส่วนใหญ่อยู่ในอาร์เคียมากกว่าแบคทีเรียที่มีความสัมพันธ์ใกล้ชิดกัน ซึ่งบ่งชี้ถึง HGT ที่แพร่หลายระหว่างทั้งสอง[ 37 ]การคาดการณ์เหล่านี้ได้รับการสนับสนุนในภายหลังโดยการวิเคราะห์ลักษณะโครงสร้างของโมเลกุล DNA [ 17 ]

อย่างไรก็ตาม วิธีนี้มีข้อจำกัดในการตรวจจับเหตุการณ์ HGT ที่ค่อนข้างใหม่ แท้จริงแล้ว หาก HGT เกิดขึ้นในบรรพบุรุษร่วมของสองชนิดหรือมากกว่าที่รวมอยู่ในฐานข้อมูล การจับคู่ที่ใกล้เคียงที่สุดจะอยู่ภายในกลุ่มนั้น ดังนั้น HGT จะไม่ถูกตรวจพบโดยวิธีนี้ ดังนั้น เกณฑ์ของจำนวนขั้นต่ำของการจับคู่ BLAST สูงสุดจากต่างประเทศที่ต้องสังเกตเพื่อตัดสินว่ามีการถ่ายโอนยีนนั้นขึ้นอยู่กับการครอบคลุมทางอนุกรมวิธานของฐานข้อมูลลำดับเป็นอย่างมาก ดังนั้น การตั้งค่าการทดลองอาจจำเป็นต้องกำหนดในลักษณะเฉพาะเจาะจง[ 78 ]

ความไม่สอดคล้องกันระหว่างระยะห่างของยีนและสปีชีส์

สมมติฐานนาฬิกาโมเลกุลระบุว่ายีนโฮโมล็อกจะวิวัฒนาการในอัตราคงที่โดยประมาณในสปีชีส์ต่างๆ[ 79 ]หากพิจารณาเฉพาะยีนโฮโมล็อกที่เกี่ยวข้องผ่านเหตุการณ์การเกิดสปีชีส์ใหม่ (เรียกว่ายีน "ออร์โธล็อก") ต้นไม้พื้นฐานของยีนเหล่านั้นควรสอดคล้องกับต้นไม้ของสปีชีส์ตามคำจำกัดความ ดังนั้น หากสมมติว่ามีนาฬิกาโมเลกุล ระยะทางวิวัฒนาการระหว่างยีนออร์โธล็อกควรเป็นสัดส่วนโดยประมาณกับระยะทางวิวัฒนาการระหว่างสปีชีส์ของยีนเหล่านั้น หากกลุ่มออร์โธล็อกที่สันนิษฐานไว้มีซีโนล็อก (คู่ของยีนที่เกี่ยวข้องผ่าน HGT) ความเป็นสัดส่วนของระยะทางวิวัฒนาการอาจใช้ได้เฉพาะในกลุ่มออร์โธล็อกเท่านั้น ไม่ใช่ในกลุ่มซีโนล็อก[ 80 ]

วิธีการแบบง่ายๆ จะเปรียบเทียบการกระจายของคะแนนความคล้ายคลึงกันของลำดับเฉพาะและคู่ออร์โธล็อกในสปีชีส์อื่นๆ โดยอนุมาน HGT จากค่าผิดปกติ[ 81 ] [ 82 ]วิธี DLIGHT ('Distance Likelihood-based Inference of Genes Horizontally Transferred') ที่ซับซ้อนกว่าจะพิจารณาผลกระทบของ HGT ต่อลำดับทั้งหมดภายในกลุ่มของออร์โธล็อกที่คาดการณ์ไว้พร้อมกัน: [ 7 ]หากการทดสอบอัตราส่วนความน่าจะเป็นของสมมติฐาน HGT เทียบกับสมมติฐานที่ไม่มี HGT มีนัยสำคัญ จะอนุมานเหตุการณ์ HGT ที่คาดการณ์ไว้ได้ นอกจากนี้ วิธีนี้ยังช่วยให้สามารถอนุมานสปีชีส์ผู้ให้และผู้รับที่เป็นไปได้ และให้การประมาณเวลาตั้งแต่เหตุการณ์ HGT เกิดขึ้น

โปรไฟล์ทางวิวัฒนาการ

กลุ่มยีนออร์โธล็อกัสหรือโฮโมล็อกัสสามารถวิเคราะห์ได้ในแง่ของการมีอยู่หรือไม่มีอยู่ของสมาชิกกลุ่มในจีโนมอ้างอิง รูปแบบดังกล่าวเรียกว่าโปรไฟล์ทางวิวัฒนาการ [ 83 ] เพื่อค้นหาเหตุการณ์ HGT โปรไฟล์ทางวิวัฒนาการจะถูกสแกนหาการกระจายตัวของยีนที่ผิดปกติ การไม่มีโฮโมล็อกในสมาชิกบางส่วนของกลุ่มสายพันธุ์ที่เกี่ยวข้องอย่างใกล้ชิดเป็นข้อบ่งชี้ว่ายีนที่ตรวจสอบอาจมาถึงผ่านเหตุการณ์ HGT ตัวอย่างเช่น สายพันธุ์Frankia sp. ที่เป็นซิมไบโอติกแบบไม่บังคับสาม สายพันธุ์มีขนาดแตกต่างกันอย่างเห็นได้ชัด: 5.43 Mbp, 7.50 Mbp และ 9.04 Mbp ขึ้นอยู่กับช่วงของโฮสต์[ 84 ]พบว่าส่วนที่ทำเครื่องหมายไว้ของยีนเฉพาะสายพันธุ์ไม่มีการจับคู่ที่สำคัญในฐานข้อมูลอ้างอิง และอาจได้รับมาจากการถ่ายโอน HGT จากแบคทีเรียอื่น ในทำนองเดียวกัน สายพันธุ์ Escherichia coliทั้งสามสายพันธุ์ที่มีลักษณะฟีโนไทป์แตกต่างกัน( ก่อให้เกิดโรคทางเดินปัสสาวะก่อให้ เกิดเลือดออกในลำไส้ และไม่ก่อให้เกิดอันตราย) มี ยีนพูลรวมกันประมาณ 40% โดยอีก 60% เป็นยีนเฉพาะสายพันธุ์และเป็นตัวเลือก HGT [ 85 ]หลักฐานเพิ่มเติมสำหรับยีนเหล่านี้ที่เกิดจาก HGT คือรูปแบบการใช้โคดอนที่แตกต่างอย่างเห็นได้ชัดจากยีนหลักและการขาดการอนุรักษ์ลำดับยีน (การอนุรักษ์ลำดับเป็นลักษณะเฉพาะของยีนที่วิวัฒนาการในแนวดิ่ง) [ 85 ]การมีอยู่/ไม่มีอยู่ของโฮโมล็อก (หรือจำนวนที่มีประสิทธิภาพ) จึงสามารถใช้โดยโปรแกรมเพื่อสร้างสถานการณ์วิวัฒนาการที่น่าจะเป็นไปได้มากที่สุดตามแผนผังสายพันธุ์ เช่นเดียวกับวิธีการประนีประนอมสิ่งนี้สามารถทำได้ผ่านการประมาณจำนวนเหตุการณ์การได้มาและการสูญเสีย อย่างประหยัด [ 86 ] หรือแบบความน่าจะเป็น [ 87 ] [ 88 ]แบบจำลองสามารถทำให้ซับซ้อนขึ้นได้โดยการเพิ่มกระบวนการต่างๆ เช่น การตัดทอนยีน[ 89 ]แต่ยังรวมถึงการสร้างแบบจำลองความแตกต่างของอัตราการได้รับและการสูญเสียในแต่ละสายพันธุ์[ 90 ]และ/หรือตระกูลยีน[ 88 ] [ 91 ]

กลุ่มของไซต์โพลีมอร์ฟิก

โดยทั่วไปแล้ว ยีนถือเป็นหน่วยพื้นฐานที่ถูกถ่ายโอนผ่านเหตุการณ์ HGT อย่างไรก็ตาม HGT ก็สามารถเกิดขึ้นภายในยีนได้เช่นกัน ตัวอย่างเช่น มีการแสดงให้เห็นว่าการถ่ายโอนแนวนอนระหว่างสายพันธุ์ที่ใกล้เคียงกันส่งผลให้มีการแลกเปลี่ยนชิ้นส่วนORF มากขึ้น [ 92 ] [ 93 ]ซึ่งเป็นการถ่ายโอนประเภทหนึ่งที่เรียกว่าการแปลงยีน โดยมีตัวกลางคือการรวม ตัวกันแบบโฮโมโลกัส การวิเคราะห์กลุ่มของ สายพันธุ์ Escherichia coli สี่สายพันธุ์ และShigella flexneri สอง สายพันธุ์เผยให้เห็นว่าลำดับที่เหมือนกันในทั้งหกสายพันธุ์มีไซต์โพลีมอร์ฟิกซึ่งเป็นผลมาจากการรวมตัวกันแบบโฮโมโลกัส[ 94 ]ดังนั้นคลัสเตอร์ของไซต์โพลีมอร์ฟิกที่มากเกินไปจึงสามารถใช้เพื่อตรวจจับร่องรอยของ DNA ที่รวมตัวกันใหม่กับญาติที่อยู่ห่างไกลได้[ 95 ]อย่างไรก็ตาม วิธีการตรวจจับนี้ถูกจำกัดเฉพาะไซต์ที่เหมือนกันในลำดับที่วิเคราะห์ทั้งหมด ซึ่งจำกัดการวิเคราะห์ไว้เฉพาะกลุ่มของสิ่งมีชีวิตที่ใกล้เคียงกัน

การประเมิน

การมีวิธีการมากมายและหลากหลายในการอนุมานการถ่ายทอดยีนแนวนอน (HGT) ทำให้เกิดคำถามว่า จะตรวจสอบความถูกต้องของการอนุมานแต่ละวิธีได้อย่างไร และจะเปรียบเทียบวิธีการต่างๆ เหล่านั้นได้อย่างไร

ปัญหาหลักคือ เช่นเดียวกับการอนุมานทางวิวัฒนาการประเภทอื่นๆ ประวัติวิวัฒนาการที่แท้จริงไม่สามารถกำหนดได้อย่างแน่นอน ส่งผลให้ยากที่จะได้รับชุดทดสอบ ที่เป็นตัวแทน ของเหตุการณ์ HGT ยิ่งไปกว่านั้น วิธีการอนุมาน HGT แตกต่างกันอย่างมากในข้อมูลที่พิจารณา และมักระบุกลุ่มผู้สมัคร HGT ที่ไม่สอดคล้องกัน[ 6 ] [ 96 ] ยังไม่ชัดเจนว่าการใช้ จุดตัดการรวมกันหรือการผสมผสานอื่นๆ ของวิธีการแต่ละวิธีส่งผลต่ออัตราผลบวกเท็จและ ผล ลบเท็จ มาก น้อยเพียงใด[ 14 ]

วิธีการเชิงพารามิเตอร์และวิธีการเชิงวิวัฒนาการอาศัยแหล่งข้อมูลที่แตกต่างกัน ดังนั้นจึงยากที่จะสรุปโดยทั่วไปเกี่ยวกับประสิทธิภาพเชิงเปรียบเทียบของทั้งสองวิธี อย่างไรก็ตาม สามารถใช้เหตุผลเชิงแนวคิดมาอธิบายได้ วิธีการเชิงพารามิเตอร์จำกัดอยู่เฉพาะการวิเคราะห์จีโนมเดี่ยวหรือคู่ของจีโนม ในขณะที่วิธีการเชิงวิวัฒนาการให้กรอบการทำงานที่เป็นธรรมชาติในการใช้ประโยชน์จากข้อมูลที่มีอยู่ในจีโนมหลายๆ จีโนม ในหลายกรณี ส่วนของจีโนมที่อนุมานว่าเป็นการถ่ายทอดยีนแนวนอน (HGT) โดยพิจารณาจากองค์ประกอบที่ผิดปกติ สามารถระบุได้ว่าเป็นเช่นนั้นโดยอาศัยการวิเคราะห์เชิงวิวัฒนาการหรือเพียงแค่การไม่มีอยู่ในจีโนมของสิ่งมีชีวิตที่เกี่ยวข้อง นอกจากนี้ วิธีการเชิงวิวัฒนาการยังอาศัยแบบจำลองวิวัฒนาการของลำดับที่ชัดเจน ซึ่งเป็นกรอบการทำงานที่เข้าใจได้ดีสำหรับการอนุมานพารามิเตอร์ การทดสอบสมมติฐาน และการเลือกแบบจำลองสิ่งนี้สะท้อนให้เห็นในเอกสารทางวิชาการ ซึ่งมักจะนิยมใช้วิธีการเชิงวิวัฒนาการเป็นมาตรฐานในการพิสูจน์ HGT [ 97 ] [ 98 ] [ 99 ] [ 100 ]การใช้วิธีการทางวิวัฒนาการจึงดูเหมือนจะเป็นมาตรฐานที่ต้องการ โดยเฉพาะอย่างยิ่งเมื่อพิจารณาว่าพลังการคำนวณที่เพิ่มขึ้นควบคู่กับการปรับปรุงอัลกอริทึมทำให้สามารถจัดการได้ง่ายขึ้น[ 63 ] [ 72 ]และการสุ่มตัวอย่างจีโนมที่หนาแน่นขึ้นเรื่อยๆ ทำให้การทดสอบเหล่านี้มีประสิทธิภาพมากขึ้น

เมื่อพิจารณาวิธีการทางวิวัฒนาการ มีการนำแนวทางต่างๆ มาใช้ในการตรวจสอบความถูกต้องของการอนุมาน HGT แต่ละรายการและวิธีการเปรียบเทียบมาตรฐาน ซึ่งโดยทั่วไปจะอาศัยการจำลอง ในรูปแบบต่างๆ เนื่องจากความจริงเป็นที่ทราบในการจำลอง จำนวนผลบวกเท็จและจำนวนผลลบเท็จจึงคำนวณได้ง่าย อย่างไรก็ตาม การจำลองข้อมูลไม่ได้แก้ปัญหาได้อย่างง่ายดาย เนื่องจากขอบเขตที่แท้จริงของ HGT ในธรรมชาติยังคงไม่เป็นที่รู้จักมากนัก และการระบุอัตรา HGT ในแบบจำลองนั้นมีความเสี่ยงเสมอ ถึงกระนั้น การศึกษาที่เกี่ยวข้องกับการเปรียบเทียบวิธีการทางวิวัฒนาการหลายวิธีในกรอบการจำลองสามารถให้การประเมินเชิงปริมาณของประสิทธิภาพของแต่ละวิธี และช่วยให้นักชีววิทยาเลือกเครื่องมือที่เหมาะสมได้อย่างเป็นกลาง[ 58 ]

Standard tools to simulate sequence evolution along trees such as INDELible[101] or PhyloSim[102] can be adapted to simulate HGT. HGT events cause the relevant gene trees to conflict with the species tree. Such HGT events can be simulated through subtree pruning and regrafting rearrangements of the species tree.[55] However, it is important to simulate data that are realistic enough to be representative of the challenge provided by real datasets, and simulation under complex models are thus preferable. A model was developed to simulate gene trees with heterogeneous substitution processes in addition to the occurrence of transfer, and accounting for the fact that transfer can come from now extinct donor lineages.[103] Alternatively, the genome evolution simulator ALF[104] directly generates gene families subject to HGT, by accounting for a whole range of evolutionary forces at the base level, but in the context of a complete genome. Given simulated sequences which have HGT, analysis of those sequences using the methods of interest and comparison of their results with the known truth permits study of their performance. Similarly, testing the methods on sequence known not to have HGT enables the study of false positive rates.

Simulation of HGT events can also be performed by manipulating the biological sequences themselves. Artificial chimeric genomes can be obtained by inserting known foreign genes into random positions of a host genome.[12][105][106][107] The donor sequences are inserted into the host unchanged or can be further evolved by simulation,[7] e.g., using the tools described above.

One important caveat to simulation as a way to assess different methods is that simulation is based on strong simplifying assumptions which may favour particular methods.[108]

See also

  1. ฮิรามัตสึ เค, ชุย แอล, คุโรดะ เอ็ม, อิโตะ ที (ตุลาคม 2544) "การเกิดขึ้นและวิวัฒนาการของเชื้อ Staphylococcus aureus ที่ดื้อต่อเมทิซิลิน " แนวโน้มทางจุลชีววิทยา . 9 (10): 486– 93. รหัสสินค้า : 2001TrMic...9..486H . ดอย : 10.1016/s0966-842x(01)02175-8 . PMID11597450 . 
  2. Griffith F (มกราคม 1928). "ความสำคัญของชนิดของเชื้อนิวโมค็อกคัส"วารสารสุขอนามัย 27 ( 2): 113– 59. doi : 10.1017/s0022172400031879 . PMC 2167760 . PMID 20474956 .  
  3. Tatum EL, Lederberg J (มิถุนายน 1947). "การรวมตัวของยีนในแบคทีเรีย Escherichia coli" . Journal of Bacteriology . 53 (6): 673– 84. doi : 10.1128/JB.53.6.673-684.1947 . PMC 518375 . PMID 16561324 .  
  4. Zinder ND , Lederberg J (พฤศจิกายน 1952). "การแลกเปลี่ยนทางพันธุกรรมใน Salmonella" . Journal of Bacteriology . 64 (5): 679– 99. Bibcode : 1952JBact..64..679Z . doi : 10.1128/JB.64.5.679-699.1952 . PMC 169409 . PMID 12999698 .  
  5. Jones D, Sneath PH (มีนาคม 1970). "การถ่ายทอดทางพันธุกรรมและอนุกรมวิธานของแบคทีเรีย" . Bacteriological Reviews . 34 (1): 40– 81. doi : 10.1128/MMBR.34.1.40-81.1970 . PMC 378348 . PMID 4909647 .  
  6. 1 2 3 Lawrence JG, Ochman H (มกราคม 2545). "การประสานแง่มุมต่างๆ ของการถ่ายทอดยีนด้านข้าง". แนวโน้มในจุลชีววิทยา 10 ( 1): 1– 4. Bibcode : 2002TrMic..10....1L . doi : 10.1016/s0966-842x(01)02282-x . PMID 11755071 . 
  7. 1 2 3 Dessimoz C, Margadant D, Gonnet GH (2008). "DLIGHT – การตรวจจับการถ่ายโอนยีนด้านข้างโดยใช้ระยะทางวิวัฒนาการแบบคู่ในกรอบทางสถิติ" การวิจัยในชีววิทยาโมเลกุลเชิง คำนวณ บันทึก การบรรยายในวิทยาศาสตร์คอมพิวเตอร์ เล่มที่4955หน้า315–330 doi : 10.1007/978-3-540-78839-3_27 ISBN   978-3-540-78838-6. S2CID 12776750 . 
  8. 1 2 Guindon S, Perrière G (กันยายน 2544). "ความแปรผันของเนื้อหาเบสภายในจีโนมเป็นแหล่งที่มาของอคติที่อาจเกิดขึ้นเมื่อค้นหายีนที่ถ่ายโอนในแนวนอน" . Molecular Biology and Evolution . 18 (9): 1838– 40. doi : 10.1093/oxfordjournals.molbev.a003972 . PMID 11504864 . 
  9. 1 2 Lawrence JG, Ochman H (เมษายน 1997). "การปรับปรุงจีโนมของแบคทีเรีย: อัตราการเปลี่ยนแปลงและการแลกเปลี่ยน". Journal of Molecular Evolution . 44 (4): 383– 97. Bibcode : 1997JMolE..44..383L . CiteSeerX 10.1.1.590.7214 . doi : 10.1007/pl00006158 . PMID 9089078 . S2CID 7928957 .   
  10. 1 2 Azad RK, Lawrence JG (พฤษภาคม 2011). "มุ่งสู่การพัฒนาวิธีการตรวจจับยีนต่างดาวที่มีประสิทธิภาพยิ่งขึ้น" . Nucleic Acids Research . 39 (9): e56. doi : 10.1093/nar/gkr059 . PMC 3089488 . PMID 21297116 .  
  11. Xiong D, Xiao F, Liu L, Hu K, Tan Y, He S, Gao X (2012). "มุ่งสู่การตรวจจับยีนที่ถ่ายทอดในแนวนอนได้ดียิ่งขึ้นโดยการรวมคุณสมบัติที่ผิดปกติเข้าด้วยกันอย่างมีประสิทธิภาพ" PLOS ONE . ​​7 (8) e43126. Bibcode : 2012PLoSO...743126X . doi : 10.1371/journal.pone.0043126 . PMC 3419211 . PMID 22905214 .  
  12. 1 2 3 Becq J, Churlaud C, Deschavanne P (เมษายน 2010). "เกณฑ์มาตรฐานของวิธีการพาราเมตริกสำหรับการตรวจจับการถ่ายโอนแนวนอน" PLOS ONE . ​​5 (4) e9989. Bibcode : 2010PLoSO...5.9989B . doi : 10.1371/journal.pone.0009989 . PMC 2848678 . PMID 20376325 .  
  13. Poptsova M (2009). "การทดสอบวิธีการทางวิวัฒนาการเพื่อระบุการถ่ายทอดยีนในแนวนอน" การถ่ายทอดยีนในแนวนอนวิธีการทางชีววิทยาระดับโมเลกุล เล่มที่532หน้า227–40 doi : 10.1007 /978-1-60327-853-9_13 ISBN   978-1-60327-852-2. PMID 19271188 . 
  14. 1 2 Poptsova MS, Gogarten JP (มีนาคม 2550). "พลังของวิธีการทางวิวัฒนาการในการตรวจจับยีนที่ถ่ายทอดในแนวนอน" . BMC Evolutionary Biology . 7 (1): 45. Bibcode : 2007BMCEE...7...45P . doi : 10.1186/1471-2148-7-45 . PMC 1847511 . PMID 17376230 .  
  15. 1 2 3 Daubin V, Lerat E, Perrière G (2003). "แหล่งที่มาของยีนที่ถ่ายโอนด้านข้างในจีโนมแบคทีเรีย" . Genome Biology . 4 (9) R57. Bibcode : 2003GenBi...4..R57D . doi : 10.1186/gb-2003-4-9-r57 . PMC 193657 . PMID 12952536 .  
  16. 1 2 Lawrence JG, Ochman H (สิงหาคม 1998). "โบราณคดีโมเลกุลของจีโนม Escherichia coli" . Proceedings of the National Academy of Sciences of the United States of America . 95 (16): 9413– 7. Bibcode : 1998PNAS...95.9413L . doi : 10.1073/pnas.95.16.9413 . PMC 21352 . PMID 9689094 .  
  17. 1 2 3 4 Worning P, Jensen LJ, Nelson KE, Brunak S, Ussery DW (กุมภาพันธ์ 2000). "การวิเคราะห์โครงสร้างของลำดับดีเอ็นเอ: หลักฐานการถ่ายโอนยีนด้านข้างใน Thermotoga maritima" . Nucleic Acids Research . 28 (3): 706– 9. doi : 10.1093/nar/28.3.706 . PMC 102551 . PMID 10637321 .  
  18. Deschavanne P, Filipski J (เมษายน 1995). "ความสัมพันธ์ของปริมาณ GC กับเวลาการจำลองแบบและกลไกการซ่อมแซมในยีน E.coli ที่แสดงออกอย่างอ่อน" . Nucleic Acids Research . 23 (8): 1350– 3. doi : 10.1093/nar/23.8.1350 . PMC 306860 . PMID 7753625 .  
  19. Wuitschick JD, Karrer KM (1999). "การวิเคราะห์เนื้อหา G + C ในจีโนม การใช้โคดอน บริบทของโคดอนเริ่มต้น และตำแหน่งการสิ้นสุดการแปลใน Tetrahymena thermophila" วารสารจุลชีววิทยาของยูคาริโอ46 (3): 239– 47. doi : 10.1111/j.1550-7408.1999.tb05120.x . PMID 10377985 . S2CID 28836138 .  
  20. เรนดูลิก เอส, แจ็กแทป พี, โรซินัส เอ, เอปปิงเงอร์ เอ็ม, บาร์ ซี, แลนซ์ ซี, และคณะ (มกราคม 2547). "นักล่าที่ไม่เปิดเผย: วงจรชีวิตของแบคทีเรีย Bdellovibrio จากมุมมองของจีโนม" ศาสตร์ . 303 (5658): 689– 92. Bibcode : 2004Sci...303..689R . ดอย : 10.1126/science.1093027 . PMID 14752164 . S2CID 38154836 .   
  21. Gophna U, Charlebois RL, Doolittle WF (กุมภาพันธ์ 2549). "การถ่ายโอนยีนด้านข้างโบราณในวิวัฒนาการของ Bdellovibrio bacteriovorus". Trends in Microbiology . 14 (2): 64– 9. Bibcode : 2006TrMic..14...64G . doi : 10.1016/j.tim.2005.12.008 . PMID 16413191 . 
  22. Vernikos GS, Thomson NR, Parkhill J (2007). "การเปลี่ยนแปลงทางพันธุกรรมเมื่อเวลาผ่านไปในสายพันธุ์ Salmonella" . Genome Biology . 8 (6) R100. doi : 10.1186/gb-2007-8-6-r100 . PMC 2394748 . PMID 17547764 .  
  23. McCutcheon JP, Moran NA (2010). "การบรรจบกันเชิงหน้าที่ในจีโนมที่ลดลงของแบคทีเรียที่เป็น symbiont ครอบคลุมวิวัฒนาการ 200 ล้านปี" . Genome Biology and Evolution . 2 : 708– 18. doi : 10.1093/gbe/evq055 . PMC 2953269 . PMID 20829280 .  
  24. Liu Z, Venkatesh SS, Maley CC (ตุลาคม 2551). "การครอบคลุมพื้นที่ลำดับ เอนโทรปีของจีโนม และศักยภาพในการตรวจจับดีเอ็นเอที่ไม่ใช่ของมนุษย์ในตัวอย่างของมนุษย์" . BMC Genomics . 9 509. doi : 10.1186/1471-2164-9-509 . PMC 2628393 . PMID 18973670 .  
  25. Bentley SD, Parkhill J (2004). "โครงสร้างจีโนมเปรียบเทียบของโปรคาริโอต". Annual Review of Genetics . 38 : 771–92 . doi : 10.1146/annurev.genet.38.072902.094318 . PMID 15568993. S2CID 5524251 .  
  26. Karlin S, Burge C (กรกฎาคม 1995). "ค่าสุดขั้วของความอุดมสมบูรณ์สัมพัทธ์ของไดนิวคลีโอไทด์: ลายเซ็นทางจีโนม"แนวโน้มในพันธุศาสตร์ 11 ( 7): 283– 90. doi : 10.1016/S0168-9525(00)89076-9 . PMID 7482779 . 
  27. Vernikos GS, Parkhill J (กันยายน 2549). "รูปแบบลำดับตัวแปรที่แทรกสอดสำหรับการระบุ DNA ที่ได้รับมาในแนวนอน: การทบทวนเกาะก่อโรคของ Salmonella" . Bioinformatics . 22 (18): 2196– 203. doi : 10.1093/bioinformatics/btl369 . PMID 16837528 . 
  28. Hooper SD, Berg OG (มีนาคม 2002). "การตรวจหายีนที่มีลำดับนิวคลีโอไทด์ที่ผิดปกติในจีโนมของจุลินทรีย์". Journal of Molecular Evolution . 54 (3): 365– 75. Bibcode : 2002JMolE..54..365H . doi : 10.1007/ s00239-001-0051-8 . PMID 11847562. S2CID 6872232 .  
  29. Deschavanne PJ, Giron A, Vilain J, Fagot G, Fertil B (ตุลาคม 1999). "ลายเซ็นจีโนม: การกำหนดลักษณะและการจำแนกประเภทของสปีชีส์ที่ประเมินโดยการแสดงลำดับด้วยเกมโกลาหล" . ชีววิทยาโมเลกุลและวิวัฒนาการ . 16 (10): 1391– 9. doi : 10.1093/oxfordjournals.molbev.a026048 . PMID 10563018 . 
  30. Dufraigne C, Fertil B, Lespinats S, Giron A, Deschavanne P (มกราคม 2548). "การตรวจจับและลักษณะเฉพาะของการถ่ายโอนแนวนอนในโปรคาริโอตโดยใช้ลายเซ็นจีโนม" . Nucleic Acids Research . 33 (1): e6. doi : 10.1093/nar/gni004 . PMC 546175 . PMID 15653627 .  
  31. Cortez D, Forterre P, Gribaldo S (2009). "แหล่งกักเก็บที่ซ่อนอยู่ขององค์ประกอบแบบบูรณาการเป็นแหล่งที่มาหลักของยีนต่างประเทศและ ORFan ที่ได้รับมาใหม่ในจีโนมของอาร์เคียและแบคทีเรีย" . Genome Biology . 10 (6) R65. Bibcode : 2009GenBi..10..R65C . doi : 10.1186/gb-2009-10-6-r65 . PMC 2718499 . PMID 19531232 .  
  32. Nakamura Y, Itoh T, Matsuda H, Gojobori T (กรกฎาคม 2547). "หน้าที่ทางชีวภาพที่ลำเอียงของยีนที่ถ่ายโอนในแนวนอนในจีโนมของโปรคาริโอต" Nature Genetics 36 ( 7): 760– 6. doi : 10.1038/ng1381 . PMID 15208628 . 
  33. Ornstein RL, Rein R (ตุลาคม 1978). "ฟังก์ชันศักยภาพที่ปรับให้เหมาะสมสำหรับการคำนวณพลังงานปฏิสัมพันธ์ของกรดนิวคลีอิก I. การเรียงซ้อนของเบส" Biopolymers . 17 (10): 2341– 60. doi : 10.1002/bip.1978.360171005 . PMID 24624489 . S2CID 13063636 .  
  34. el Hassan MA, Calladine CR (พฤษภาคม 1996). "การบิดตัวแบบใบพัดของคู่เบสและการเคลื่อนที่เชิงโครงสร้างของขั้นไดนิวคลีโอไทด์ใน DNA". Journal of Molecular Biology . 259 (1): 95– 103. doi : 10.1006/jmbi.1996.0304 . PMID 8648652 . 
  35. Olson WK, Gorin AA, Lu XJ, Hock LM, Zhurkin VB (กันยายน 1998). "ความสามารถในการเปลี่ยนรูปที่ขึ้นอยู่กับลำดับ DNA ที่ได้จากการอนุมานจากคอมเพล็กซ์ผลึกโปรตีน-DNA" Proceedings of the National Academy of Sciences of the United States of America . 95 (19): 11163– 8. Bibcode : 1998PNAS...9511163O . doi : 10.1073/pnas.95.19.11163 . PMC 21613 . PMID 9736707 .  
  36. Herzel H, Weiss O, Trifonov EN (มีนาคม 1999). "คาบ 10-11 bp ในจีโนมที่สมบูรณ์สะท้อนโครงสร้างโปรตีนและการพับตัวของ DNA" . Bioinformatics . 15 (3): 187– 93. doi : 10.1093/bioinformatics/15.3.187 . PMID 10222405 . 
  37. 1 2 Nelson KE, Clayton RA, Gill SR, Gwinn ML, Dodson RJ, Haft DH และคณะ (พฤษภาคม 1999). "หลักฐานการถ่ายโอนยีนด้านข้างระหว่างอาร์เคียและแบคทีเรียจากลำดับจีโนมของ Thermotoga maritima" Nature . 399 (6734): 323– 9. Bibcode : 1999Natur.399..323N . doi : 10.1038/20601 . PMID 10360571 . S2CID 4420157 .   
  38. Langille MG, Hsiao WW, Brinkman FS (พฤษภาคม 2010). "การตรวจจับเกาะจีโนมโดยใช้วิธีการทางชีวสารสนเทศ" Nature Reviews. Microbiology . 8 (5): 373– 82. doi : 10.1038/nrmicro2350 . PMID 20395967 . S2CID 2373228 .  
  39. Hacker J, Blum-Oehler G, Mühldorfer I, Tschäpe H (มีนาคม 1997). "เกาะก่อโรคของแบคทีเรียที่ก่อโรค: โครงสร้าง หน้าที่ และผลกระทบต่อวิวัฒนาการของจุลินทรีย์" . Molecular Microbiology . 23 (6): 1089– 97. doi : 10.1046/j.1365-2958.1997.3101672.x . PMID 9106201 . S2CID 27524815 .  
  40. Vernikos GS, Parkhill J (กุมภาพันธ์ 2551). "การแก้ไขลักษณะโครงสร้างของเกาะจีโนม: แนวทางการเรียนรู้ของเครื่อง" . Genome Research . 18 (2): 331– 42. doi : 10.1101/gr.7004508 . PMC 2203631 . PMID 18071028 .  
  41. Altenhoff AM, Dessimoz C (2012). "การอนุมานออร์โธโลยีและพาราโลยี" (PDF)จีโนมิกส์เชิงวิวัฒนาการวิธีการทางชีววิทยาระดับโมเลกุล เล่มที่855 โทโทวา รัฐนิวเจอร์ซีย์: สำนักพิมพ์ฮิวมานา หน้า259–279 doi : 10.1007 /978-1-61779-582-4_9 ISBN   978-1-61779-581-7. PMID 22407712 . 
  42. Than C, Ruths D, Innan H, Nakhleh L (พฤษภาคม 2550). "ปัจจัยรบกวนในการตรวจจับ HGT: ข้อผิดพลาดทางสถิติ ผลกระทบจากการรวมตัว และวิธีแก้ปัญหาหลายวิธี" วารสารชีววิทยาเชิงคำนวณ 14 ( 4): 517– 35. CiteSeerX 10.1.1.121.7834 . doi : 10.1089/cmb.2007.A010 . PMID 17572027 .  
  43. Goldman N, Anderson JP, Rodrigo AG (ธันวาคม 2000). "การทดสอบโทโพโลยีตามความน่าจะเป็นในวิวัฒนาการ" . Systematic Biology . 49 (4): 652– 70. doi : 10.1080/106351500750049752 . PMID 12116432 . 
  44. Shimodaira H, Hasegawa M (1999). "การเปรียบเทียบค่าลอการิทึมความน่าจะเป็นหลายค่าพร้อมการประยุกต์ใช้ในการอนุมานเชิงวิวัฒนาการ" . ชีววิทยาโมเลกุลและวิวัฒนาการ . 16 (8): 1114– 1116. doi : 10.1093/oxfordjournals.molbev.a026201 .
  45. Shimodaira H (มิถุนายน 2545). "การทดสอบการเลือกแผนภูมิวิวัฒนาการที่ไม่ลำเอียงโดยประมาณ". Systematic Biology . 51 (3): 492– 508. doi : 10.1080/10635150290069913 . PMID 12079646 . S2CID 11586099 .  
  46. Lerat E, Daubin V, Moran NA (ตุลาคม 2546). "จากต้นไม้ของยีนไปสู่วิวัฒนาการของสิ่งมีชีวิตในโปรคาริโอต: กรณีของแกมมา-โปรตีโอแบคทีเรีย" PLOS Biology . 1 (1) E19. doi : 10.1371/journal.pbio.0000019 . PMC 193605 . PMID 12975657 .  
  47. Zhaxybayeva O, Hamel L, Raymond J, Gogarten JP (2004). "การแสดงภาพเนื้อหาทางวิวัฒนาการของจีโนมทั้งห้าโดยใช้แผนที่รูปห้าเหลี่ยมสิบสี่" . Genome Biology . 5 (3) R20. doi : 10.1186/gb-2004-5-3-r20 . PMC 395770 . PMID 15003123 .  
  48. 1 2 Beiko RG, Harlow TJ, Ragan MA (ตุลาคม 2548). "ทางหลวงแห่งการแบ่งปันยีนในโปรคาริโอต" . Proceedings of the National Academy of Sciences of the United States of America . 102 (40): 14332– 7. Bibcode : 2005PNAS..10214332B . doi : 10.1073/pnas.0504068102 . PMC 1242295 . PMID 16176988 .  
  49. 1 2 3 4 Boc A, Philippe H, Makarenkov V (มีนาคม 2010). "การอนุมานและการตรวจสอบความถูกต้องของเหตุการณ์การถ่ายโอนยีนแนวนอนโดยใช้ความแตกต่างแบบแบ่งส่วน" . Systematic Biology . 59 (2). สำนักพิมพ์มหาวิทยาลัยออกซ์ฟอร์ด: 195– 211. doi : 10.1093/sysbio/syp103 . PMID 20525630 . 
  50. Zhaxybayeva O, Gogarten JP, Charlebois RL, Doolittle WF, Papke RT (กันยายน 2549). "การวิเคราะห์เชิงวิวัฒนาการของจีโนมไซยาโนแบคทีเรีย: การหาปริมาณเหตุการณ์การถ่ายโอนยีนในแนวนอน" . Genome Research . 16 (9): 1099– 108. doi : 10.1101/gr.5322306 . PMC 1557764 . PMID 16899658 .  
  51. Bansal MS, Banay G, Gogarten JP, Shamir R (กันยายน 2011). "การตรวจจับทางหลวงของการถ่ายทอดยีนแนวนอน". Journal of Computational Biology . 18 (9): 1087– 114. CiteSeerX 10.1.1.418.3658 . doi : 10.1089/cmb.2011.0066 . PMID 21899418 .  
  52. Bansal MS, Banay G, Harlow TJ, Gogarten JP, Shamir R (มีนาคม 2013). "การอนุมานอย่างเป็นระบบของทางหลวงของการถ่ายทอดยีนแนวนอนในโปรคาริโอต" . Bioinformatics . 29 (5): 571– 9. doi : 10.1093/bioinformatics/btt021 . PMID 23335015 . 
  53. 1 2 Hallett MT, Lagergren J. RECOMB 2001. มอนทรีออล: ACM; 2001. อัลกอริทึมที่มีประสิทธิภาพสำหรับปัญหาการถ่ายโอนยีนด้านข้าง; หน้า 149–156
  54. Baroni M, Grünewald S, Moulton V, Semple C (สิงหาคม 2548). "การจำกัดจำนวนเหตุการณ์การผสมข้ามสายพันธุ์เพื่อประวัติวิวัฒนาการที่สอดคล้องกัน". Journal of Mathematical Biology . 51 (2): 171– 82. doi : 10.1007/s00285-005-0315-9 . hdl : 10092/12222 . PMID 15868201 . S2CID 3180904 .  
  55. 1 2 Beiko RG, Hamilton N (กุมภาพันธ์ 2549). "การระบุเชิงวิวัฒนาการของเหตุการณ์การถ่ายโอนยีนด้านข้าง" . BMC Evolutionary Biology . 6 (1) 15. Bibcode : 2006BMCEE...6...15B . doi : 10.1186/1471-2148-6-15 . PMC 1431587 . PMID 16472400 .  
  56. 1 2 3 Boc A, Diallo AB, Makarenkov V (กรกฎาคม 2012). "T-REX: เว็บเซิร์ฟเวอร์สำหรับการอนุมาน การตรวจสอบความถูกต้อง และการแสดงภาพต้นไม้และเครือข่ายวิวัฒนาการ" . Nucleic Acids Research . 40 (W1). สำนักพิมพ์มหาวิทยาลัยออกซ์ฟอร์ด: W573-9. doi : 10.1093/nar/gks485 . PMC 3394261 . PMID 22675075 .  
  57. 1 2 Nakhleh L, Ruths DA, Wang L: RIATA-HGT: วิธีการฮิวริสติกที่รวดเร็วและแม่นยำสำหรับการสร้างการถ่ายโอนยีนแนวนอนขึ้นใหม่ COCOON, 16–29 สิงหาคม 2548; คุนหมิง 2548
  58. 1 2 Abby SS, Tannier E, Gouy M, Daubin V (มิถุนายน 2010). "การตรวจจับการถ่ายโอนยีนด้านข้างโดยการกระทบยอดทางสถิติของป่าวิวัฒนาการ" . BMC Bioinformatics . 11 324. doi : 10.1186/1471-2105-11-324 . PMC 2905365 . PMID 20550700 .  
  59. ฮิคกี้ จี, เดห์เน เอฟ, ราอู-แชปลิน เอ, บลูอิน ซี (กุมภาพันธ์ 2551) "การคำนวณระยะทาง SPR สำหรับต้นไม้ที่ไม่มีราก " ชีวสารสนเทศเชิงวิวัฒนาการออนไลน์4 EBO.S419: 17– 27. ดอย : 10.4137/ ebo.s419 PMC 2614206 . PMID 19204804 .  
  60. Hein J, Jiang T, Wang L, Zhang K (1996). "เกี่ยวกับความซับซ้อนของการเปรียบเทียบต้นไม้วิวัฒนาการ"คณิตศาสตร์ประยุกต์แบบไม่ต่อเนื่อง 71 ( 1– 3 ): 153– 169. doi : 10.1016/S0166-218X(96)00062-5 .
  61. Allen BL, Steel M (2001). "การดำเนินการถ่ายโอนซับทรีและเมตริกที่เหนี่ยวนำบนต้นไม้วิวัฒนาการ" Annals of Combinatorics . 5 : 1– 15. CiteSeerX 10.1.1.24.8389 . doi : 10.1007/s00026-001-8006-8 . S2CID 2934442 .  
  62. MacLeod D, Charlebois RL, Doolittle F, Bapteste E (เมษายน 2548). "การอนุมานเหตุการณ์การถ่ายโอนยีนด้านข้างที่น่าจะเป็นไปได้ผ่านการเปรียบเทียบแผนภูมิวิวัฒนาการโดยการรวมและการจัดเรียงใหม่แบบวนซ้ำ" . BMC Evolutionary Biology . 5 27. doi : 10.1186/1471-2148-5-27 . PMC 1087482 . PMID 15819979 .  
  63. 1 2 Whidden C, Zeh N, Beiko RG (กรกฎาคม 2557). "Supertrees Based on the Subtree Prune-and-Regraft Distance" . Systematic Biology . 63 (4): 566– 81. doi : 10.1093/sysbio/syu023 . PMC 4055872 . PMID 24695589 .  
  64. 1 2 Doyon JP, Hamel S, Chauve C (2012). "วิธีการที่มีประสิทธิภาพสำหรับการสำรวจพื้นที่ของการประนีประนอมต้นไม้ของยีน/ต้นไม้ของสปีชีส์ในกรอบงานเชิงความน่าจะเป็น" (PDF) . IEEE/ACM Transactions on Computational Biology and Bioinformatics . 9 (1): 26– 39. Bibcode : 2012ITCBB...9...26D . doi : 10.1109/TCBB.2011.64 . PMID 21464510 . S2CID 2493991 .  
  65. 1 2 David LA, Alm EJ (มกราคม 2011). "นวัตกรรมวิวัฒนาการอย่างรวดเร็วในช่วงการขยายตัวทางพันธุกรรมของอาร์เคียน" ( PDF) Nature . 469 (7328): 93– 6. Bibcode : 2011Natur.469...93D . doi : 10.1038/nature09649 . hdl : 1721.1/61263 . PMID 21170026 . S2CID 4420725 .  
  66. Szöllosi GJ, Boussau B, Abby SS, Tannier E, Daubin V (ตุลาคม 2012). "การสร้างแบบจำลองทางวิวัฒนาการของการถ่ายโอนยีนด้านข้างสร้างรูปแบบและช่วงเวลาสัมพัทธ์ของการเกิดสปีชีส์ใหม่" Proceedings of the National Academy of Sciences of the United States of America . 109 (43): 17513– 8. Bibcode : 2012PNAS..10917513S . doi : 10.1073/pnas.1202997109 . PMC 3491530 . PMID 23043116 .  
  67. Nguyen TH, Ranwez V, Pointet S, Chifolleau AM, Doyon JP, Berry V (เมษายน 2013). "การปรองดองและการจัดเรียงต้นไม้ของยีนในท้องถิ่นใหม่สามารถเป็นประโยชน์ร่วมกันได้" . Algorithms for Molecular Biology . 8 (1) 12. doi : 10.1186/1748-7188-8-12 . PMC 3871789 . PMID 23566548 .  
  68. Szöllosi GJ, Tannier E, Lartillot N, Daubin V (พฤษภาคม 2013). "การถ่ายทอดยีนด้านข้างจากผู้ตาย" . Systematic Biology . 62 (3): 386– 97. arXiv : 1211.4606 . doi : 10.1093/sysbio/syt003 . PMC 3622898 . PMID 23355531 .  
  69. Bansal MS, Alm EJ, Kellis M (มิถุนายน 2012). "อัลกอริทึมที่มีประสิทธิภาพสำหรับปัญหาการประนีประนอมกับยีนที่ซ้ำกัน การถ่ายโอนแนวนอน และการสูญเสีย" . Bioinformatics . 28 (12): i283-91. doi : 10.1093/bioinformatics/bts225 . PMC 3371857 . PMID 22689773 .  
  70. Majewski J, Zawadzki P, Pickerill P, Cohan FM, Dowson CG (กุมภาพันธ์ 2000). "อุปสรรคต่อการแลกเปลี่ยนทางพันธุกรรมระหว่างสายพันธุ์แบคทีเรีย: การเปลี่ยนแปลงของ Streptococcus pneumoniae"วารสารแบคทีริโอโลยี 182 ( 4): 1016– 23. Bibcode : 2000JBact.182.1016M . doi : 10.1128/jb.182.4.1016-1023.2000 . PMC 94378 . PMID 10648528 .  
  71. Sjöstrand J, Tofigh A, Daubin V, Arvestad L, Sennblad B, Lagergren J (พฤษภาคม 2014). "วิธีการแบบเบย์เซียนสำหรับการวิเคราะห์การถ่ายโอนยีนด้านข้าง" . Systematic Biology . 63 (3): 409– 20. doi : 10.1093/sysbio/syu007 . PMID 24562812 . 
  72. 1 2 Szöllõsi GJ, Rosikiewicz W, Boussau B, Tannier E, Daubin V (พฤศจิกายน 2013). "การสำรวจพื้นที่ของต้นไม้ลำดับยีนที่สอดคล้องกันอย่างมีประสิทธิภาพ" . Systematic Biology . 62 (6): 901– 12. arXiv : 1306.2167 . Bibcode : 2013arXiv1306.2167S . doi : 10.1093/sysbio/syt054 . PMC 3797637 . PMID 23925510 .  
  73. Haggerty LS, Jachiet PA, Hanage WP, Fitzpatrick DA, Lopez P, O'Connell MJ และคณะ (มีนาคม 2014). "บัญชีพหุภาคีของความเหมือนกัน: การปรับแบบจำลองให้เข้ากับข้อมูล" . ชีววิทยาโมเลกุลและวิวัฒนาการ . 31 (3): 501– 16. doi : 10.1093/molbev/mst228 . PMC 3935183 . PMID 24273322 .   
  74. Szöllősi GJ, Tannier E, Daubin V, Boussau B (January 2015). "The inference of gene trees with species trees". Systematic Biology. 64 (1): e42-62. doi:10.1093/sysbio/syu048. PMC 4265139. PMID 25070970.
  75. Lassalle F, Planel R, Penel S, Chapulliot D, Barbe V, Dubost A, et al. (December 2017). "Ancestral Genome Estimation Reveals the History of Ecological Diversification in Agrobacterium". Genome Biology and Evolution. 9 (12): 3413–3431. doi:10.1093/gbe/evx255. PMC 5739047. PMID 29220487.
  76. Duchemin W, Anselmetti Y, Patterson M, Ponty Y, Bérard S, Chauve C, et al. (May 2017). "DeCoSTAR: Reconstructing the Ancestral Organization of Genes or Genomes Using Reconciled Phylogenies". Genome Biology and Evolution. 9 (5): 1312–1319. doi:10.1093/gbe/evx069. PMC 5441342. PMID 28402423.
  77. Koski LB, Golding GB (June 2001). "The closest BLAST hit is often not the nearest neighbor". Journal of Molecular Evolution. 52 (6): 540–2. Bibcode:2001JMolE..52..540K. doi:10.1007/s002390010184. PMID 11443357. S2CID 24848333.
  78. Wisniewski-Dyé F, Borziak K, Khalsa-Moyers G, Alexandre G, Sukharnikov LO, Wuichet K, et al. (December 2011). Richardson PM (ed.). "Azospirillum genomes reveal transition of bacteria from aquatic to terrestrial environments". PLOS Genetics. 7 (12) e1002430. doi:10.1371/journal.pgen.1002430. PMC 3245306. PMID 22216014.
  79. Zuckerkandl, E. and Pauling, L.B. 1965. Evolutionary divergence and convergence in proteins. In Bryson, V.and Vogel, H.J. (editors). Evolving Genes and Proteins. Academic Press, New York. pp. 97–166.
  80. Novichkov PS, Omelchenko MV, Gelfand MS, Mironov AA, Wolf YI, Koonin EV (ตุลาคม 2547). "นาฬิกาโมเลกุลทั่วทั้งจีโนมและการถ่ายโอนยีนแนวนอนในวิวัฒนาการของแบคทีเรีย"วารสารแบคทีเรียวิทยา 186 ( 19): 6575– 85. Bibcode : 2004JBact.186.6575N . doi : 10.1128/JB.186.19.6575-6585.2004 . PMC 516599 . PMID 15375139 .  
  81. Lawrence JG, Hartl DL (กรกฎาคม 1992). "การอนุมานการถ่ายทอดทางพันธุกรรมแนวนอนจากข้อมูลโมเลกุล: แนวทางโดยใช้บูตสแตรป"พันธุศาสตร์ 131 ( 3): 753– 60. doi : 10.1093/genetics/131.3.753 . PMC 1205046 . PMID 1628816 .  
  82. Clarke GD, Beiko RG, Ragan MA, Charlebois RL (เมษายน 2545). "การอนุมานแผนภูมิจีโนมโดยใช้ตัวกรองเพื่อกำจัดลำดับที่ไม่สอดคล้องกันทางวิวัฒนาการและเมทริกซ์ระยะทางตามคะแนน BLASTP ที่ปรับค่าเฉลี่ยแล้ว"วารสารแบคทีริโอโลยี 184 ( 8): 2072– 80. doi : 10.1128/jb.184.8.2072-2080.2002 . PMC 134965 . PMID 11914337 .  
  83. Pellegrini M, Marcotte EM, Thompson MJ, Eisenberg D, Yeates TO (เมษายน 1999). "การกำหนดหน้าที่ของโปรตีนโดยการวิเคราะห์จีโนมเปรียบเทียบ: โปรไฟล์วิวัฒนาการของโปรตีน" Proceedings of the National Academy of Sciences of the United States of America . 96 (8): 4285– 8. Bibcode : 1999PNAS...96.4285P . doi : 10.1073/pnas.96.8.4285 . PMC 16324 . PMID 10200254 .  
  84. Normand P, Lapierre P, Tisa LS, Gogarten JP, Alloisio N, Bagnarol E และคณะ (มกราคม 2550). "ลักษณะทางพันธุกรรมของสายพันธุ์ Frankia sp. ที่เป็น symbiotic แบบไม่บังคับ สะท้อนถึงช่วงโฮสต์และชีวภูมิศาสตร์ของพืชโฮสต์" . Genome Research . 17 (1): 7– 15. doi : 10.1101/gr.5798407 . PMC 1716269 . PMID 17151343 .   
  85. 1 2 Welch RA, Burland V, Plunkett G, Redford P, Roesch P, Rasko D และคณะ (ธันวาคม 2002). "โครงสร้างโมเสกที่กว้างขวางซึ่งเปิดเผยโดยลำดับจีโนมที่สมบูรณ์ของ Escherichia coli ที่ก่อโรคทางเดินปัสสาวะ" Proceedings of the National Academy of Sciences of the United States of America . 99 (26): 17020– 4. Bibcode : 2002PNAS...9917020W . doi : 10.1073/pnas.252529799 . PMC 139262 . PMID 12471157 .   
  86. Csűrös MS (2008). "การสร้างบรรพบุรุษขึ้นใหม่โดยใช้ความประหยัดแบบ Wagner ที่ไม่สมมาตรเหนือลักษณะต่อเนื่องและความประหยัดแบบกำลังสองเหนือการกระจาย" จีโนมิกส์เชิงเปรียบเทียบ บันทึก การบรรยายในวิทยาศาสตร์คอมพิวเตอร์ เล่มที่5267 หน้า72–86 doi : 10.1007/978-3-540-87989-3_6 ISBN   978-3-540-87988-6. S2CID 10717969 . 
  87. Pagel M (ตุลาคม 1999). "การอนุมานรูปแบบทางประวัติศาสตร์ของวิวัฒนาการทางชีววิทยา" Nature . 401 (6756): 877– 84. Bibcode : 1999Natur.401..877P . doi : 10.1038/44766 . hdl : 2027.42/148253 . PMID 10553904 . S2CID 205034365 .  
  88. 1 2 Csurös M, Miklós I (กันยายน 2552). "การปรับปรุงและจีโนมบรรพบุรุษขนาดใหญ่ในอาร์เคียที่อนุมานด้วยแบบจำลองการเกิดและการตายทางวิวัฒนาการ" . ชีววิทยาโมเลกุลและวิวัฒนาการ . 26 (9): 2087– 95. doi : 10.1093/molbev/msp123 . PMC 2726834 . PMID 19570746 .  
  89. Hao W, Golding GB (กันยายน 2010). "การอนุมานฟลักซ์จีโนมแบคทีเรียโดยพิจารณายีนที่ถูกตัดทอน"พันธุศาสตร์ 186 ( 1): 411– 26. doi : 10.1534/genetics.110.118448 . PMC 2940306 . PMID 20551435 .  
  90. Hao W, Golding GB (พฤษภาคม 2549). "ชะตากรรมของยีนที่ถ่ายโอนข้ามสายพันธุ์: ชีวิตในเส้นทางที่รวดเร็วสู่การปรับตัวหรือความตาย" . Genome Research . 16 (5): 636– 43. doi : 10.1101/gr.4746406 . PMC 1457040 . PMID 16651664 .  
  91. Hao W, Golding GB (พฤษภาคม 2008). "การค้นพบความแปรผันของอัตราการถ่ายโอนยีนด้านข้างระหว่างวิวัฒนาการของจีโนมแบคทีเรีย" . BMC Genomics . 9 : 235. doi : 10.1186/1471-2164-9-235 . PMC 2426709 . PMID 18492275 .  
  92. Ochman H, Lawrence JG, Groisman EA (พฤษภาคม 2000). "การถ่ายทอดยีนด้านข้างและธรรมชาติของนวัตกรรมแบคทีเรีย" Nature . 405 (6784): 299– 304. Bibcode : 2000Natur.405..299O . doi : 10.1038/35012500 . PMID 10830951 . S2CID 85739173 .  
  93. Papke RT, Koenig JE, Rodríguez-Valera F, Doolittle WF (ธันวาคม 2004). "การเกิดการรวมตัวใหม่บ่อยครั้งในประชากร Halorubrum ในบ่อเกลือ" Science . 306 (5703): 1928– 9. Bibcode : 2004Sci...306.1928P . doi : 10.1126/science.1103289 . PMID 15591201 . S2CID 21595153 .  
  94. Mau B, Glasner JD, Darling AE, Perna NT (2006). "การตรวจจับและการวิเคราะห์การรวมตัวของโฮโมโลกัสทั่วทั้งจีโนมในสายพันธุ์ Escherichia coli ที่ได้รับการจัดลำดับ" . Genome Biology . 7 (5) R44. Bibcode : 2006GenBi...7..R44M . doi : 10.1186/gb-2006-7-5-r44 . PMC 1779527 . PMID 16737554 .  
  95. Didelot X, Falush D (มีนาคม 2550). "การอนุมานวิวัฒนาการระดับจุลภาคของแบคทีเรียโดยใช้ข้อมูลลำดับหลายตำแหน่ง"พันธุศาสตร์ 175 ( 3): 1251– 66. doi : 10.1534/genetics.106.063305 . PMC 1840087 . PMID 17151252 .  
  96. Ragan MA (กรกฎาคม 2544). "เกี่ยวกับวิธีการทดแทนสำหรับการตรวจจับการถ่ายทอดยีนด้านข้าง" . FEMS Microbiology Letters . 201 (2): 187– 91. Bibcode : 2001FEMML.201..187R . doi : 10.1111/j.1574-6968.2001.tb10755.x . PMID 11470360 . 
  97. Ragan MA, Harlow TJ, Beiko RG (มกราคม 2549). "วิธีการทดแทนที่แตกต่างกันสามารถตรวจจับเหตุการณ์การถ่ายโอนทางพันธุกรรมด้านข้างที่มีอายุสัมพัทธ์ต่างกันได้หรือไม่?" Trends in Microbiology . 14 (1): 4– 8. doi : 10.1016/j.tim.2005.11.004 . PMID 16356716 . 
  98. Kechris KJ, Lin JC, Bickel PJ, Glazer AN (มิถุนายน 2549). "การสำรวจเชิงปริมาณของการเกิดการถ่ายโอนยีนด้านข้างโดยใช้ยีนตรึงไนโตรเจนเป็นกรณีศึกษา" Proceedings of the National Academy of Sciences of the United States of America . 103 (25): 9584– 9. Bibcode : 2006PNAS..103.9584K . doi : 10.1073 / pnas.0603534103 . PMC 1480450. PMID 16769896 .  
  99. Moran NA, Jarvik T (เมษายน 2010). "การถ่ายทอดยีนจากเชื้อราในแนวราบเป็นพื้นฐานของการผลิตแคโรทีนอยด์ในเพลี้ย" Science . 328 (5978): 624– 7. Bibcode : 2010Sci...328..624M . doi : 10.1126/science.1187113 . PMID 20431015 . S2CID 14785276 .  
  100. Danchin EG, Rosso MN, Vieira P, de Almeida-Engler J, Coutinho PM, Henrissat B, Abad P (ตุลาคม 2010). "การถ่ายโอนยีนด้านข้างหลายครั้งและการทำสำเนาซ้ำได้ส่งเสริมความสามารถในการเป็นปรสิตพืชในไส้เดือนฝอย" Proceedings of the National Academy of Sciences of the United States of America . 107 (41): 17651– 6. Bibcode : 2010PNAS..10717651D . doi : 10.1073/pnas.1008486107 . PMC 2955110 . PMID 20876108 .  
  101. Fletcher W, Yang Z (สิงหาคม 2552). "INDELible: โปรแกรมจำลองวิวัฒนาการลำดับทางชีวภาพที่ยืดหยุ่น" . Molecular Biology and Evolution . 26 (8): 1879– 88. doi : 10.1093/molbev/msp098 . PMC 2712615 . PMID 19423664 .  
  102. Sipos B, Massingham T, Jordan GE, Goldman N (เมษายน 2011). "PhyloSim - การจำลองมอนเตคาร์โลของการวิวัฒนาการลำดับในสภาพแวดล้อมการคำนวณทางสถิติ R" . BMC Bioinformatics . 12 104. doi : 10.1186/1471-2105-12-104 . PMC 3102636 . PMID 21504561 .  
  103. Galtier N (สิงหาคม 2550). "แบบจำลองการถ่ายทอดยีนแนวนอนและปัญหาวิวัฒนาการของแบคทีเรีย" . Systematic Biology . 56 (4): 633– 42. doi : 10.1080/10635150701546231 . PMID 17661231 . 
  104. Dalquen DA, Anisimova M, Gonnet GH, Dessimoz C (เมษายน 2012). "ALF--กรอบการจำลองสำหรับการวิวัฒนาการของจีโนม" . ชีววิทยาโมเลกุลและวิวัฒนาการ . 29 (4): 1115– 23. doi : 10.1093/molbev/msr268 . PMC 3341827 . PMID 22160766 .  
  105. Cortez DQ, Lazcano A, Becerra A (2005). "การวิเคราะห์เปรียบเทียบวิธีการตรวจจับยีนที่ถ่ายทอดในแนวนอน: การประเมินใหม่ของแบบจำลองมาร์คอฟลำดับที่หนึ่ง" In Silico Biology . 5 ( 5– 6): 581– 92. doi : 10.3233/ISB-00212 . PMID 16610135 . 
  106. Tsirigos A, Rigoutsos I (2005). "วิธีการคำนวณใหม่สำหรับการตรวจจับเหตุการณ์การถ่ายโอนยีนแนวนอน" . Nucleic Acids Research . 33 (3): 922– 33. doi : 10.1093/nar/gki187 . PMC 549390 . PMID 15716310 .  
  107. Azad RK, Lawrence JG (พฤศจิกายน 2548). "การใช้จีโนมเทียมในการประเมินวิธีการตรวจจับยีนที่ผิดปกติ" PLOS Computational Biology 1 (6) e56. Bibcode : 2005PLSCB ...1...56A . doi : 10.1371/journal.pcbi.0010056 . PMC 1282332 . PMID 16292353 .  
  108. Iantorno S, Gori K, Goldman N, Gil M, Dessimoz C (2014). "ใครเฝ้าดูผู้เฝ้าดู? การประเมินเกณฑ์มาตรฐานสำหรับการจัดเรียงลำดับหลายลำดับ" วิธีการจัดเรียงลำดับหลายลำดับวิธีการในชีววิทยาระดับโมเลกุล เล่มที่1079หน้า59–73 arXiv : 1211.2160 doi : 10.1007 /978-1-62703-646-7_4 ISBN   978-1-62703-645-0. PMID 24170395 . S2CID 2363657 .  
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Inferring_horizontal_gene_transfer&oldid=1337372408 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การอนุมานการถ่ายทอดยีนในแนวนอน

การถ่ายทอดยีนในแนวนอนหรือด้านข้าง (HGT หรือ LGT) คือการส่งผ่านส่วนของดีเอ็นเอ จี โนม ระหว่างสิ่งมีชีวิตผ่านกระบวนการที่แยกออกจาก การถ่ายทอดทางพันธุกรรมในแนวดิ่ง...

ภาพรวม

การถ่ายทอดยีนในแนวนอนถูกสังเกตครั้งแรกในปี พ.ศ. 2461 ใน การทดลอง ของ Frederick Griffith ซึ่งแสดงให้เห็นว่าความรุนแรงสามารถถ่ายทอดจากสายพันธุ์ที่ก่อโรคไปยังสายพันธุ์ที่ไม่ก่อโรคของ Streptococcus pneumoniae ได้ Griffith...

วิธีการเชิงพารามิเตอร์

วิธีการเชิงพารามิเตอร์ในการอนุมาน HGT ใช้ลักษณะเฉพาะของลำดับจีโนมที่เฉพาะเจาะจงกับสายพันธุ์หรือ กลุ่มสายพันธุ์ ซึ่งเรียกอีกอย่างว่า ลายเซ็นทางจีโนม หากชิ้นส่วนของจีโนมเบี่ยงเบนอย่างมากจากลายเซ็นทางจีโนม นี่เป็นสัญญาณของการถ่ายโอนแนวนอนที่อาจเกิดขึ้นได้...

องค์ประกอบของนิวคลีโอไทด์

ปริมาณ GC ของแบคทีเรียอยู่ในช่วงกว้าง โดย Ca. Zinderia insecticola มีปริมาณ GC 13.