อ่าน 14 นาที
การบูรณาการข้อมูลหลายโอไมซ์ระดับเซลล์เดี่ยว
การบูรณาการมัลติโอมิกส์ระดับเซลล์เดี่ยวหมายถึงชุดวิธีการคำนวณที่ใช้ในการประสานข้อมูลจาก " โอม " หลายๆ แบบ เพื่อวิเคราะห์ปรากฏการณ์ทางชีวภาพร่วมกัน
การบูรณาการข้อมูลหลายโอไมซ์ระดับเซลล์เดี่ยว

การบูรณาการมัลติโอมิกส์ระดับเซลล์เดี่ยวหมายถึงชุดวิธีการคำนวณที่ใช้ในการประสานข้อมูลจาก " โอม " หลายๆ แบบ เพื่อวิเคราะห์ปรากฏการณ์ทางชีวภาพร่วมกัน[ 2 ] [ 3 ] [ 4 ] [ 5 ]แนวทางนี้ช่วยให้นักวิจัยสามารถค้นพบความสัมพันธ์ที่ซับซ้อนระหว่างรูปแบบทางเคมี-กายภาพที่แตกต่างกัน โดยการเชื่อมโยงข้ามชั้นโมเลกุลต่างๆ พร้อมกัน วิธีการบูรณาการมัลติโอมิกส์สามารถแบ่งออกเป็น 4 ประเภทใหญ่ๆ ได้แก่ วิธีการบูรณาการช่วงต้น วิธีการบูรณาการช่วงกลาง และวิธีการบูรณาการช่วงปลาย[ 6 ]การบูรณาการมัลติโอมิกส์สามารถเพิ่มความแข็งแกร่งของการทดลองได้โดยการจัดหาแหล่งหลักฐานอิสระเพื่อตอบคำถามสมมติฐาน ใช้ประโยชน์จากจุดแข็งเฉพาะของแต่ละรูปแบบเพื่อชดเชยจุดอ่อนของรูปแบบอื่นผ่านการประมาณค่า และนำเสนอการจัดกลุ่มและการแสดงภาพเซลล์ประเภทต่างๆ ที่สอดคล้องกับความเป็นจริงมากขึ้น[ 2 ] [ 3 ]
พื้นหลัง
การเกิดขึ้นของ เทคโนโลยี การจัดลำดับจีโนมระดับเซลล์เดี่ยวได้ปฏิวัติความเข้าใจของเราเกี่ยวกับความหลากหลายของเซลล์ เผยให้เห็นภูมิทัศน์ที่ละเอียดอ่อนของประเภทเซลล์และความสัมพันธ์กับกระบวนการทางชีวภาพ เทคโนโลยีโอไมซ์ระดับเซลล์เดี่ยวได้ขยายขอบเขตไปไกลกว่าทรานสคริปโตมเพื่อสร้างโปรไฟล์คุณสมบัติทางกายภาพและเคมีที่หลากหลายในระดับเซลล์เดี่ยว รวมถึงจี โนม / เอ็กโซมทั้งหมด การเมทิลเลชั่ นของ DNA การเข้าถึงโครมาติน การดัดแปลง ฮิสโตน เอพิทรานสคริปโตม (เช่น mRNA, microRNA , tRNA, lncRNA) โปรตีโอมฟอสโฟโปรตีโอมเมตาโบโลมและอื่นๆ[ 4 ] [ 7 ] [ 8 ]ในความเป็นจริง มีคลังข้อมูลชุดข้อมูลเซลล์เดี่ยวที่เปิดเผยต่อสาธารณะเพิ่มมากขึ้น ตัวอย่างเช่น ฐานข้อมูลที่กำลังเติบโต เช่นโครงการ Human Cell Atlas Project (HCA) โครงการ Cancer Genome Atlas (TCGA)และโครงการENCODE [ 9 ] [ 10 ] [ 11 ] [ 12 ] [ 13 ]ด้วยความหลากหลายที่เพิ่มขึ้นทั้งในชุดข้อมูลที่มีอยู่และประเภทข้อมูลการบูรณาการข้อมูลมัลติโอมิกส์และการวิเคราะห์ข้อมูลมัลติโมดอลถือเป็นเส้นทางสำคัญสำหรับอนาคตของชีววิทยา ระบบ
การบูรณาการมัลติโอมิกส์ระดับเซลล์เดี่ยวสามารถเปิดเผยความสัมพันธ์ที่ถูกมองข้ามระหว่างรูปแบบทางเคมีและกายภาพ ขยายคำจำกัดความของสถานะเซลล์ให้กว้างขึ้นกว่าโปรไฟล์คุณลักษณะรูปแบบเดียว และให้หลักฐานอิสระระหว่างการวิเคราะห์เพื่อสนับสนุนการทดสอบสมมติฐานทางชีววิทยา อย่างไรก็ตามมิติ ที่สูง (คุณลักษณะ > การสังเกต) ความแปรปรวนทางเทคนิคและทางชีววิทยาแบบสุ่มในระดับสูงและความเบาบางของข้อมูลเซลล์เดี่ยว (ประสิทธิภาพการกู้คืนโมเลกุลต่ำ) ทำให้การบูรณาการเชิงคำนวณเป็นปัญหาที่ท้าทาย[ 14 ] [ 15 ] [ 16 ] [ 17 ]ยิ่งไปกว่านั้น มีโซลูชันที่แตกต่างกันสำหรับการบูรณาการมัลติโอมิกส์ขึ้นอยู่กับปัจจัยต่างๆ เช่น ข้อมูลตรงกัน (การวัดพร้อมกันที่ได้มาจากเซลล์เดียวกัน) หรือไม่ตรงกัน (การวัดที่ได้มาจากเซลล์ที่แตกต่างกัน) มีคำอธิบายประกอบประเภทเซลล์หรือไม่ หรือมีการแปลงคุณลักษณะรูปแบบหรือไม่ โดยมีการใช้งานที่แตกต่างกันเพื่อให้เหมาะกับกรณีการใช้งาน เฉพาะ [ 2 ]ด้วยเหตุนี้ จึงมีแนวทางการบูรณาการข้อมูลเซลล์เดี่ยวหลายวิธี แต่ละวิธีมีกรณีการใช้งานที่แตกต่างกัน และแต่ละวิธีมีข้อดีและข้อเสียของตัวเอง[ 2 ] [ 6 ] [ 18 ]
แนวทางการบูรณาการข้อมูลหลายโอไมซ์
การบูรณาการในระยะเริ่มต้น
การบูรณาการเบื้องต้นเป็นวิธีการที่เชื่อมต่อ (โดยการผูกแถวและคอลัมน์) ชุดข้อมูลโอไมซ์สองชุดขึ้นไปเข้าด้วยกันเป็นเมทริกซ์ข้อมูลเดียว[ 19 ] [ 20 ]ข้อดีบางประการของการบูรณาการเบื้องต้นคือ วิธีการนี้เรียบง่าย ตีความได้ง่าย และสามารถจับความสัมพันธ์ระหว่างคุณลักษณะจากรูปแบบต่างๆ ได้ การบูรณาการเบื้องต้นส่วนใหญ่ใช้เพื่อรวมชุดข้อมูลประเภทเดียวกัน (เช่น การบูรณาการชุดข้อมูล scRNA-seq สองชุดที่แตกต่างกัน) ทั้งนี้เนื่องจากการบูรณาการชุดข้อมูลจากรูปแบบต่างๆ อาจนำไปสู่ชุดคุณลักษณะที่รวมกันซึ่งมีช่วงค่าคุณลักษณะที่แปรผันได้ ตัวอย่างเช่น ข้อมูลการแสดงออกมักครอบคลุมช่วงที่กว้างกว่าเมื่อเทียบกับข้อมูลการเข้าถึง ซึ่งโดยทั่วไปจะมีช่วงระหว่างค่า 0 ถึง 2
วิธีการบูรณาการในระยะเริ่มต้นมักสร้างเมทริกซ์ข้อมูลที่มีมิติสูงกว่าเมทริกซ์เดิม ดังนั้น วิธี การลดมิติเช่นการเลือกคุณลักษณะและการสกัดคุณลักษณะจึงมักเป็นขั้นตอนที่จำเป็นสำหรับการวิเคราะห์ในขั้นตอนต่อไป การเลือกคุณลักษณะเกี่ยวข้องกับการคงไว้เฉพาะตัวแปรที่สำคัญจากชั้นข้อมูลโอไมค์เดิม ในขณะที่การสกัดคุณลักษณะจะแปลงคุณลักษณะอินพุตเดิมให้เป็นส่วนผสมของคุณลักษณะเดิม การฉายภาพข้อมูลที่มีมิติสูงไปยังพื้นที่ที่มีมิติต่ำกว่าจะช่วยลดสัญญาณรบกวนและทำให้ชุดข้อมูลง่ายขึ้น ส่งผลให้การจัดการข้อมูลง่ายขึ้น
การบูรณาการระดับกลาง
การบูรณาการระดับกลางอธิบายถึงแนวทางประเภทหนึ่งที่มุ่งวิเคราะห์ชุดข้อมูลโอไมค์หลายชุดพร้อมกันโดยไม่จำเป็นต้องมีการแปลงข้อมูลล่วงหน้า (เนื่องจากเกิดขึ้นระหว่างการบูรณาการข้อมูล) [ 19 ] [ 20 ]ตัวอย่างหลายประการของการบูรณาการระดับกลาง ได้แก่ การบูรณาการตามความคล้ายคลึง การลดมิติร่วม และการสร้างแบบจำลองทางสถิติ
การบูรณาการตามความคล้ายคลึงกัน
การบูรณาการตามความคล้ายคลึงมีเป้าหมายเพื่อระบุรูปแบบในชุดข้อมูลหลายโอไมซ์โดยใช้การจัดกลุ่มสเปกตรัม (เช่น Spectrum [ 21 ]และ PC-MSC [ 22 ] ) การจัดกลุ่มสเปกตรัมจะจัดกลุ่มเซลล์ตามเมทริกซ์ความคล้ายคลึงที่ได้มาจากชุดข้อมูลหลายโอไมซ์หรืออัลกอริทึมการรวมกราฟ (เช่น Seurat4) ซึ่งสร้างกราฟจากเลเยอร์โอไมซ์แต่ละชั้นและรวมเข้าเป็นกราฟเดียว[ 23 ]
การลดขนาดข้อต่อ
การลดมิติร่วมมีเป้าหมายเพื่อลดความซับซ้อนของข้อมูลมัลติโอมิกส์โดยการฉายภาพการสังเกตไปยังพื้นที่แฝงที่ มีมิติต่ำกว่า เพื่อให้สามารถวิเคราะห์เลเยอร์โอมิกส์ที่แตกต่างกันได้พร้อมกัน[ 24 ]การวิเคราะห์ความสัมพันธ์แบบแคนอนิก (CCA)การแยกตัวประกอบเมทริกซ์ที่ไม่เป็นลบ (NMF)และการจัดเรียงแมนิโฟลด์เป็นแนวทางที่นิยมสำหรับการลดมิติร่วม เครื่องมือที่ใช้ CCA หรือ CCA แบบเบาบางที่เป็นอนุพันธ์ เช่น Seurat3 [ 25 ]และ bindSC [ 26 ] ระบุความสัมพันธ์เชิงเส้นระหว่างชุดข้อมูลโดยการระบุการรวมกันเชิงเส้นของตัวแปรที่เพิ่มความสัมพันธ์ของคุณลักษณะให้สูงสุด เครื่องมือที่ใช้ NMF (เช่น LIGER [ 27 ]และ coupledNMF [ 28 ] ) สกัดการแสดงข้อมูลที่มีมิติต่ำจากข้อมูลที่มีมิติสูง เพื่อให้สามารถระบุปัจจัยที่ใช้ร่วมกันและปัจจัยเฉพาะชุดข้อมูลในชุดข้อมูลโอมิกส์หลายชุดได้ การจัดเรียงแบบแมนิโฟลด์ (เช่น MATCHER [ 29 ]และ MAGAN [ 30 ] ) หมายถึงแนวทางที่การแสดงข้อมูลหลายโอไมซ์ในมิติที่ต่ำกว่าจะถูกคำนวณแยกกัน จากนั้นจึงแสดงเป็นพื้นที่แฝงร่วมกัน
การสร้างแบบจำลองทางสถิติ
สามารถใช้แนวทางทางสถิติต่างๆ รวมถึง กรอบงานการสร้างแบบจำลอง แบบเบย์เซียนเชิง ความน่าจะเป็น (ซึ่งช่วยให้สามารถรวมความรู้ก่อนหน้าและความไม่แน่นอนเข้ากับการวิเคราะห์ได้) เพื่อบูรณาการชุดข้อมูลหลายโอไมซ์ ตัวอย่างเช่น BREM-SC [ 31 ]ใช้กรอบงานการจัดกลุ่มแบบเบย์เซียนเพื่อจัดกลุ่มชุดข้อมูลหลายโอไมซ์ร่วมกัน ในขณะที่เครื่องมืออื่นๆ เช่น clonealign ใช้ระเบียบวิธีแบบเบย์เซียนเพื่อบูรณาการการแสดงออกของยีนและโปรไฟล์จำนวนสำเนาเพื่อศึกษาโคลนมะเร็ง
การบูรณาการล่าช้า
การบูรณาการแบบล่าช้ามีเป้าหมายเพื่อประมวลผลและสร้างแบบจำลองโมดาลิตีโอมิกส์แยกกัน จากนั้นจึงรวมแบบจำลองทั้งสองเข้าด้วยกันในตอนท้าย[ 19 ] [ 20 ]ข้อดีของการบูรณาการแบบล่าช้าคือสามารถใช้เครื่องมือที่ปรับแต่งมาสำหรับแต่ละโมดาลิตีโอมิกส์ได้ ในขณะที่วิธีการบูรณาการแบบล่าช้ามักใช้ในบริบทของการศึกษามัลติโอมิกส์แบบกลุ่ม (เช่น การวิเคราะห์คลัสเตอร์ของคลัสเตอร์[ 32 ]และการจัดกลุ่มแบบบูรณาการการเรียนรู้เคอร์เนล[ 33 ] ) วิธีการบูรณาการแบบล่าช้าสำหรับการบูรณาการเซลล์เดี่ยวยังคงเป็นสาขาใหม่ ตัวอย่างเช่น เทคนิค การเรียนรู้แบบกลุ่มเช่น การจัดกลุ่มแบบกลุ่ม (เช่น การจัดกลุ่ม SAME [ 34 ] Sc-GPE [ 35 ] EC-PGMGR [ 36 ] ) ได้แสดงให้เห็นถึงศักยภาพในการรวบรวมผลลัพธ์การจัดกลุ่มจากแหล่งต่างๆ วิธีการเหล่านี้รวมผลลัพธ์การจัดกลุ่มจากชุดข้อมูลโอไมค์ต่างๆ เพื่อสร้างการจัดกลุ่มแบบฉันทามติ ซึ่งจำลองความสัมพันธ์ระหว่างผลลัพธ์การจัดกลุ่มแต่ละรายการ เพื่อค้นหาโซลูชันการจัดกลุ่มโดยรวมที่ดีขึ้นในรูปแบบต่างๆ
เนื่องจากการบูรณาการล่าช้าเกี่ยวข้องกับการวิเคราะห์แต่ละชั้นโอไมซ์แยกกันก่อนที่จะบูรณาการผลลัพธ์เข้ากับผลลัพธ์ที่เป็นเอกฉันท์ จึงอาจไม่สามารถจับภาพปฏิสัมพันธ์และความสัมพันธ์ระหว่างโมดาลิตีโอไมซ์ที่แตกต่างกันได้ ดังนั้นบางกลุ่มจึงโต้แย้งว่าการบูรณาการล่าช้าแสดงถึงการวิเคราะห์โอไมซ์เดี่ยวแบบขนานหลายครั้งที่ดำเนินการกับข้อมูลหลายประเภท แทนที่จะบรรลุ "เป้าหมายที่แท้จริง" ของการบูรณาการหลายโอไมซ์ ซึ่งก็คือการค้นพบความสัมพันธ์ระหว่างโอไมซ์ที่มีอยู่ในข้อมูลหลายโอไมซ์[ 20 ]
| เครื่องมือ | รองรับวิธีการวัดมาตรฐาน | กลยุทธ์การบูรณาการ |
|---|---|---|
| BindSC [ 26 ] | ทรานสคริปโตมและการเข้าถึงโครมาติน | ระดับกลาง |
| BREM-SC [ 31 ] | ทรานสคริปโตมและโปรตีโอม | ระดับต้นหรือระดับกลาง |
| CiteFuse [ 37 ] | ทรานสคริปโตมและโปรตีโอม | ช้า |
| โคลนอะไลน์[ 38 ] | ทรานสคริปโตมและจีโนม | ระดับกลาง |
| CoupledNMF [ 28 ] | ข้อมูลทรานสคริปโตมและการเข้าถึงโครมาติน | ระดับกลาง |
| ไลเกอร์[ 27 ] | ทรานสคริปโตม การแสดงออกของยีนเชิงพื้นที่ เมทิลโลม และการเข้าถึงโครมาติน | ระดับกลาง |
| มากัน[ 30 ] | การตรวจทางอิมมูโนฮิสโตเคมีแบบมัลติเพล็กซ์และทรานสคริปโตม | ระดับกลาง |
| MMD-MA [ 39 ] | ทรานสคริปโตมและเมทิลโลม | ระดับกลาง |
| MOFA+ [ 40 ] | ทรานสคริปโตมและการเข้าถึงโครมาติน | ระดับต้นหรือระดับกลาง |
| แผนผัง[ 41 ] | ทรานสคริปโตม การเข้าถึงโครมาติน และการแสดงออกของยีนเชิงพื้นที่ | ระดับกลาง |
| scMVAE [ 42 ] | ทรานสคริปโตมและการเข้าถึงโครมาติน | ระดับกลาง |
| เซอราต์3 [ 25 ] | ทรานสคริปโตมและการเข้าถึงโครมาติน | ระดับกลางหรือปลาย |
| เซอราต์4 [ 43 ] | ทรานสคริปโตม การเข้าถึงโครมาติน และโปรตีโอม | ระดับกลางหรือปลาย |
| เซอราต์5 [ 44 ] | ทรานสคริปโตม โปรตีโอม เมทิลโลม และแฮชแท็กโอลิโก | ระดับกลางหรือปลาย |
| สเปกตรัม[ 21 ] | ทรานสคริปโตม ไมโครอาร์เอ็นเอ และโปรตีโอม | ระดับกลาง |
| TotalVI [ 45 ] | ทรานสคริปโตมและโปรตีโอม | ระดับกลาง |
| ยูนิคอม[ 46 ] | ทรานสคริปโตมและเมทิลโลม | ระดับกลาง |
ข้อควรพิจารณาสำหรับการบูรณาการข้อมูลมัลติโอมิกส์
เสียงรบกวน
เนื่องจากข้อมูลเซลล์เดี่ยวมีแนวโน้มที่จะเกิดสัญญาณรบกวนจากทั้งแหล่งชีวภาพและทางเทคนิค การพัฒนาวิธีการลดสัญญาณรบกวนที่มีประสิทธิภาพเพื่อลดสัญญาณรบกวนจึงอาจมีความจำเป็น[ 47 ]ในบริบทของการทดลองเซลล์เดี่ยว ความแปรปรวนทางชีวภาพที่เกิดจากปัจจัยต่างๆ เช่นการระเบิดของการถอดรหัส ความแตกต่างในวงจรเซลล์ และสภาพแวดล้อมจุลภาคของเซลล์ อาจทำให้เกิดสัญญาณรบกวนในชุดข้อมูล นอกจากนี้ ความแปรปรวนทางเทคนิคที่เกิดจากปัจจัยต่างๆ เช่น คุณภาพลำดับที่ไม่ดี ความครอบคลุมของลำดับที่ไม่สม่ำเสมอและการปนเปื้อนของตัวอย่าง ก็ต้องได้รับการแก้ไขด้วยเช่นกัน
ความเข้ากันได้ของชุดข้อมูล
การบูรณาการโมดาลิตีโอมิกส์ที่แตกต่างกันอาจเป็นเรื่องท้าทายเนื่องจากโครงสร้างที่แตกต่างกันของชุดข้อมูลต่างๆ[ 48 ]ตัวอย่างเช่น คุณลักษณะ scRNA-seq จะแสดงบนมาตราส่วนต่อเนื่อง ในขณะที่ข้อมูลการเข้าถึงโครมาติน (เช่น scATAC-seq) มีค่าอยู่ระหว่าง 0-2 (สำเนาสองชุดของแต่ละภูมิภาคต่อเซลล์) ดังนั้น การบูรณาการโมดาลิตีที่แตกต่างกันอาจต้องใช้ขั้นตอนเพิ่มเติมในการแปลงชุดข้อมูลให้เป็นพื้นที่แฝงร่วมกัน ถึงกระนั้น กลยุทธ์การบูรณาการ เช่น การบูรณาการในระยะเริ่มต้น ก็อาจยังคงมีแนวโน้มที่จะเกิดปัญหาความลำเอียง หากเมทริกซ์ที่ได้นั้นมีคุณลักษณะจากโมดาลิตีเฉพาะหนึ่งๆ มากเกินไป
มิติ
การวิเคราะห์ชุดข้อมูลมัลติโอมิกส์ระดับเซลล์เดี่ยวขนาดใหญ่อาจต้องใช้การคำนวณอย่างมากเนื่องจากชุดข้อมูลมีมิติสูง[ 1 ] [ 2 ]ดังนั้น เครื่องมือที่ใช้ในการบูรณาการชุดข้อมูลจึงต้องมีประสิทธิภาพในการคำนวณ หรือควรใช้วิธีการคำนวณเพื่อลดมิติของชุดข้อมูลในเบื้องต้น (ดูที่การลดมิติ)
ความสามารถในการตีความและการตรวจสอบความถูกต้อง
วิธีการบูรณาการหลายวิธีมุ่งเน้นไปที่ความสัมพันธ์ทางสถิติมากกว่าการสร้างแบบจำลองเชิงสาเหตุโดยละเอียด ดังนั้น การตีความและการตรวจสอบความถูกต้องของผลลัพธ์จึงอาจเป็นเรื่องท้าทายอย่างยิ่ง โดยเฉพาะอย่างยิ่งหากมีการใช้เครือข่ายประสาทเทียม เนื่องจากวิธีการเหล่านี้เป็นกล่องดำ [ 20 ] ประโยชน์และการตรวจสอบความถูกต้องของวิธีการบูรณาการจำเป็นต้องได้รับการประเมินโดยพิจารณาจากการใช้งานจริง เช่น การระบุความสัมพันธ์แบบหลายโอไมซ์ที่เกี่ยวข้องทางชีววิทยาได้อย่างแม่นยำ
ข้อมูลที่ตรงกันและไม่ตรงกัน
การบูรณาการข้อมูลมัลติโอมิกส์ระดับเซลล์เดี่ยวมีความท้าทายที่แตกต่างกันไป ขึ้นอยู่กับว่าชุดข้อมูลนั้นตรงกันหรือไม่ตรงกัน[ 48 ]ชุดข้อมูลที่ตรงกันหมายถึงเลเยอร์โอมิกส์หลายชั้นที่วัดจากเซลล์แต่ละเซลล์เดียวกัน ในขณะที่ข้อมูลที่ไม่ตรงกันหมายถึงชุดข้อมูลที่วัดจากกลุ่มเซลล์ที่แตกต่างกัน แม้ว่าชุดข้อมูลที่ตรงกันจะช่วยให้สามารถเปรียบเทียบโดยตรงระหว่างเลเยอร์โอมิกส์ที่แตกต่างกันภายในเซลล์เดียวกันได้ แต่ก็อาจไม่พร้อมใช้งานได้ง่ายเท่ากับชุดข้อมูลที่ไม่ตรงกัน ในทางกลับกัน แม้ว่าชุดข้อมูลที่ไม่ตรงกันจะช่วยให้สามารถบูรณาการแหล่งที่มาและเงื่อนไขที่แตกต่างกันได้ แต่ก็จำเป็นต้องพิจารณาถึงอคติและปัจจัยรบกวนที่อาจเกิดขึ้น (เช่น ความแตกต่างในประชากรเซลล์ เงื่อนไขการทดลอง หรือวิธีการเตรียมตัวอย่างระหว่างชุดข้อมูลที่แตกต่างกัน) แนวทางต่างๆ ในการบูรณาการมัลติโอมิกส์สำหรับข้อมูลที่ไม่ตรงกัน ได้แก่ การจับคู่ตามกลุ่มเซลล์ (ต้องมีคำอธิบายประกอบประเภทเซลล์) การจับคู่ตามคุณลักษณะที่ใช้ร่วมกัน หรือแนวทางทางสถิติ เช่น NMF [ 2 ]
การใช้งานและการประยุกต์ใช้
แม้ว่าชุดข้อมูลแบบโมดาลิตี้เดียวจะได้รับการพิสูจน์แล้วว่าเป็นหลักสำคัญในชีววิทยาเชิงระบบแต่การรวมข้อมูลทางชีววิทยาจากหลายโมดาลิตี้มีศักยภาพที่จะตอบคำถามทางชีววิทยาที่ไม่สามารถอนุมานได้จากข้อมูลประเภทเดียวเพียงอย่างเดียว
การสร้างแบบจำลองเครือข่ายชีวภาพ
ตัวอย่างเช่น การบูรณาการทรานสคริปโตมและการเข้าถึง DNA ช่วยให้สามารถพัฒนาเครื่องมือทางชีวสารสนเทศเพื่ออนุมานเครือข่ายการควบคุมยีน เฉพาะประเภทเซลล์ ได้[ 49 ] [ 50 ] [ 51 ]ซึ่งทำได้โดยการใช้ประโยชน์จากการ แสดงออกของ ปัจจัยการถอดรหัสและยีนเป้าหมายพร้อมกับข้อมูลการควบคุมแบบซิสเพื่ออนุมานปัจจัยการถอดรหัสที่เกี่ยวข้องและพันธมิตรการควบคุมของพวกมัน
การขยายขอบเขตความหมายของสถานะเซลล์
การประยุกต์ใช้การบูรณาการมัลติโอมิกส์อีกประการหนึ่งคือการขยายคำจำกัดความของสถานะเซลล์ที่รวมคุณลักษณะที่สังเกตได้จากหลายรูปแบบ ตัวอย่างเช่น การบูรณาการการตรวจจับเครื่องหมายโปรตีนกับการสร้างโปรไฟล์ทรานสคริปโตมโดยใช้เทคโนโลยีการจัดลำดับมัลติโอมิกส์ เช่นCITE-seqสามารถแยกแยะลายเซ็นสถานะเซลล์ตามการควบคุมยีนร่วมกันและการแสดงออกของเครื่องหมายพื้นผิว[ 52 ]ซึ่งช่วยให้สามารถอนุมานเกี่ยวกับฟีโนไทป์ของเซลล์ได้อย่างแข็งแกร่งยิ่งขึ้น ซึ่งคล้ายคลึงและสามารถเปรียบเทียบได้โดยตรงกับผลลัพธ์จากโฟลว์ไซโตเมตรี แบบคลาสสิก ยิ่งไปกว่านั้น การกำหนดสถานะเซลล์โดยอาศัยการวิเคราะห์การจัดกลุ่มภายในพื้นที่แฝงแบบบูรณาการอาจให้การประมาณฟีโนไทป์ของเซลล์ที่เสถียรยิ่งขึ้นเมื่อเทียบกับการวิเคราะห์ภายในพื้นที่แฝงแบบรูปแบบเดียว[ 2 ]
การป้อนข้อมูล
นอกจากนี้ การบูรณาการมัลติโอมิกส์ยังสามารถเอาชนะข้อจำกัดเฉพาะโมดาลิตี้ได้ด้วยการเติมข้อมูลตัวอย่างเช่น เทคโนโลยีการจัดลำดับทราน สคริปโตมิกส์เชิงพื้นที่ ส่วนใหญ่ ประสบปัญหาความละเอียดเชิงพื้นที่ที่จำกัด (พิกเซลประกอบด้วยเซลล์ท้องถิ่นผสมกัน) และความซับซ้อนของคุณลักษณะต่ำ[ 53 ]การบูรณาการทรานสคริปโตมิกส์เชิงพื้นที่กับ scRNAseq สามารถช่วยเอาชนะข้อจำกัดเหล่านี้ได้โดยการสนับสนุนการแยกส่วน เชิงพื้นที่ ของการอ่านค่าความละเอียดต่ำและการประมาณความถี่ของเซลล์แต่ละประเภท[ 54 ] [ 55 ]
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การบูรณาการข้อมูลหลายโอไมซ์ระดับเซลล์เดี่ยว
การบูรณาการมัลติโอมิกส์ระดับเซลล์เดี่ยวหมายถึงชุดวิธีการคำนวณที่ใช้ในการประสานข้อมูลจาก " โอม " หลายๆ แบบ เพื่อวิเคราะห์ปรากฏการณ์ทางชีวภาพร่วมกัน
พื้นหลัง
การเกิดขึ้นของ เทคโนโลยี การจัดลำดับจีโนมระดับเซลล์เดี่ยว ได้ปฏิวัติความเข้าใจของเราเกี่ยวกับความหลากหลายของเซลล์ เผยให้เห็นภูมิทัศน์ที่ละเอียดอ่อนของประเภทเซลล์และความสัมพันธ์กับกระบวนการทางชีวภาพ เทคโนโลยีโอไมซ์ระดับเซลล์เดี่ยวได้ขยายขอบเขตไปไกลกว่า...
การบูรณาการในระยะเริ่มต้น
การบูรณาการเบื้องต้นเป็นวิธีการที่เชื่อมต่อ (โดยการผูกแถวและคอลัมน์) ชุดข้อมูลโอไมซ์สองชุดขึ้นไปเข้าด้วยกันเป็นเมทริกซ์ข้อมูลเดียว [ 19 ] [ 20 ] ข้อดีบางประการของการบูรณาการเบื้องต้นคือ วิธีการนี้เรียบง่าย ตีความได้ง่าย...
การบูรณาการระดับกลาง
การบูรณาการระดับกลางอธิบายถึงแนวทางประเภทหนึ่งที่มุ่งวิเคราะห์ชุดข้อมูลโอไมค์หลายชุดพร้อมกันโดยไม่จำเป็นต้องมีการแปลงข้อมูลล่วงหน้า (เนื่องจากเกิดขึ้นระหว่างการบูรณาการข้อมูล) [ 19 ] [ 20 ] ตัวอย่างหลายประการของการบูรณาการระดับกลาง ได้แก่...