อ่าน 4 นาที
จีเนเน็ตเวิร์ค
GeneNetwork เป็นฐานข้อมูลและซอฟต์แวร์วิเคราะห์ข้อมูล ชีวสารสนเทศ แบบโอเพนซอร์สที่รวม กันสำหรับพันธุ ศาสตร์ เชิงระบบ [ 1 ] แหล่งข้อมูลนี้ใช้ในการศึกษา เครือข่ายควบคุมยีน...
จีเนเน็ตเวิร์ค
| จีเนเน็ตเวิร์ค | |
|---|---|
| นักพัฒนา | ทีมพัฒนา GeneNetwork มหาวิทยาลัยเทนเนสซี |
| ปล่อย | 15 มกราคม 2537 |
| เวอร์ชันเสถียร | 2.0 / 29 พฤษภาคม 2559 |
| เขียนเป็น | JavaScript , HTML , Python , CSS , CoffeeScript , PHP |
| ใบอนุญาต | ใบอนุญาตสาธารณะทั่วไปของ Affero |
| เว็บไซต์ | www.genenetwork.org |
| ที่เก็บข้อมูล | github |
GeneNetworkเป็นฐานข้อมูลและซอฟต์แวร์วิเคราะห์ข้อมูลชีวสารสนเทศแบบโอเพนซอร์สที่รวม กันสำหรับพันธุ ศาสตร์เชิงระบบ[ 1 ]แหล่งข้อมูลนี้ใช้ในการศึกษาเครือข่ายควบคุมยีน ที่เชื่อมโยงความแตกต่างของลำดับ DNA กับความแตกต่างที่สอดคล้องกันในการแสดงออกของยีนและโปรตีน และความแปรผันในลักษณะต่างๆ เช่น สุขภาพและความเสี่ยงต่อโรค ชุดข้อมูลใน GeneNetwork โดยทั่วไปประกอบด้วยชุดข้อมูลจีโนไทป์ (เช่นSNP ) และฟีโนไทป์จำนวนมากจากกลุ่มบุคคลต่างๆ รวมถึงมนุษย์ สายพันธุ์ของหนูและหนูแรต และสิ่งมีชีวิตที่หลากหลาย เช่นDrosophila melanogaster , Arabidopsis thalianaและข้าวบาร์เลย์ [ 2 ] การรวมจีโนไทป์ทำให้สามารถทำแผนที่ยีน บนเว็บ เพื่อค้นหาบริเวณของจีโนมที่ก่อให้เกิดความแตกต่างระหว่างบุคคลในระดับ mRNA โปรตีน และเมตาโบไลต์ ตลอดจนความแตกต่างในหน้าที่ของเซลล์ กายวิภาคศาสตร์ สรีรวิทยา และพฤติกรรมได้
ประวัติศาสตร์
การพัฒนา GeneNetwork เริ่มต้นที่ศูนย์วิทยาศาสตร์สุขภาพมหาวิทยาลัยเทนเนสซีในปี 1994 ในรูปแบบเว็บเบสของพจนานุกรมจีโนมหนูแบบพกพา (1994) [ 3 ] GeneNetworkเป็นบริการเว็บแรกและใช้งานต่อเนื่องยาวนานที่สุดในการวิจัยทางการแพทย์ [ดูhttps://en.wikipedia.org/wiki/List_of_websites_founded_before_1995 ] ในปี 1999 พจนานุกรมยีนแบบพกพาถูกรวมเข้ากับ โปรแกรมการทำแผนที่ Map Manager QT ของ Kenneth F. Manly เพื่อสร้างระบบออนไลน์สำหรับการวิเคราะห์ทางพันธุกรรมแบบเรียลไทม์[ 4 ] ในช่วงต้นปี 2003 ชุดข้อมูลการแสดงออกของยีนAffymetrixขนาดใหญ่ชุดแรก (mRNA สมองหนู ทั้งหมด และเซลล์ต้นกำเนิดเม็ดเลือด) ได้ถูกรวมเข้าและระบบได้รับการเปลี่ยนชื่อเป็น WebQTL [ 5 ] [ 6 ]ปัจจุบัน GeneNetwork ได้รับการพัฒนาโดยกลุ่มนักพัฒนานานาชาติและมีไซต์สำรองและไซต์พัฒนาในยุโรป เอเชีย และออสเตรเลีย ระบบการผลิตหลักทำงานบนระบบที่ศูนย์วิทยาศาสตร์สุขภาพแห่งมหาวิทยาลัยเทนเนสซีโดยมีระบบสำรองอยู่ในยุโรป
GeneNetwork เวอร์ชันการผลิตปัจจุบัน (หรือที่รู้จักกันในชื่อ GN2) เปิดตัวในปี 2016 [ 7 ] GeneNetwork เวอร์ชันปัจจุบันใช้ฐานข้อมูลเดียวกันกับ GN1 รุ่นก่อนหน้า แต่มีโค้ดโอเพนซอร์สที่เป็นโมดูลาร์และบำรุงรักษาได้ง่ายกว่ามาก (มีให้ใช้งานบนGitHub ) GeneNetwork ยังมีคุณสมบัติใหม่ที่สำคัญมากมาย รวมถึงการสนับสนุนสำหรับ:
- ประชากรที่มีความซับซ้อนทางพันธุกรรมโดยใช้แบบจำลองผสมเชิงเส้นที่ดำเนินการด้วยGEMMA เวอร์ชันที่อัปเดต แล้ว [ 8 ]
- โมดูล R/qtlพร้อมตัวเลือกการทำแผนที่มากมาย รวมถึงการทำแผนที่ลูกผสม 4 ทาง และสต็อกที่หลากหลาย
- การวิเคราะห์เครือข่ายความสัมพันธ์แบบถ่วงน้ำหนักหรือที่รู้จักกันในชื่อ WGCNA
- การแสดงผลเครือข่ายCytoscape
- การทำแผนที่ตำแหน่งยีนลักษณะสัมพันธ์[ 9 ]
- โปรแกรมแสดงผลข้อมูลทางพันธุกรรมและจีโนมที่ใช้แพลตฟอร์ม Biodalliance
- โมดูลที่เชื่อมโยงกับเว็บเซิร์ฟเวอร์เครือข่ายเบย์เซียน [ 10 ]สำหรับการสร้างแบบจำลองเชิงสาเหตุ
การจัดระเบียบและการใช้งาน
GeneNetwork ประกอบด้วยส่วนประกอบหลักสองส่วน:
- ชุดข้อมูลทางพันธุกรรม จีโนม และลักษณะทางกายภาพจำนวนมหาศาลสำหรับกลุ่มบุคคลจำนวนมาก
- ซอฟต์แวร์วิเคราะห์ทางสถิติและการทำแผนที่ยีนขั้นสูงที่ช่วยให้สามารถวิเคราะห์เครือข่ายระดับโมเลกุลและเซลล์ รวมถึงความสัมพันธ์ระหว่างจีโนไทป์และฟีโนไทป์ได้
โดยปกติแล้วจะมีการเก็บรวบรวมข้อมูลสี่ระดับสำหรับแต่ละครอบครัวหรือประชากร:
- ลำดับดีเอ็นเอและจีโนไทป์
- ข้อมูลการแสดงออกระดับโมเลกุล มักสร้างขึ้นโดยใช้อาร์เรย์ , RNA-seq , เอพิเจโนมิกส์, โปรตีโอมิกส์, เมตาโบโลมิกส์ และเมตาจีโนมิกส์ (ฟีโนไทป์ระดับโมเลกุล)
- ลักษณะทางฟีโนไทป์เชิงปริมาณมาตรฐานที่มักเป็นส่วนหนึ่งของเวชระเบียนทั่วไป (เช่น เคมีในเลือด น้ำหนักตัว)
- ไฟล์คำอธิบายประกอบและข้อมูลเมตาสำหรับลักษณะและชุดข้อมูล
ข้อมูลประเภทต่างๆ ที่รวมกันจะถูกจัดเก็บไว้ด้วยกันในฐานข้อมูลเชิงสัมพันธ์และเซิร์ฟเวอร์ไฟล์ IPSF โดยได้รับการจัดระเบียบและจัดกลุ่มตามแนวคิดตามชนิด รุ่น และวงศ์ ระบบนี้ถูกนำไปใช้ในรูป แบบของชุด ซอฟต์แวร์ LAMPโค้ดและเวอร์ชันที่เรียบง่ายของ ฐานข้อมูล MariaDBมีให้ใช้งานบน GitHub
GeneNetwork ส่วนใหญ่ใช้โดยนักวิจัย แต่ก็ได้รับการนำไปใช้ประสบความสำเร็จในหลักสูตรระดับปริญญาตรีและบัณฑิตศึกษาในสาขาพันธุศาสตร์และชีวสารสนเทศ (ดูตัวอย่างใน YouTube ) ชีวสารสนเทศ สรีรวิทยา และจิตวิทยา[ 11 ]โดยทั่วไปนักวิจัยและนักศึกษาจะดึงชุดจีโนไทป์และฟีโนไทป์จากครอบครัวหนึ่งครอบครัวขึ้นไป และใช้ฟังก์ชันทางสถิติและการทำแผนที่ในตัวเพื่อสำรวจความสัมพันธ์ระหว่างตัวแปรและเพื่อประกอบเครือข่ายความสัมพันธ์ ขั้นตอนสำคัญ ได้แก่ การวิเคราะห์ปัจจัยเหล่านี้:
- ช่วงความแปรผันของลักษณะต่างๆ
- ความแปรปรวนร่วมกันระหว่างลักษณะต่างๆ (แผนภาพกระจายและความสัมพันธ์ การวิเคราะห์องค์ประกอบหลัก)
- สถาปัตยกรรมของเครือข่ายคุณลักษณะขนาดใหญ่
- การทำแผนที่ ตำแหน่งยีนควบคุมลักษณะเชิงปริมาณและแบบจำลองเชิงสาเหตุของการเชื่อมโยงระหว่างความแตกต่างของลำดับดีเอ็นเอและความแตกต่างของลักษณะฟีโนไทป์
แหล่งข้อมูล
ชุดข้อมูลลักษณะทางพันธุกรรมและการแสดงออกระดับโมเลกุลนั้น นักวิจัยเป็นผู้ส่งเข้ามาโดยตรง หรือดึงมาจากแหล่งเก็บข้อมูลต่างๆ เช่นNational Center for Biotechnology Information Gene Expression Omnibus ข้อมูลครอบคลุมเซลล์และเนื้อเยื่อหลากหลายชนิด ตั้งแต่ประชากรเซลล์เดี่ยวของระบบภูมิคุ้มกัน เนื้อเยื่อเฉพาะ (เรตินา สมองส่วนหน้า) ไปจนถึงระบบทั้งหมด (สมองทั้งหมด ปอด กล้ามเนื้อ หัวใจ ไขมัน ไต ดอกไม้ ตัวอ่อนพืชทั้งหมด) ชุดข้อมูลทั่วไปจะครอบคลุมบุคคลที่มีจีโนไทป์ครบถ้วนหลายร้อยคน และอาจรวมถึงตัวอย่างซ้ำทางเทคนิคและทางชีววิทยาด้วย จีโนไทป์และฟีโนไทป์มักนำมาจากบทความวิจัยที่ได้รับการตรวจสอบโดยผู้เชี่ยวชาญ GeneNetwork มีไฟล์คำอธิบายประกอบสำหรับแพลตฟอร์มการวิเคราะห์ RNA หลายแพลตฟอร์ม (Affymetrix, Illumina และ Agilent) นอกจากนี้ยังมีข้อมูล RNA-seq และข้อมูลโปรตีโอมิกส์เชิงปริมาณ เมตาโบโลมิกส์ เอพิเจเนติกส์ และเมตาจีโนมิกส์สำหรับหลายสายพันธุ์ รวมถึงหนูและมนุษย์
เครื่องมือและคุณสมบัติ
ในเว็บไซต์นี้มีเครื่องมือมากมายสำหรับฟังก์ชันที่หลากหลาย ตั้งแต่การแสดงผลกราฟิกอย่างง่ายของการเปลี่ยนแปลงในการแสดงออกของยีนหรือลักษณะทางฟีโนไทป์อื่นๆ แผนภาพกระจายของคู่ลักษณะ (เพียร์สันหรือลำดับ) การสร้างกราฟเครือข่ายทั้งแบบง่ายและซับซ้อน การวิเคราะห์ส่วนประกอบหลักและลักษณะสังเคราะห์ การทำแผนที่ QTL โดยใช้การถดถอยของเครื่องหมาย การทำแผนที่ช่วง และการสแกนคู่เพื่อหาปฏิสัมพันธ์แบบเอพิสแตติก ฟังก์ชันส่วนใหญ่ใช้งานได้กับลักษณะมากถึง 100 ลักษณะ และบางฟังก์ชันใช้งานได้กับทรานสคริปโทมทั้งหมด
สามารถเรียกดูและค้นหาฐานข้อมูลได้ที่ หน้า ค้นหา หลัก มีบทช่วยสอนออนไลน์ให้ใช้ งานได้ นอกจากนี้ ผู้ใช้ยังสามารถ ดาวน์โหลดชุดข้อมูลหลักเป็นไฟล์ข้อความ ไฟล์ Excel หรือในกรณีของกราฟเครือข่าย เป็นไฟล์ SBML ได้ อีกด้วย ณ ปี 2017 GN2เปิดให้ใช้งานในเวอร์ชันเบต้า
รหัส
GeneNetwork เป็นโครงการโอเพนซอร์สที่เผยแพร่ภายใต้ใบอนุญาตAffero General Public License (AGPLv3) โค้ดส่วนใหญ่เขียนด้วยภาษา Python แต่ก็มีโมดูลและโค้ดอื่นๆ ที่เขียนด้วยภาษา C, R และ JavaScript ด้วย โค้ดส่วนใหญ่เป็น Python 2.4 GN2 ส่วนใหญ่เขียนด้วย Python 2.7 ใน เฟรมเวิร์ก Flaskโดยใช้ เทมเพลต HTML Jinja 2 แต่มีแผนจะแปลงเป็น Python 3.X ในอีกไม่กี่ปีข้างหน้า GN2 เรียกใช้กระบวนการทางสถิติหลายอย่างที่เขียนด้วยภาษาโปรแกรม Rซอร์สโค้ดดั้งเดิมจากปี 2010 พร้อมฐานข้อมูลขนาดกะทัดรัดมีให้ใช้งานบนSourceForgeในขณะที่GN1ได้รับการดูแลอย่างต่อเนื่องจนถึงปี 2019 บนGitHub แต่ตั้งแต่ปี 2020 เป็นต้นมา งานทั้งหมดมุ่งเน้นไปที่GN2
ดูเพิ่มเติม
- จีโนมิกส์เชิงคำนวณ
- ไซโตสเคป
- KEGG (สารานุกรมยีนและจีโนมแห่งเกียวโต)
- รีแอคโตม
- วิกิพาธเวย์
ลิงก์ภายนอก
- หน้าแรกของ GeneNetwork
- แหล่งข้อมูลที่เกี่ยวข้อง
ระบบอื่นๆ เช่น พันธุศาสตร์ และฐานข้อมูลเครือข่าย
- ไบโอจีพีเอส
- เซจ ไบโอเน็ตเวิร์คส์
- อามิโก
- วิกิพาธเวย์
- ไซโตสเคป
- esyN
- GeneNetwork ประเทศเนเธอร์แลนด์
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ จีเนเน็ตเวิร์ค
GeneNetwork เป็นฐานข้อมูลและซอฟต์แวร์วิเคราะห์ข้อมูล ชีวสารสนเทศ แบบโอเพนซอร์สที่รวม กันสำหรับพันธุ ศาสตร์ เชิงระบบ [ 1 ] แหล่งข้อมูลนี้ใช้ในการศึกษา เครือข่ายควบคุมยีน...
ประวัติศาสตร์
การพัฒนา GeneNetwork เริ่มต้นที่ศูนย์วิทยาศาสตร์สุขภาพมหาวิทยาลัยเทนเนสซีในปี 1994 ในรูปแบบเว็บเบสของพจนานุกรมจีโนมหนูแบบพกพา (1994) [ 3 ] GeneNetwork เป็นบริการเว็บแรกและใช้งานต่อเนื่องยาวนานที่สุดในการวิจัยทางการแพทย์ [ดูhttps://en.wikipedia.
การจัดระเบียบและการใช้งาน
GeneNetwork ประกอบด้วยส่วนประกอบหลักสองส่วน:
แหล่งข้อมูล
ชุดข้อมูลลักษณะทางพันธุกรรมและการแสดงออกระดับโมเลกุลนั้น นักวิจัยเป็นผู้ส่งเข้ามาโดยตรง หรือดึงมาจากแหล่งเก็บข้อมูลต่างๆ เช่น National Center for Biotechnology Information Gene Expression Omnibus ข้อมูลครอบคลุมเซลล์และเนื้อเยื่อหลากหลายชนิด...