อ่าน 3 นาที
ฐานข้อมูลคำอธิบายประกอบกฎระเบียบแบบเปิด
ฐานข้อมูลคำอธิบายประกอบด้านกฎระเบียบแบบเปิด (หรือที่รู้จักกันในชื่อORegAnno ) ถูกออกแบบมาเพื่อส่งเสริมการจัดการข้อมูลด้านกฎระเบียบโดยชุมชน โดยเฉพาะอย่างยิ่ง...
ฐานข้อมูลคำอธิบายประกอบกฎระเบียบแบบเปิด
ฐานข้อมูลคำอธิบายประกอบด้านกฎระเบียบแบบเปิด (หรือที่รู้จักกันในชื่อORegAnno ) ถูกออกแบบมาเพื่อส่งเสริมการจัดการข้อมูลด้านกฎระเบียบโดยชุมชน โดยเฉพาะอย่างยิ่ง ฐานข้อมูลนี้ประกอบด้วยข้อมูลเกี่ยวกับ บริเวณ ควบคุม ตำแหน่ง การจับของปัจจัยการถอดรหัส ตัวแปรควบคุม และแฮปโลไทป์
ณ วันที่ 10 กุมภาพันธ์ 2569 พบว่าไม่สามารถเข้าถึง เว็บไซต์ของโครงการ ( www.oreganno.org เก็บถาวรเมื่อวันที่ 21 มีนาคม 2564 ในWayback Machine ) โดยแสดงข้อผิดพลาดหมดเวลาการเชื่อมต่อ
ภาพรวม
การจัดการข้อมูล
สำหรับแต่ละรายการ จะมีการรักษาการอ้างอิงโยงไปยังEnsEMBL , dbSNP , Entrez Gene , ฐานข้อมูลอนุกรมวิธานของ NCBIและPubMedข้อมูลภายใน ORegAnno จะถูกแมปและจัดเตรียมไว้เป็นประจำใน รูปแบบของแทร็ก UCSC Genome Browserนอกจากนี้ แต่ละรายการยังเชื่อมโยงกับหลักฐานเชิงทดลอง ซึ่งฝังอยู่ในEvidence Ontology Archived 2007-08-15 ที่Wayback Machineภายใน ORegAnno สิ่งนี้ช่วยให้นักวิจัยสามารถวิเคราะห์ข้อมูลด้านกฎระเบียบโดยใช้เงื่อนไขของตนเองเกี่ยวกับความเหมาะสมของหลักฐานสนับสนุนได้
การเข้าถึงซอฟต์แวร์และข้อมูล
โครงการนี้เป็นโอเพนซอร์สข้อมูลและซอฟต์แวร์ทั้งหมดที่ผลิตในโครงการสามารถเข้าถึงและใช้งานได้โดยเสรี
เนื้อหาในฐานข้อมูล
ณ วันที่ 20 ธันวาคม 2549 ORegAnno มีลำดับควบคุม 4220 ลำดับ (ไม่รวมบันทึกที่ล้าสมัย) สำหรับตำแหน่งการจับของปัจจัยการถอดรหัส 2190 ตำแหน่ง บริเวณควบคุม 1853 แห่ง (ตัวเร่งปฏิกิริยา โปรโมเตอร์ ฯลฯ) โพลีมอร์ฟิซึมควบคุม 170 รายการ และแฮปโลไทป์ควบคุม 7 รายการ สำหรับสิ่งมีชีวิต 17 ชนิดที่แตกต่างกัน (ส่วนใหญ่เป็นDrosophila melanogaster , Homo sapiens , Mus musculus , Caenorhabditis elegansและRattus norvegicusตามลำดับ) บันทึกเหล่านี้ได้มาจากการคัดกรองด้วยตนเองจากเอกสารเผยแพร่ 828 ฉบับโดยผู้ใช้ ORegAnno 45 คนจากชุมชนการควบคุมยีน คิวเอกสารเผยแพร่ของ ORegAnno มีเอกสารเผยแพร่ 4215 ฉบับ ซึ่ง 858 ฉบับปิดแล้ว 34 ฉบับอยู่ในระหว่างดำเนินการ (สถานะเปิด) และ 3321 ฉบับรอการระบุคำอธิบายประกอบ (สถานะรอดำเนินการ) ORegAnno ได้รับการอัปเดตอย่างต่อเนื่อง ดังนั้นเนื้อหาฐานข้อมูลปัจจุบันควรตรวจสอบได้จากwww.oreganno.org เก็บถาวรเมื่อวันที่ 21 มีนาคม 2021 ที่Wayback Machine
งาน RegCreative Jamboree ปี 2006
งานประชุม RegCreative เกิดขึ้นจากความคิดริเริ่มของชุมชนในการจัดเก็บและรักษาลำดับจีโนมที่ได้รับการพิสูจน์แล้วจากการทดลองว่าควบคุมการแสดงออกของยีนอย่างถาวร เป้าหมายนี้มีความสำคัญอย่างยิ่งต่อการวิเคราะห์วิวัฒนาการและการวิจัยเชิงประยุกต์ เนื่องจากกลไกการควบคุมมีส่วนเกี่ยวข้องอย่างกว้างขวางในการปรับตัวเฉพาะสายพันธุ์และสาเหตุของโรค ความคิดริเริ่มนี้ได้นำไปสู่การก่อตั้งกลุ่มนักวิทยาศาสตร์นานาชาติที่มีแนวคิดเดียวกันซึ่งอุทิศตนเพื่อบรรลุเป้าหมายนี้ งานประชุม RegCreative เป็นโอกาสแรกที่กลุ่มเหล่านี้ได้พบปะกันเพื่อประเมินสถานะปัจจุบันของความรู้เกี่ยวกับการควบคุมยีนอย่างแม่นยำ และเริ่มต้นพัฒนามาตรฐานในการจัดเก็บข้อมูลการควบคุม
โดยรวมแล้ว มีนักวิจัย 44 คนจาก 9 ประเทศและ 23 สถาบันเข้าร่วมการประชุมเชิงปฏิบัติการครั้งนี้ นอกจากนี้ยังได้รับการสนับสนุนด้านเงินทุนจาก ENFIN, BioSapiens Network, FWO Research Foundation, Genome Canada และ Genome British Columbia ด้วย
ผลลัพธ์ที่สำคัญของการประชุม RegCreative จนถึงปัจจุบันมีดังนี้:
- ก่อนการจัดงาน RegCreative Jamboree ผู้เข้าร่วมงานได้รับเชิญให้เข้าร่วมการประเมินความสอดคล้องระหว่างผู้ให้คำอธิบายประกอบ มีการตั้งเซิร์ฟเวอร์ ORegAnno สองเซิร์ฟเวอร์ โดยมีชุดเอกสารเผยแพร่ที่เหมือนกันอยู่ในคิวรอการให้คำอธิบายประกอบ โดยรวมแล้ว มีการรวบรวมคำอธิบายประกอบที่ซ้ำซ้อน 33 รายการจากเอกสารเผยแพร่ 18 ฉบับ (เซิร์ฟเวอร์ที่ 1 และเซิร์ฟเวอร์ที่ 2 รวบรวมคำอธิบายประกอบ 79 รายการสำหรับเอกสาร 31 ฉบับ และเซิร์ฟเวอร์ที่ 2 รวบรวมคำอธิบายประกอบ 60 รายการสำหรับเอกสาร 21 ฉบับ) ความพยายามนี้ถูกนำมาใช้เป็นเกณฑ์พื้นฐานในการกำหนดประสิทธิภาพของผู้ให้คำอธิบายประกอบ
- กิจกรรมการลงมือปฏิบัติจริงในการระบุตำแหน่งยีนเกิดขึ้นในช่วง 2 วันแรกของการประชุมเชิงปฏิบัติการ 3 วัน โดยรวมแล้ว นักวิจัย 39 คนได้ร่วมกันระบุตำแหน่ง TFBS จำนวน 184 ตำแหน่ง และบริเวณควบคุม (Regulatory Regions) จำนวน 317 ตำแหน่ง จากบทความวิจัย 96 เรื่อง นักวิจัยหลายคนได้รับการฝึกอบรมเกี่ยวกับระบบ ORegAnno ซึ่งช่วยเพิ่มจำนวนผู้ใช้งานที่มีประสบการณ์ในระบบนี้อย่างมีนัยสำคัญ การระบุตำแหน่งยีนเหล่านี้ในแต่ละสายพันธุ์ประกอบด้วย 339 ตำแหน่งในHomo sapiens , 42 ตำแหน่งในMus musculus , 72 ตำแหน่งในDrosophila melanogaster , 24 ตำแหน่งในCiona intestinalis , 14 ตำแหน่งในRattus norvegicus , 6 ตำแหน่งใน Halocynthia roretzi, 2 ตำแหน่งในCiona savignyiและ 2 ตำแหน่งในHIVนอกจากนี้ ยังมีการเพิ่มชุดข้อมูลใหม่ 1 ชุดลงใน ORegAnno ด้วย Maximillian Haessler จากสถาบัน Alfred Fessard ได้ทำการระบุคำอธิบายประกอบเชิงโปรแกรมให้กับตัวเร่งปฏิกิริยาทางพันธุกรรมของมนุษย์จำนวน 274 ตัว จากงานวิจัยของ Visel และคณะ ในวารสารNucleic Acids Researchปี 2006 โดยรวมแล้ว มีการศึกษาทางวิทยาศาสตร์จำนวน 130 เรื่องที่ได้รับการตรวจสอบอย่างละเอียด งานวิจัยที่ได้รับการระบุคำอธิบายประกอบนั้น ได้รับการคัดเลือกไว้ล่วงหน้าจากสิ่งพิมพ์ที่คัดสรรโดยผู้เชี่ยวชาญในคิว ORegAnno ซึ่งมีเอกสารฉบับเต็มให้ใช้งานได้ผ่านHighWire Press
- มีความจำเป็นเร่งด่วนในการปรับปรุงมาตรฐานข้อมูลและการพัฒนาออนโทโลยีที่เกี่ยวข้อง โดยเฉพาะอย่างยิ่ง ควรมีการพัฒนาและการบูรณาการแบบเปิดกว้างของหลักเกณฑ์การตั้งชื่อปัจจัยการถอดรหัสและออนโทโลยีลำดับ ประเภทเซลล์ สายเซลล์ เนื้อเยื่อ และหลักฐาน การวางรากฐานเพื่อแก้ไขและจัดลำดับความสำคัญของความต้องการเหล่านี้ได้สำเร็จลุล่วงไปแล้วหลายวิธีในระหว่างการประชุม:
- ประเด็นปัญหาเกี่ยวกับการตั้งชื่อปัจจัยถอดรหัสได้รับการแก้ไขโดยการอภิปรายเกี่ยวกับการบูรณาการของกระบวนการทำนายปัจจัยถอดรหัส เช่น DBD หรือ flyTF ซึ่งได้รับการเสริมด้วยการตรวจสอบด้วยตนเอง เมื่อเทียบกับการใช้งานที่ตรวจสอบด้วยตนเองเพียงอย่างเดียว เช่น TFcat
- Marc Halfonจากมหาวิทยาลัยบัฟฟาโลเป็นผู้นำการประชุมกลุ่มย่อยเพื่อปรับปรุงออนโทโลยีลำดับ (Sequence Ontology)จากรูปแบบฐานข้อมูล ORegAnno และ REDfly ที่มีอยู่เดิม ภายใต้กรอบการทำงานที่กำลังพัฒนาขึ้นเป็นส่วนหนึ่งของออนโทโลยีชีวการแพทย์แบบเปิด (Open Biomedical Ontologies ) สามารถดูเวอร์ชันเบื้องต้นของการปรับปรุงเหล่านี้ได้ในวิกิของ ORegAnno
- การพัฒนาออนโทโลยีโดยอาศัยการเรียนรู้ถือเป็นคุณลักษณะที่สำคัญอย่างยิ่งในกระบวนการให้คำอธิบายประกอบ เพื่อให้ผู้ให้คำอธิบายประกอบไม่ถูกจำกัดด้วยข้อจำกัดของคำศัพท์ควบคุมและข้อยกเว้นเหล่านี้สามารถนำไปใช้ในการพัฒนาออนโทโลยีหลักต่อไปได้
- การพัฒนาออนโทโลยีควรแยกส่วนออกจากกรอบงานการระบุคำอธิบายประกอบของ ORegAnno โดยเฉพาะอย่างยิ่ง มีแผนที่จะแยกออนโทโลยีหลักฐานของ ORegAnno ออกมาและเปิดให้ชุมชนที่กว้างขึ้นสามารถพัฒนาได้
- ให้ความสำคัญกับการบูรณาการทรัพยากรเฉพาะสายพันธุ์เข้ากับกรอบการทำงานด้านการระบุข้อมูลอีกครั้ง
- ประเด็นสำคัญของการประชุมเชิงปฏิบัติการครั้งนี้คือการกล่าวถึงบทบาทของการทำเหมืองข้อมูลจากข้อความในการอำนวยความสะดวกในการระบุคำอธิบายประกอบด้านกฎระเบียบ การบรรยายนำโดย ดร. Lynette Hirschman จาก MITRE และ ดร. Martin Krallinger จาก CNIO เพื่อกำหนดว่าการทำเหมืองข้อมูลจากข้อความสามารถช่วยได้อย่างไร เป้าหมายระยะสั้นของการวิเคราะห์โดยใช้การทำเหมืองข้อมูลจากข้อความนั้นมุ่งเน้นไปที่การเพิ่มข้อมูลลงในคิว ORegAnno และการใช้ส่วนที่ผู้เชี่ยวชาญคัดกรองแล้วในคิว ORegAnno เพื่อตรวจสอบความถูกต้องของการได้มาซึ่งเอกสารเผยแพร่โดยใช้การทำเหมืองข้อมูลจากข้อความ เป้าหมายหลังนี้กำลังดำเนินการโดย ดร. Stein Aertsจากมหาวิทยาลัย Leuven
ลิงก์ภายนอก
- ORegAnno เก็บถาวรเมื่อ 2021-03-21 ที่Wayback Machine
- งาน RegCreative Jamboree ปี 2006
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ฐานข้อมูลคำอธิบายประกอบกฎระเบียบแบบเปิด
ฐานข้อมูลคำอธิบายประกอบด้านกฎระเบียบแบบเปิด (หรือที่รู้จักกันในชื่อORegAnno ) ถูกออกแบบมาเพื่อส่งเสริมการจัดการข้อมูลด้านกฎระเบียบโดยชุมชน โดยเฉพาะอย่างยิ่ง...
การจัดการข้อมูล
สำหรับแต่ละรายการ จะมีการรักษาการอ้างอิงโยงไปยังEnsEMBL , dbSNP , Entrez Gene , ฐานข้อมูลอนุกรมวิธานของ NCBIและPubMedข้อมูลภายใน ORegAnno จะถูกแมปและจัดเตรียมไว้เป็นประจำใน รูปแบบของแทร็ก UCSC Genome Browserนอกจากนี้ แต่ละรายการยังเชื่อมโยงกับหลักฐานเชิงทดลอง...
การเข้าถึงซอฟต์แวร์และข้อมูล
โครงการนี้เป็น โอเพนซอร์ส ข้อมูลและซอฟต์แวร์ทั้งหมดที่ผลิตในโครงการสามารถเข้าถึงและใช้งานได้โดยเสรี
เนื้อหาในฐานข้อมูล
ณ วันที่ 20 ธันวาคม 2549 ORegAnno มีลำดับควบคุม 4220 ลำดับ (ไม่รวมบันทึกที่ล้าสมัย) สำหรับตำแหน่งการจับของปัจจัยการถอดรหัส 2190 ตำแหน่ง บริเวณควบคุม 1853 แห่ง (ตัวเร่งปฏิกิริยา โปรโมเตอร์ ฯลฯ