อ่าน 3 นาที
วัตถุไบโอคอมพิวต์
โครงการ BioCompute Object ( BCO ) เป็นโครงการริเริ่มที่ขับเคลื่อนโดยชุมชนเพื่อสร้างกรอบการทำงานสำหรับการกำหนดมาตรฐานและการแบ่งปันการคำนวณและการวิเคราะห์ที่สร้างขึ้นจาก...
วัตถุไบโอคอมพิวต์
| วัตถุไบโอคอมพิวต์ | |
|---|---|
| คำย่อ | บีซีโอ |
| สถานะ | กลุ่มทำงาน IEEE ที่ใช้งานอยู่ |
| มาตรฐานที่เกี่ยวข้อง | ภาษาเวิร์กโฟลว์ทั่วไป |
| ใบอนุญาต | เงื่อนไข BSD-3 |
| เว็บไซต์ | osf.io/h59uh/ |
โครงการBioCompute Object ( BCO ) เป็นโครงการริเริ่มที่ขับเคลื่อนโดยชุมชนเพื่อสร้างกรอบการทำงานสำหรับการกำหนดมาตรฐานและการแบ่งปันการคำนวณและการวิเคราะห์ที่สร้างขึ้นจากการจัดลำดับจีโนมความเร็วสูง (HTS—เรียกอีกอย่างว่าการจัดลำดับจีโนมรุ่นต่อไปหรือการจัดลำดับแบบขนานขนาดใหญ่ ) โครงการนี้ได้รับการกำหนดมาตรฐานแล้วเมื่อวันที่ 2 ตุลาคม 2023 ที่Wayback Machineในชื่อ IEEE 2791-2020 และไฟล์โครงการได้รับการดูแลรักษาใน คลังข้อมูลแบบ โอเพนซอร์ส[ 1 ]ฉบับวันที่ 22 กรกฎาคม 2020ของ Federal Register ประกาศว่าFDAสนับสนุนการใช้ BioCompute (อย่างเป็นทางการคือ IEEE 2791-2020) ในการยื่นขออนุมัติตามกฎระเบียบ และการรวมมาตรฐานนี้ไว้ในแคตตาล็อกมาตรฐานข้อมูลสำหรับการส่งข้อมูล HTS ใน NDA , ANDA, BLA และ INDไปยังCBER , CDERและCFSAN
โครงการนี้เริ่มต้นจากการเป็นสัญญาความร่วมมือระหว่างมหาวิทยาลัยจอร์จ วอชิงตันและสำนักงานคณะกรรมการอาหารและยา ( FDA ) และได้ขยายขอบเขตไปสู่การรวมมหาวิทยาลัย บริษัทเทคโนโลยีชีวภาพ ความร่วมมือระหว่างภาครัฐและเอกชน และบริษัทยามากกว่า 20 แห่ง รวมถึง Seven Bridges และ Harvard Medical School [ 2 ] BCO มีเป้าหมายเพื่ออำนวยความสะดวกในการแลกเปลี่ยนเวิร์กโฟลว์ HTS ระหว่างองค์กรต่างๆ เช่น FDA บริษัทยา องค์กรวิจัยตามสัญญา ผู้ให้บริการแพลตฟอร์มชีวสารสนเทศ และนักวิจัยทางวิชาการ เนื่องจากลักษณะที่ละเอียดอ่อนของการยื่นเอกสารทางกฎหมาย จึงมีการอ้างอิงโดยตรงถึงเนื้อหาได้น้อยมาก อย่างไรก็ตาม ปัจจุบันโครงการนี้ได้รับทุนเพื่อฝึกอบรมผู้ตรวจสอบและผู้บริหารของ FDA ให้สามารถอ่านและตีความ BCO ได้ และปัจจุบันมีเอกสารเผยแพร่ 4 ฉบับที่ส่งแล้วหรือใกล้จะส่งแล้ว
พื้นหลัง
หนึ่งในความท้าทายที่ใหญ่ที่สุดในด้านชีวสารสนเทศคือการจัดทำเอกสารและแบ่งปันเวิร์กโฟลว์ทางวิทยาศาสตร์ในลักษณะที่การคำนวณและผลลัพธ์สามารถตรวจสอบโดยผู้เชี่ยวชาญหรือทำซ้ำได้อย่างน่าเชื่อถือ[ 3 ] โดยทั่วไปแล้ว ไปป์ไลน์ชีวสารสนเทศจะใช้ซอฟต์แวร์หลายชิ้น ซึ่งแต่ละชิ้นมักจะมีหลายเวอร์ชัน พารามิเตอร์อินพุตหลายตัว เอาต์พุตหลายตัว และอาจมีการกำหนดค่าเฉพาะแพลตฟอร์ม เช่นเดียวกับพารามิเตอร์การทดลองในโปรโตคอลห้องปฏิบัติการ การเปลี่ยนแปลงเล็กน้อยในพารามิเตอร์การคำนวณอาจส่งผลกระทบอย่างมากต่อความถูกต้องทางวิทยาศาสตร์ของผลลัพธ์ กรอบงาน BioCompute มีการออกแบบเชิงวัตถุซึ่งสามารถสร้าง BCO ที่มีรายละเอียดของไปป์ไลน์และวิธีการใช้งานได้ลงนามแบบดิจิทัลและแบ่งปันได้ แนวคิด BioCompute ได้รับการพัฒนาขึ้นเพื่อตอบสนองความต้องการด้านการวิจัยและการตรวจสอบตามกฎระเบียบของ FDA สำหรับการประเมิน การตรวจสอบความถูกต้อง และการยืนยันข้อมูลจีโนมิกส์ อย่างไรก็ตาม กรอบงาน BioCompute ปฏิบัติตามหลักการข้อมูล FAIR [ 4 ]และสามารถใช้ได้อย่างกว้างขวางเพื่อให้การสื่อสารและการทำงานร่วมกันระหว่างแพลตฟอร์ม อุตสาหกรรม นักวิทยาศาสตร์ และหน่วยงานกำกับดูแลต่างๆ[ 5 ]
คุณประโยชน์
BioCompute Objects เป็นมาตรฐานสำหรับการจัดการข้อมูลทางพันธุกรรม ซึ่งมีประโยชน์ต่อผู้ใช้สามกลุ่มหลัก ได้แก่ 1) นักวิจัยทางวิชาการที่ทำการทดลองทางพันธุกรรมใหม่ๆ 2) บริษัทเภสัชกรรม/เทคโนโลยีชีวภาพที่ต้องการส่งผลงานให้องค์การอาหารและยา (FDA) พิจารณาอนุมัติ และ 3) สถานพยาบาล (โรงพยาบาลและห้องปฏิบัติการ) ที่ให้บริการตรวจทางพันธุกรรมและเวชศาสตร์เฉพาะบุคคล ประโยชน์สำหรับนักวิจัยทางวิชาการคือความสามารถในการทำซ้ำข้อมูลการทดลองได้อย่างแม่นยำและมีความไม่แน่นอนน้อยลง ประโยชน์สำหรับหน่วยงานที่ต้องการส่งผลงานให้ FDA คือวิธีการที่คล่องตัวมากขึ้น มีความไม่แน่นอนน้อยลง และสามารถทำซ้ำผลงานได้อย่างแม่นยำยิ่งขึ้น สำหรับสถานพยาบาลนั้น การส่งข้อมูล HTS และข้อมูลเมตาทางคลินิกอย่างถูกต้องแม่นยำเป็นสิ่งสำคัญ โดยควรเป็นรูปแบบมาตรฐานที่ผู้มีส่วนได้ส่วนเสียทุกฝ่าย รวมถึงหน่วยงานกำกับดูแล สามารถอ่านได้
รูปแบบ
อ็อบเจ็กต์ BioCompute อยู่ใน รูปแบบ jsonและอย่างน้อยที่สุดจะต้องมีเวอร์ชันซอฟต์แวร์และพารามิเตอร์ทั้งหมดที่จำเป็นในการประเมินหรือตรวจสอบไปป์ไลน์การคำนวณ นอกจากนี้ยังอาจมีข้อมูลอินพุตเป็นไฟล์หรือลิงก์ จีโนมอ้างอิง หรือส่วนประกอบ Docker ที่สามารถเรียกใช้งานได้ อ็อบเจ็กต์ BioCompute สามารถผสานรวมกับHL7 FHIRเป็นทรัพยากรที่มา[ 6 ]การใช้งานร่วมกันหลายรายการกำลังอยู่ระหว่างการพัฒนาซึ่งใช้ประโยชน์จากรูปแบบที่เน้นรายงานของ BCO รวมถึง CWL (หนึ่งในนั้นเป็นส่วนหนึ่งของสัญญาสาธารณะที่ได้รับทุนจากรัฐบาลกับผู้ร่วมก่อตั้ง CWL เพื่อนำร่องและสร้างเอกสารสำหรับ BCO-CWL ร่วมกัน ตลอดจนตัวอย่าง) และ RO [ 7 ]
กลุ่มบริษัท BCO
กลุ่มทำงาน BioCompute Object (BCO) ได้อำนวยความสะดวกให้ผู้มีส่วนได้ส่วนเสียต่างๆ สามารถให้ข้อมูลเกี่ยวกับแนวปฏิบัติปัจจุบันของ BCO ได้ กลุ่มทำงานนี้ก่อตั้งขึ้นในระหว่างการเตรียมการสำหรับการประชุมเชิงปฏิบัติการมาตรฐานการคำนวณ HTS สำหรับวิทยาศาสตร์การกำกับดูแล (HTS Computational Standards for Regulatory Sciences Workshop) ปี 2017และเริ่มต้นจากผู้เข้าร่วมการประชุมเชิงปฏิบัติการ การเติบโตและการทำงานของกลุ่มทำงาน BCO ซึ่งเป็นผลโดยตรงจากการมีปฏิสัมพันธ์ระหว่างผู้มีส่วนได้ส่วนเสียหลากหลายกลุ่มจากทุกชุมชนที่สนใจ ได้นำไปสู่มาตรฐานอย่างเป็นทางการIEEE 2791-2020 (เก็บถาวรเมื่อ 2023-10-02 ที่Wayback Machine)ซึ่งได้รับการอนุมัติในเดือนมกราคม 2020 ความร่วมมือระหว่างภาครัฐและเอกชนได้ก่อตั้งขึ้นระหว่าง GWU และ CBER และได้กลายเป็นจุดเริ่มต้นที่ง่ายสำหรับบุคคลหรือสถาบันใหม่ๆ ในการเข้าร่วมโครงการ BCO เพื่อมีส่วนร่วมในการอภิปรายเกี่ยวกับแนวปฏิบัติที่ดีที่สุดสำหรับวัตถุต่างๆ
การนำไปใช้
แพ็กเกจ R ง่ายๆ biocompute [ 8 ]สามารถสร้าง ตรวจสอบ และส่งออก BioCompute Objects ได้Genomics Compliance Suiteเป็นแอป Shiny ที่มีคุณสมบัติคล้ายกับนิพจน์ปกติที่พบในโปรแกรมแก้ไขข้อความสมัยใหม่ทั้งหมด มี แพ็กเกจซอฟต์แวร์โอ เพนซอร์สและเว็บแอปพลิเคชันที่พัฒนาขึ้นภายในหลายรายการที่ใช้ข้อกำหนด BioCompute ซึ่งสามรายการได้ถูกนำไปใช้งานในระบบคลาวด์AWS EC2 ที่เข้าถึงได้โดยสาธารณะ ซึ่งรวมถึงอินสแตนซ์ของHigh-performance Integrated Virtual Environment , BioCompute Portal [ 9 ] (เว็บแอปพลิเคชันแบบฟอร์มที่สามารถสร้างและแก้ไข BioCompute Objects ตาม มาตรฐาน IEEE-2791-2020) และอินสแตนซ์Galaxy ที่สอดคล้องกับ BioCompute
แพลตฟอร์มชีวสารสนเทศบางแพลตฟอร์มมีระบบรองรับ Biocompute ในตัว ซึ่งช่วยให้ผู้ใช้สามารถสร้าง BCO จากเวิร์กโฟลว์โดยอัตโนมัติและแก้ไขเนื้อหาคำอธิบายได้
- DNAnexus และ PrecisionFDA ช่วยอำนวยความสะดวกในการสร้าง BCO โดยการนำเข้าเวิร์กโฟลว์ ทำให้ผู้ใช้สามารถแก้ไขเนื้อหาเชิงพรรณนาได้ แพลตฟอร์มนี้รองรับการนำเข้าและส่งออกเมตาเดตาของสคริปต์ WDL และ CWL และมีเครื่องมือ BCOnexus ซึ่งเป็นเครื่องมือระดับสูงที่ไม่ขึ้นกับแพลตฟอร์มใดๆ พร้อมด้วยอินเทอร์เฟซผู้ใช้แบบกราฟิกที่ช่วยให้ผู้ใช้สามารถรวม BCO เข้าด้วยกันได้
- นอกจากนี้ Velsera's Seven Bridges Genomics และ Cancer Genomics Cloud ยังรองรับ BioCompute โดยเปิดใช้งานการเติมข้อมูลในฟิลด์ BCO ล่วงหน้าโดยตรงจากเวิร์กโฟลว์ได้อีกด้วย
- นอกจากนี้ BioCompute ยังถูกรวมเข้ากับHIVEและระบบ Galaxy หลัก ซึ่งทั้งสองระบบนี้ช่วยให้ผู้ใช้สามารถสร้าง BCO โดยอัตโนมัติและแก้ไขเนื้อหาภายในแพลตฟอร์มเหล่านี้ได้เช่นกัน
- นอกจากนี้ BioCompute ยังถูกนำไปใช้ในโครงการ Common Fund Data Elements Playbook Partnership ด้วย การนำไปใช้นี้ช่วยให้ผู้ใช้สามารถบันทึกเวิร์กโฟลว์ได้เมื่อพอใจกับผลลัพธ์ ซึ่งช่วยในการตรวจสอบย้อนกลับผ่านเครือข่ายของทรัพยากรที่มีการกำหนดเวอร์ชันอย่างอิสระ ทำให้ผู้ใช้สามารถบันทึกคำสั่งค้นหาและใส่คำอธิบายประกอบเพื่อใช้ในอนาคต แบ่งปัน หรือทำซ้ำได้ ซึ่งสอดคล้องกับบทบาทของ BioCompute ในการพัฒนาแนวทางการปฏิบัติทางชีวสารสนเทศ
การบูรณาการเข้ากับแพลตฟอร์มต่างๆ มีจุดมุ่งหมายเพื่อปรับปรุงการจัดการข้อมูลและการทำงานร่วมกัน และมอบวิธีการที่มีประสิทธิภาพให้ผู้ใช้สามารถดำเนินการตามขั้นตอนการทำงานได้ ในขณะที่การแสดง BCO ในรูปแบบกราฟิกมักเป็นวิธีที่ใช้งานง่ายกว่าในการเรียกดูหรืออ่าน BCO
ลิงก์ภายนอก
- เว็บไซต์อย่างเป็นทางการ
- โครงการโอเพนซอร์ส IEEE 2791-2020
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ วัตถุไบโอคอมพิวต์
โครงการ BioCompute Object ( BCO ) เป็นโครงการริเริ่มที่ขับเคลื่อนโดยชุมชนเพื่อสร้างกรอบการทำงานสำหรับการกำหนดมาตรฐานและการแบ่งปันการคำนวณและการวิเคราะห์ที่สร้างขึ้นจาก...
พื้นหลัง
หนึ่งในความท้าทายที่ใหญ่ที่สุดในด้านชีวสารสนเทศคือการจัดทำเอกสารและแบ่งปัน เวิร์กโฟลว์ทางวิทยาศาสตร์ ในลักษณะที่การคำนวณและผลลัพธ์สามารถตรวจสอบโดยผู้เชี่ยวชาญหรือทำซ้ำได้อย่างน่าเชื่อถือ [ 3 ] โดยทั่วไปแล้ว ไปป์ไลน์ชีว สารสนเทศจะใช้ซอฟต์แวร์หลายชิ้น...
คุณประโยชน์
BioCompute Objects เป็นมาตรฐานสำหรับการจัดการข้อมูลทางพันธุกรรม ซึ่งมีประโยชน์ต่อผู้ใช้สามกลุ่มหลัก ได้แก่ 1) นักวิจัยทางวิชาการที่ทำการทดลองทางพันธุกรรมใหม่ๆ 2) บริษัทเภสัชกรรม/เทคโนโลยีชีวภาพที่ต้องการส่งผลงานให้องค์การอาหารและยา (FDA) พิจารณาอนุมัติ และ 3)...
รูปแบบ
อ็อบเจ็กต์ BioCompute อยู่ใน รูปแบบ json และอย่างน้อยที่สุดจะต้องมีเวอร์ชันซอฟต์แวร์และพารามิเตอร์ทั้งหมดที่จำเป็นในการประเมินหรือตรวจสอบไปป์ไลน์การคำนวณ นอกจากนี้ยังอาจมีข้อมูลอินพุตเป็นไฟล์หรือลิงก์ จีโนมอ้างอิง หรือส่วนประกอบ Docker ที่สามารถเรียกใช้งานได้...