กลับไปหน้าบทความ

อ่าน 4 นาที

ระบบภาษาทางการแพทย์แบบรวม

ระบบภาษาทางการแพทย์แบบรวม ( UMLS ) เป็นชุดคำศัพท์ควบคุมจำนวนมากใน วิทยาศาสตร์ ชีวการแพทย์ (สร้างขึ้นในปี 1986) ระบบนี้มีโครงสร้างการจับคู่ระหว่างคำศัพท์เหล่านี้...

ระบบภาษาทางการแพทย์แบบรวม

ระบบภาษาทางการแพทย์แบบรวม ( UMLS ) เป็นชุดคำศัพท์ควบคุมจำนวนมากใน วิทยาศาสตร์ ชีวการแพทย์ (สร้างขึ้นในปี 1986) [ 1 ]ระบบนี้มีโครงสร้างการจับคู่ระหว่างคำศัพท์เหล่านี้ จึงทำให้สามารถแปลระหว่างระบบคำศัพท์ต่างๆ ได้ นอกจากนี้ยังสามารถมองได้ว่าเป็นพจนานุกรมและออนโทโลยี ที่ครอบคลุม ของแนวคิดชีวการแพทย์ UMLS ยังมีสิ่งอำนวยความสะดวกสำหรับการประมวลผลภาษาธรรมชาติโดยมีวัตถุประสงค์หลักเพื่อใช้โดยนักพัฒนาระบบในด้านสารสนเทศทางการแพทย์

UMLS ประกอบด้วยแหล่งความรู้ (ฐานข้อมูล) และชุดเครื่องมือซอฟต์แวร์

UMLS ได้รับการออกแบบและดูแลโดยห้องสมุดการแพทย์แห่งชาติของสหรัฐอเมริกา มีการอัปเดตทุกไตรมาสและสามารถใช้งานได้ฟรี โครงการนี้ริเริ่มขึ้นในปี 1986 โดยDonald AB Lindberg , MDซึ่งดำรงตำแหน่งผู้อำนวยการห้องสมุดการแพทย์ในขณะนั้น และกำกับโดยBetsy Humphreys [ 2 ]

วัตถุประสงค์และการใช้งาน

จำนวนทรัพยากรชีวการแพทย์ที่มีให้แก่นักวิจัยนั้นมีมากมายมหาศาล บ่อยครั้งที่สิ่งนี้เป็นปัญหาเนื่องจากปริมาณเอกสารจำนวนมากที่ได้รับเมื่อค้นหาวรรณกรรมทางการแพทย์ วัตถุประสงค์ของ UMLS คือการเพิ่มการเข้าถึงวรรณกรรมนี้โดยการอำนวยความสะดวกในการพัฒนาระบบคอมพิวเตอร์ที่เข้าใจภาษาชีวการแพทย์ สิ่งนี้บรรลุผลได้โดยการเอาชนะอุปสรรคสำคัญสองประการ ได้แก่ "ความหลากหลายของวิธีการแสดงแนวคิดเดียวกันในแหล่งข้อมูลที่เครื่องอ่านได้ต่างกันและโดยบุคคลที่แตกต่างกัน" และ "การกระจายข้อมูลที่เป็นประโยชน์ในฐานข้อมูลและระบบที่แตกต่างกันมากมาย" [ 3 ]

การออกใบอนุญาต

ผู้ใช้งานระบบจะต้องลงนามใน "ข้อตกลง UMLS" และส่งรายงานการใช้งานประจำปีฉบับย่อ ผู้ใช้งานทางวิชาการสามารถใช้ UMLS ได้ฟรีเพื่อวัตถุประสงค์ในการวิจัย การใช้งานเชิงพาณิชย์หรือการผลิตจำเป็นต้องได้รับใบอนุญาตลิขสิทธิ์สำหรับคำศัพท์ต้นฉบับบางส่วนที่รวมอยู่ในระบบ

แหล่งความรู้

เมตาเธซอรัส

Metathesaurus เป็นพื้นฐานของ UMLS และประกอบด้วยแนวคิดทางชีวการแพทย์มากกว่า 1 ล้านรายการ และชื่อแนวคิดมากกว่า 5 ล้านรายการ ซึ่งทั้งหมดมาจากคำศัพท์ควบคุมและระบบการจำแนกประเภทที่รวมอยู่มากกว่า 100 ระบบ ตัวอย่างของคำศัพท์ควบคุมที่รวมอยู่ ได้แก่CPT , ICD-10 , MeSH , SNOMED CT , DSM-IV , LOINC , WHO Adverse Drug Reaction Terminology , UK Clinical Terms , RxNorm , Gene OntologyและOMIM (ดูรายชื่อทั้งหมด )

เมตาธีซอรัสจัดเรียงตามแนวคิด และแต่ละแนวคิดมีคุณลักษณะเฉพาะที่กำหนดความหมายและเชื่อมโยงกับชื่อแนวคิดที่สอดคล้องกันในคำศัพท์ต้นฉบับต่างๆ ความสัมพันธ์ระหว่างแนวคิดต่างๆ มากมายถูกแสดงไว้ เช่น ความสัมพันธ์แบบลำดับชั้น เช่น " เป็น " สำหรับคลาสย่อย และ "เป็นส่วนหนึ่งของ" สำหรับหน่วยย่อย และความสัมพันธ์แบบสัมพันธ์ เช่น "เกิดจาก" หรือ "ในวรรณกรรมมักเกิดขึ้นใกล้กับ" (ซึ่งอย่างหลังได้มาจากMedline )

ขอบเขตของ Metathesaurus ถูกกำหนดโดยขอบเขตของคำศัพท์ต้นฉบับ หากคำศัพท์ที่แตกต่างกันใช้ชื่อที่แตกต่างกันสำหรับแนวคิดเดียวกัน หรือหากใช้ชื่อเดียวกันสำหรับแนวคิดที่แตกต่างกัน Metathesaurus ก็จะแสดงข้อมูลเหล่านั้นอย่างถูกต้อง ข้อมูลลำดับชั้นทั้งหมดจากคำศัพท์ต้นฉบับจะถูกเก็บรักษาไว้ใน Metathesaurus นอกจากนี้ แนวคิดใน Metathesaurus ยังสามารถเชื่อมโยงไปยังแหล่งข้อมูลภายนอกฐานข้อมูลได้ เช่น ฐานข้อมูลลำดับยีน

เครือข่ายความหมาย

แต่ละแนวคิดใน Metathesaurus จะถูกกำหนดประเภทความหมาย (หมวดหมู่) หนึ่งประเภทขึ้นไป ซึ่งเชื่อมโยงกันผ่านความสัมพันธ์ทางความหมาย [ 4 ​​] เครือ ข่ายความหมายเป็นแคตตาล็อกของประเภทความหมายและความสัมพันธ์เหล่านี้ นี่เป็นการจำแนกประเภทที่ค่อนข้างกว้าง มีประเภทความหมายทั้งหมด 127 ประเภทและความสัมพันธ์ 54 รายการ

ประเภทความหมายหลัก ได้แก่ สิ่งมีชีวิต โครงสร้างทางกายวิภาค หน้าที่ทางชีวภาพ สารเคมี เหตุการณ์ วัตถุทางกายภาพ และแนวคิดหรือความคิด การเชื่อมโยงระหว่างประเภทความหมายกำหนดโครงสร้างของเครือข่ายและแสดงความสัมพันธ์ที่สำคัญระหว่างกลุ่มและแนวคิด การเชื่อมโยงหลักระหว่างประเภทความหมายคือการเชื่อมโยง " isa " ซึ่งสร้างลำดับชั้นของประเภท เครือข่ายยังมี 5 หมวดหมู่หลักของความสัมพันธ์ที่ไม่เป็นลำดับชั้น (หรือแบบเชื่อมโยง) ซึ่งประกอบเป็นประเภทความสัมพันธ์ที่เหลืออีก 53 ประเภท ได้แก่ "มีความสัมพันธ์ทางกายภาพกับ" "มีความสัมพันธ์เชิงพื้นที่กับ" "มีความสัมพันธ์เชิงเวลากับ" "มีความสัมพันธ์เชิงหน้าที่กับ" และ "มีความสัมพันธ์เชิงแนวคิดกับ" [ 4 ]

ข้อมูลเกี่ยวกับประเภทความหมายประกอบด้วยตัวระบุ คำจำกัดความ ตัวอย่าง ข้อมูลลำดับชั้นเกี่ยวกับประเภทความหมายที่ครอบคลุม และ ความสัมพันธ์แบบ เชื่อมโยงความสัมพันธ์แบบเชื่อมโยงภายในเครือข่ายความหมายนั้นอ่อนแอมาก โดยจะบันทึกความสัมพันธ์แบบ "บางตัว-บางตัว" เท่านั้น กล่าวคือ บันทึกข้อเท็จจริงที่ว่าอินสแตนซ์บางส่วนของประเภทแรกอาจเชื่อมต่อด้วยความสัมพันธ์ที่เด่นชัดกับอินสแตนซ์บางส่วนของประเภทที่สอง กล่าวอีกนัยหนึ่งคือ บันทึกข้อเท็จจริงที่ว่าข้อความแสดงความสัมพันธ์ที่สอดคล้องกันนั้นมีความหมาย (แม้ว่าจะไม่จำเป็นต้องเป็นจริงในทุกกรณีก็ตาม)

ตัวอย่างของความสัมพันธ์แบบเชื่อมโยงคือ " อาจก่อให้เกิด " เมื่อนำไปใช้กับคำ (การสูบบุหรี่, มะเร็งปอด) จะได้ว่า: การสูบบุหรี่ " อาจก่อให้เกิด " มะเร็งปอด

พจนานุกรมเฉพาะทาง

พจนานุกรมเฉพาะทาง (SPECIALIST Lexicon) ประกอบด้วยข้อมูลเกี่ยวกับคำศัพท์ภาษาอังกฤษทั่วไป คำศัพท์ทางการแพทย์ คำศัพท์ที่พบในMEDLINEและคำศัพท์ที่พบใน UMLS Metathesaurus แต่ละรายการประกอบด้วย ข้อมูล ทางไวยากรณ์ (วิธีการนำคำมาประกอบกันเพื่อสร้างความหมาย) ทางสัณฐานวิทยา (รูปแบบและโครงสร้าง) และทางอักขรวิธี (การสะกดคำ) ชุด โปรแกรม Javaใช้พจนานุกรมนี้ในการวิเคราะห์ความแตกต่างในข้อความทางการแพทย์โดยการเชื่อมโยงคำตามชนิดของคำ ซึ่งจะเป็นประโยชน์ใน การค้นหาข้อมูล บนเว็บหรือการค้นหาในเวชระเบียนอิเล็กทรอนิกส์

รายการอาจเป็นคำเดียวหรือหลายคำ บันทึกประกอบด้วยสี่ส่วน: รูปแบบพื้นฐาน (เช่น "run" สำหรับ "running"); ส่วนของคำพูด (ซึ่ง Specialist รู้จัก 11 ส่วน); ตัวระบุที่ไม่ซ้ำกัน; และตัวแปรการสะกดคำที่มีอยู่ ตัวอย่างเช่นการค้นหา "anesthetic" จะส่งคืนค่าต่อไปนี้: [ 5 ]

{ base=ยาชา spelling_variant=anesthetic รายการ = E0008769 แมว = คำนาม ตัวแปร=ปกติ } { base=ยาชา spelling_variant=anesthetic รายการ = E0008770 แมว = คำคุณศัพท์ ตัวแปร = การลงทุน ตำแหน่ง = แอตทริบิวต์(3) } 

พจนานุกรม SPECIALIST มีให้เลือกใช้สองรูปแบบ รูปแบบ "ระเบียนหน่วย" สามารถดูได้ด้านบน ซึ่งประกอบด้วยช่องและตัวเติมช่องคือองค์ประกอบ (เช่น "base=" หรือ "spelling variant=") และตัวเติมคือค่าที่กำหนดให้กับช่องนั้นสำหรับรายการนั้น รูปแบบ " ตารางเชิงสัมพันธ์ " ยังไม่ได้รับการทำให้เป็นมาตรฐานและมีข้อมูลที่ซ้ำซ้อนจำนวนมากในไฟล์

ความไม่สอดคล้องกันและข้อผิดพลาดอื่นๆ

เนื่องจากขนาดและความซับซ้อนของ UMLS และนโยบายที่อนุญาตให้รวมคำศัพท์เข้าด้วยกัน ข้อผิดพลาดจึงเป็นสิ่งที่หลีกเลี่ยงไม่ได้[ 6 ] ข้อผิดพลาดรวมถึงความกำกวมและความซ้ำซ้อน วงจรความสัมพันธ์แบบลำดับชั้น (แนวคิดหนึ่งเป็นทั้งบรรพบุรุษและลูกหลานของอีกแนวคิดหนึ่ง) บรรพบุรุษที่หายไป (ประเภทความหมายของแนวคิดแม่และลูกไม่มีความสัมพันธ์กัน) และการผกผันความหมาย (ความสัมพันธ์ระหว่างลูก/แม่กับประเภทความหมายไม่สอดคล้องกับแนวคิด) [ 7 ]

ข้อผิดพลาดเหล่านี้ถูกค้นพบและแก้ไขโดยการตรวจสอบ UMLS การตรวจสอบด้วยตนเองอาจใช้เวลานานและมีค่าใช้จ่ายสูง นักวิจัยได้พยายามแก้ไขปัญหานี้ด้วยวิธีการต่างๆ มากมาย สามารถใช้เครื่องมืออัตโนมัติในการค้นหาข้อผิดพลาดเหล่านี้ สำหรับความไม่สอดคล้องกันเชิงโครงสร้าง (เช่น วงวน) วิธีแก้ปัญหาแบบง่ายๆ โดยอิงตามลำดับจะใช้ได้ผล อย่างไรก็ตาม วิธีเดียวกันนี้จะใช้ไม่ได้ผลเมื่อความไม่สอดคล้องกันอยู่ที่ระดับคำหรือแนวคิด (ความหมายเฉพาะบริบทของคำ) [ 8 ]ซึ่งต้องใช้กลยุทธ์การค้นหาที่มีข้อมูล ( การแสดงความรู้ )

เครื่องมือซอฟต์แวร์สนับสนุน

นอกเหนือจากแหล่งความรู้แล้วหอสมุดแห่งชาติทางการแพทย์ยังจัดหาเครื่องมือสนับสนุนอีกด้วย

  • MetamorphoSys - ปรับแต่ง Metathesaurus ให้เหมาะสมกับการใช้งานเฉพาะด้าน เช่น การยกเว้นคำศัพท์ต้นฉบับบางคำ
  • lvg - โปรแกรมที่ใช้พจนานุกรมเฉพาะทาง (SPECIALIST lexicon) เพื่อสร้างคำศัพท์ที่หลากหลายสำหรับคำที่กำหนด และเพื่อสนับสนุนการวิเคราะห์ข้อความภาษาธรรมชาติ
  • MetaMap - เครื่องมือออนไลน์ที่เมื่อป้อนข้อความใดๆ ก็ตาม จะค้นหาและแสดงคำศัพท์ที่เกี่ยวข้องจาก Metathesaurus
  • MetaMap Transfer (MMTx) - การใช้งาน MetaMap ในภาษา Java (ปัจจุบันไม่ได้รับการสนับสนุนอีกต่อไป)
  • เซิร์ฟเวอร์แหล่งข้อมูลความรู้ - การเข้าถึงคำศัพท์ผ่านเว็บ (เลิกใช้งานในฤดูใบไม้ร่วงปี 2010) [ 9 ]

ซอฟต์แวร์ของบุคคลที่สาม

  • UMLS-Similarityเป็นแพ็กเกจซอฟต์แวร์โอเพนซอร์สที่ใช้ในการวัดความคล้ายคลึงและความสัมพันธ์ทางความหมายหลายด้าน
  • เว็บอินเทอร์เฟซของ UMLS-Similarity ถูกเก็บถาวรเมื่อวันที่ 1 กันยายน 2017 ที่Wayback Machineซึ่งเป็นเว็บอินเทอร์เฟซสำหรับ UMLS-Similarity

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • Bodenreider O (มกราคม 2547). "ระบบภาษาทางการแพทย์แบบรวม (UMLS): การบูรณาการศัพท์ทางการแพทย์ชีวภาพ" . Nucleic Acids Research . 32 (ฉบับฐานข้อมูล): D267-70. doi : 10.1093/nar/gkh061 . PMC  308795 . PMID  14681409 .
  • Kumar A, Smith B (2003). "ระบบภาษาทางการแพทย์แบบรวมและออนโทโลยีของยีน: ข้อคิดเชิงวิพากษ์บางประการ" ( PDF)ความก้าวหน้าในปัญญาประดิษฐ์ (บันทึกการบรรยายในปัญญาประดิษฐ์ 2821 ) เบอร์ลิน: Springer หน้า  135–148
  • Smith B, Kumar A, Schulze-Kremer S (2004). "การปรับปรุงเครือข่ายความหมาย UMLS" (PDF)ใน Fieschi M และคณะ (บรรณาธิการ). Medinfo . อัมสเตอร์ดัม: IOS Press. หน้า 1700.
  • Coiera E (2003). "บทที่ 17 - ศัพท์ทางการแพทย์และระบบการจำแนกประเภท" คู่มือสารสนเทศทางการแพทย์ (ฉบับที่ 2). Modder, Arnold. ISBN 978-0-340-76425-1.
  • Mougin F, Bodenreider O (2005). "แนวทางในการกำจัดวงจรใน UMLS Metathesaurus: แบบง่ายเทียบกับแบบเป็นทางการ" . รายงานการประชุมสัมมนาประจำปีของ AMIA . 2005 : 550– 4. PMC  1560864 . PMID  16779100 .
  • เว็บไซต์อย่างเป็นทางการ
  • คำอธิบายโดยสรุปของ UMLSพร้อมลิงก์ไปยังเอกสารข้อมูลและเอกสารประกอบสำหรับ Metathesaurus, Semantic Network, SPECIALIST Lexicon และ MetamorphoSys
  • ภาพรวมและบทแนะนำการใช้งาน UMLSโดย Rachel Kleinsorge, Jan Willis, Allen Browne และ Alan Aronson
  • โมดูล Perl สำหรับสอบถามข้อมูลจากฐานข้อมูล MySQL ของ UMLS
  • ระบบภาษาทางการแพทย์แบบรวมศูนย์ ณ หอสมุดแห่งชาติสหรัฐอเมริกาหัวข้อเรื่องทางการแพทย์ (MeSH)
  • UMLS.me ถูกเก็บถาวรเมื่อวันที่ 23 พฤศจิกายน 2024 ที่Wayback Machine - ดึงข้อมูลแนวคิดและรหัสทางการแพทย์ของ UMLS จากข้อความอิสระในเบราว์เซอร์ โดย Alexander Scarlat MD
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Unified_Medical_Language_System&oldid=1327668131 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ระบบภาษาทางการแพทย์แบบรวม

ระบบภาษาทางการแพทย์แบบรวม ( UMLS ) เป็นชุดคำศัพท์ควบคุมจำนวนมากใน วิทยาศาสตร์ ชีวการแพทย์ (สร้างขึ้นในปี 1986) ระบบนี้มีโครงสร้างการจับคู่ระหว่างคำศัพท์เหล่านี้...

วัตถุประสงค์และการใช้งาน

จำนวนทรัพยากรชีวการแพทย์ที่มีให้แก่นักวิจัยนั้นมีมากมายมหาศาล บ่อยครั้งที่สิ่งนี้เป็นปัญหาเนื่องจากปริมาณเอกสารจำนวนมากที่ได้รับเมื่อค้นหาวรรณกรรมทางการแพทย์ วัตถุประสงค์ของ UMLS...

การออกใบอนุญาต

ผู้ใช้งานระบบจะต้องลงนามใน "ข้อตกลง UMLS" และส่งรายงานการใช้งานประจำปีฉบับย่อ ผู้ใช้งานทางวิชาการสามารถใช้ UMLS ได้ฟรีเพื่อวัตถุประสงค์ในการวิจัย การใช้งานเชิงพาณิชย์หรือการผลิตจำเป็นต้องได้รับใบอนุญาตลิขสิทธิ์สำหรับคำศัพท์ต้นฉบับบางส่วนที่รวมอยู่ในระบบ

เมตาเธซอรัส

Metathesaurus เป็นพื้นฐานของ UMLS และประกอบด้วยแนวคิดทางชีวการแพทย์มากกว่า 1 ล้านรายการ และชื่อแนวคิดมากกว่า 5 ล้านรายการ ซึ่งทั้งหมดมาจากคำศัพท์ควบคุมและระบบการจำแนกประเภทที่รวมอยู่มากกว่า 100 ระบบ ตัวอย่างของคำศัพท์ควบคุมที่รวมอยู่ ได้แก่ CPT , ICD-10 ,...