อ่าน 5 นาที
การค้นหาข้อมูลทางกฎหมาย
การค้นหาข้อมูลทางกฎหมาย คือศาสตร์แห่ง การค้นหาข้อมูลที่ประยุกต์ ใช้ กับข้อความทางกฎหมาย ซึ่งรวมถึง กฎหมาย คำพิพากษาและงานวิชาการ [ 1 ]...
การค้นหาข้อมูลทางกฎหมาย
การค้นหาข้อมูลทางกฎหมายคือศาสตร์แห่งการค้นหาข้อมูลที่ประยุกต์ใช้กับข้อความทางกฎหมาย ซึ่งรวมถึงกฎหมายคำพิพากษาและงานวิชาการ[ 1 ]การค้นหาข้อมูลทางกฎหมายที่ถูกต้องแม่นยำมีความสำคัญต่อการเข้าถึงกฎหมายสำหรับบุคคลทั่วไปและผู้เชี่ยวชาญด้านกฎหมาย ความสำคัญของการค้นหาข้อมูลทางกฎหมายเพิ่มมากขึ้นเนื่องจากปริมาณเอกสารทางกฎหมายที่มีอยู่มากมายและเพิ่มขึ้นอย่างรวดเร็วผ่านทางอิเล็กทรอนิกส์[ 2 ]การค้นหาข้อมูลทางกฎหมายเป็นส่วนหนึ่งของสาขาสารสนเทศทางกฎหมายที่ กำลังเติบโต
ในบริบททางกฎหมาย การค้นหาข้อมูลทั้งหมดที่เกี่ยวข้องกับคำถามเฉพาะเจาะจงมักมีความสำคัญ อย่างไรก็ตาม วิธี การค้นหาแบบบูลีน ที่ใช้กันทั่วไป (การจับคู่ที่ตรงกันทุกประการของคำที่ระบุ) ในเอกสารทางกฎหมายฉบับเต็ม พบว่ามีอัตราการเรียกคืนข้อมูล เฉลี่ย ต่ำเพียง 20 เปอร์เซ็นต์[ 3 ]ซึ่งหมายความว่าเอกสารที่เกี่ยวข้องเพียง 1 ใน 5 เท่านั้นที่ถูกค้นพบ ในกรณีดังกล่าว นักวิจัยเชื่อว่าพวกเขาค้นพบเอกสารที่เกี่ยวข้องมากกว่า 75% [ 3 ]ซึ่งอาจส่งผลให้ไม่สามารถค้นหากรณีสำคัญหรือ กรณี ตัวอย่างได้ในบางเขตอำนาจศาล ปัญหานี้อาจร้ายแรงเป็นพิเศษ เนื่องจากผู้ประกอบวิชาชีพกฎหมายมีภาระผูกพันทางจริยธรรมที่จะต้องได้รับข้อมูลเกี่ยวกับเอกสารทางกฎหมายที่เกี่ยวข้องอย่างเหมาะสม[ 4 ]
การดึงข้อมูลทางกฎหมายพยายามเพิ่มประสิทธิภาพของการค้นหาทางกฎหมายโดยการเพิ่มจำนวนเอกสารที่เกี่ยวข้อง (ให้ผลลัพธ์ที่มีอัตราการเรียกคืน สูง ) และลดจำนวนเอกสารที่ไม่เกี่ยวข้อง ( ให้ผลลัพธ์ที่มีความแม่นยำ สูง ) นี่เป็นงานที่ยาก เนื่องจากสาขากฎหมายมักมีศัพท์เฉพาะ [ 5 ] คำที่มี หลายความหมาย [ 6 ] (คำที่มีความหมายต่างกันเมื่อใช้ในบริบททางกฎหมาย) และมีการเปลี่ยนแปลงอยู่ตลอดเวลา
เทคนิคที่ใช้เพื่อให้บรรลุเป้าหมายเหล่านี้โดยทั่วไปแบ่งออกได้เป็นสามประเภท ได้แก่ การค้นหาแบบ บูลีนการจำแนกประเภทข้อความทางกฎหมายด้วยตนเอง และ การประมวลผล ข้อความทางกฎหมาย ด้วยภาษาธรรมชาติ
ปัญหา
การประยุกต์ใช้ เทคนิค การค้นหาข้อมูล มาตรฐาน กับข้อความทางกฎหมายอาจทำได้ยากกว่าการประยุกต์ใช้ในวิชาอื่นๆ ปัญหาสำคัญประการหนึ่งคือกฎหมายมักไม่มีการจัดหมวดหมู่ โดย ธรรมชาติ[ 7 ]แต่กฎหมายโดยทั่วไปมักเต็มไปด้วยคำศัพท์ที่เปิดกว้าง ซึ่งอาจเปลี่ยนแปลงไปตามกาลเวลา[ 7 ]โดยเฉพาะอย่างยิ่งใน ประเทศ ที่ใช้กฎหมายจารีตประเพณีซึ่งแต่ละคดีที่ตัดสินอาจเปลี่ยนแปลงความหมายของคำหรือวลีบางคำได้อย่างละเอียดอ่อน[ 8 ]
ระบบข้อมูลทางกฎหมายจะต้องได้รับการตั้งโปรแกรมให้สามารถจัดการกับคำและวลีเฉพาะทางกฎหมายได้เช่นกัน แม้ว่าปัญหานี้จะน้อยลงในบริบทของคำที่ปรากฏเฉพาะในกฎหมายเท่านั้น แต่ข้อความทางกฎหมายก็มักใช้คำที่มีหลายความหมาย คำอาจมีความหมายต่างกันเมื่อใช้ในลักษณะทางกฎหมายหรือการพูดทั่วไป ซึ่งอาจเกิดขึ้นได้ทั้งสองแบบในเอกสารเดียวกัน ความหมายทางกฎหมายอาจขึ้นอยู่กับขอบเขตของกฎหมายที่นำไปใช้ ตัวอย่างเช่น ในบริบทของกฎหมายสหภาพยุโรป คำว่า "คนงาน" มีความหมายต่างกันสี่แบบ: [ 9 ]
- คนงานใดๆ ตามที่กำหนดไว้ในมาตรา 3(ก) ของคำสั่ง 89/391/EECที่ใช้จอแสดงผลเป็นส่วนสำคัญของงานปกติของตนเป็นประจำ
- บุคคลใดก็ตามที่ได้รับการจ้างงานจากนายจ้าง รวมถึงผู้ฝึกงานและนักเรียนฝึกงาน แต่ไม่รวมถึงคนรับใช้ในบ้าน
- บุคคลใดก็ตามที่ประกอบอาชีพบนเรือ รวมถึงผู้ฝึกงานและนักเรียนฝึกหัด แต่ไม่รวมถึงเจ้าหน้าที่นำร่องเรือและเจ้าหน้าที่ภาคพื้นดินที่ปฏิบัติงานบนเรือบริเวณท่าเทียบเรือ
- บุคคลใดก็ตามที่ได้รับการคุ้มครองในฐานะลูกจ้างภายใต้กฎหมายแรงงานแห่งชาติและสอดคล้องกับแนวปฏิบัติของประเทศสมาชิกที่เกี่ยวข้อง
นอกจากนี้ยังมีความหมายทั่วไปอีกด้วย:
- บุคคลที่ทำงานในอาชีพเฉพาะ[ 9 ]
แม้ว่าคำศัพท์อาจจะคล้ายกัน แต่การค้นหาข้อมูลที่ถูกต้องจะต้องแยกแยะระหว่างการใช้งานที่ตั้งใจไว้กับการใช้งานที่ไม่เกี่ยวข้อง เพื่อให้ได้ผลลัพธ์ที่ถูกต้อง
แม้ว่าระบบจะสามารถเอาชนะปัญหาทางภาษาที่มีอยู่ในกฎหมายได้ แต่ก็ยังต้องพิจารณาความเกี่ยวข้องของแต่ละผลลัพธ์ ในบริบทของการตัดสินของศาล จำเป็นต้องพิจารณาคุณค่าของคดีที่เป็นบรรทัดฐาน[ 10 ]คำตัดสินของศาลชั้นสูงหรือศาลที่เหนือกว่าอาจมีความเกี่ยวข้องมากกว่าคำตัดสินของศาลที่ต่ำกว่า แม้ว่าคำตัดสินของศาลที่ต่ำกว่าจะมีรายละเอียดเกี่ยวกับข้อเท็จจริงที่เกี่ยวข้องมากกว่าก็ตาม[ 10 ]อย่างไรก็ตาม ในทางกลับกันอาจเป็นจริงได้ หากศาลชั้นสูงมีรายละเอียดเกี่ยวกับหัวข้อนั้นเพียงเล็กน้อย (เช่น หากเป็นประเด็นรองในคดี) [ 10 ]ระบบการค้นหาข้อมูลต้องตระหนักถึงอำนาจของเขตอำนาจศาลด้วย คดีจากหน่วยงานที่มีผลผูกพันมีแนวโน้มที่จะมีคุณค่ามากกว่าคดีจากหน่วยงานที่ไม่มีผลผูกพัน
นอกจากนี้ เจตนาของผู้ใช้อาจเป็นตัวกำหนดว่ากรณีใดที่พวกเขาเห็นว่ามีคุณค่า ตัวอย่างเช่น ในกรณีที่ผู้เชี่ยวชาญด้านกฎหมายพยายามโต้แย้งการตีความกฎหมายเฉพาะเจาะจง เขาอาจพบว่าคำตัดสินของศาลชั้นต้นที่สนับสนุนจุดยืนของเขามีคุณค่ามากกว่าจุดยืนของศาลชั้นสูงที่ไม่สนับสนุน[ 10 ]เขายังอาจให้คุณค่ากับจุดยืนที่คล้ายคลึงกันจากสาขากฎหมายที่แตกต่างกัน เขตอำนาจศาลที่แตกต่างกัน หรือความเห็นที่คัดค้าน[ 10 ]
การเอาชนะปัญหาเหล่านี้อาจทำได้ยากขึ้นเนื่องจากจำนวนคดีที่มีอยู่มากมาย จำนวนคดีทางกฎหมายที่มีให้ใช้งานผ่านช่องทางอิเล็กทรอนิกส์เพิ่มขึ้นอย่างต่อเนื่อง (ในปี 2546 ศาลอุทธรณ์ของสหรัฐฯ ได้ตัดสินคดีใหม่ประมาณ 500 คดีต่อวัน[ 2 ] ) ซึ่งหมายความว่าระบบการค้นหาข้อมูลทางกฎหมายที่ถูกต้องจะต้องรวมวิธีการทั้งการจัดเรียงข้อมูลในอดีตและการจัดการข้อมูลใหม่[ 2 ] [ 11 ]
เทคนิค
การค้นหาแบบบูลีน
การค้นหาแบบบูลีนซึ่งผู้ใช้สามารถระบุเงื่อนไขต่างๆ เช่น การใช้คำเฉพาะ หรือคำพิพากษาของศาลเฉพาะแห่ง เป็นรูปแบบการค้นหาที่พบได้บ่อยที่สุดในระบบการค้นหาข้อมูลทางกฎหมาย มีการใช้งานอย่างแพร่หลาย แต่แก้ไขปัญหาที่กล่าวถึงข้างต้นได้เพียงเล็กน้อย
อัตราการเรียกคืนและความแม่นยำของการค้นหาเหล่านี้แตกต่างกันไปตามการใช้งานและการค้นหาที่วิเคราะห์ การศึกษาหนึ่งพบว่าอัตราการเรียกคืน ของการค้นหาแบบบูลีนพื้นฐาน อยู่ที่ประมาณ 20% และอัตราความแม่นยำอยู่ที่ประมาณ 79% [ 3 ]การศึกษาอีกฉบับหนึ่งได้นำการค้นหาทั่วไปมาใช้ (นั่นคือ ไม่ได้ออกแบบมาเพื่อการใช้งานทางกฎหมาย) และพบอัตราการเรียกคืน 56% และอัตราความแม่นยำ 72% ในกลุ่มผู้เชี่ยวชาญด้านกฎหมาย ตัวเลขทั้งสองเพิ่มขึ้นเมื่อทำการค้นหาโดยผู้ที่ไม่ใช่ผู้เชี่ยวชาญด้านกฎหมาย โดยมีอัตราการเรียกคืน 68% และอัตราความแม่นยำ 77% ซึ่งอาจอธิบายได้เนื่องจากการใช้คำศัพท์ทางกฎหมายที่ซับซ้อนโดยผู้เชี่ยวชาญด้านกฎหมาย[ 12 ]
การจำแนกประเภทด้วยตนเอง
เพื่อเอาชนะข้อจำกัดของการค้นหาแบบบูลีนพื้นฐาน ระบบสารสนเทศได้พยายามจัดประเภทกฎหมายและพระราชบัญญัติต่างๆ ให้เป็นโครงสร้างที่เป็นมิตรกับคอมพิวเตอร์มากขึ้น โดยปกติแล้ว สิ่งนี้จะส่งผลให้เกิดการสร้างออนโทโลยีเพื่อจัดประเภทข้อความ โดยอิงจากวิธีที่ผู้เชี่ยวชาญด้านกฎหมายอาจคิดเกี่ยวกับข้อความเหล่านั้น[ 13 ]ความพยายามเหล่านี้เชื่อมโยงข้อความตามประเภท คุณค่า และ/หรือหัวข้อของข้อความ ผู้ให้บริการค้นหากฎหมายรายใหญ่ส่วนใหญ่ในปัจจุบันได้นำการค้นหาแบบจัดประเภทมาใช้ เช่น การค้นหา"ภาษาธรรมชาติ" ของWestlaw [ 14 ]หรือ การค้นหา Headnote ของLexisNexis [ 15 ]นอกจากนี้ บริการทั้งสองนี้ยังอนุญาตให้เรียกดูการจัดประเภทผ่าน West Key Numbers ของ Westlaw [ 14 ]หรือ Headnotes ของ Lexis [ 15 ]แม้ว่าอัลกอริทึมการค้นหาทั้งสองนี้จะเป็นกรรมสิทธิ์และเป็นความลับ แต่ก็เป็นที่ทราบกันว่ามีการใช้การจัดประเภทข้อความด้วยตนเอง (แม้ว่าอาจจะใช้คอมพิวเตอร์ช่วยก็ตาม) [ 13 ]
ระบบเหล่านี้สามารถช่วยเอาชนะปัญหาส่วนใหญ่ที่มีอยู่ในระบบการค้นหาข้อมูลทางกฎหมายได้ เนื่องจากการจัดประเภทด้วยตนเองมีโอกาสมากที่สุดในการระบุคดีสำคัญและทำความเข้าใจประเด็นที่เกิดขึ้นในข้อความ[ 16 ]ในการศึกษาหนึ่ง การค้นหาแบบออนโทโลยีส่งผลให้อัตราความแม่นยำอยู่ที่ 82% และอัตราการเรียกคืนอยู่ที่ 97% ในกลุ่มผู้เชี่ยวชาญด้านกฎหมาย[ 17 ]อย่างไรก็ตาม ข้อความทางกฎหมายที่รวมอยู่ได้รับการควบคุมอย่างระมัดระวังให้เหลือเพียงไม่กี่สาขากฎหมายในเขตอำนาจศาลเฉพาะ[ 18 ]
ข้อเสียเปรียบที่สำคัญของแนวทางนี้คือความต้องการใช้ผู้เชี่ยวชาญด้านกฎหมายที่มีทักษะสูงและใช้เวลาจำนวนมากในการจัดประเภทข้อความ[ 16 ] [ 19 ]เนื่องจากปริมาณข้อความที่มีอยู่เพิ่มขึ้นอย่างต่อเนื่อง บางคนจึงแสดงความเชื่อว่าการจัดประเภทด้วยตนเองนั้นไม่ยั่งยืน[ 20 ]
การประมวลผลภาษาธรรมชาติ
เพื่อลดการพึ่งพาผู้เชี่ยวชาญด้านกฎหมายและลดเวลาที่จำเป็น จึงได้มีการพยายามสร้างระบบเพื่อจำแนกข้อความและคำถามทางกฎหมายโดยอัตโนมัติ[ 2 ] [ 21 ] [ 22 ]การแปลที่เหมาะสมของทั้งสองอย่างจะช่วยให้สามารถดึงข้อมูลได้อย่างแม่นยำโดยไม่ต้องเสียค่าใช้จ่ายสูงในการจำแนกโดยมนุษย์ ระบบอัตโนมัติเหล่านี้โดยทั่วไปใช้ เทคนิค การประมวลผลภาษาธรรมชาติ (NLP) ที่ปรับให้เข้ากับโดเมนทางกฎหมาย และยังต้องสร้างออนโทโลยี ทางกฎหมาย ด้วย แม้ว่าจะมีระบบหลายระบบที่ได้รับการเสนอ[ 2 ] [ 21 ] [ 22 ]แต่มีเพียงไม่กี่ระบบที่รายงานผลลัพธ์ ระบบหนึ่งชื่อ “SMILE” ซึ่งพยายามแยกการจำแนกประเภทจากข้อความคดีโดยอัตโนมัติ ส่งผลให้ค่าf-measure (ซึ่งเป็นการคำนวณทั้งอัตราการเรียกคืนและความแม่นยำ) ต่ำกว่า 0.3 (เมื่อเทียบกับค่า f-measure ที่สมบูรณ์แบบที่ 1.0) [ 23 ]ซึ่งอาจต่ำกว่าอัตราที่ยอมรับได้สำหรับการใช้งานทั่วไปมาก[ 23 ] [ 24 ]
แม้ว่าผลลัพธ์จะจำกัด แต่ทฤษฎีหลายอย่างคาดการณ์ว่าวิวัฒนาการของระบบดังกล่าวจะเข้ามาแทนที่ระบบการจำแนกประเภทด้วยตนเองในที่สุด[ 25 ] [ 26 ]
การจัดอันดับตามการอ้างอิง
ในช่วงกลางทศวรรษที่ 1990 โครงการค้นหากฎหมายคดี Room 5 ใช้การขุดค้นการอ้างอิงเพื่อสรุปและจัดอันดับผลการค้นหาตามประเภทและจำนวนการอ้างอิง ซึ่งเกิดขึ้นก่อน อัลกอริทึม PageRankที่ Stanford เล็กน้อย ซึ่งก็เป็นการจัดอันดับตามการอ้างอิงเช่นกัน การจัดอันดับผลลัพธ์ขึ้นอยู่กับเขตอำนาจศาลมากพอๆ กับจำนวนการอ้างอิง[ 27 ]
หมายเหตุ
- ^ Maxwell, KT และ Schafer, B. 2009, หน้า 1
- ↑ a b c d e Jackson และคณะ, p. 60
- ^ a b c Blair, DC และ Maron, ME, 1985, หน้า 293
- ^สมาคมเนติบัณฑิตอเมริกัน, กฎข้อบังคับทางจริยธรรมวิชาชีพฉบับมาตรฐาน ข้อ 1.1, http://www.abanet.org/cpr/mrpc/rule_1_1.html
- ^ปีเตอร์ส, ดับเบิลยู. และคณะ 2007, หน้า 118
- ^ปีเตอร์ส, ดับเบิลยู. และคณะ 2007, หน้า 130
- ^ a b Peters, W. et al. 2007, หน้า 120
- ↑ศราวานันท์, เอ็ม. และคณะ. 2552 หน้า 101
- ^ a b Peters, W. et al. 2007, หน้า 131
- ^ a b c d e Maxwell, KT และ Schafer, B. 2008, หน้า 8
- ^ Maxwell, KT และ Schafer, B. 2007, หน้า 1
- ↑ศราวานันท์ เอ็ม., และคณะ. 2552 หน้า 116
- ^ a b Maxwell, KT และ Schafer, B. 2008, หน้า 2
- ^ a b Westlaw Research, http://www.westlaw.com
- ^ a b Lexis Research, http://www.lexisnexis.com
- ^ a b Maxwell, KT และ Schafer, B. 2008, หน้า 3
- ↑ศราวานันท์, เอ็ม. และคณะ. 2552 หน้า 116
- ↑ศราวานันท์, เอ็ม. และคณะ. 2552 หน้า 103
- ↑ Schweighofer, E. และ Liebwald, D. 2008, p. 108
- ^ Maxwell, KT และ Schafer, B. 2008, หน้า 4
- ^ a bแอชลีย์, เคดี และ บรูนิงเฮาส์, เอส. 2009, หน้า 125
- ^ a b Gelbart, D. และ Smith, JC 1993, หน้า 142
- ^ a b Ashley, KD และ Bruninghaus, S. 2009, หน้า 159
- ^ Maxwell, KT และ Schafer, B. 2009, หน้า 3
- ^ Maxwell, KT และ Schafer, B. 2009, หน้า 9
- ^แอชลีย์, เคดี และ บรูนิงเฮาส์, เอส. 2009, หน้า 126
- ^ Loui, RP, Norman, J., Altepeter, J., Pinkard, D., Craven, D., Linsday, J., & Foltz, M. (1997, มิถุนายน). ความคืบหน้าของ Room 5: แพลตฟอร์มทดสอบสำหรับการโต้แย้งทางกฎหมายแบบกึ่งทางการเชิงโต้ตอบสาธารณะ ใน Proceedings of the 6th international conference on Artificial intelligence and law (หน้า 207-214). ACM.
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การค้นหาข้อมูลทางกฎหมาย
การค้นหาข้อมูลทางกฎหมาย คือศาสตร์แห่ง การค้นหาข้อมูลที่ประยุกต์ ใช้ กับข้อความทางกฎหมาย ซึ่งรวมถึง กฎหมาย คำพิพากษาและงานวิชาการ [ 1 ]...
ปัญหา
การประยุกต์ใช้ เทคนิค การค้นหาข้อมูล มาตรฐาน กับข้อความทางกฎหมายอาจทำได้ยากกว่าการประยุกต์ใช้ในวิชาอื่นๆ ปัญหาสำคัญประการหนึ่งคือกฎหมายมักไม่มี การจัดหมวดหมู่ โดย ธรรมชาติ [ 7 ] แต่กฎหมายโดยทั่วไปมักเต็มไปด้วยคำศัพท์ที่เปิดกว้าง ซึ่งอาจเปลี่ยนแปลงไปตามกาลเวลา...
การค้นหาแบบบูลีน
การค้นหาแบบบูลีน ซึ่งผู้ใช้สามารถระบุเงื่อนไขต่างๆ เช่น การใช้คำเฉพาะ หรือคำพิพากษาของศาลเฉพาะแห่ง เป็นรูปแบบการค้นหาที่พบได้บ่อยที่สุดในระบบการค้นหาข้อมูลทางกฎหมาย มีการใช้งานอย่างแพร่หลาย แต่แก้ไขปัญหาที่กล่าวถึงข้างต้นได้เพียงเล็กน้อย
การจำแนกประเภทด้วยตนเอง
เพื่อเอาชนะข้อจำกัดของการค้นหาแบบบูลีนพื้นฐาน ระบบสารสนเทศได้พยายามจัดประเภทกฎหมายและพระราชบัญญัติต่างๆ ให้เป็นโครงสร้างที่เป็นมิตรกับคอมพิวเตอร์มากขึ้น โดยปกติแล้ว สิ่งนี้จะส่งผลให้เกิดการสร้างออน โทโลยี เพื่อจัดประเภทข้อความ...