อ่าน 7 นาที
การค้นหาทางอิเล็กทรอนิกส์
การค้นหาข้อมูลทางอิเล็กทรอนิกส์ (หรือ ediscovery หรือ e-discovery ) หมายถึง การค้นหาข้อมูล ในกระบวนการทางกฎหมาย เช่น การฟ้องร้อง การสืบสวนของรัฐบาล หรือ คำขอ...
การค้นหาทางอิเล็กทรอนิกส์
การค้นหาข้อมูลทางอิเล็กทรอนิกส์ (หรือediscoveryหรือe-discovery ) หมายถึงการค้นหาข้อมูลในกระบวนการทางกฎหมาย เช่นการฟ้องร้องการสืบสวนของรัฐบาล หรือ คำขอ ตามพระราชบัญญัติเสรีภาพในการเข้าถึงข้อมูลข่าวสาร โดยข้อมูลที่ต้องการนั้นอยู่ในรูปแบบอิเล็กทรอนิกส์ (มักเรียกว่าข้อมูลที่จัดเก็บทางอิเล็กทรอนิกส์หรือ ESI) [ 1 ]การค้นหาข้อมูลทางอิเล็กทรอนิกส์อยู่ภายใต้กฎของกระบวนการทางแพ่งและกระบวนการที่ตกลงกันไว้ ซึ่งมักเกี่ยวข้องกับการตรวจสอบสิทธิพิเศษและความเกี่ยวข้องก่อนที่จะส่งมอบข้อมูลให้กับฝ่ายที่ร้องขอ
ข้อมูลอิเล็กทรอนิกส์แตกต่างจากข้อมูลกระดาษเนื่องจากรูปแบบที่ไม่เป็นรูปธรรม ปริมาณ ความไม่ถาวร และความคงทน ข้อมูลอิเล็กทรอนิกส์มักมีเมตาเดตาที่ไม่มีในเอกสารกระดาษ และสามารถมีบทบาทสำคัญในฐานะหลักฐาน (เช่น วันและเวลาที่เขียนเอกสารอาจมีประโยชน์ใน คดี ลิขสิทธิ์ ) การเก็บรักษาเมตาเดตาจากเอกสารอิเล็กทรอนิกส์ก่อให้เกิดความท้าทายพิเศษในการป้องกันการทำลายหลักฐาน
ในสหรัฐอเมริกา ในระดับรัฐบาลกลาง การค้นหาหลักฐานอิเล็กทรอนิกส์อยู่ภายใต้กฎหมายทั่วไปกฎหมายคดี และกฎหมายเฉพาะ แต่ส่วนใหญ่อยู่ภายใต้กฎข้อบังคับวิธีพิจารณาความแพ่งของรัฐบาลกลาง (FRCP) รวมถึงการแก้ไขเพิ่มเติมที่มีผลบังคับใช้เมื่อวันที่ 1 ธันวาคม 2549 และ 1 ธันวาคม 2558 [ 2 ] [ 3 ]นอกจากนี้ กฎหมายของรัฐและหน่วยงานกำกับดูแลยังให้ความสำคัญกับประเด็นที่เกี่ยวข้องกับการค้นหาหลักฐานอิเล็กทรอนิกส์มากขึ้นเรื่อยๆ ในอังกฤษและเวลส์ส่วนที่ 31 ของกฎวิธีพิจารณาความแพ่ง[ 4 ]และแนวทางปฏิบัติ 31B เกี่ยวกับการเปิดเผยเอกสารอิเล็กทรอนิกส์มีผลบังคับใช้[ 5 ]เขตอำนาจศาลอื่นๆ ทั่วโลกก็มีกฎที่เกี่ยวข้องกับการค้นหาหลักฐานอิเล็กทรอนิกส์เช่นกัน
ขั้นตอนของกระบวนการ
แบบจำลองอ้างอิงการค้นหาข้อมูลอิเล็กทรอนิกส์ (EDRM)เป็นแผนภาพที่ใช้กันอย่างแพร่หลาย ซึ่งแสดงมุมมองเชิงแนวคิดของขั้นตอนต่างๆ ที่เกี่ยวข้องในกระบวนการค้นหาข้อมูลอิเล็กทรอนิกส์
การระบุตัวตน
ขั้นตอนการระบุเอกสารคือขั้นตอนการระบุเอกสารที่อาจเกี่ยวข้องเพื่อการวิเคราะห์และตรวจสอบเพิ่มเติม ในสหรัฐอเมริกา ในคดีZubulake v. UBS Warburg Shira Scheindlinได้ตัดสินว่า การไม่แจ้ง หนังสือ ระงับทางกฎหมายเป็นลายลักษณ์อักษรเมื่อคาดการณ์ว่าจะมีการฟ้องร้องดำเนินคดีจะถือว่าเป็นการประมาทเลินเล่ออย่างร้ายแรง คำตัดสินนี้ทำให้แนวคิดเรื่องการระงับทางกฎหมาย การค้นหาข้อมูลทางอิเล็กทรอนิกส์ และการเก็บรักษาข้อมูลทางอิเล็กทรอนิกส์ได้รับความสนใจมากขึ้น[ 6 ]ผู้ดูแลที่ครอบครองข้อมูลหรือเอกสารที่อาจเกี่ยวข้องจะถูกระบุ เทคนิค การแมปข้อมูลมักถูกนำมาใช้เพื่อให้แน่ใจว่ามีการระบุแหล่งข้อมูลอย่างครบถ้วน เนื่องจากขอบเขตของข้อมูลอาจมีมากหรือไม่แน่นอนในขั้นตอนนี้ จึงมีการพยายามลดขอบเขตโดยรวมให้น้อยลงอย่างเหมาะสมในขั้นตอนนี้ เช่น การจำกัดการระบุเอกสารให้อยู่ในช่วงวันที่หรือผู้ดูแลที่กำหนด
การอนุรักษ์
หน้าที่ในการรักษาข้อมูลเริ่มต้นขึ้นเมื่อคาดการณ์ได้อย่างสมเหตุสมผลว่าจะมีการฟ้องร้อง ข้อมูลที่ระบุว่าอาจมีความเกี่ยวข้องในระหว่างการรักษาจะถูกเก็บไว้ในสถานะระงับทางกฎหมายซึ่งทำให้มั่นใจได้ว่าข้อมูลจะไม่ถูกทำลาย มีการดูแลเพื่อให้แน่ใจว่ากระบวนการนี้สามารถป้องกันได้ ในขณะที่เป้าหมายสุดท้ายคือการลดความเป็นไปได้ของการทำลายหรือทำให้ข้อมูลสูญหาย การไม่รักษาข้อมูลอาจนำไปสู่การลงโทษ แม้ว่าศาลจะไม่ตัดสินว่าการไม่รักษาข้อมูลเป็นความประมาทเลินเล่อ แต่ศาลก็สามารถบังคับให้ผู้ถูกกล่าวหาจ่ายค่าปรับได้หากข้อมูลที่สูญหายทำให้ฝ่ายจำเลย "เสียเปรียบอย่างไม่เป็นธรรมในการพิสูจน์ข้อแก้ตัว" [ 7 ]
ของสะสม
เมื่อเอกสารได้รับการเก็บรักษาไว้แล้ว การรวบรวมก็สามารถเริ่มต้นได้ การรวบรวมคือการถ่ายโอนข้อมูลจากบริษัทไปยังที่ปรึกษาทางกฎหมาย ซึ่งจะเป็นผู้กำหนดความเกี่ยวข้องและการจัดการข้อมูล บริษัทบางแห่งที่ต้องรับมือกับการฟ้องร้องบ่อยครั้งมีซอฟต์แวร์ไว้เพื่อระงับการดำเนินการทางกฎหมายกับผู้ดูแลข้อมูลบางรายอย่างรวดเร็วเมื่อเกิดเหตุการณ์ (เช่น การแจ้งเตือนทางกฎหมาย) และเริ่มต้นกระบวนการรวบรวมทันที[ 8 ]บริษัทอื่นๆ อาจจำเป็นต้องเรียก ผู้เชี่ยวชาญ ด้านนิติวิทยาศาสตร์ดิจิทัล เข้ามา เพื่อป้องกันการทำลายข้อมูล ขนาดและขอบเขตของการรวบรวมนี้จะถูกกำหนดโดยขั้นตอนการระบุตัวตน
กำลังประมวลผล
ในขั้นตอนการประมวลผล ไฟล์ต้นฉบับจะถูกเตรียมพร้อมสำหรับการโหลดเข้าสู่ แพลตฟอร์ม การตรวจสอบเอกสารบ่อยครั้งที่ขั้นตอนนี้ยังเกี่ยวข้องกับการแยกข้อความและข้อมูลเมตาจากไฟล์ต้นฉบับด้วย มีการใช้เทคนิคการคัดกรองข้อมูลต่างๆ ในขั้นตอนนี้ เช่น การลบข้อมูลซ้ำซ้อนและการลบข้อมูลที่ไม่ตรงตามมาตรฐาน NIST บางครั้งไฟล์ต้นฉบับจะถูกแปลงเป็นรูปแบบที่คงที่คล้ายกระดาษ (เช่น PDF หรือ TIFF) ในขั้นตอนนี้เพื่อให้ง่ายต่อการแก้ไขและการ ติดฉลาก Bates
เครื่องมือประมวลผลที่ทันสมัยยังสามารถใช้ เครื่องมือ วิเคราะห์ ขั้นสูง เพื่อช่วยให้ทนายความที่ตรวจสอบเอกสารสามารถระบุเอกสารที่อาจเกี่ยวข้องได้อย่างแม่นยำยิ่งขึ้น
ทบทวน
ในขั้นตอนการตรวจสอบ เอกสารจะถูกตรวจสอบว่าสอดคล้องกับคำขอการค้นหาข้อมูลและเป็นไปตามสิทธิพิเศษหรือไม่ แพลตฟอร์มและบริการตรวจสอบเอกสารต่างๆ สามารถช่วยในหลายๆ งานที่เกี่ยวข้องกับกระบวนการนี้ รวมถึงการระบุเอกสารที่อาจเกี่ยวข้องได้อย่างรวดเร็ว และการคัดกรองเอกสารตามเกณฑ์ต่างๆ (เช่น คำสำคัญ ช่วงวันที่ เป็นต้น) เครื่องมือตรวจสอบส่วนใหญ่ยังช่วยให้ทนายความกลุ่มใหญ่สามารถทำงานร่วมกันในคดีได้อย่างง่ายดาย โดยมีเครื่องมือการทำงานร่วมกันและการทำงานเป็นชุดเพื่อเร่งกระบวนการตรวจสอบและลดการทำงานซ้ำซ้อน
การวิเคราะห์
การวิเคราะห์เชิงคุณภาพของเนื้อหาที่ค้นพบในขั้นตอนการรวบรวมข้อมูลและหลังจากลดขนาดลงในขั้นตอนการประมวลผลเบื้องต้น หลักฐานจะถูกพิจารณาในบริบท การวิเคราะห์ความสัมพันธ์หรือการวิเคราะห์ตามบริบทเพื่อดึงข้อมูลที่มีโครงสร้างซึ่งเกี่ยวข้องกับกรณี การจัดโครงสร้างข้อมูลตามลำดับเวลาหรือจัดกลุ่มตามหัวข้อเป็นเรื่องปกติ ตัวอย่างเช่น สามารถจัดเรียงหลักฐานตามความสัมพันธ์ระหว่างสมาชิกในกลุ่มในรูปแบบของการวิเคราะห์เครือข่ายสังคมได้
การผลิต
เอกสารจะถูกส่งมอบให้กับทนายความฝ่ายตรงข้ามตามข้อกำหนดที่ตกลงกันไว้ บ่อยครั้งที่การส่งมอบเอกสารนี้จะมาพร้อมกับไฟล์โหลด ซึ่งใช้สำหรับโหลดเอกสารเข้าสู่แพลตฟอร์มการตรวจสอบเอกสาร เอกสารสามารถจัดทำได้ทั้งในรูปแบบไฟล์ต้นฉบับหรือในรูปแบบที่เข้ารหัส (เช่นPDFหรือTIFF ) พร้อมกับข้อมูลเมตา
การนำเสนอ
การนำเสนอและอธิบายหลักฐานต่อหน้าผู้ชม (ในการให้การในชั้นศาล การไต่สวน การตัดสินคดี ฯลฯ) จุดประสงค์คือเพื่อให้ผู้ชมเข้าใจการนำเสนอ และบุคคลทั่วไปที่ไม่ใช่ผู้เชี่ยวชาญสามารถติดตามการตีความได้ ความชัดเจนและความเข้าใจง่ายเป็นสิ่งสำคัญ ข้อมูลในรูปแบบดั้งเดิมจำเป็นต้องถูกแยกย่อย แสดงภาพ และนำเสนอในบริบทที่เหมาะสม ผลลัพธ์ของการวิเคราะห์ควรเป็นหัวข้อหลักของการนำเสนอ เอกสารที่ชัดเจนควรแสดงให้เห็นถึงความสามารถในการทำซ้ำได้
ประเภทของข้อมูลที่จัดเก็บในรูปแบบอิเล็กทรอนิกส์
ข้อมูลใดๆ ที่จัดเก็บในรูปแบบอิเล็กทรอนิกส์อาจต้องถูกเปิดเผยภายใต้กฎ eDiscovery ทั่วไป ข้อมูลประเภทนี้ในอดีตได้แก่ อีเมลและเอกสารสำนักงาน (สเปรดชีต งานนำเสนอ เอกสาร PDF ฯลฯ) แต่ยังอาจรวมถึงรูปภาพ วิดีโอ ข้อความโต้ตอบแบบทันที เครื่องมือการทำงานร่วมกัน ข้อความ (SMS) แอปพลิเคชันส่งข้อความ สื่อสังคมออนไลน์ ข้อความชั่วคราว อินเทอร์เน็ตของสรรพสิ่ง (อุปกรณ์อัจฉริยะ เช่นนาฬิกาอัจฉริยะผู้ช่วยเสมือนและศูนย์กลางบ้านอัจฉริยะ ) ฐานข้อมูล และไฟล์ประเภทอื่นๆ ด้วย
นอกจากนี้ การค้นหาหลักฐานทางอิเล็กทรอนิกส์ยังรวมถึง " ข้อมูลดิบ " ซึ่งผู้ตรวจสอบทางนิติวิทยาศาสตร์สามารถตรวจสอบเพื่อค้นหาหลักฐานที่ซ่อนอยู่ได้ รูปแบบไฟล์ดั้งเดิมเรียกว่า"รูปแบบต้นฉบับ"ผู้ฟ้องร้องอาจตรวจสอบเอกสารจากการค้นหาหลักฐานทางอิเล็กทรอนิกส์ได้หลายรูปแบบ ได้แก่ เอกสารกระดาษที่พิมพ์แล้ว "ไฟล์ต้นฉบับ" หรือรูปแบบที่คล้ายกระดาษ เช่น ไฟล์ PDF หรือภาพ TIFF แพลตฟอร์มการตรวจสอบเอกสารสมัยใหม่รองรับการใช้ไฟล์ต้นฉบับและอนุญาตให้แปลงเป็น TIFF และ ประทับตรา Batesเพื่อใช้ในศาล
ข้อความอิเล็กทรอนิกส์
ในปี 2549 การแก้ไขเพิ่มเติมของศาลฎีกาสหรัฐฯ ต่อ กฎระเบียบวิธีพิจารณาความแพ่งของรัฐบาล กลาง ได้สร้างหมวดหมู่สำหรับบันทึกอิเล็กทรอนิกส์ ซึ่งเป็นครั้งแรกที่ระบุอย่างชัดเจนว่าอีเมลและการสนทนาแบบข้อความโต้ตอบแบบทันทีเป็นบันทึกที่น่าจะถูกจัดเก็บและนำมาแสดงเมื่อมีความเกี่ยวข้อง
ปัญหาเกี่ยวกับการเก็บรักษาหลักฐานประเภทหนึ่งเกิดขึ้นใน คดีความระหว่าง Zubulake กับ UBS Warburgตลอดทั้งคดี โจทก์อ้างว่าหลักฐานที่จำเป็นในการพิสูจน์คดีนั้นมีอยู่ในอีเมลที่จัดเก็บไว้ในระบบคอมพิวเตอร์ของ UBS เอง เนื่องจากอีเมลที่ร้องขอไม่เคยถูกค้นพบหรือถูกทำลาย ศาลจึงพบว่าอีเมลเหล่านั้นมีแนวโน้มที่จะมีอยู่มากกว่าที่จะหายไป ศาลพบว่าในขณะที่ทนายความของบริษัทสั่งให้เก็บรักษาหลักฐานการค้นหาทั้งหมดที่เป็นไปได้ รวมถึงอีเมล แต่เจ้าหน้าที่ที่ได้รับคำสั่งนั้นไม่ได้ปฏิบัติตาม ส่งผลให้ UBS ถูกลงโทษ อย่างหนัก
เพื่อสร้างความน่าเชื่อถือ ระบบจัดเก็บข้อมูลบางระบบจะใช้รหัสเฉพาะกับข้อความหรือการสนทนาแต่ละรายการที่ถูกจัดเก็บ ระบบเหล่านี้จะป้องกันการแก้ไขข้อความต้นฉบับ ข้อความไม่สามารถถูกลบ และบุคคลที่ไม่ได้รับอนุญาตไม่สามารถเข้าถึงข้อความได้
การเปลี่ยนแปลงอย่างเป็นทางการของกฎระเบียบวิธีพิจารณาความแพ่งของรัฐบาลกลางในเดือนธันวาคม พ.ศ. 2549 และ พ.ศ. 2550 บังคับให้ผู้ฟ้องคดีแพ่งต้องปฏิบัติตามกฎระเบียบเกี่ยวกับการเก็บรักษาและการจัดการข้อมูลอิเล็กทรอนิกส์ (ESI) อย่างถูกต้อง การจัดการ ESI ที่ไม่เหมาะสมอาจส่งผลให้มีการตัดสินว่ามีการทำลายหลักฐานและมีการลงโทษอย่างน้อยหนึ่งอย่าง รวมถึงคำแนะนำของคณะลูกขุนในการอนุมานในทางลบ คำพิพากษาโดยสรุปค่าปรับ และการลงโทษอื่นๆ ในบางกรณี เช่นQualcomm v. Broadcomทนายความอาจถูกฟ้องร้องได้[ 9 ]
ในคดี United States v. Heppner (2026) ศาลรัฐบาลกลางได้ตัดสินว่าการสนทนากับเครื่องมือ AI สาธารณะ Claude ไม่ได้รับการคุ้มครองภายใต้สถานการณ์ที่นำเสนอ โดยเน้นย้ำว่าการสนทนาของแชทบอท AI เป็นหมวดหมู่ของข้อมูลที่จัดเก็บทางอิเล็กทรอนิกส์ที่อาจค้นพบได้[ 10 ] [ 11 ] [ 12 ]
ฐานข้อมูลและข้อมูลที่มีโครงสร้างอื่นๆ
ข้อมูลที่มีโครงสร้างโดยทั่วไปจะจัดเก็บอยู่ในฐานข้อมูลหรือชุดข้อมูล โดยจัดเรียงในรูปแบบตารางที่มีคอลัมน์ แถว และชนิดข้อมูลที่กำหนดไว้ ระบบที่ใช้กันทั่วไปมากที่สุดคือระบบจัดการฐานข้อมูลเชิงสัมพันธ์ ( RDBMS ) ซึ่งสามารถจัดการข้อมูลปริมาณมากได้ เช่นOracle , IBM Db2 , Microsoft SQL Server , SybaseและTeradataนอกจากนี้ ขอบเขตของข้อมูลที่มีโครงสร้างยังรวมถึงสเปรดชีต (ไม่ใช่สเปรดชีตทุกแผ่นที่มีข้อมูลที่มีโครงสร้าง แต่แผ่นที่มีข้อมูลจัดเรียงในรูปแบบตารางคล้ายฐานข้อมูล) ฐานข้อมูลบนเดสก์ท็อป เช่นFileMaker Pro และMicrosoft Access ไฟล์ข้อความเรียบที่มีโครงสร้างไฟล์XML คลังข้อมูลย่อยคลังข้อมูลขนาดใหญ่ เป็นต้น
เสียง
ข้อความเสียงมักจะสามารถค้นพบได้ภายใต้กฎการค้นหาข้อมูลทางอิเล็กทรอนิกส์ นายจ้างอาจมีหน้าที่ต้องเก็บรักษาข้อความเสียงไว้หากคาดการณ์ว่าจะมีการฟ้องร้องดำเนินคดีกับพนักงานดังกล่าว ข้อมูลจากผู้ช่วยเสียง เช่นAmazon Alexaและ Siri ถูกนำมาใช้ในคดีอาญา[ 13 ]
สื่อสังคมออนไลน์และข้อมูลมือถือ
สื่อต่างๆ เช่น โพสต์ ข้อความ รูปภาพ และบันทึกการใช้งานแอปพลิเคชัน มีบทบาทมากขึ้นเรื่อยๆ ในการค้นหาข้อมูลในยุคปัจจุบัน
รูปแบบการรายงาน
แม้ว่าการแปลงเอกสารเป็นรูปแบบภาพนิ่ง ( TIFFและJPEG ) จะกลายเป็นวิธีการตรวจสอบเอกสารมาตรฐานมาเกือบสองทศวรรษแล้ว แต่การตรวจสอบเอกสารในรูปแบบไฟล์ดั้งเดิมกลับได้รับความนิยมเพิ่มขึ้นนับตั้งแต่ปี 2547 เนื่องจากจำเป็นต้องตรวจสอบเอกสารในรูปแบบไฟล์ดั้งเดิม แอปพลิเคชันและชุดเครื่องมือที่สามารถเปิดไฟล์ได้หลายรูปแบบจึงได้รับความนิยมมากขึ้นเช่นกัน เช่นเดียวกับในตลาดจัดเก็บข้อมูล ECM ( Enterprise Content Management ) ซึ่งกำลังผสานรวมกับเทคโนโลยี ESI อย่างรวดเร็ว
การแปลงไฟล์ต้นฉบับเป็นรูปแบบรูปภาพที่ไม่ต้องใช้แอปพลิเคชันดั้งเดิมเรียกว่าการแปลงเป็นหิน ซึ่งมีประโยชน์ในการปกปิดข้อมูลที่เป็นความลับหรือข้อมูลที่ละเอียดอ่อน เนื่องจากเครื่องมือปกปิดข้อมูลสำหรับรูปภาพนั้นมีความสมบูรณ์กว่าและใช้งานง่ายกว่ากับรูปภาพประเภทเดียวกันโดยบุคคลที่ไม่ใช่ผู้เชี่ยวชาญด้านเทคนิค ความพยายามในการปกปิดไฟล์ PDF ที่แปลงเป็นรูปแบบหินในลักษณะเดียวกันโดยบุคลากรที่ไม่มีความสามารถได้ลบเลเยอร์ที่ถูกปกปิดออกไปและเปิดเผยข้อมูลที่ถูกปกปิด เช่น หมายเลขประกันสังคมและข้อมูลส่วนตัวอื่นๆ[ 14 ] [ 15 ]
ตามธรรมเนียมแล้ว ผู้ให้บริการด้านการค้นหาข้อมูลอิเล็กทรอนิกส์จะได้รับการว่าจ้างให้แปลงไฟล์ต้นฉบับเป็นภาพ TIFF (เช่น ภาพ 10 ภาพสำหรับ เอกสาร Microsoft Word 10 หน้า ) พร้อมไฟล์โหลดสำหรับใช้ในแอปพลิเคชันฐานข้อมูลการตรวจสอบข้อมูลแบบภาพ ปัจจุบัน แอปพลิเคชันฐานข้อมูลการตรวจสอบข้อมูลได้ฝังโปรแกรมดูไฟล์ต้นฉบับที่มีความสามารถในการจัดการไฟล์ TIFF ไว้มากขึ้น ด้วยความสามารถทั้งไฟล์ต้นฉบับและไฟล์ภาพ อาจทำให้พื้นที่จัดเก็บข้อมูลที่จำเป็นทั้งหมดเพิ่มขึ้นหรือลดลง เนื่องจากอาจมีหลายรูปแบบและหลายไฟล์ที่เกี่ยวข้องกับไฟล์ต้นฉบับแต่ละไฟล์ การใช้งาน การจัดเก็บ และแนวทางปฏิบัติที่ดีที่สุดจึงมีความสำคัญและจำเป็นอย่างยิ่งในการรักษากลยุทธ์ที่คุ้มค่า
ข้อมูลที่มีโครงสร้างมักจะถูกสร้างขึ้นในรูปแบบข้อความคั่น เมื่อจำนวนตารางที่ต้องค้นหามีจำนวนมากหรือความสัมพันธ์ระหว่างตารางมีความสำคัญ ข้อมูลจะถูกสร้างขึ้นในรูปแบบฐานข้อมูลดั้งเดิมหรือเป็นไฟล์สำรองฐานข้อมูล[ 16 ]
ปัญหาทั่วไป
บุคคลหลายคนอาจมีส่วนร่วมในโครงการค้นหาหลักฐานอิเล็กทรอนิกส์ ได้แก่ ทนายความของทั้งสองฝ่าย ผู้เชี่ยวชาญด้านนิติวิทยาศาสตร์ ผู้จัดการด้านไอที และผู้จัดการบันทึกข้อมูล เป็นต้น การตรวจสอบทางนิติวิทยาศาสตร์มักใช้คำศัพท์เฉพาะทาง (ตัวอย่างเช่น "ภาพ" หมายถึงการได้มาซึ่งสื่อดิจิทัล) ซึ่งอาจนำไปสู่ความสับสนได้[ 1 ]
แม้ว่าทนายความที่เกี่ยวข้องกับคดีความจะพยายามอย่างเต็มที่ที่จะทำความเข้าใจบริษัทและองค์กรที่ตนเป็นตัวแทน แต่พวกเขาก็อาจไม่เข้าใจนโยบายและแนวปฏิบัติที่ใช้ใน แผนก ไอที ของบริษัท ส่งผลให้ข้อมูลบางส่วนอาจถูกทำลายหลังจากมีการออกคำสั่งระงับการทำลายข้อมูลโดยช่างเทคนิคที่ไม่รู้เรื่องซึ่งปฏิบัติหน้าที่ตามปกติ บริษัทหลายแห่งกำลังติดตั้งซอฟต์แวร์ที่เก็บรักษาข้อมูลอย่างถูกต้องทั่วทั้งเครือข่ายเพื่อต่อสู้กับแนวโน้มนี้และป้องกันการทำลายข้อมูลโดยไม่ตั้งใจ
เนื่องจากความซับซ้อนของการดำเนินคดีในปัจจุบันและระบบสารสนเทศที่หลากหลายในท้องตลาด การค้นหาหลักฐานอิเล็กทรอนิกส์มักต้องอาศัยผู้เชี่ยวชาญด้านไอทีจากทั้งสำนักงานทนายความ (หรือผู้ให้บริการ) และคู่ความในคดี เพื่อสื่อสารโดยตรงเพื่อแก้ไขปัญหาความไม่เข้ากันของเทคโนโลยีและตกลงรูปแบบการส่งมอบหลักฐาน การไม่ได้รับคำแนะนำจากผู้เชี่ยวชาญที่มีความรู้ความสามารถมักนำไปสู่เวลาเพิ่มเติมและค่าใช้จ่ายที่ไม่คาดคิดในการจัดหาเทคโนโลยีใหม่หรือปรับเทคโนโลยีที่มีอยู่ให้รองรับข้อมูลที่รวบรวมได้
แนวโน้มที่กำลังเกิดขึ้น
วิธีการเก็บรวบรวมทางเลือก
ปัจจุบัน แนวทางหลักสองประการในการระบุเนื้อหาที่เกี่ยวข้องบนเครื่องคอมพิวเตอร์ของผู้ดูแลระบบ ได้แก่:
(1) ในกรณีที่สามารถเข้าถึงเครือข่ายขององค์กรได้ทางกายภาพ — จะมีการติดตั้งเอเจนต์บนเครื่องผู้ดูแลแต่ละเครื่อง ซึ่งจะส่งข้อมูลจำนวนมากเพื่อจัดทำดัชนีผ่านเครือข่ายไปยังเซิร์ฟเวอร์หนึ่งเครื่องหรือมากกว่าที่ต้องเชื่อมต่อกับเครือข่าย หรือ
(2) ในกรณีที่เป็นไปไม่ได้หรือไม่สะดวกที่จะไปที่สถานที่ตั้งทางกายภาพของระบบผู้ดูแลระบบ — อุปกรณ์จัดเก็บข้อมูลจะเชื่อมต่อกับเครื่องผู้ดูแลระบบ (หรือเซิร์ฟเวอร์ของบริษัท) จากนั้นอินสแตนซ์การรวบรวมแต่ละรายการจะถูกปรับใช้ด้วยตนเอง
สำหรับแนวทางแรกนั้น มีประเด็นปัญหาอยู่หลายประการ:
- ในกระบวนการรวบรวมข้อมูลทั่วไป ข้อมูลปริมาณมากจะถูกส่งผ่านเครือข่ายเพื่อทำการจัดทำดัชนี ซึ่งส่งผลกระทบต่อการดำเนินงานทางธุรกิจตามปกติ
- กระบวนการจัดทำดัชนีไม่แม่นยำ 100% ในการค้นหาเนื้อหาที่เกี่ยวข้อง
- โดยทั่วไปแล้ว ผู้ดูแลระบบไอทีไม่ค่อยพอใจกับการติดตั้งเอเจนต์บนเครื่องคอมพิวเตอร์ของผู้ดูแลระบบ
- จำนวนเครื่องผู้ดูแลระบบที่สามารถประมวลผลพร้อมกันได้นั้นมีจำกัดอย่างมาก เนื่องจากแบนด์วิดท์ของเครือข่ายที่จำเป็น
เทคโนโลยีใหม่สามารถแก้ไขปัญหาที่เกิดจากแนวทางแรกได้โดยการเรียกใช้แอปพลิเคชันทั้งหมดในหน่วยความจำบนเครื่องผู้ดูแลแต่ละเครื่อง และส่งเฉพาะข้อมูลที่ตอบสนองผ่านเครือข่าย กระบวนการนี้ได้รับการจดสิทธิบัตร[ 17 ]และรวมอยู่ใน เครื่องมือ ISEEKซึ่งเป็นหัวข้อของเอกสารการประชุมโดยAdams , Mann และ Hobbs [ 18 ]
ในส่วนที่เกี่ยวข้องกับแนวทางที่สอง แม้ว่าการรวบรวมด้วยตนเองจะเป็นหัวข้อที่ได้รับความสนใจอย่างมากใน eDiscovery แต่ข้อกังวลต่างๆ กำลังได้รับการแก้ไขโดยการจำกัดการมีส่วนร่วมของผู้ดูแลให้เหลือเพียงแค่เสียบอุปกรณ์และเรียกใช้แอปพลิเคชันเพื่อสร้างคอนเทนเนอร์ที่เข้ารหัสของเอกสารที่เกี่ยวข้อง[ 19 ]
ไม่ว่าจะใช้วิธีใดในการรวบรวมและประมวลผลข้อมูล ก็มีทรัพยากรน้อยมากสำหรับผู้ปฏิบัติงานในการประเมินเครื่องมือต่างๆ นี่เป็นปัญหาเนื่องจากต้นทุนของโซลูชัน eDiscovery ค่อนข้างสูง แม้จะมีตัวเลือกจำกัดในการขอรับใบอนุญาตทดลองใช้สำหรับเครื่องมือต่างๆ แต่อุปสรรคสำคัญในกระบวนการประเมินคือการสร้างสภาพแวดล้อมที่เหมาะสมในการทดสอบเครื่องมือเหล่านั้นอดัมส์แนะนำให้ใช้ Microsoft Deployment Lab ซึ่งจะสร้างเครือข่ายเสมือนขนาดเล็กที่ทำงานภายใต้ Hyper-V โดยอัตโนมัติ[ 20 ]
การตรวจสอบโดยใช้เทคโนโลยีช่วย
การทบทวนโดยใช้เทคโนโลยีช่วย (TAR) หรือที่รู้จักกันในชื่อการทบทวนโดยใช้คอมพิวเตอร์ช่วยหรือการเข้ารหัสเชิงทำนาย เกี่ยวข้องกับการประยุกต์ใช้การเรียนรู้ของเครื่องจักรแบบมีผู้กำกับดูแลหรือ วิธีการ ตามกฎเพื่ออนุมานความเกี่ยวข้อง (หรือการตอบสนอง สิทธิพิเศษ หรือหมวดหมู่ความสนใจอื่นๆ) ของ ESI [ 21 ]การทบทวนโดยใช้เทคโนโลยีช่วยได้พัฒนาอย่างรวดเร็วนับตั้งแต่เริ่มใช้เมื่อประมาณปี 2548 [ 22 ] [ 23 ]
จากการศึกษาวิจัยที่บ่งชี้ถึงประสิทธิผล[ 24 ] [ 25 ] TAR ได้รับการยอมรับครั้งแรกโดยศาลสหรัฐฯ ในปี 2555 [ 26 ]โดยศาลไอร์แลนด์ในปี 2558 [ 27 ]และโดยศาลสูงในอังกฤษในปี 2559 [ 28 ]
ในปี 2558 ศาลแขวงสหรัฐอเมริกาประจำเขตทางใต้ของนิวยอร์กได้ประกาศว่า “เป็นกฎหมายลายลักษณ์อักษรที่ว่า หากฝ่ายผู้ผลิตต้องการใช้ TAR สำหรับการตรวจสอบเอกสาร ศาลจะอนุญาต” [ 29 ]ในปีต่อมา ศาลดังกล่าวระบุว่า[ 30 ]
เพื่อให้ชัดเจน ศาลเชื่อว่าในกรณีส่วนใหญ่ในปัจจุบัน TAR เป็นเครื่องมือค้นหาที่ดีที่สุดและมีประสิทธิภาพที่สุด โดยเฉพาะอย่างยิ่งตามการศึกษาวิจัย (อ้างอิงในRio Tinto [ 29 ] ) ซึ่งวิธีการ TAR ใช้การเรียนรู้แบบแอคทีฟต่อเนื่อง ("CAL") [ 31 ]ซึ่งขจัดปัญหาเกี่ยวกับชุดเมล็ดพันธุ์และการทำให้เครื่องมือ TAR มีเสถียรภาพ ศาลต้องการให้เมืองใช้ TAR ในกรณีนี้ แต่ศาลไม่สามารถและจะไม่บังคับให้เมืองทำเช่นนั้น อาจมีช่วงเวลาหนึ่งที่ TAR ถูกใช้อย่างแพร่หลายจนอาจไม่สมเหตุสมผลที่ฝ่ายใดฝ่ายหนึ่งจะปฏิเสธการใช้ TAR เรายังไม่ถึงจุดนั้น ดังนั้น แม้ว่าศาลอาจต้องการให้ฝ่ายที่ตอบโต้ทำอะไรก็ตาม หลักการ Sedona ข้อ 6 [ 32 ] ก็ยัง คงควบคุมอยู่ คำร้องของ Hyles ที่ขอให้บังคับให้เมืองใช้ TAR จึงถูกปฏิเสธ
Maura R. GrossmanและGordon Cormackได้ให้คำจำกัดความของ TAR ไว้ดังนี้:
กระบวนการจัดลำดับความสำคัญหรือการเข้ารหัสชุดเอกสารโดยใช้ระบบคอมพิวเตอร์ที่ใช้ประโยชน์จากการตัดสินใจของมนุษย์จากผู้เชี่ยวชาญเฉพาะเรื่องหนึ่งคนหรือมากกว่านั้นในชุดเอกสารขนาดเล็ก จากนั้นจึงขยายการตัดสินใจเหล่านั้นไปยังชุดเอกสารที่เหลือ วิธีการ TAR บางวิธีใช้อัลกอริธึมการเรียนรู้ของเครื่องเพื่อแยกแยะเอกสารที่เกี่ยวข้องออกจากเอกสารที่ไม่เกี่ยวข้อง โดยอิงจากตัวอย่างการฝึกอบรมที่ผู้เชี่ยวชาญเฉพาะเรื่องเข้ารหัสว่าเป็นเอกสารที่เกี่ยวข้องหรือไม่เกี่ยวข้อง ในขณะที่วิธีการ TAR อื่นๆ จะสร้างกฎที่เป็นระบบซึ่งเลียนแบบกระบวนการตัดสินใจของผู้เชี่ยวชาญ กระบวนการ TAR โดยทั่วไปจะรวมแบบจำลองทางสถิติและ/หรือเทคนิคการสุ่มตัวอย่างเพื่อเป็นแนวทางในกระบวนการและเพื่อวัดประสิทธิภาพโดยรวมของระบบ[ 33 ]
การผสานรวมเข้ากับการกำกับดูแลข้อมูล
หลักฐานเชิงประจักษ์เกี่ยวกับแนวโน้มที่กำลังเกิดขึ้นนี้ ชี้ให้เห็นถึงคุณค่าทางธุรกิจของการกำกับดูแลข้อมูล (Information Governance : IG) ซึ่ง Gartnerนิยามไว้ว่า "การกำหนดสิทธิ์ในการตัดสินใจและกรอบความรับผิดชอบเพื่อส่งเสริมพฤติกรรมที่พึงประสงค์ในการประเมิน การสร้าง การจัดเก็บ การใช้งาน การเก็บรักษา และการลบข้อมูล ซึ่งรวมถึงกระบวนการ บทบาท มาตรฐาน และตัวชี้วัดที่รับประกันการใช้ข้อมูลอย่างมีประสิทธิภาพและประสิทธิผล เพื่อช่วยให้องค์กรบรรลุเป้าหมาย"
เมื่อเทียบกับ eDiscovery แล้ว การกำกับดูแลข้อมูลในฐานะที่เป็นศาสตร์แขนงหนึ่งนั้นค่อนข้างใหม่ อย่างไรก็ตาม มีแรงผลักดันให้เกิดการหลอมรวมกัน eDiscovery ซึ่งเป็นอุตสาหกรรมมูลค่าหลายพันล้านดอลลาร์ กำลังพัฒนาอย่างรวดเร็ว พร้อมที่จะนำโซลูชันที่เหมาะสมที่สุดมาใช้เพื่อเสริมสร้างความปลอดภัยทางไซเบอร์ (สำหรับการประมวลผลบนคลาวด์) ตั้งแต่ต้นทศวรรษ 2000 ผู้ปฏิบัติงานด้าน eDiscovery ได้พัฒนาทักษะและเทคนิคที่สามารถนำไปใช้กับการกำกับดูแลข้อมูลได้ องค์กรต่างๆ สามารถนำบทเรียนที่ได้จาก eDiscovery มาใช้เพื่อเร่งกระบวนการสร้างกรอบการกำกับดูแลข้อมูลที่ซับซ้อนยิ่งขึ้นได้
แบบจำลองอ้างอิงการกำกับดูแลข้อมูล (IGRM) แสดงให้เห็นถึงความสัมพันธ์ระหว่างผู้มีส่วนได้ส่วนเสียหลักและวงจรชีวิตของข้อมูล และเน้นย้ำถึงความโปร่งใสที่จำเป็นเพื่อให้สามารถกำกับดูแลได้อย่างมีประสิทธิภาพ IGRM เวอร์ชัน 3.0 ที่ได้รับการปรับปรุงเน้นย้ำว่าเจ้าหน้าที่ฝ่ายความเป็นส่วนตัวและความปลอดภัยเป็นผู้มีส่วนได้ส่วนเสียที่สำคัญ หัวข้อนี้ได้รับการกล่าวถึงในบทความชื่อ "Better Ediscovery: Unified Governance and the IGRM" ซึ่งตีพิมพ์โดย American Bar Association [ 34 ]
ดูเพิ่มเติม
- ระบบคลังเก็บตัวเร่งปฏิกิริยา
- การขุดข้อมูล
- การเก็บรักษาข้อมูล
- การค้นพบ (กฎหมาย)
- การประเมินกรณีเบื้องต้น
- ข้อมูลที่จัดเก็บทางอิเล็กทรอนิกส์ (กฎระเบียบวิธีพิจารณาความแพ่งของรัฐบาลกลาง)
- บริการฝากไฟล์
- การค้นหาทางนิติวิทยาศาสตร์
- การกำกับดูแลข้อมูล
- การกำกับดูแลทางกฎหมาย การจัดการความเสี่ยง และการปฏิบัติตามกฎหมาย
- การเรียนรู้ของเครื่อง
- การเก็บรักษาข้อมูลด้านโทรคมนาคม
ลิงก์ภายนอก
- ศูนย์ตุลาการกลาง: เอกสารเกี่ยวกับการค้นหาข้อมูลทางอิเล็กทรอนิกส์
- บทความของสมาคมเนติบัณฑิตอเมริกันเกี่ยวกับการค้นหาหลักฐานทางอิเล็กทรอนิกส์ (eDiscovery)
- การค้นหาหลักฐานทางอิเล็กทรอนิกส์ด้วย AI (Financial Times)
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การค้นหาทางอิเล็กทรอนิกส์
การค้นหาข้อมูลทางอิเล็กทรอนิกส์ (หรือ ediscovery หรือ e-discovery ) หมายถึง การค้นหาข้อมูล ในกระบวนการทางกฎหมาย เช่น การฟ้องร้อง การสืบสวนของรัฐบาล หรือ คำขอ...
ขั้นตอนของกระบวนการ
แบบจำลองอ้างอิงการค้นหาข้อมูลอิเล็กทรอนิกส์ (EDRM)เป็นแผนภาพที่ใช้กันอย่างแพร่หลาย ซึ่งแสดงมุมมองเชิงแนวคิดของขั้นตอนต่างๆ ที่เกี่ยวข้องในกระบวนการค้นหาข้อมูลอิเล็กทรอนิกส์
การระบุตัวตน
ขั้นตอนการระบุเอกสารคือขั้นตอนการระบุเอกสารที่อาจเกี่ยวข้องเพื่อการวิเคราะห์และตรวจสอบเพิ่มเติม ในสหรัฐอเมริกา ในคดี Zubulake v.
การอนุรักษ์
หน้าที่ในการรักษาข้อมูลเริ่มต้นขึ้นเมื่อคาดการณ์ได้อย่างสมเหตุสมผลว่าจะมีการฟ้องร้อง ข้อมูลที่ระบุว่าอาจมีความเกี่ยวข้องในระหว่างการรักษาจะถูกเก็บไว้ในสถานะ ระงับทางกฎหมาย ซึ่งทำให้มั่นใจได้ว่าข้อมูลจะไม่ถูกทำลาย...