อ่าน 19 นาที
สไตโลเมตรี
สไตโลเมตรีคือการประยุกต์ใช้การศึกษารูปแบบทางภาษา โดยปกติ ใช้กับภาษาเขียน นอกจาก นี้ยังนำไปประยุกต์ใช้ได้อย่างประสบความสำเร็จกับดนตรีภาพวาดหมากรุกและซอร์สโค้ด
สไตโลเมตรี
| ส่วนหนึ่งของชุดบทความเกี่ยวกับ |
| ภาษาศาสตร์ |
|---|
สไตโลเมตรีคือการประยุกต์ใช้การศึกษารูปแบบทางภาษา โดยปกติ ใช้กับภาษาเขียน[ 1 ] นอกจาก นี้ยังนำไปประยุกต์ใช้ได้อย่างประสบความสำเร็จกับดนตรี[ 2 ]ภาพวาด[ 3 ]หมากรุก[ 4 ]และซอร์สโค้ด [ 5 ]
สไตโลเมตรีมักใช้เพื่อระบุผู้เขียนเอกสารที่ไม่ระบุชื่อหรือเอกสารที่มีข้อโต้แย้ง[ 6 ]มีการประยุกต์ใช้ทั้งทางกฎหมาย วิชาการ และวรรณกรรม ตั้งแต่คำถามเกี่ยวกับผู้เขียนผลงานของเชกสเปียร์ไปจนถึงภาษาศาสตร์นิติวิทยาศาสตร์และมีความคล้ายคลึงกันในเชิงวิธีการกับการวิเคราะห์ความสามารถ ในการอ่าน ข้อความ
การวิเคราะห์รูปแบบการเขียนอาจใช้เพื่อเปิดเผยตัวตน ของผู้เขียนที่ ใช้นามแฝงหรือนิรนาม หรือเพื่อเปิดเผยข้อมูลบางอย่างเกี่ยวกับผู้เขียนโดยไม่จำเป็นต้องระบุตัวตนอย่างสมบูรณ์ ผู้เขียนอาจใช้การวิเคราะห์รูปแบบการเขียนแบบต่อต้านเพื่อต่อต้านการระบุตัวตนนี้โดยการกำจัดลักษณะเฉพาะทางรูปแบบการเขียนของตนเองโดยไม่เปลี่ยนแปลงเนื้อหาที่มีความหมายของการสื่อสารของพวกเขา วิธีนี้สามารถเอาชนะการวิเคราะห์ที่ไม่ได้คำนึงถึงความเป็นไปได้นี้ได้ แต่ประสิทธิภาพสูงสุดของการวิเคราะห์รูปแบบการเขียนในสภาพแวดล้อมแบบต่อต้านนั้นไม่แน่นอน การระบุตัวตนด้วยการวิเคราะห์รูปแบบการเขียนอาจไม่น่าเชื่อถือ แต่ก็ไม่สามารถรับประกันได้ว่าจะไม่สามารถระบุตัวตนได้ การใช้การวิเคราะห์รูปแบบการเขียนแบบต่อต้านนั้นเองก็อาจตรวจจับได้
ประวัติศาสตร์
สไตโลเมทรีพัฒนามาจากเทคนิคก่อนหน้านี้ในการวิเคราะห์ข้อความเพื่อหาหลักฐานยืนยันความถูกต้องและตัวตนของผู้เขียน
การปฏิบัติสมัยใหม่ของสาขาวิชานี้ได้รับความสนใจจากการศึกษาปัญหาเรื่องผู้เขียนในละครยุคเรเนสซองส์ของอังกฤษ นักวิจัยและผู้อ่านสังเกตว่านักเขียนบทละครบางคนในยุคนั้นมีรูปแบบการใช้ภาษาที่โดดเด่น และพยายามใช้รูปแบบเหล่านั้นเพื่อระบุผู้เขียนผลงานที่ไม่แน่ชัดหรือผลงานที่เขียนร่วมกัน ความพยายามในช่วงแรกไม่ได้ประสบความสำเร็จเสมอไป: ในปี 1901 นักวิจัยคนหนึ่งพยายามใช้ ความชอบ ของจอห์น เฟลตเชอร์สำหรับ " 'em" ซึ่งเป็นรูปย่อของ "them" เป็นเครื่องหมายเพื่อแยกแยะระหว่างเฟลตเชอร์และฟิลิป แมสซิงเจอร์ในผลงานที่เขียนร่วมกัน—แต่เขาใช้ฉบับผลงานของแมสซิงเจอร์ที่บรรณาธิการขยายคำว่า " 'em" ทั้งหมดเป็น "them" โดยไม่ได้ตั้งใจ[ 7 ]
หลักการพื้นฐานของสไตโลเมตรีได้รับการวางรากฐานโดยนักปรัชญาชาวโปแลนด์วินเซนตี ลูโตสลาฟสกีในPrincipes de stylométrie (1890) ลูโตสลาฟสกีใช้วิธีนี้เพื่อพัฒนาลำดับเหตุการณ์ของบทสนทนาของเพลโต[ 8 ]
ในช่วงต้นทศวรรษ 1960 บาทหลวง AQ Morton ได้ทำการวิเคราะห์ด้วยคอมพิวเตอร์เกี่ยวกับจดหมาย 14 ฉบับในพันธสัญญาใหม่ที่เชื่อกันว่าเป็นของนักบุญเปาโล ซึ่งระบุว่ามีผู้เขียนที่แตกต่างกันถึง 6 คนที่เขียนงานชิ้นนี้ การตรวจสอบวิธีการของเขาโดยนำไปใช้กับงานของJames Joyceทำให้ได้ผลลัพธ์ว่าUlyssesซึ่งเป็นนวนิยายที่มีหลายมุมมองและหลายรูปแบบของ Joyce นั้นถูกเขียนขึ้นโดยบุคคล 5 คนที่แตกต่างกัน โดยที่ไม่มีใครมีส่วนร่วมในการเขียนนวนิยายเรื่องแรกของ Joyce คือA Portrait of the Artist as a Young Manเลย[ 9 ]
ความสำเร็จในช่วงแรกที่โดดเด่นประการหนึ่งคือการแก้ไขข้อพิพาทเรื่องผู้เขียนบทความThe Federalist Papers จำนวน 12 บทความ โดยFrederick Mostellerและ David Wallace [ 10 ]นอกจากนี้ การประยุกต์ใช้การวิเคราะห์ข้อความกับงานเขียนของ Fletcher โดยCyrus Hoyและคนอื่นๆ ประสบความสำเร็จและได้ผลลัพธ์ที่ชัดเจนในช่วงปลายทศวรรษ 1950 [ 11 ] [ 12 ]
แอปพลิเคชัน
การประยุกต์ใช้สไตโลเมตรี ได้แก่ การศึกษาวรรณกรรม การศึกษาประวัติศาสตร์ การศึกษาสังคม การค้นหาข้อมูล และคดีและการศึกษาทางนิติวิทยาศาสตร์หลายกรณี[ 13 ] [ 14 ]เมื่อเร็วๆ นี้ การถกเถียงกันมายาวนานเกี่ยวกับมหากาพย์ไอซ์แลนด์ยุคกลางที่ไม่ระบุชื่อผู้เขียนได้รับการพัฒนาขึ้นโดยการใช้ สไตโลเมตรี [ 15 ] [ 16 ] [ 17 ]นอกจากนี้ยังสามารถนำไปใช้กับรหัสคอมพิวเตอร์[ 18 ]และการตรวจจับการลอกเลียนแบบโดยเนื้อแท้ซึ่งเป็นการตรวจจับการลอกเลียนแบบโดยพิจารณาจากการเปลี่ยนแปลงรูปแบบการเขียนภายในเอกสาร[ 19 ]สไตโลเมตรียังสามารถใช้เพื่อทำนายว่าบุคคลนั้นเป็นเจ้าของภาษาอังกฤษหรือไม่โดยพิจารณาจากความเร็วในการพิมพ์[ 20 ]
วิธีการวัดสไตล์มีความเสี่ยงต่อการบิดเบือนข้อความระหว่างการแก้ไข[ 21 ]นอกจากนี้ยังมีกรณีที่ผู้เขียนนำรูปแบบการเขียนที่แตกต่างกันมาใช้ในระหว่างอาชีพการงานของตน ดังที่แสดงให้เห็นในกรณีของเพลโตผู้ซึ่งเลือกนโยบายการเขียนที่แตกต่างกัน เช่น นโยบายที่ใช้สำหรับบทสนทนาช่วงต้นและช่วงกลางที่กล่าวถึงปัญหาของโสกราตีส[ 22 ]
คุณสมบัติ
คุณลักษณะของข้อความที่น่าสนใจสำหรับการระบุผู้เขียนนั้น ในด้านหนึ่งคือการคำนวณการเกิดขึ้นของสำนวนหรือโครงสร้างเฉพาะตัว (เช่น การตรวจสอบว่าผู้เขียนใช้เครื่องหมายวรรคตอนอย่างไร หรือผู้เขียนใช้โครงสร้าง passive ที่ไม่มีผู้กระทำบ่อยแค่ไหน) และในอีกด้านหนึ่งก็คล้ายกับที่ใช้ในการวิเคราะห์ความสามารถในการอ่าน เช่น การวัดความแปรผันของคำศัพท์และความแปรผันของไวยากรณ์[ 23 ]เนื่องจากผู้เขียนมักมีความชอบในหัวข้อบางอย่าง การทดลองวิจัยในการระบุผู้เขียนส่วนใหญ่จึงลบคำเนื้อหา เช่น คำนาม คำคุณศัพท์ และคำกริยา ออกจากชุดคุณลักษณะ โดยคงไว้เฉพาะองค์ประกอบโครงสร้างของข้อความเพื่อหลีกเลี่ยงการปรับแบบจำลองให้เข้ากับหัวข้อมากกว่าลักษณะของผู้เขียน[ 24 ] [ 25 ]คุณลักษณะทางสไตล์มักคำนวณเป็นค่าเฉลี่ยของข้อความหรือผลงานทั้งหมดที่รวบรวมไว้ของผู้เขียน ทำให้ได้ค่าต่างๆ เช่น ความยาวคำเฉลี่ยหรือความยาวประโยคเฉลี่ย สิ่งนี้ทำให้แบบจำลองสามารถระบุผู้เขียนที่มีความชอบที่ชัดเจนสำหรับประโยคที่ยาวหรือสั้น แต่ซ่อนความแปรผันไว้: ผู้เขียนที่มีประโยคยาวและสั้นผสมกันจะมีค่าเฉลี่ยเท่ากับผู้เขียนที่มีประโยคความยาวปานกลางที่สม่ำเสมอ เพื่อจับภาพความแปรผันดังกล่าว การทดลองบางอย่างใช้ลำดับหรือรูปแบบในการสังเกตแทนที่จะใช้ความถี่เฉลี่ยที่สังเกตได้ เช่น สังเกตว่าผู้เขียนแสดงความชอบต่อรูปแบบการเน้นเสียงหรือการเน้นย้ำบางอย่าง[ 26 ] [ 27 ]หรือว่าผู้เขียนมักจะตามด้วยประโยคยาวๆ ตามด้วยประโยคสั้นๆ[ 28 ] [ 29 ]
หนึ่งในแนวทางแรกๆ ในการระบุผู้เขียนโดย Mendenhall อาจกล่าวได้ว่าเป็นการรวบรวมข้อสังเกตโดยไม่ต้องหาค่าเฉลี่ย[ 30 ]
โมเดลการระบุผู้เขียนรุ่นใหม่ใช้โมเดลพื้นที่เวกเตอร์เพื่อจับภาพสิ่งที่เฉพาะเจาะจงกับสไตล์ของผู้เขียนโดยอัตโนมัติ แต่ยังคงอาศัยการออกแบบคุณลักษณะอย่างรอบคอบด้วยเหตุผลเดียวกับโมเดลแบบดั้งเดิม[ 31 ] [ 32 ]
สไตโลเมตรีเชิงโต้แย้ง
การวิเคราะห์รูปแบบการเขียนแบบต่อต้าน (Adversarial stylometry) คือการปฏิบัติในการเปลี่ยนแปลงรูปแบบการเขียนเพื่อลดโอกาสที่การวิเคราะห์รูปแบบการเขียนจะค้นพบตัวตนของผู้เขียนหรือลักษณะเฉพาะของพวกเขา[ 33 ]งานนี้เรียกอีกอย่างว่าการปกปิดตัวตนของผู้เขียนหรือการทำให้ผู้เขียนเป็นนิรนาม การวิเคราะห์รูปแบบการเขียนก่อให้เกิดความท้าทายด้านความเป็นส่วนตัวอย่างมากเนื่องจากความสามารถในการเปิดเผย ตัวตนของผู้เขียน นิรนามหรือเชื่อมโยงนามแฝงกับตัวตนอื่นๆ ของผู้เขียน[ 34 ]ซึ่งตัวอย่างเช่น สร้างความยากลำบากให้กับผู้แจ้งเบาะแส [ 35 ]นักเคลื่อนไหว[ 36 ]และผู้หลอกลวงและผู้ฉ้อโกง[ 37 ]คาดว่าความเสี่ยงด้านความเป็นส่วนตัวจะเพิ่มขึ้นเมื่อ เทคนิคการเรียน รู้ของเครื่องและคลังข้อความพัฒนาขึ้น[ 38 ]
สไตโลเมตรีเชิงต่อต้านทั้งหมดมีแนวคิดหลักร่วมกันคือการถอดความข้อความต้นฉบับอย่างซื่อสัตย์เพื่อให้ความหมายไม่เปลี่ยนแปลง แต่สัญญาณทางสไตล์จะถูกบดบัง[ 39 ] [ 40 ]การถอดความที่ซื่อสัตย์ดังกล่าวเป็นตัวอย่างเชิงต่อต้านสำหรับตัวจำแนกสไตโลเมตรี[ 41 ]มีแนวทางกว้างๆ หลายประการสำหรับเรื่องนี้ โดยมีการทับซ้อนกันบ้าง ได้แก่การเลียนแบบการแทนที่สไตล์ของผู้เขียนเองด้วยสไตล์ของผู้อื่นการแปลการใช้การแปลด้วยเครื่องจักรโดยหวังว่าสิ่งนี้จะกำจัดสไตล์ที่เป็นลักษณะเฉพาะในข้อความต้นฉบับ และการทำให้คลุมเครือ การแก้ไขสไตล์ของข้อความโดยเจตนาเพื่อให้ไม่เหมือนกับสไตล์ของผู้เขียนเอง[ 39 ]
การปกปิดรูปแบบด้วยตนเองนั้นเป็นไปได้ แต่ต้องใช้แรงงานมาก[ 42 ]ในบางสถานการณ์ การ ปกปิด รูปแบบด้วยตนเอง อาจเป็นสิ่งที่เหมาะสมหรือจำเป็น [ 43 ] เครื่องมืออัตโนมัติ ไม่ว่าจะเป็นแบบกึ่งอัตโนมัติหรืออัตโนมัติเต็มรูปแบบ สามารถช่วยผู้เขียนได้ [ 42 ]วิธีการที่ดีที่สุดในการทำงานและออกแบบเครื่องมือดังกล่าวเป็นคำถามวิจัยที่ยังเปิดอยู่[ 44 ] [ 38 ]แม้ว่าบางแนวทางจะแสดงให้เห็นว่าสามารถเอาชนะการวิเคราะห์สไตล์เมตริกบางอย่างได้[ 45 ]โดยเฉพาะอย่างยิ่งการวิเคราะห์ที่ไม่คำนึงถึงศักยภาพของความเป็นปรปักษ์[ 46 ]การสร้างความปลอดภัยเมื่อเผชิญกับการวิเคราะห์ที่ไม่รู้จักจึงเป็นปัญหา[ 47 ]การรับรองความถูกต้องของการถอดความถือเป็นความท้าทายที่สำคัญสำหรับเครื่องมืออัตโนมัติ[ 38 ]
ยังไม่แน่ชัดว่าการปฏิบัติการวิเคราะห์สไตล์แบบต่อต้านสามารถตรวจจับได้หรือไม่ การศึกษาบางชิ้นพบว่าวิธีการเฉพาะบางอย่างสร้างสัญญาณในข้อความที่ส่งออก แต่ผู้เชี่ยวชาญด้านการวิเคราะห์สไตล์ที่ไม่แน่ใจว่ามีการใช้วิธีการใด อาจไม่สามารถตรวจจับได้อย่างน่าเชื่อถือ[ 38 ]
งานวิจัยปัจจุบัน
สไตโลเมตรีสมัยใหม่ใช้คอมพิวเตอร์สำหรับการวิเคราะห์ทางสถิติปัญญาประดิษฐ์และการเข้าถึงคลังข้อความที่เพิ่มขึ้นเรื่อยๆ ผ่านทางอินเทอร์เน็ต[ 48 ] ระบบซอฟต์แวร์ เช่น Signature [ 49 ] (ซอฟต์แวร์ฟรีที่ผลิตโดย Peter Millican แห่งมหาวิทยาลัยออกซ์ฟอร์ด), JGAAP [ 50 ] (โปรแกรม Java Graphical Authorship Attribution Program ซึ่งเป็นซอฟต์แวร์ฟรีที่ผลิตโดย Dr. Patrick Juolaแห่งมหาวิทยาลัย Duquesne), stylo [ 51 ] [ 52 ] (แพ็กเกจ R แบบโอเพนซอร์สสำหรับการวิเคราะห์สไตโลเมตรีที่หลากหลาย รวมถึงการระบุผู้เขียน ซึ่งพัฒนาโดยMaciej Eder , Jan RybickiและMike Kestemont ) และ Stylene [ 53 ]สำหรับภาษาดัตช์ (ซอฟต์แวร์ฟรีออนไลน์โดย Prof. Walter Daelemansแห่งมหาวิทยาลัย Antwerp และ Dr. Véronique Hoste แห่งมหาวิทยาลัย Ghent) ทำให้การใช้งานเป็นไปได้มากขึ้น แม้แต่สำหรับผู้ที่ไม่ใช่ผู้เชี่ยวชาญ
สถานที่และกิจกรรมทางวิชาการ
วิธีการสไตโลเมตริกถูกนำมาใช้ในหัวข้อวิชาการหลายเรื่อง เช่น การประยุกต์ใช้ภาษาศาสตร์ พจนานุกรม หรือวรรณกรรมศึกษา[ 1 ]ร่วมกับการประมวลผลภาษาธรรมชาติและการเรียนรู้ของเครื่อง และนำไปใช้ในการตรวจจับการลอกเลียนแบบ การวิเคราะห์ผู้เขียน หรือการดึงข้อมูล[ 48 ]
ภาษาศาสตร์นิติวิทยาศาสตร์
สมาคมนักภาษาศาสตร์นิติวิทยาศาสตร์นานาชาติ (IAFL) จัดการประชุมใหญ่ประจำปีของสมาคมนักภาษาศาสตร์นิติวิทยาศาสตร์นานาชาติ (ครั้งที่ 13 ในปี 2016 ที่เมืองปอร์โต ) และตีพิมพ์วารสารนานาชาติว่าด้วยคำพูด ภาษา และกฎหมายโดยมีนิติวิทยาศาสตร์เชิงสไตล์เป็นหนึ่งในหัวข้อหลัก
เอซีแอล
สมาคมภาษาศาสตร์เชิงคำนวณ (ACL) จัดการประชุมหลายครั้งซึ่งนำเสนอวิธีการวัดสไตล์เชิงคำนวณ รวมถึงการประชุมเกี่ยวกับวิธีการเชิงประจักษ์ในการประมวลผลภาษาธรรมชาติ (EMNLP) และการประชุมประจำปีของสมาคมภาษาศาสตร์เชิงคำนวณ[ 54 ] [ 55 ] [ 56 ]
AAAI
สมาคมเพื่อความก้าวหน้าของปัญญาประดิษฐ์ (AAAI) ได้จัดกิจกรรมหลายครั้งเกี่ยวกับการวิเคราะห์ข้อความเชิงอัตวิสัยและเชิงสไตล์[ 57 ] [ 58 ] [ 59 ]
กระทะ
การประชุมเชิงปฏิบัติการ PAN (เดิมทีเป็นการวิเคราะห์การลอกเลียนแบบ การระบุผู้เขียน และการตรวจจับข้อความที่เกือบซ้ำกัน ต่อมาเป็นการประชุมเชิงปฏิบัติการทั่วไปเกี่ยวกับการเปิดเผยการลอกเลียนแบบ การระบุผู้เขียน และการใช้ซอฟต์แวร์โซเชียลในทางที่ผิด) จัดขึ้นตั้งแต่ปี 2007 ส่วนใหญ่ร่วมกับการประชุมเกี่ยวกับการเข้าถึงข้อมูล เช่น ACM SIGIR , FIREและCLEF PAN กำหนดภารกิจท้าทายร่วมกันสำหรับการตรวจจับ การลอกเลียนแบบ [ 60 ] การระบุผู้เขียน [ 61 ]การระบุเพศของผู้เขียน[ 62 ] การสร้างโปรไฟล์ผู้เขียน[ 63 ]การตรวจจับการทำลาย[ 64 ]และภารกิจการวิเคราะห์ข้อความอื่นๆ ที่เกี่ยวข้อง ซึ่งหลายอย่างขึ้นอยู่กับสไตโลเมตรี
กรณีศึกษาที่น่าสนใจ
- ในปี ค.ศ. 1439 ลอเรนโซ วัลลาได้แสดงให้เห็นว่าเอกสารการบริจาคของคอนสแตนตินเป็นของปลอมโดยอ้างเหตุผลส่วนหนึ่งจากการเปรียบเทียบภาษา ละตินกับภาษา ละตินที่ใช้ในเอกสารแท้จากศตวรรษที่ 4
- ในปี พ.ศ. 2495 บาทหลวงชาวสวีเดนดิ๊ก เฮลันเดอร์ได้รับเลือกเป็นบิชอปแห่ง สเตร็ งเนสการหาเสียงเป็นไปอย่างดุเดือด และเฮลันเดอร์ถูกกล่าวหาว่าเขียนจดหมายหมิ่นประมาทผู้สมัครคนอื่นๆ โดยไม่ระบุชื่อเป็นจำนวนกว่าร้อยฉบับ ให้กับผู้มีสิทธิเลือกตั้งในเขตบิชอปแห่งสเตร็งเนส เฮลันเดอร์ถูกตัดสินว่ามีความผิดในข้อหาเขียนจดหมายดังกล่าวในเบื้องต้น และสูญเสียตำแหน่งบิชอปไป แต่ต่อมาได้รับการยกเว้นความผิดบางส่วน จดหมายเหล่านั้นได้รับการศึกษาโดยใช้การวัดทางสไตโลเมตริกหลายวิธี (รวมถึงลักษณะของเครื่องพิมพ์ดีดด้วย) และคดีความต่างๆ และการตรวจสอบเพิ่มเติม ซึ่งหลายครั้งเฮลันเดอร์เป็นผู้ว่าจ้างเองในช่วงหลายปีจนกระทั่งเสียชีวิตในปี พ.ศ. 2521 ได้กล่าวถึงวิธีการทางสไตโลเมตริกและคุณค่าของมันในฐานะหลักฐานอย่างละเอียด[ 65 ] [ 66 ]
- ในปี พ.ศ. 2518 หลังจากที่โรนัลด์ เรแกนดำรงตำแหน่งผู้ว่าการรัฐแคลิฟอร์เนีย เขาเริ่มให้ความเห็นทางวิทยุรายสัปดาห์ซึ่งเผยแพร่ไปยังสถานีวิทยุหลายร้อยแห่ง หลังจากที่บันทึกส่วนตัวของเขาถูกเปิดเผยต่อสาธารณะในวันเกิดครบรอบ 90 ปีของเขาในปี พ.ศ. 2544 มีการศึกษาโดยใช้วิธีการทางสถิติสไตล์เพื่อพิจารณาว่าคำพูดเหล่านั้นเขียนโดยเขาเองและเขียนโดยผู้ช่วยต่างๆ[ 67 ]
- ในปี พ.ศ. 2539 การวิเคราะห์สไตโลเมตริกของหนังสือPrimary Colorsที่ เขียนโดยผู้เขียนนิรนามซึ่งเป็นที่ถกเถียงกัน ซึ่งดำเนินการโดยDonald Fosterศาสตราจารย์จากวิทยาลัย Vassar [ 68 ]ได้นำหัวข้อนี้มาสู่ความสนใจของผู้ชมในวงกว้างมากขึ้น หลังจากระบุผู้เขียนได้อย่างถูกต้องว่าเป็นJoe Klein (กรณีนี้ได้รับการแก้ไขหลังจากการวิเคราะห์ลายมือยืนยันความเป็นผู้เขียนแล้วเท่านั้น)
- ในปี พ.ศ. 2539 มีการใช้วิธีการสไตโลเมตริกเพื่อเปรียบเทียบแถลงการณ์ของ Unabomberกับจดหมายที่เขียนโดยหนึ่งในผู้ต้องสงสัยคือTheodore Kaczynskiซึ่งส่งผลให้ Kaczynski ถูกจับกุมและถูกตัดสินลงโทษในภายหลัง[ 69 ]
- ในเดือนเมษายน พ.ศ. 2558 นักวิจัยที่ใช้เทคนิคสไตโลเมตรีระบุว่าบทละครเรื่องDouble Falsehoodเป็นผลงานของวิลเลียม เชกสเปียร์ [ 70 ] [ 71 ] นักวิจัยวิเคราะห์บทละคร 54 เรื่องของเชกสเปียร์และจอห์น เฟลตเชอร์และเปรียบเทียบความยาวประโยคโดยเฉลี่ย ศึกษาการใช้คำที่ไม่ธรรมดา และวัดปริมาณความซับซ้อนและคุณค่า ทางจิตวิทยา ของภาษา
- ในปี 2016 MacDonald P. Jacksonศาสตราจารย์กิตติคุณด้านภาษาอังกฤษแห่งมหาวิทยาลัยโอ๊คแลนด์ประเทศนิวซีแลนด์ และสมาชิกของราชสมาคมแห่งนิวซีแลนด์ผู้ซึ่งใช้เวลาตลอดอาชีพทางวิชาการในการวิเคราะห์การระบุผู้แต่ง ได้เขียนหนังสือชื่อWho Wrote "The Night Before Christmas"?: Analyzing the Clement Clarke Moore Vs. Henry Livingston Question [ 72 ] ซึ่งเขาได้ประเมินข้อโต้แย้งที่ขัดแย้งกัน และเป็นครั้งแรกที่ใช้เทคนิคการระบุผู้แต่งของสไตล์ศาสตร์เชิงคำนวณสมัยใหม่เพื่อตรวจสอบข้อโต้แย้งที่มีมายาวนาน Jackson ใช้การทดสอบหลายอย่างและแนะนำการทดสอบใหม่ คือ การวิเคราะห์ทางสถิติของหน่วยเสียง เขาสรุปว่า Livingston เป็นผู้แต่งที่แท้จริงของผลงานคลาสสิกชิ้นนี้
- ในปี 2017 Simon Fuller และJames O'Sullivanได้ตีพิมพ์งานวิจัยที่อ้างว่าJames Patterson นักเขียนขายดี ไม่ได้เขียนอะไรเลยในนวนิยายที่ดูเหมือนจะเขียนร่วมกับผู้อื่น[ 73 ] [ 74 ] [ 75 ]ตามที่ O'Sullivan กล่าว การร่วมงานของเขากับอดีตประธานาธิบดีสหรัฐฯBill Clintonเรื่องThe President is Missingเป็นข้อยกเว้นของกฎนี้[ 76 ]
- ในปี 2017 กลุ่มนักภาษาศาสตร์ นักวิทยาศาสตร์คอมพิวเตอร์ และนักวิชาการได้วิเคราะห์ความเป็นผู้เขียนของElena Ferranteโดยอิงจากคลังข้อมูลที่สร้างขึ้นที่มหาวิทยาลัยปาดัวซึ่งประกอบด้วยนวนิยาย 150 เรื่องที่เขียนโดยนักเขียน 40 คน พวกเขาได้วิเคราะห์รูปแบบการเขียนของ Ferrante โดยพิจารณาจากนวนิยายเจ็ดเรื่องของเธอ พวกเขาสามารถเปรียบเทียบรูปแบบการเขียนของเธอกับนักเขียนนวนิยายคนอื่นๆ อีก 39 คน โดยใช้ stylo เป็นต้น[ 51 ]ข้อสรุปที่ได้เหมือนกันสำหรับทุกคนคือDomenico Starnoneเป็นผู้เขียนลับของ Elena Ferrante [ 77 ]
- ในปี 2018 มาร์ค กลิกแมนอาจารย์อาวุโสสาขาสถิติที่มหาวิทยาลัยฮาร์วาร์ด ได้ทำงานร่วมกับไรอัน ซอง อดีตนักศึกษาสถิติที่ฮาร์วาร์ด และเจสัน บราวน์ ศาสตราจารย์ที่มหาวิทยาลัยดัลฮาวซีในโนวาสโกเชีย โดยใช้สไตโลเมตรีเพื่อค้นพบว่าเพลง " In My Life " ของ เดอะบีทเทิลส์ นั้น จอห์น เลนนอนน่าจะแต่งขึ้น แต่มีโอกาส 50% ที่พอล แม็กคา ร์ตนีย์จะเป็นผู้แต่งท่อนกลาง[ 78 ] [ 79 ]
- ในปี 2019 โครงการ ETSO: การวิเคราะห์สไตล์การเขียนประยุกต์ใช้กับโรงละครยุคทองของสเปน[ 80 ]ซึ่งกำกับโดยÁlvaro Cuéllar GonzálezและGermán Vega García-Luengos (มหาวิทยาลัย Valladolid) สามารถรวบรวมบทละคร 3,000 เรื่องจากยุคทองของสเปนได้ หลังจากใช้การวิเคราะห์สไตล์การเขียนแล้ว การระบุMujeres y criadosให้กับLope de Vega [ 81 ] [ 82 ]ได้รับการยืนยัน และตรวจพบปัญหาเรื่องผู้ประพันธ์ในLa monja alférezซึ่งเป็นบทละครที่ระบุว่าเป็นของ Pérez de Montalbán ซึ่งด้วยการวิเคราะห์เหล่านี้และผ่านการวิจัยทางประวัติศาสตร์และภาษาศาสตร์ ในที่สุดก็ได้รับการระบุว่าเป็นของJuan Ruiz de Alarcón [ 83 ] [ 84 ] [ 85 ] [ 86 ]ในปี 2023 โครงการเดียวกันนี้พบว่า Lope de Vega เป็นผู้ประพันธ์La francesa Laura (ลอร่าหญิงชาวฝรั่งเศส) แม้ว่าต้นฉบับจะเขียนขึ้นหลายปีหลังจากที่เขาเสียชีวิต[ 87 ]ละครตลกเรื่องนี้ถูกจัดประเภทเป็นผลงานในช่วงปลายของ Lope de Vega และมีอายุตั้งแต่ปี 1628 ถึง 1630 เนื่องจากเนื้อหาที่ยกย่องฝรั่งเศสอาจเป็นผลมาจากความสัมพันธ์ที่ดีชั่วคราวระหว่างสเปนและฝรั่งเศสในช่วงสงครามสามสิบปีโดยมีอังกฤษเป็นศัตรูร่วมกัน[ 88 ]ในการวิเคราะห์นี้ คำที่พบบ่อยที่สุด 500 คำของข้อความที่กำลังตรวจสอบจะถูกนำมาเปรียบเทียบกับ 500 คำของผลงานที่เหลือ ในกรณีของLa francesa Lauraการค้นพบพบว่าผลงาน 100 ชิ้นที่ใกล้เคียงที่สุดนั้นเกือบทั้งหมดเป็นผลงานของ Lope de Vega วิธีการเรียนรู้ของเครื่อง เช่น การวิเคราะห์ เครื่องเวกเตอร์สนับสนุนก็ได้ดำเนินการด้วยพารามิเตอร์ที่หลากหลายเช่นกัน การวิเคราะห์ทางภาษาศาสตร์แบบดั้งเดิมเกี่ยวกับผู้เขียนผลงานได้รับการยืนยันจากการตรวจสอบด้านสไตโลเมตรีและปัญญาประดิษฐ์[ 89 ]
- ในปี 2020 เรเชล แมคคาร์ธีและเจมส์ โอซัลลิแวนได้โต้แย้งว่าเอมิลี บรอนเต้เป็นผู้เขียนWuthering Heights ตัวจริง ซึ่งเป็นการยุติการคาดเดาของนักวิจารณ์บางคนว่านวนิยายเรื่องนี้อาจเขียนโดยพี่น้องของเธอคนใดคนหนึ่ง โดยเฉพาะอย่างยิ่งแบรนเวลล์หรือชาร์ลอตต์[ 90 ]
- ในปี 2020 Hartmut Ilsemann ใช้ Rolling Delta และ Rolling Classify จากชุดโปรแกรม R Stylo เพื่อแสดงให้เห็นว่าคลังข้อมูลของ Marlowe มีลักษณะทางสไตล์ที่ไม่เป็นเนื้อเดียวกัน และผู้เขียนTamburlaines ทั้งสอง แทบจะไม่มีอยู่ในคลังข้อมูลอย่างเป็นทางการของ Marlowe ที่เหลืออยู่เลย[ 91 ] [ 92 ] [ 93 ]
- ในปี 2022 นักวิชาการชาวอิตาลี Simone Rebora และ Massimo Salgaro ได้แสดงให้เห็นโดยใช้วิธี "ระยะทางเดลต้า" ของ John F. Burrows ว่าFelix Saltenเป็นผู้เขียนนวนิยายนิรนามเรื่องJosefine Mutzenbacherจากปี 1906 ที่มีความเป็นไปได้มากที่สุด โดยไม่นับรวมหน้าสุดท้าย[ 94 ]
- ในปี 2023 นักข่าวชาวสวีเดน Lapo Lappin อ้างว่านวนิยายอาชญากรรมสองเรื่องของนักเขียนชาวสวีเดนCamilla Läckbergอาจเป็นผลงานของนักเขียนรับจ้าง ซึ่งสันนิษฐานว่าเป็นบรรณาธิการของเธอPascal Engmanข้อกล่าวอ้างนี้ถูกปฏิเสธในตอนแรกโดยนักเขียนและโฆษกของเธอ[ 95 ]อย่างไรก็ตาม Läckberg ยอมรับในภายหลังว่าเธอกับ Pascal Engman ทำงานร่วมกันอย่างใกล้ชิด และเขาเป็นผู้แก้ไขข้อความของเธอ[ 96 ]
- ในปี 2024 Matthew Britt และ Jaaron Wingo ได้นำการวิเคราะห์สไตล์เมตริกมาใช้กับคลังวรรณกรรมคริสเตียนยุคแรก โดยเปรียบเทียบรูปแบบทางภาษาในข้อความต่างๆ จากสองศตวรรษแรกของคริสต์ศักราช การศึกษาของพวกเขาได้ตรวจสอบคำถามเกี่ยวกับผู้เขียน การแทรกข้อความ และความสอดคล้องของข้อความ และกระตุ้นให้เกิดการอภิปรายเชิงวิธีการในวรรณกรรมวิชาการ[ 97 ]
ข้อมูลและวิธีการ
เนื่องจากสไตโลเมตรีมีทั้งกรณีการใช้งานเชิงพรรณนา ซึ่งใช้ในการจำแนกลักษณะเนื้อหาของชุดข้อมูล และกรณีการใช้งานเชิงระบุ เช่น การระบุผู้เขียนหรือหมวดหมู่ของข้อความ วิธีการที่ใช้ในการวิเคราะห์ข้อมูลและคุณลักษณะข้างต้นจึงมีตั้งแต่การจำแนกรายการออกเป็นชุด หรือการกระจายรายการในพื้นที่ของการเปลี่ยนแปลงคุณลักษณะ วิธีการส่วนใหญ่เป็นวิธีการทางสถิติ เช่นการวิเคราะห์กลุ่มและการวิเคราะห์จำแนกซึ่งโดยทั่วไปแล้วจะอิงตาม ข้อมูลและคุณลักษณะ ทางภาษาศาสตร์และเป็นโดเมนการประยุกต์ใช้ที่ได้ผลดีสำหรับวิธี การเรียนรู้ของเครื่อง สมัยใหม่
ในอดีต สไตโลเมตรีเน้นองค์ประกอบที่หายากหรือโดดเด่นที่สุดของข้อความ แต่เทคนิคในปัจจุบันสามารถแยกแยะรูปแบบการระบุตัวตนได้แม้ในส่วนของคำพูดทั่วไป ระบบส่วนใหญ่ใช้สถิติคำศัพท์ กล่าวคือ ใช้ความถี่ของคำและศัพท์ในข้อความเพื่อกำหนดลักษณะของข้อความ (หรือผู้เขียน) ในบริบทนี้ ต่างจากการค้นหาข้อมูลรูปแบบการเกิดขึ้นที่สังเกตได้ของคำที่พบบ่อยที่สุดนั้นน่าสนใจกว่าคำศัพท์เฉพาะเรื่องซึ่งมีความถี่น้อยกว่า[ 98 ] [ 99 ]
วิธีการวัดสไตล์การเขียนหลักคือ ตัวแปรคงที่ของ ผู้เขียน (writer invariant ) ซึ่งเป็นคุณสมบัติที่พบได้ทั่วไปในทุกข้อความ หรืออย่างน้อยก็ทุกข้อความที่มีความยาวเพียงพอที่จะนำมาวิเคราะห์และให้ผลลัพธ์ที่มีนัยสำคัญทางสถิติ ซึ่งเขียนโดยผู้เขียนคนเดียวกัน ตัวอย่างของตัวแปรคงที่ของผู้เขียนคือ ความถี่ของคำเชื่อมที่ผู้เขียนใช้
ในวิธีการหนึ่งนั้น ข้อความจะถูกวิเคราะห์เพื่อหาคำที่พบบ่อยที่สุด 50 คำ จากนั้นข้อความจะถูกแบ่งออกเป็นส่วนย่อยๆ ละ 5,000 คำ และแต่ละส่วนย่อยจะถูกวิเคราะห์เพื่อหาความถี่ของคำ 50 คำนั้นในส่วนย่อยนั้นๆ ซึ่งจะสร้างตัวระบุตัวเลข 50 ตัวที่ไม่ซ้ำกันสำหรับแต่ละส่วนย่อย ตัวเลขเหล่านี้จะวางแต่ละส่วนของข้อความลงในจุดหนึ่งในพื้นที่ 50 มิติ พื้นที่ 50 มิตินี้จะถูกทำให้แบนราบลงบนระนาบโดยใช้การวิเคราะห์ส่วนประกอบหลัก (PCA) ผลลัพธ์ที่ได้คือการแสดงจุดที่สอดคล้องกับสไตล์ของผู้เขียน หากงานวรรณกรรมสองชิ้นถูกวางไว้บนระนาบเดียวกัน รูปแบบที่ได้อาจแสดงให้เห็นว่างานทั้งสองชิ้นนั้นเป็นของผู้เขียนคนเดียวกันหรือต่างกัน
สถิติแบบเกาส์เซียน
ข้อมูลสไตโลเมตริกมีการกระจายตามกฎของ Zipf–Mandelbrotการกระจายมีลักษณะแหลมคมและมีค่าความโค้ง สูงมาก ซึ่งเป็นเหตุผลที่นักวิจัยไม่สามารถใช้สถิติเพื่อแก้ปัญหา เช่น ปัญหาการระบุผู้เขียน อย่างไรก็ตาม การใช้สถิติแบบเกาส์เซียนนั้นเป็นไปได้อย่างสมบูรณ์โดยการใช้การแปลงข้อมูล[ 100 ]
เครือข่ายประสาทเทียม
โครงข่ายประสาทเทียมซึ่งเป็นกรณีพิเศษของวิธีการเรียนรู้ของเครื่องจักรเชิงสถิติ ได้ถูกนำมาใช้ในการวิเคราะห์ความเป็นเจ้าของผลงานเขียน ข้อความที่มีความเป็นเจ้าของผลงานอย่างไม่มีข้อโต้แย้งจะถูกนำมาใช้ในการฝึกโครงข่ายประสาทเทียมด้วยกระบวนการต่างๆ เช่น การย้อนกลับการแพร่ กระจาย (backpropagation ) โดยจะคำนวณข้อผิดพลาดในการฝึกและนำไปใช้ในการปรับปรุงกระบวนการเพื่อเพิ่มความแม่นยำ ผ่านกระบวนการที่คล้ายกับการถดถอยแบบไม่เชิงเส้น โครงข่ายจะได้รับความสามารถในการสรุปความสามารถในการจดจำไปยังข้อความใหม่ๆ ที่ยังไม่เคยได้รับรู้มาก่อน โดยจำแนกประเภทข้อความเหล่านั้นตามระดับความมั่นใจที่ระบุไว้ เทคนิคดังกล่าวถูกนำไปใช้กับข้อกล่าวอ้างที่มีมายาวนานเกี่ยวกับการร่วมมือกันของเชกสเปียร์ กับ จอห์น เฟลต เชอร์ และคริสโตเฟอร์ มาร์โลว์ซึ่งเป็นบุคคลร่วมสมัยของเขา[ 101 ] [ 102 ]และยืนยันความคิดเห็นตามหลักวิชาการทั่วไปว่าการร่วมมือกันดังกล่าวเกิดขึ้นจริง
การศึกษาในปี 1999 แสดงให้เห็นว่าโปรแกรมเครือข่ายประสาทเทียมบรรลุความแม่นยำ 70% ในการระบุผู้แต่งบทกวีที่ยังไม่ได้วิเคราะห์ การศึกษานี้จาก Vrije Universiteit ตรวจสอบการระบุบทกวีโดยผู้แต่งชาวดัตช์สามคนโดยใช้เพียงลำดับตัวอักษรเช่น "den" [ 103 ]
การศึกษาใช้เครือข่ายความเชื่อเชิงลึก (DBN) สำหรับแบบจำลองการตรวจสอบผู้เขียนที่ใช้ได้สำหรับการตรวจสอบความถูกต้องอย่างต่อเนื่อง (CA) [ 104 ]
ปัญหาหนึ่งของวิธีการวิเคราะห์นี้คือเครือข่ายอาจมีอคติขึ้นอยู่กับชุดข้อมูลฝึกฝน ซึ่งอาจเลือกผู้เขียนที่เครือข่ายได้วิเคราะห์บ่อยกว่า[ 103 ]
อัลกอริทึมทางพันธุกรรม
อัลกอริทึมทางพันธุกรรมเป็นอีกหนึ่งเทคนิคการเรียนรู้ของเครื่องที่ใช้ในด้านการวิเคราะห์สไตล์การเขียน วิธีนี้เริ่มต้นด้วยชุดของกฎ ตัวอย่างกฎอาจเป็น "ถ้าคำว่า'แต่'ปรากฏมากกว่า 1.7 ครั้งในทุกๆ 1,000 คำ แสดงว่าข้อความนั้นเป็นผลงานของนักเขียน X" โปรแกรมจะได้รับข้อความและใช้กฎเหล่านี้ในการระบุผู้เขียน กฎเหล่านี้จะถูกทดสอบกับชุดข้อความที่รู้จัก และแต่ละกฎจะได้รับคะแนนความเหมาะสม กฎ 50 ข้อที่มีคะแนนต่ำที่สุดจะไม่ถูกนำมาใช้ กฎที่เหลือ 50 ข้อจะได้รับการเปลี่ยนแปลงเล็กน้อย และจะมีการเพิ่มกฎใหม่ 50 ข้อ กระบวนการนี้จะถูกทำซ้ำจนกว่ากฎที่พัฒนาขึ้นจะสามารถระบุผู้เขียนได้อย่างถูกต้อง
คู่ที่หายาก
วิธีหนึ่งในการระบุลักษณะเฉพาะของ งานเขียนเรียกว่า "คู่คำหายาก" ซึ่งอาศัยลักษณะเฉพาะตัวในการใช้คำร่วมกัน การใช้คำบางคำสำหรับผู้เขียนคนใดคนหนึ่ง อาจมีความสัมพันธ์กับการใช้คำอื่นๆ ที่คาดเดาได้ในแบบที่ไม่เหมือนใคร
การระบุชื่อผู้เขียนในโปรแกรมส่งข้อความโต้ตอบแบบทันที
การแพร่หลายของอินเทอร์เน็ตทำให้ความสนใจในการระบุผู้เขียนเปลี่ยนไปอยู่ที่ข้อความออนไลน์ (เว็บเพจ บล็อก ฯลฯ) ข้อความอิเล็กทรอนิกส์ (อีเมล ทวีต โพสต์ ฯลฯ) และข้อมูลที่เป็นลายลักษณ์อักษรประเภทอื่นๆ ที่สั้นกว่าหนังสือโดยเฉลี่ยมาก มีรูปแบบที่ไม่เป็นทางการน้อยกว่า และมีความหลากหลายมากกว่าในแง่ขององค์ประกอบการแสดงออก เช่นสีเค้าโครงแบบอักษรกราฟิกอีโมติคอนฯลฯ มีการรายงานถึงความพยายามที่จะคำนึงถึงแง่มุมดังกล่าวทั้งในระดับโครงสร้างและไวยากรณ์ใน[ 105 ]นอกจากนี้ ยังมีการนำเบาะแสเฉพาะเนื้อหาและเฉพาะบุคคล (เช่น แบบจำลองหัวข้อและ เครื่องมือ ตรวจสอบไวยากรณ์ ) มาใช้เพื่อเปิดเผยทางเลือกเชิงสไตล์โดยเจตนา[ 106 ]
คุณลักษณะสไตโลเมตริกมาตรฐานถูกนำมาใช้เพื่อจำแนกเนื้อหาของการแชทโดย การส่งข้อความ โต้ตอบแบบทันที[ 107 ]หรือพฤติกรรมของผู้เข้าร่วม[ 108 ]แต่ความพยายามในการระบุผู้เข้าร่วมการแชทยังคงมีน้อยและอยู่ในช่วงเริ่มต้น นอกจากนี้ ความคล้ายคลึงกันระหว่างการสนทนาด้วยวาจาและการโต้ตอบในการแชทยังถูกละเลย ในขณะที่เป็นความแตกต่างที่สำคัญระหว่างข้อมูลการแชทและข้อมูลที่เป็นลายลักษณ์อักษรประเภทอื่น ๆ
ดูเพิ่มเติม
- การระบุข้อมูลซ้ำ
- ลายน้ำดิจิทัล
- ภาษาศาสตร์และพระคัมภีร์มอรมอน § สไตโลเมตรี
- โมเช่ คอปเปล
- ภาษาศาสตร์เชิงปริมาณ
- สเตกาโนกราฟี
- เขียนพิมพ์
หมายเหตุ
- ^ a b Argamon, Shlomo , Kevin Burns และShlomo Dubnovบรรณาธิการ โครงสร้างของสไตล์: แนวทางเชิงอัลกอริทึมเพื่อทำความเข้าใจลักษณะและความหมาย Springer Science & Business Media, 2010
- ^เวสต์คอตต์, ริชาร์ด (15 มิถุนายน 2549). "การสร้างเพลงฮิตให้เป็นวิทยาศาสตร์" . บีบีซี นิวส์ .
- ^เซธิ, ริกกี้ (7 มิถุนายน 2016). "การใช้คอมพิวเตอร์เพื่อทำความเข้าใจศิลปะให้ดียิ่งขึ้น" . เดอะคอนเวอร์เซชั่น. สืบค้นเมื่อ1 ธันวาคม 2021 .
- ^ McIlroy-Young, Reid; Wang, Yu; Sen, Siddhartha; Kleinberg, Jon; Anderson, Ashton (2021). การตรวจจับรูปแบบการตัดสินใจเฉพาะบุคคล: การสำรวจรูปแบบพฤติกรรมในหมากรุกการประชุมระบบประมวลผลข้อมูลประสาทครั้งที่ 35
- ^ Caliskan-Islam, Aylin; Harang, Richard; Liu, Andrew; Narayanan, Arvind; Voss, Clare; Yamaguchi, Fabian; Greenstadt, Rachel (สิงหาคม 2015). "การเปิดเผยตัวตนของโปรแกรมเมอร์ผ่านการวิเคราะห์รูปแบบโค้ด" . รายงานการประชุม USENIX Security Symposium ครั้งที่ 24 . วอชิงตัน ดี.ซี.: สมาคม USENIX. หน้า 255–270 . ISBN 978-1-939133-11-3สืบค้นข้อมูลเมื่อ 25 กุมภาพันธ์ 2026
- ^ Chen, Hsinchun; Yang, Christopher C.; Chau, Michael; Li, Shu-Hsing (2009). Intelligence and Security Informatics: Pacific Asia Workshop, PAISI 2009, Bangkok, Thailand, April 27, 2009. Proceedings . Berlin: Springer Science & Business Media. p. 15. ISBN 978-3-642-01392-8.
- ^ Samuel Schoenbaum ,หลักฐานภายในและการประพันธ์บทละครสมัยเอลิซาเบธ; บทความเกี่ยวกับประวัติศาสตร์และวิธีการทางวรรณกรรม,หน้า 171
- ↑ลูโตสลาฟสกี้, ว. (1898) “ปรินซิปี เดอ สไตโลเมทรี แอพพลิเคชั่น à la chronologie des OEuvres de Platon” Revue des Études Grecques 11 (41): 61– 81. ดอย : 10.3406 / reg.1898.5847 ISSN 0035-2039 .
- ^ Samuel Schoenbaum ,หลักฐานภายในและการประพันธ์บทละครสมัยเอลิซาเบธ; บทความเกี่ยวกับประวัติศาสตร์และวิธีการทางวรรณกรรม,หน้า 196
- ^ F. Mosteller & D. Wallace (1964). การอนุมานและการโต้แย้งเรื่องผู้เขียน: เดอะเฟเดอรา ลิสต์ . เรดดิง, แมสซาชูเซตส์ : แอดดิสัน-เวสลีย์ .
- ^ Hoy, Cyrus (1956). "ส่วนแบ่งของเฟลตเชอร์และผู้ร่วมงานของเขาในแคนอนของบิวโมนต์และเฟลตเชอร์ (I)" . การศึกษาด้านบรรณานุกรม . 8 : 129– 146. ISSN 0081-7600 .
- ^ Hoy, Cyrus (1958). "ส่วนแบ่งของเฟลตเชอร์และผู้ร่วมงานของเขาในแคนอนของบิวโมนต์และเฟลตเชอร์ (III)" . การศึกษาด้านบรรณานุกรม . 11 : 85– 106. ISSN 0081-7600 .
- ^ Chaski, Carole (2012). "การระบุตัวตนผู้แต่งในบริบททางนิติวิทยาศาสตร์" ใน Solan, Lawrence M; Tiersma, Peter M (บรรณาธิการ). คู่มือภาษาและกฎหมายแห่งออกซ์ฟอร์ดสำนักพิมพ์มหาวิทยาลัยออกซ์ฟอร์ดdoi : 10.1093 /oxfordhb/9780199572120.001.0001 ISBN 978-0-19-957212-0.
- ^ Chaski, Carole (22 ธันวาคม 2005). Wecht, Cyril H.; Rago, John T. (บรรณาธิการ). นิติวิทยาศาสตร์และกฎหมาย: การประยุกต์ใช้ในการสืบสวนในคดีอาญา คดีแพ่ง และคดีครอบครัว . สำนักพิมพ์ CRC. ISBN 978-1-4200-5811-6.
- ^ Michael MacPherson และ Yoav Tirosh (2020). "การวิเคราะห์สไตล์เมตริกของ Ljósvetninga saga" . Gripla . 31 : 7– 41.
- ^ Haukur Thorgeirsson (2018). "Heimskringla และ Egils saga มีความคล้ายคลึงกันมากน้อยเพียงใด? การประยุกต์ใช้เดลต้าของ Burrows กับข้อความภาษาไอซ์แลนด์"วารสารยุโรปศึกษาสแกนดิเนเวีย 48 ( 1): 1– 18. doi : 10.1515/ejss-2018-0001 .
- ↑บียอร์นสัน, ซิกูร์ดูร์ อินกิเบอร์กูร์; คาราสัน, สไตน์กรีมูร์ ปัล; เฮลกาสัน, จอน คาร์ล (06-12-2564) "รูปแบบและลายนิ้วมือจางๆ ของนักเขียนซากะ" ในการค้นหาผู้กระทำผิด เดอ กรอยเตอร์. หน้า 97– 122. ดอย : 10.1515/9783110725339-005 . ไอเอสบีเอ็น 978-3-11-072533-9.
- ^ Claburn, Thomas (16 มีนาคม 2018). "FYI: เครื่องมือ AI สามารถเปิดเผยตัวตนของผู้เขียนโค้ดนิรนามจากไฟล์ปฏิบัติการไบนารีได้" The Register . สืบค้นเมื่อ2 สิงหาคม 2018 .
- ^ Bensalem, Imene; Rosso, Paolo; Chikhi, Salim (2019). "เกี่ยวกับการใช้ n-gram ของตัวอักษรเป็นหลักฐานภายในเพียงอย่างเดียวของการลอกเลียนแบบ" Language Resources and Evaluation . 53 (3): 363– 396. doi : 10.1007/s10579-019-09444-w . hdl : 10251/159151 . S2CID 86630897 .
- ^ Brizan, David (ตุลาคม 2015). "การใช้พลวัตการกดแป้นพิมพ์ที่ปรับปรุงทางภาษาศาสตร์เพื่อทำนายความรู้ความเข้าใจและข้อมูลประชากรของผู้พิมพ์ดีด" วารสารนานาชาติว่าด้วยการศึกษาปฏิสัมพันธ์ระหว่างมนุษย์กับคอมพิวเตอร์ 82 : 57– 68. doi : 10.1016 /j.ijhcs.2015.04.005 .
- ^ Alican, Necip Fikri (2012). การคิดใหม่เกี่ยวกับเพลโต: การแสวงหาเพลโตที่แท้จริงตามแนวคิดของเดการ์ต . อัมสเตอร์ดัม: Rodopi. หน้า 183. ISBN 978-90-420-3537-9.
- ^โรว์, คริสโตเฟอร์ (2000). ประวัติศาสตร์ความคิดทางการเมืองของกรีกและโรมันฉบับเคมบริดจ์ . เคมบริดจ์ สหราชอาณาจักร: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์. หน้า 160. ISBN 0-521-48136-8.
- ^ Stamatatos, Efstathios (2009). "การสำรวจวิธีการระบุผู้เขียนสมัยใหม่". JASIST . 60 (3): 538– 556. doi : 10.1002/asi.21001 . S2CID 6231242 .
- ^ Stamatatos, Efstathios (2018). "การปิดบังข้อมูลที่เกี่ยวข้องกับหัวข้อเพื่อเพิ่มความน่าเชื่อถือของผู้เขียน" JASIS . 69 (3).
- ^ Karlgren, Jussi; Esposito, Lewis; Gratton, Chantal; Kanerva, Pentti (2018). "การสร้างโปรไฟล์ผู้เขียนโดยไม่ใช้ข้อมูลเฉพาะเรื่อง". CLEF Working Notes . CEUR-WS.
- ^ Corbara, Silvia; Moreo, Alejandro; Sebastiani, Fabrizio (2022). "รูปแบบปริมาณพยางค์เป็นลักษณะจังหวะสำหรับการระบุผู้แต่งภาษาละติน" . JASIST . 74 : 128– 141. arXiv : 2110.14203 . doi : 10.1002/asi.24660 . S2CID 239998537 .
- ^ Corbara, Silvia; Chulvi, Berta; Rosso, Paolo; Moreo, Alejandro (2022). "ลักษณะจังหวะและจิตวิทยาภาษาศาสตร์สำหรับงานเขียนในรัฐสเปน: การประเมินและการวิเคราะห์" การค้นหาข้อมูลเชิงทดลองพบกับความหลากหลายทางภาษา รูปแบบหลากหลาย และปฏิสัมพันธ์ CLEF. Springer. หน้า 79–92 . doi : 10.1007/978-3-031-13643-6_6
- ^ Karlgren, Jussi; Eriksson, Gunnar (2007). "ผู้เขียน ประเภทวรรณกรรม และแบบแผนทางภาษา" การประชุมเชิงปฏิบัติการ SIGIR ว่าด้วยการวิเคราะห์การลอกเลียนแบบ การระบุตัวตนผู้เขียน และการตรวจจับงานเขียนที่ใกล้เคียงกัน SIGIR. PAN.
- ^ Eriksson, Linda (2014). การรวมคุณลักษณะข้อความตามลำดับเพื่อการระบุตัวตนผู้เขียนที่ไม่ขึ้นกับโดเมน (ปริญญาโท). สถาบันเทคโนโลยีหลวง KTH.
- ^ Mendenhall, TC (1887). "เส้นโค้งลักษณะเฉพาะขององค์ประกอบ" . Science . 9 (214S): 237– 246. doi : 10.1126/science.ns-9.214S.237 . PMID 17736020 .
- ^ Chen, Beichen (2021). การฝังข้อมูลสำหรับความคล้ายคลึงกันของหนังสือ (PDF) (วิทยาศาสตรมหาบัณฑิต). สถาบันเทคโนโลยีหลวง KTH.
- ^ Stamatatos, Efstathios; Kestemont, Mike; Kredens, Krzysztof; Pezik, Piotr; Heini, Annina (2022). "ภาพรวมของภารกิจการตรวจสอบความเป็นเจ้าของผลงานที่ PAN 2022" ใน Faggioli; Ferro; Hanbury; Potthast (บรรณาธิการ). CLEF 2022 Labs and Workshops, Notebook Papers . CEUR-WS . สืบค้นเมื่อ6 กันยายน 2022 .
- ^ Neal et al. 2018 , หน้า 5.
- ↑กรุนดาห์ล และอโศก 2020a , p. 3.
- ↑คัคมาร์ซิก แอนด์ กามอน 2549 , หน้า 1. 444.
- ↑มาห์มูด และคณะ 2019 , หน้า. 54.
- ^ Afroz, Brennan & Greenstadt 2012 , หน้า 461.
- ↑ a b c d Gröndahl & Asokan 2020a , p. 28.
- ^ a b Neal et al. 2018 , หน้า 6.
- ↑พอตธาสต์, ฮาเกน แอนด์ สไตน์ 2016 , หน้า 1. 10.
- ^ Saedi & Dras 2020 , หน้า 181.
- ↑ ขกรุนดาห์ล และอโศก 2020a , p. 21-22.
- ^ Wang, Juola & Riddell 2022 , หน้า 2.
- ^ Neal et al. 2018 , หน้า 27.
- ^ Brennan, Afroz & Greenstadt 2012 , หน้า 2.
- ^ Zhai et al. 2022 , หน้า 7373.
- ↑เอ็มเมอรี, คาดาร์ & ชูปาวา 2021 , หน้า. 2388-2389.
- ^ a b Argamon, Shlomo , Jussi KarlgrenและJames G. Shanahanการวิเคราะห์เชิงสไตล์ของข้อความเพื่อการเข้าถึงข้อมูล บทความจากการประชุมเชิงปฏิบัติการที่จัดขึ้นร่วมกับการประชุมวิชาการนานาชาติประจำปีครั้งที่ 28 ของ ACM ว่าด้วยการวิจัยและพัฒนาด้านการค้นหาข้อมูล วันที่ 13-19 สิงหาคม 2548 เมืองซัลวาดอร์ รัฐบาเฮีย ประเทศบราซิล สถาบันวิทยาศาสตร์คอมพิวเตอร์แห่งสวีเดน 2548
- ^ "ระบบการวัดลายมือที่เป็นเอกลักษณ์" . PhiloComp . สืบค้นเมื่อ2014-01-03 .
- ^ "JGAAP" . JGAAP. 4 กันยายน 2012 . สืบค้นเมื่อ15 ตุลาคม 2012 .
- ^ a b "แพ็กเกจ stylo สำหรับ R"กลุ่มวิจัยด้านสไตล์ศาสตร์เชิงคำนวณ 2014-10-24 เก็บถาวรจากต้นฉบับเมื่อ 2014-12-21 เรียกดูเมื่อ2014-10-24
- ^ Eder, Maciej; Rybicki, Jan; Kestemont, Mike (2016). "Stylometry with R: a package for computational text analysis" (PDF) . R Journal . 8 (1): 107– 121. doi : 10.32614/RJ-2016-007 .
- ^ Daelemans, Walter & Hoste, Véronique (2013). STYLENE: สภาพแวดล้อมสำหรับการวิจัยด้านสไตโลเมตรีและความอ่านง่ายสำหรับภาษาดัตช์ (รายงานทางเทคนิค). ชุดรายงานทางเทคนิค CLiPS. ISSN 2033-3544 .
- ^ Bhatia, Archna; สมาคมภาษาศาสตร์เชิงคำนวณ, บรรณาธิการ (2020). การประชุมเชิงปฏิบัติการนานาชาติครั้งแรกเกี่ยวกับภัยคุกคามทางสังคมในการสนทนาออนไลน์: การทำความเข้าใจและการจัดการ: การประชุมเชิงปฏิบัติการ LREC 2020, การประชุมทรัพยากรภาษาและการประเมินผล, 11-16 พฤษภาคม 2020: รายงานการประชุม . ปารีส: สมาคมทรัพยากรภาษาแห่งยุโรป (ELRA). ISBN 979-10-95546-39-9.
- ^ "รายงานการประชุมวิชาการด้านวิธีการเชิงประจักษ์ในการประมวลผลภาษาธรรมชาติประจำปี 2019 และการประชุมวิชาการร่วมระหว่างประเทศครั้งที่ 9 ด้านการประมวลผลภาษาธรรมชาติ (EMNLP-IJCNLP): การสาธิตระบบ - ACL Anthology " aclanthology.org สืบค้นเมื่อ2026-03-12
- ^ "รายงานการประชุมประจำปีครั้งที่ 50 ของสมาคมภาษาศาสตร์เชิงคำนวณ (เล่มที่ 2: บทความสั้น) - ACL Anthology" . aclanthology.org . สืบค้นเมื่อ2026-03-12 .
- ^ Yan Qu , James G. Shanahanและ Janyce Wiebe . "การสำรวจทัศนคติและอารมณ์ความรู้สึกในข้อความ: ทฤษฎีและการประยุกต์ใช้" รายงานทางเทคนิคการประชุมสัมมนาฤดูใบไม้ผลิของ AAAI SS-04-07. สำนักพิมพ์ AAAI, Menlo Park, CA. 2004.
- ^ Jussi Karlgren , Björn Gambäckและ Pentti Kanerva . "การได้มา (และการใช้) ความรู้ทางภาษาศาสตร์ (และโลก) เพื่อการเข้าถึงข้อมูล" (2002). การประชุมวิชาการฤดูใบไม้ผลิของ AAAI. รายงานทางเทคนิค SS-02-09. สำนักพิมพ์ AAAI, Menlo Park, CA. 2002.
- ^ Shlomo Argamon , Shlomo Dubnovและ Julie Jupp . "รูปแบบและความหมายในภาษา ศิลปะ ดนตรี และการออกแบบ" (2004). รายงานทางเทคนิค FS-04-07 ในงานประชุมวิชาการฤดูใบไม้ร่วงของ AAAI
- ^ Potthast, Martin, Benno Stein, Alberto Barrón-Cedeño และ Paolo Rosso. "กรอบการประเมินสำหรับการตรวจจับการลอกเลียนแบบ" ในรายงานการประชุมวิชาการนานาชาติว่าด้วยภาษาศาสตร์เชิงคำนวณ ครั้งที่ 23: โปสเตอร์ หน้า 997–1005 สมาคมภาษาศาสตร์เชิงคำนวณ, 2010
- ↑สตามาตาตอส, เอฟสตาธิออส, วอลเตอร์ เดเลม็องส์, เบน เวอร์โฮเอเวน, แพทริค จูโอลา, ออเรลิโอ โลเปซ-โลเปซ, มาร์ติน พอตธาสต์ และ เบนโน ชไตน์ "ภาพรวมของงานการระบุผู้แต่งที่ PAN 2014" ใน CLEF (Working Notes), หน้า 877–897 2014.
- ^ Rangel, Francisco, Paolo Rosso, Martin Potthast และ Benno Stein. "ภาพรวมของงานจัดทำโปรไฟล์ผู้เขียนครั้งที่ 5 ในงาน pan 2017: การระบุเพศและความหลากหลายทางภาษาในทวิตเตอร์" เอกสารบันทึกการทำงานของ CLEF (2017)
- ^ Rangel Pardo, Francisco Manuel, Fabio Celli, Paolo Rosso, Martin Potthast, Benno Stein และ Walter Daelemans. "ภาพรวมของภารกิจการจัดทำโปรไฟล์ผู้เขียนครั้งที่ 3 ในงาน PAN 2015" ในเอกสารบันทึกการทำงานของห้องปฏิบัติการประเมินผลและการประชุมเชิงปฏิบัติการ CLEF 2015 หน้า 1–8. 2015.
- ^ Potthast, Martin, Benno Stein และ Teresa Holfeld. "ภาพรวมของการแข่งขันระดับนานาชาติครั้งที่ 1 ด้านการตรวจจับการก่อกวนในวิกิพีเดีย" ใน CLEF (เอกสารประกอบการเรียน/ห้องปฏิบัติการ/เวิร์คช็อป) 2010
- ↑การประมวลผลข้อความ การวิเคราะห์และการสร้างข้อความ – ประเภทข้อความและการระบุแหล่งที่มา รายงานการประชุมโนเบล ครั้งที่ 51 เรียบเรียงโดยสตัวร์ อัลเลน สตอกโฮล์ม: Almqvist & Wiksell international 1982. Data linguistica, 16. Nobel symposium, 51. ISBN 91-22-00594-3
- ^ Karlgren, Jussi (2003). "Helander: An Authorship Attribution Case" . สืบค้นเมื่อ4 ตุลาคม 2017 .
- ^ Airoldi, Edoardo M. ; Fienberg, Stephen E.; Skinner, Kiron K. (กรกฎาคม 2550). "ความคิดของใคร? คำพูดของใคร? ผู้เขียนสุนทรพจน์ทางวิทยุของโรนัลด์ เรแกน" (PDF) . PS: รัฐศาสตร์และการเมือง . 40 (3): 501– 506. CiteSeerX 10.1.1.190.5798 . doi : 10.1017/S1049096507070874 . S2CID 18730541 .
- ^ ผู้เขียนไม่ระบุชื่อโดย Gavin McNett Salon 2 พฤศจิกายน 2000
- ^เบลลัค, แพม (10 เมษายน 1996). "ในคดีอูนาบอม ความเจ็บปวดสำหรับครอบครัวผู้ต้องสงสัย"เดอะนิวยอร์กไทมส์ . เก็บถาวรจากต้นฉบับเมื่อ 10 สิงหาคม 2017. สืบค้นเมื่อ5 กรกฎาคม 2008 .
- ^ "การศึกษาพบว่าบทละครของเชกสเปียร์ที่เป็นที่ถกเถียงกันนั้นมีร่องรอยของปรมาจารย์อยู่" . ลอสแอนเจลิสไทมส์ . 10 เมษายน 2558 . สืบค้นเมื่อ13 เมษายน 2558 .
- ^ Boyd, Ryan L. ; Pennebaker, James W. (2015). "เชกสเปียร์เขียนความเท็จสองชั้นจริงหรือ? การระบุตัวบุคคลโดยการสร้างลายเซ็นทางจิตวิทยาด้วยการวิเคราะห์ข้อความ" . วิทยาศาสตร์จิตวิทยา . 26 (5): 570– 582. doi : 10.1177/0956797614566658 . PMID 25854277 . S2CID 13022405 .
- ^แจ็กสัน, แมคโดนัลด์ พี (27 เมษายน 2559). ใครเป็นผู้เขียน "คืนก่อนวันคริสต์มาส"? การวิเคราะห์คำถามระหว่างเคลเมนต์ คลาร์ก มัวร์ กับ เฮนรี ลิฟวิงสตัน . แมคฟาร์แลนด์ แอนด์ โค. ISBN 978-1-4766-6443-9.
- ^ Fuller, Simon; O'Sullivan, James (2017). "โครงสร้างเหนือรูปแบบ: การ ประพันธ์ร่วมกันและการฟื้นฟูทุนนิยมทางวรรณกรรม"วารสารมนุษยศาสตร์ดิจิทัล11 (1) สืบค้นเมื่อ20 เมษายน 2017
- ^เลน, แอนโทนี (18 มิถุนายน 2018). "ความร่วมมือที่ก่อให้เกิดการกระทบกระเทือนทางสมองระหว่างบิล คลินตันและเจมส์ แพตเตอร์สัน"เดอะนิวยอร์กเกอร์. สืบค้นเมื่อ7 มิถุนายน 2018 .
- ^ "ทำไมคุณไม่จำเป็นต้องเขียนมากก็สามารถเป็นนักเขียนที่ขายดีที่สุดในโลกได้" The Conversation 3เมษายน 2560 สืบค้นเมื่อ20 เมษายน 2560
- ^โอซัลลิแวน, เจมส์ (7 มิถุนายน 2018). "บิล คลินตันและเจมส์ แพตเตอร์สันเป็นผู้เขียนร่วม – แต่ใครเป็นคนเขียน?"เดอะการ์เดียน. สืบค้นเมื่อ7 มิถุนายน 2018 .
- ^ Savoy, Jacques (2018). "Starnone เป็นผู้เขียน Ferrante จริงหรือ?" . Digital Scholarship in the Humanities . 33 (4): 902– 918. doi : 10.1093/llc/fqy016 .
- ^รูเอลล์, ปีเตอร์: "คุณพูดว่าจอห์น ผมพูดว่าพอล แต่สไตโลเมตรีบอกว่าอย่างไรล่ะ?"
- ^ Glickman, Mark; Brown, Jason; Song, Ryan (2019). "(A) Data in the Life: Authorship Attribution in Lennon-McCartney Songs" . Harvard Data Science Review . 1 (1). arXiv : 1906.05427 . doi : 10.1162/99608f92.130f856e . S2CID 189762434 .
- ^โครงการ ETSO
- ↑ "Un monstruo de la naturaleza llamado Lope" [สัตว์ประหลาดแห่งธรรมชาติชื่อโลเป] abc (ในภาษาสเปน) 28-11-2018 . สืบค้นเมื่อ2019-08-11 .
- ↑ "Rastreadores digitales en el Siglo de Oro" [เครื่องมือติดตามดิจิทัลในยุคทอง] เอล นอร์เต เด กัสติยา (ภาษาสเปน) 23-12-2018 . สืบค้นเมื่อ2019-08-11 .
- ↑เรอัล, ลา ทริบูนา เด ซิวดัด (2019-07-09) "Juan Ruiz de Alarcón aumenta su obra cinco siglos después" [Juan Ruiz de Alarcón เพิ่มผลงานของเขาในอีกห้าศตวรรษต่อมา] ลา ทริบูนา เด ซิวดัด เรอัล (ภาษาสเปน) สืบค้นเมื่อ2019-08-11 .
- ↑มิเกลลาเญซ, ดาเนียล (28 กรกฎาคม 2019) "เอล โฮล์มส์ เด ลา ฟิโลโลเกีย " พีเอสอีอี แชมเบอร์รี . ลำดับที่ 6 น. 8.เก็บถาวรจากต้นฉบับเมื่อ 2020-07-18 . สืบค้นเมื่อ2019-08-11 .
- ↑ "Sor Juana Inés centró las 42 Jornadas de Teatro Clasico" . Lanza Digital (ภาษาสเปนแบบยุโรป) 2019-07-14 . สืบค้นเมื่อ2019-08-11 .
- ^ "'La monja alférez' ya no es de Pérez de Montalbán, sino de Ruiz de Alarcón" ['La monja alférez' ไม่ใช่ของ Pérez de Montalbán อีกต่อไป แต่โดย Ruiz de Alarcón] El Norte de Castilla (in Spanish). 2019-07-10 . ดึงข้อมูลเมื่อ2019-08-11 .
- ^ "ปัญญาประดิษฐ์ช่วยค้นหาว่า Lope de Vega นักเขียนบทละครชื่อดังชาวสเปน เป็นผู้ประพันธ์บทละครจากต้นฉบับที่เขียนขึ้นหลายปีหลังจากการเสียชีวิตของเขา" newsendip.com 31มกราคม 2023 สืบค้นเมื่อ8 กุมภาพันธ์ 2023
- ^โจนส์, แซม (5 กุมภาพันธ์ 2023). "ปัญญาประดิษฐ์เผยผลงานที่สูญหายของบุคคลสำคัญแห่ง 'ยุคทอง' ของสเปน"" . เดอะการ์เดียน. สืบค้นเมื่อ8 กุมภาพันธ์ 2023 .
- ↑โมราเลส, มานูเอล (31-01-2023) "La inteligencia Artificial atribuye a Lope de Vega una obra anónima delfondo de manuscritos de la Biblioteca Nacional" [ปัญญาประดิษฐ์ระบุถึงผลงานที่ไม่ระบุชื่อจากคอลเลคชันต้นฉบับของหอสมุดแห่งชาติถึง Lope de Vega] เอลปาอิส (ภาษาสเปน) สืบค้นเมื่อ2023-02-08 .
- ^ McCarthy, Rachel; O'Sullivan, James (2020). "ใครเป็นผู้เขียน Wuthering Heights?" . Digital Scholarship in the Humanities . 36 (2): 383– 391. doi : 10.1093/llc/fqaa031 . hdl : 10468/10194 .
- ↑อิลเซมันน์, ฮาร์มุต (2020) "Phantom Marlowe: Paradigmenwechsel in Autorschaftsbestimmungen des englischen Renaissancedramas". Düren: Shaker, ISBN 978-3-8440-7412-3
- ^ Ilsemann, Harmut (2020). "การทบทวนคลังข้อมูลของ Marlowe" . ทุนการศึกษาดิจิทัลในสาขามนุษยศาสตร์ . 36 (2): 333– 360. doi : 10.1093/llc/fqaa010 .
- ^ Ilsemann, Harmut (2021). "ภาคผนวกย่อของ "The Marlowe Corpus Revisited" และ Phantom Marlowe" . Digital Scholarship in the Humanities . 37 (2): 462– 468. doi : 10.1093/llc/fqab078 .
- ^ Rebora, Simone; Salgaro, Massimo (2022). "Felix Salten เป็นผู้แต่งนวนิยาย Mutzenbacher (1906) หรือไม่? ใช่และไม่ใช่" ภาษาและวรรณคดี: วารสารนานาชาติว่าด้วยสไตล์ศาสตร์ 31 ( 2): 243– 264. doi : 10.1177/09639470221090384 . ISSN 0963-9470 .
- ↑ AI avslöjar: Läckberg har antagligen spökskrivare – skjuter ned anklagelserna. Hufvudstadsbladet , 27 กันยายน 2023 (ในภาษาสวีเดน)
- ↑ "Läckberg om rykterna: 'Han petade i meningarna'" . Hufvudstadsbladet (ในภาษาสวีเดน) เฮลซิงฟอร์ส 21 ธันวาคม 2023 หน้า 23
- ^ Hansen, Chrissy M. (2024-01-02). "พระคริสต์ก่อนพระเยซู: หลักฐานเกี่ยวกับต้นกำเนิดของพระเยซูในศตวรรษที่สอง โดย Matthew Britt และ Jaaron Wingo: สำนักพิมพ์ Cooper and Samuels. 2024. xii + 317 ISBN: 979-8990235809" . วารสารประวัติศาสตร์คริสเตียนยุคต้น . 14 (1): 70– 73. doi : 10.1080/2222582X.2024.2366761 . ISSN 2222-582X .
- ^บิเบอร์, ดักลาส . ความหลากหลายในการพูดและการเขียน. สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์, 1991.
- ^ Karlgren, Jussi ; Cutting, Douglass (1994). "การจำแนกประเภทของข้อความด้วยเมตริกอย่างง่ายโดยใช้การวิเคราะห์จำแนกประเภท". รายงานการประชุมวิชาการด้านภาษาศาสตร์เชิงคำนวณครั้งที่ 15 - . เล่ม 2. หน้า 1071. arXiv : cmp-lg/9410008 . Bibcode : 1994cmp.lg...10008K . doi : 10.3115/991250.991324 . S2CID 1297432 .
- ^ Van Droogenbroeck FJ, "การตีความกฎ Zipf-Mandelbrot ใหม่ที่สำคัญเพื่อแก้ปัญหาการประยุกต์ใช้การระบุผู้เขียนโดยใช้สถิติแบบเกาส์เซียน" (2019)
- ^ Matthews, Robert AJ; Merriam, Thomas V. N (1993). "การคำนวณทางประสาทในสไตโลเมตรี I: การประยุกต์ใช้กับผลงานของเชกสเปียร์และเฟลตเชอร์" การคำนวณทางวรรณกรรมและภาษาศาสตร์8 (4): 203– 209. doi : 10.1093/llc/8.4.203 .
- ^ Merriam, Thomas V. N; Matthews, Robert AJ (1994). "การคำนวณทางประสาทในสไตโลเมตรี II: การประยุกต์ใช้กับผลงานของเชกสเปียร์และมาร์โลว์" การคำนวณทางวรรณกรรมและภาษาศาสตร์9 (1): 1– 6. doi : 10.1093/llc/9.1.1 .
- ^ a b JF Hoorn; SL Frank; W Kowalczyk; F van der Ham (2012-09-03). "การระบุตัวตนกวีโดยใช้ลำดับตัวอักษรด้วยโครงข่ายประสาทเทียม" การคำนวณทางวรรณกรรมและภาษาศาสตร์14 (3): 311– 338. doi : 10.1093/llc/14.3.311 .
- ^ Brocardo, ML; Traore, I; Woungang, I; Obaidat, MS (2017). "การตรวจสอบความเป็นเจ้าของผลงานโดยใช้ระบบเครือข่ายความเชื่อเชิงลึก" Int J Commun Syst . 30 (12) e3259. doi : 10.1002/dac.3259 . S2CID 40745740 .
- ^ de Vel, O.; Anderson, A.; Corney, M.; Mohay, G. (2001-12-01). "การวิเคราะห์เนื้อหาอีเมลเพื่อการระบุตัวตนผู้เขียนทางนิติวิทยาศาสตร์" SIGMOD Rec . 30 (4): 55– 64. CiteSeerX 10.1.1.408.4231 . doi : 10.1145/604264.604272 . ISSN 0163-5808 . S2CID 1623521 .
- ^ Argamon, Shlomo; Koppel, Moshe; Pennebaker, James W.; Schler, Jonathan (2009-02-01). "การสร้างโปรไฟล์ผู้เขียนข้อความนิรนามโดยอัตโนมัติ" Commun. ACM . 52 (2): 119– 123. CiteSeerX 10.1.1.136.9952 . doi : 10.1145/1461928.1461959 . ISSN 0001-0782 . S2CID 5413411 .
- ^ "การจำแนกประเภทการสื่อสารข้อความโต้ตอบแบบทันทีสำหรับการวิเคราะห์ทางนิติวิทยาศาสตร์ – TechRepublic" . TechRepublic . สืบค้นเมื่อ2016-01-26 .
- ^ Zhou, L.; Zhang, Dongsong (2004-01-01). "พฤติกรรมออนไลน์สามารถเปิดเผยผู้หลอกลวงได้หรือไม่? - การสำรวจเชิงสำรวจเกี่ยวกับการหลอกลวงในการส่งข้อความโต้ตอบแบบทันที" การประชุมวิชาการนานาชาติฮาวายด้านวิทยาศาสตร์ระบบประจำปีครั้งที่ 37 ปี 2004. เอกสารประกอบการประชุมหน้า 9 หน้า–. doi : 10.1109/HICSS.2004.1265079 . ISBN 978-0-7695-2056-8S2CID 7154702
อ่านเพิ่มเติม
ดูเพิ่มเติมได้ในวารสารวิชาการLiterary and Linguistic Computingซึ่งปัจจุบันคือDigital Scholarship in the Humanities (จัดพิมพ์โดยมหาวิทยาลัยออกซ์ฟอร์ด ) และ วารสาร Language Resources and Evaluation (เดิมชื่อComputers and the Humanities )
ลิงก์ภายนอก
- สมาคมคอมพิวเตอร์และมนุษยศาสตร์
- การคำนวณทางวรรณกรรมและภาษาศาสตร์
- กลุ่มสไตล์ศาสตร์เชิงคำนวณ
- ระบบสไตโลเมตริกลายเซ็น
- โปรแกรมการระบุแหล่งที่มาของผู้เขียนJGAAP
- ไขปริศนาของนวนิยายเรื่องล่าสุดของ เจ.เค. โรว์ลิ่ง
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ สไตโลเมตรี
สไตโลเมตรีคือการประยุกต์ใช้การศึกษารูปแบบทางภาษา โดยปกติ ใช้กับภาษาเขียน นอกจาก นี้ยังนำไปประยุกต์ใช้ได้อย่างประสบความสำเร็จกับดนตรีภาพวาดหมากรุกและซอร์สโค้ด
ประวัติศาสตร์
สไตโลเมทรีพัฒนามาจากเทคนิคก่อนหน้านี้ในการวิเคราะห์ข้อความเพื่อหาหลักฐานยืนยันความถูกต้องและตัวตนของผู้เขียน
แอปพลิเคชัน
การประยุกต์ใช้สไตโลเมตรี ได้แก่ การศึกษาวรรณกรรม การศึกษาประวัติศาสตร์ การศึกษาสังคม การค้นหาข้อมูล และคดีและการศึกษาทางนิติวิทยาศาสตร์หลายกรณี [ 13 ] [ 14 ] เมื่อเร็วๆ นี้...
คุณสมบัติ
คุณลักษณะของข้อความที่น่าสนใจสำหรับการระบุผู้เขียนนั้น ในด้านหนึ่งคือการคำนวณการเกิดขึ้นของสำนวนหรือโครงสร้างเฉพาะตัว (เช่น การตรวจสอบว่าผู้เขียนใช้เครื่องหมายวรรคตอนอย่างไร หรือผู้เขียนใช้โครงสร้าง passive ที่ไม่มีผู้กระทำบ่อยแค่ไหน)...