อ่าน 4 นาที
เคเวอร์โฟน
Caverphone ในด้าน ภาษาศาสตร์ และ การคำนวณ เป็น อัลกอริ ทึม การจับคู่เสียง [ 1 ] [ 2 ] ที่คิดค้นขึ้นเพื่อระบุชื่อภาษาอังกฤษด้วยเสียง...
เคเวอร์โฟน
Caverphone ในด้านภาษาศาสตร์และการคำนวณเป็น อัลกอริ ทึมการจับคู่เสียง[ 1 ] [ 2 ]ที่คิดค้นขึ้นเพื่อระบุชื่อภาษาอังกฤษด้วยเสียง โดยสร้างขึ้นครั้งแรกเพื่อประมวลผลชุดข้อมูลที่กำหนดเองระหว่างปี 1893 ถึง 1938 ในDunedin ทางตอนใต้ ของนิวซีแลนด์[ 3 ]เริ่มต้นจากแนวคิดที่คล้ายกับmetaphoneและได้รับการพัฒนาเพื่อรองรับและประมวลผลภาษาอังกฤษทั่วไปตั้งแต่นั้นมา[ 3 ]
นิรุกติศาสตร์
โปรแกรม Caverphone ถูกสร้างขึ้นโดย David Hood ในโครงการ Cavershamที่มหาวิทยาลัย Otagoประเทศนิวซีแลนด์ในปี 2002 และได้รับการปรับปรุงในปี 2004 โปรแกรมนี้ถูกสร้างขึ้นเพื่อช่วยในการจับคู่ข้อมูลระหว่างทะเบียนผู้มีสิทธิเลือกตั้งในช่วงปลายศตวรรษที่ 19 และต้นศตวรรษที่ 20 โดยที่ชื่อนั้นจำเป็นต้องอยู่ใน "รูปแบบที่คนทั่วไปรู้จัก" เท่านั้น อัลกอริทึมนี้มีจุดประสงค์เพื่อใช้กับชื่อที่ไม่สามารถจับคู่ได้ง่ายระหว่างทะเบียนผู้มีสิทธิเลือกตั้ง หลังจากที่ได้ลบชื่อที่ตรงกันเป๊ะออกจากกลุ่มชื่อที่อาจตรงกันแล้ว อัลกอริทึมนี้ได้รับการปรับให้เหมาะสมกับสำเนียงที่พบในพื้นที่ศึกษา (ทางตอนใต้ของเมืองDunedinประเทศนิวซีแลนด์)
ขั้นตอน
คาเวอร์โฟน 1.0
กฎของอัลกอริทึมจะถูกนำมาใช้กับชื่อใดชื่อหนึ่งตามลำดับ โดยเป็นการแทนที่ทีละขั้นตอน
ขั้นตอนวิธีมีดังนี้:
- แปลงเป็นตัวพิมพ์เล็ก
- ลบทุกอย่างที่ไม่ใช่AZ ออกไป
- ถ้าชื่อขึ้นต้นด้วย...
- ไอแทนที่ด้วยcou2f
- roughให้เปลี่ยนเป็นrou2f
- toughเปลี่ยนเป็นtou2f แทน
- พอแล้วแทนที่ด้วยenou2f
- gnให้แทนที่ด้วย2n
- ถ้าชื่อลงท้ายด้วย
- mbให้เปลี่ยนเป็นm2
- แทนที่
- cqกับ2q
- ciกับsi
- ceกับse
- cyกับsy
- tchพร้อม2ch
- cกับk
- qกับk
- xกับk
- วีกับเอฟ
- dgกับ2g
- tioกับsio
- เทียกับเซีย
- dกับt
- phกับfh
- บีกับพี
- shกับs2
- zกับs
- สระต้นใดๆ ที่ขึ้นต้นด้วยตัวA
- สระอื่นๆ ทั้งหมดที่มีเลข3
- 3gh3กับ3kh3
- ghกับ22
- จีกับเค
- กลุ่มตัวอักษรsที่มีS
- กลุ่มของตัวอักษรtที่มีT
- กลุ่มของตัวอักษรpที่มีP
- กลุ่มของตัวอักษรkที่มีK
- กลุ่มของตัวอักษรfที่มีF
- กลุ่มของตัวอักษรmที่มีM
- กลุ่มของตัวอักษรnที่มีN
- w3กับW3
- วายกับวาย
- wh3กับwh3
- ทำไมกับทำไม
- wกับ2
- ตัวอักษร hตัวแรกที่มีA
- การปรากฏอื่นๆ ทั้งหมดของhที่มี2
- r3กับR3
- ryกับRy
- rกับ2
- l3กับL3
- lyกับLy
- ลกับ2
- เจกับวาย
- y3กับY3
- yกับ2
- ลบทั้งหมด
- 2
- 3
- ใส่เลข1หกตัวที่ท้าย
- ใช้ตัวอักษรหกตัวแรกเป็นรหัส
คาเวอร์โฟน 2.0
- เริ่มต้นด้วยคำหนึ่งคำ
- แปลงเป็นตัวพิมพ์เล็ก
- ลบสิ่งใดก็ตามที่ไม่ใช่ตัวอักษรมาตรฐาน (โดยทั่วไปคือaz ) [หมายเหตุ 1 ]
- ลบตัวอักษร eตัวสุดท้ายออก
- ถ้าชื่อขึ้นต้นด้วย
- ไอทำให้เป็นcou2f
- หยาบทำให้มันrou2f
- tough make it tou2f
- เพียงพอแล้วทำให้มันเพียงพอ
- ผ่านทางทำให้เป็นเรื่องยุ่งยาก
- gnทำให้เป็น2n
- ถ้าชื่อลงท้ายด้วย
- mbทำให้เป็นm2
- แทนที่
- cqกับ2q
- ciกับsi
- ceกับse
- cyกับsy
- tchพร้อม2ch
- cกับk
- qกับk
- xกับk
- วีกับเอฟ
- dgกับ2g
- tioกับsio
- เทียกับเซีย
- dกับt
- phกับfh
- บีกับพี
- shกับs2
- zกับs
- สระตัวแรก[หมายเหตุ 2 ]ที่มีA
- สระอื่นๆ ทั้งหมดที่มีเลข3
- เจกับวาย
- y3เริ่มต้นที่มีY3
- yตัวแรกที่มีA
- yกับ3
- 3gh3กับ3kh3
- ghกับ22
- จีกับเค
- กลุ่มตัวอักษรsที่มีS
- กลุ่มของตัวอักษรtที่มีT
- กลุ่มของตัวอักษรpที่มีP
- กลุ่มของตัวอักษรkที่มีK
- กลุ่มของตัวอักษรfที่มีF
- กลุ่มของตัวอักษรmที่มีM
- กลุ่มของตัวอักษรnที่มีN
- w3กับW3
- wh3กับwh3
- ถ้าชื่อลงท้ายด้วยw ให้แทนที่ wตัวสุดท้ายด้วย3
- wกับ2
- ตัวอักษรh ตัวแรกที่ มีA
- การปรากฏอื่นๆ ทั้งหมดของhที่มี2
- r3กับR3
- ถ้าชื่อลงท้ายด้วยr ให้แทนที่ rตัวสุดท้ายด้วย3
- rกับ2
- l3กับL3
- ถ้าชื่อลงท้ายด้วยl ให้แทนที่ lตัวสุดท้ายด้วย3
- ลกับ2
- ลบ s ทั้งหมด2ตัว
- ถ้าชื่อลงท้ายด้วยเลข 3ให้แทนที่เลข 3 ตัวสุดท้าย ด้วย ตัว อักษร A
- ลบ s ทั้ง3 ตัวออก
- ใส่เลข1 จำนวน 10ตัวไว้ที่ท้าย
- ใช้ตัวอักษร 10 ตัวแรกเป็นรหัส
ตัวอย่าง
คาเวอร์โฟน 1.0
ลี -> ลี lee -> l33 l33 -> L33 L33 -> L L -> L111111 L111111 -> L11111
ทอมป์สัน -> ทอมป์สัน thompson -> th3mps3n th3mps3n -> th3mpS3n th3mpS3n -> Th3mpS3n Th3mpS3n -> Th3mPS3n Th3mPS3n -> Th3MPS3n Th3MPS3n -> Th3MPS3N Th3MPS3N -> T23MPS3N T23MPS3N -> TMPSN TMPSN111111 -> TMPSN1
คาเวอร์โฟน 2.0
ลี -> ลี lee -> le le -> l3 l3 -> L3 L3 -> LA LA -> LA1111111111 LA1111111111 -> LA11111111
ทอมป์สัน -> ทอมป์สัน thompson -> th3mps3n th3mps3n -> th3mpS3n th3mpS3n -> Th3mpS3n Th3mpS3n -> Th3mPS3n Th3mPS3n -> Th3MPS3n Th3MPS3n -> Th3MPS3N Th3MPS3N -> T23MPS3N T23MPS3N -> TMPSN TMPSN1111111111 -> TMPSN11111
ดูเพิ่มเติม
ลิงก์ภายนอก
- โครงการเคเวอร์แชม - ชุดข้อมูลชื่อและสำเนียงการพูดในเขตทางใต้ของเมืองดูเนดินประเทศนิวซีแลนด์ ในช่วงปี 1893-1938
- อัลกอริทึม Caverphone ดั้งเดิม (ปี 2002)
- อัลกอริทึม Caverphone ฉบับปรับปรุง (2004)
- การนำไปใช้งาน:
- การใช้งาน C# ฉบับปรับปรุง
- การใช้งาน Java ในโครงการApache Commons Codec
- การใช้งาน PHP
- การใช้งานอัลกอริธึม caverphone ในภาษา Python (เวอร์ชัน 2.0) - โครงการ AdvaS Advanced Search
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ เคเวอร์โฟน
Caverphone ในด้าน ภาษาศาสตร์ และ การคำนวณ เป็น อัลกอริ ทึม การจับคู่เสียง [ 1 ] [ 2 ] ที่คิดค้นขึ้นเพื่อระบุชื่อภาษาอังกฤษด้วยเสียง...
นิรุกติศาสตร์
โปรแกรม Caverphone ถูกสร้างขึ้นโดย David Hood ใน โครงการ Caversham ที่ มหาวิทยาลัย Otago ประเทศ นิวซีแลนด์ ในปี 2002 และได้รับการปรับปรุงในปี 2004 โปรแกรมนี้ถูกสร้างขึ้นเพื่อช่วยในการจับคู่ข้อมูลระหว่างทะเบียนผู้มีสิทธิเลือกตั้งในช่วงปลายศตวรรษที่ 19...
คาเวอร์โฟน 1.0
กฎของอัลกอริทึมจะถูกนำมาใช้กับชื่อใดชื่อหนึ่งตามลำดับ โดยเป็นการแทนที่ทีละขั้นตอน
คาเวอร์โฟน 2.0
เริ่มต้นด้วยคำหนึ่งคำ แปลงเป็นตัวพิมพ์เล็ก ลบสิ่งใดก็ตามที่ไม่ใช่ตัวอักษรมาตรฐาน (โดยทั่วไปคือ az ) [ หมายเหตุ 1 ] ลบตัวอักษร e ตัวสุดท้ายออก ถ้าชื่อขึ้นต้นด้วย ไอ ทำให้เป็น cou2f หยาบ ทำให้มัน rou2f tough make it tou2f เพียงพอแล้ว ทำให้มัน เพียงพอ ผ่านทาง...