อ่าน 2 นาที
บิแกรม
ไบแกรมหรือไดแกรมคือลำดับขององค์ประกอบสองตัวที่อยู่ติดกันจากสตริงของโทเค็นซึ่งโดยทั่วไปจะเป็นตัวอักษร พยางค์ หรือคำ ไบแกรมเป็นn-แกรมสำหรับn = 2
บิแกรม
ไบแกรมหรือไดแกรมคือลำดับขององค์ประกอบสองตัวที่อยู่ติดกันจากสตริงของโทเค็นซึ่งโดยทั่วไปจะเป็นตัวอักษร พยางค์ หรือคำ ไบแกรมเป็นn-แกรมสำหรับn = 2
การแจกแจงความถี่ของไบแกรมแต่ละตัวในสตริงนั้น นิยมใช้สำหรับการวิเคราะห์ทางสถิติอย่างง่ายของข้อความในหลายแอปพลิเคชัน รวมถึงในด้านภาษาศาสตร์เชิงคำนวณการเข้ารหัสและการรู้จำเสียงพูด
ไบแกรมที่มีช่องว่างหรือไบแกรมที่ข้ามไปคือคู่คำที่อนุญาตให้มีช่องว่าง (อาจเพื่อหลีกเลี่ยงคำที่เชื่อมต่อกัน หรือเพื่อจำลองความสัมพันธ์บางอย่าง เช่น ในไวยากรณ์ความสัมพันธ์ )
แอปพลิเคชัน
บิแกรมพร้อมกับเอ็นแกรมอื่นๆ ถูกใช้ในแบบจำลองภาษา ที่ประสบความสำเร็จส่วนใหญ่ สำหรับการรู้จำเสียงพูด[ 1 ]
การโจมตีด้วยความถี่ของไบแกรมสามารถนำมาใช้ในด้านการเข้ารหัสเพื่อถอดรหัสลับ ได้ โปรดดู การ วิเคราะห์ ความถี่
ความถี่ของบิแกรมเป็นแนวทางหนึ่งในการระบุภาษาทางสถิติ
กิจกรรมบางอย่างในโลโกโลยีหรือภาษาศาสตร์เชิงสันทนาการเกี่ยวข้องกับบิแกรม ซึ่งรวมถึงความพยายามในการค้นหาคำภาษาอังกฤษที่ขึ้นต้นด้วยบิแกรมที่เป็นไปได้ทั้งหมด[ 2 ] หรือคำที่มีสตริงของบิแกรม ที่ซ้ำกัน เช่นlogogogue [ 3 ]
ความถี่ของบิแกรมในภาษาอังกฤษ
ความถี่ของคู่ตัวอักษรที่พบบ่อยที่สุดในคลังข้อมูลภาษาอังกฤษขนาดใหญ่คือ: [ 4 ]
3.56% ของ 1.17% หรือ 0.83% เขา 3.07% ed 1.17% le 0.83% ใน 2.43% คือ 1.13% และ 0.83% er 2.05% it 1.12% co 0.79% an 1.99% al 1.09% me 0.79% re 1.85% ar 1.07% de 0.76% บน 1.76% st 1.05% hi 0.76% ที่ 1.49% ถึง 1.05% ri 0.73% en 1.45% nt 1.04% ro 0.73% nd 1.35% ng 0.95% ic 0.70% ti 1.34% se 0.93% ne 0.69% es 1.34% ha 0.93% ea 0.69% หรือ 1.28% เป็น 0.87% หรือ 0.69% te 1.20% ou 0.87% ce 0.65%
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ บิแกรม
ไบแกรมหรือไดแกรมคือลำดับขององค์ประกอบสองตัวที่อยู่ติดกันจากสตริงของโทเค็นซึ่งโดยทั่วไปจะเป็นตัวอักษร พยางค์ หรือคำ ไบแกรมเป็นn-แกรมสำหรับn = 2
แอปพลิเคชัน
บิแกรมพร้อมกับเอ็นแกรมอื่นๆ ถูกใช้ใน แบบจำลองภาษา ที่ประสบความสำเร็จส่วนใหญ่ สำหรับ การรู้จำเสียง พูด [ 1 ]
ความถี่ของบิแกรมในภาษาอังกฤษ
ความถี่ของคู่ตัวอักษรที่พบบ่อยที่สุดในคลังข้อมูลภาษาอังกฤษขนาดใหญ่คือ: [ 4 ]
ดูเพิ่มเติม
สัมประสิทธิ์ Dice-Sørensen ไดกราฟ (การสะกดคำ) ความถี่ของตัวอักษร ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Bigram&oldid=1284152322 "