กลับไปหน้าบทความ

อ่าน 9 นาที

รายการคำศัพท์

รายการ คำศัพท์ คือรายการคำใน พจนานุกรม โดยทั่วไปจะเรียงลำดับตามความถี่ของการปรากฏ (ไม่ว่าจะตาม ระดับ หรือเป็นรายการจัดอันดับ) รายการคำศัพท์ถูกรวบรวมโดย...

รายการคำศัพท์

( เรียนรู้วิธีและเวลาในการลบข้อความนี้ )

รายการคำศัพท์คือรายการคำในพจนานุกรมโดยทั่วไปจะเรียงลำดับตามความถี่ของการปรากฏ (ไม่ว่าจะตามระดับหรือเป็นรายการจัดอันดับ) รายการคำศัพท์ถูกรวบรวมโดยการวิเคราะห์ความถี่ของคำศัพท์ภายในคลังข้อความ ที่กำหนด และใช้ในภาษาศาสตร์คลังข้อมูลเพื่อตรวจสอบลำดับวงศ์และวิวัฒนาการของภาษาและข้อความ คำที่ปรากฏเพียงครั้งเดียวในคลังข้อมูลเรียกว่าhapax legomenaในด้านการสอน รายการคำศัพท์ถูกใช้ในการออกแบบหลักสูตรสำหรับ การเรียน รู้คำศัพท์พจนานุกรมที่เรียงลำดับตามความถี่ "ให้พื้นฐานที่สมเหตุสมผลเพื่อให้แน่ใจว่าผู้เรียนได้รับผลตอบแทนที่ดีที่สุดจากความพยายามในการเรียนรู้คำศัพท์" ( Nation 1997 ) แต่ส่วนใหญ่มีไว้สำหรับผู้เขียนหลักสูตรไม่ใช่สำหรับผู้เรียนโดยตรง รายการความถี่ยังจัดทำขึ้นเพื่อวัตถุประสงค์ทางด้านพจนานุกรม โดยทำหน้าที่เป็นเหมือนรายการตรวจสอบเพื่อให้แน่ใจว่าคำที่ใช้บ่อยจะไม่ถูกละเลย ข้อผิดพลาดที่สำคัญบางประการ ได้แก่ เนื้อหาของคลังข้อมูล ระดับภาษาของคลังข้อมูลและความหมายของ " คำ " แม้ว่าการนับคำจะมีมานานนับพันปีแล้ว และการวิเคราะห์ขนาดใหญ่ยังคงทำด้วยมือในช่วงกลางศตวรรษที่ 20 แต่การประมวลผลภาษาธรรมชาติด้วยระบบอิเล็กทรอนิกส์จากคลังข้อมูลขนาดใหญ่ เช่น คำบรรยายภาพยนตร์ (การศึกษาขนาดใหญ่ SUBTLEX) ได้เร่งให้การวิจัยในสาขานี้ก้าวหน้าไปอย่างรวดเร็ว

ในภาษาศาสตร์เชิงคำนวณรายการความถี่คือรายการคำ (ประเภทคำ) ที่เรียงลำดับแล้ว พร้อมด้วยความถี่ ของคำเหล่านั้น โดยความถี่ในที่นี้มักหมายถึงจำนวนครั้งที่ปรากฏในคลังข้อมูล ที่กำหนด ซึ่งสามารถใช้กำหนดลำดับได้จากตำแหน่งในรายการ

ตารางที่ 1: ตัวอย่างการวิเคราะห์ความถี่ของคำศัพท์
พิมพ์เหตุการณ์อันดับ
ที่3,789,654อันดับ 1
เขา2,098,762อันดับที่ 2
[...]
กษัตริย์57,897อันดับที่ 1,356
เด็กผู้ชาย56,975อันดับที่ 1,357
[...]
สตริงกี้ไฟ5อันดับที่ 34,589
[...]
ทรานสดิวชัน1อันดับที่ 123,567

ระเบียบวิธีวิจัย

ปัจจัย

Nation ( Nation 1997 ) ตั้งข้อสังเกตถึงความช่วยเหลืออันน่าทึ่งที่ได้รับจากความสามารถในการคำนวณ ซึ่งทำให้การวิเคราะห์คลังข้อมูลทำได้ง่ายขึ้นมาก เขาได้ยกตัวอย่างประเด็นสำคัญหลายประการที่มีอิทธิพลต่อการสร้างรายการความถี่:

  • การเป็นตัวแทนของคลังข้อมูล
  • ความถี่และช่วงของคำ
  • การจัดการกลุ่มคำ
  • การวิเคราะห์สำนวนและวลีคงที่
  • ช่วงของข้อมูล
  • เกณฑ์อื่นๆ อีกหลายประการ

คลังข้อมูล

คลังเอกสารลายลักษณ์อักษรแบบดั้งเดิม

ความถี่ในการใช้สรรพนามส่วนบุคคลในภาษาเซอร์โบ-โครเอเชีย

งานวิจัยส่วนใหญ่ที่มีอยู่ในปัจจุบันนั้นอิงตามคลังข้อความ ที่เป็นลายลักษณ์อักษร ซึ่งหาได้ง่ายกว่าและประมวลผลได้ง่ายกว่า

การเคลื่อนไหวแบบซับเล็กซ์

อย่างไรก็ตามNew et al. 2007เสนอให้ใช้ประโยชน์จากคำบรรยายจำนวนมากที่มีอยู่ทางออนไลน์เพื่อวิเคราะห์คำพูดจำนวนมากBrysbaert & New 2009ได้ทำการประเมินเชิงวิพากษ์อย่างละเอียดเกี่ยวกับแนวทางการวิเคราะห์ข้อความแบบดั้งเดิม และสนับสนุนการเปลี่ยนไปใช้การวิเคราะห์คำพูดและการวิเคราะห์คำบรรยายภาพยนตร์ที่มีอยู่ทางออนไลน์ การวิจัยเบื้องต้นมีงานวิจัยติดตามผลจำนวนหนึ่ง[ 1 ]ซึ่งให้การวิเคราะห์การนับความถี่ที่มีคุณค่าสำหรับภาษาต่างๆ การวิจัยเชิงลึกของ SUBTLEX [ 2 ]เกี่ยวกับคำบรรยายแบบเปิดที่สะอาดหมดจดถูกสร้างขึ้นสำหรับภาษาฝรั่งเศส ( New et al. 2007 ), ภาษาอังกฤษแบบอเมริกัน ( Brysbaert & New 2009 ; Brysbaert, New & Keuleers 2012 ), ภาษาดัตช์ ( Keuleers & New 2010 ), จีน ( Cai & Brysbaert 2010 ), สเปน ( Cuetos et al. 2011 ), กรีก ( Dimitropoulou et al. 2010 ), เวียดนาม ( Pham, Bolger & Baayen 2011 ), เยอรมัน ( Brysbaert et al. 2011 ), โปรตุเกสบราซิล ( Tang 2012 ) และโปรตุเกสโปรตุเกส ( Soares et al. 2015 ), แอลเบเนีย ( Avdyli & Cuetos 2013 ), โปแลนด์ ( Mandera และคณะ 2557 ) และคาตาลัน (2019 [ 3 ] ), เวลส์ (Van Veuhen et al. 2024 [ 4 ] ), เกาหลี[ 5 ] SUBTLEX-IT (2015) ให้ข้อมูลดิบเท่านั้น[ 6 ]

หน่วยคำศัพท์

ไม่ว่าในกรณีใด หน่วยพื้นฐานของ "คำ" ควรได้รับการกำหนด สำหรับอักษรละติน คำมักประกอบด้วยตัวอักษรหนึ่งตัวหรือหลายตัวคั่นด้วยช่องว่างหรือเครื่องหมายวรรคตอน แต่ก็อาจมีข้อยกเว้น เช่น คำว่า "can't" ในภาษาอังกฤษและ " aujourd'hui " ในภาษาฝรั่งเศสมีเครื่องหมายวรรคตอน ในขณะที่ "chateau d'eau" ในภาษาฝรั่งเศสแสดงถึงแนวคิดที่แตกต่างจากการบวกส่วนประกอบอย่างง่ายโดยมีช่องว่างคั่นอยู่ด้วย นอกจากนี้ อาจเป็นการดีกว่าที่จะจัดกลุ่มคำในตระกูล เดียวกัน ภายใต้การแสดงคำหลัก ของมัน ดังนั้นpossible, impossible, possibilityจึงเป็นคำในตระกูลเดียวกัน ซึ่งแทนด้วยคำหลัก*possib*เพื่อวัตถุประสงค์ทางสถิติ คำเหล่านี้ทั้งหมดจะถูกรวมเข้าด้วยกันภายใต้คำหลัก *possib* ทำให้สามารถจัดอันดับแนวคิดและการเกิดขึ้นของรูปแบบได้ ยิ่งไปกว่านั้น ภาษาอื่นๆ อาจมีปัญหาเฉพาะ เช่น ภาษาจีน ซึ่งไม่ใช้ช่องว่างระหว่างคำ และที่ซึ่งลำดับของตัวอักษรหลายตัวที่กำหนดสามารถตีความได้ว่าเป็นวลีของคำที่มีตัวอักษรเดียว หรือเป็นคำที่มีหลายตัวอักษร

สถิติ

ดูเหมือนว่ากฎของ Zipfจะใช้ได้กับรายการความถี่ที่ได้จากข้อความยาวๆ ของภาษาธรรมชาติใดๆ ก็ตาม รายการความถี่เป็นเครื่องมือที่มีประโยชน์ในการสร้างพจนานุกรมอิเล็กทรอนิกส์ ซึ่งเป็นสิ่งจำเป็นสำหรับแอปพลิเคชันหลากหลายในด้านภาษาศาสตร์เชิงคำนวณ

นักภาษาศาสตร์ชาวเยอรมันกำหนดHäufigkeitsklasse (ชั้นความถี่) ของรายการโดยใช้ลอการิทึมฐาน 2ของอัตราส่วนระหว่างความถี่ของรายการนั้นกับความถี่ของรายการที่พบบ่อยที่สุด รายการที่พบบ่อยที่สุดอยู่ในชั้นความถี่ 0 (ศูนย์) และรายการใด ๆ ที่มีความถี่ประมาณครึ่งหนึ่งของรายการที่พบบ่อยที่สุดจะอยู่ในชั้นที่ 1 ในตัวอย่างรายการข้างต้น คำที่สะกดผิดว่าoutragiousมีอัตราส่วน 76/3789654 และอยู่ในชั้นที่ 16

ฟังก์ชัน floor อยู่ที่ไหน

รายการความถี่ ร่วมกับเครือข่ายความหมายถูกนำมาใช้เพื่อระบุคำศัพท์เฉพาะทางที่พบได้น้อยที่สุด ซึ่งจะถูกแทนที่ด้วยคำที่มีความหมายกว้างกว่าในกระบวนการบีบอัดความหมาย

การสอน

รายการเหล่านั้นไม่ได้มีจุดประสงค์เพื่อมอบให้แก่นักเรียนโดยตรง แต่มีไว้เพื่อเป็นแนวทางสำหรับครูและผู้เขียนตำราเรียน ( Nation 1997 ) บทสรุปการสอนภาษาสมัยใหม่ของ Paul Nationสนับสนุนให้ "เริ่มจากคำศัพท์ที่ใช้บ่อยและคำศัพท์เฉพาะเรื่อง ไปสู่คำศัพท์ที่ใช้น้อย จากนั้นจึงสอนกลยุทธ์ให้ผู้เรียนสามารถขยายคำศัพท์ได้อย่างอิสระ" ( Nation 2006 )

ผลกระทบของความถี่ของคำ

ความถี่ของคำเป็นที่ทราบกันดีว่ามีผลกระทบหลายประการ ( Brysbaert et al. 2011 ; Rudell 1993 ) การท่องจำได้รับผลดีจากความถี่ของคำที่สูงขึ้น ซึ่งอาจเป็นเพราะผู้เรียนได้รับโอกาสในการสัมผัสคำนั้นมากขึ้น ( Laufer 1997 ) การเข้าถึงคำศัพท์ได้รับอิทธิพลในเชิงบวกจากความถี่ของคำที่สูง ซึ่งเป็นปรากฏการณ์ที่เรียกว่าผลกระทบของความถี่ของคำ ( Segui et al. ) ผลกระทบของ ความถี่ของคำนั้นเกี่ยวข้องกับผลกระทบของอายุที่เรียนรู้คำนั้น

ภาษา

ด้านล่างนี้คือบทสรุปของแหล่งข้อมูลที่มีอยู่

ภาษาอังกฤษ

การนับคำเป็นสาขาที่มีมาแต่โบราณ[ 7 ]โดยมีการอภิปรายกันมาตั้งแต่สมัยเฮลเลนิสติก ในปี 1944 เอ็ดเวิร์ด ธอร์นไดค์ เออ ร์วิน ลอร์จและเพื่อนร่วมงาน[ 8 ]ได้นับคำด้วยมือจำนวน 18,000,000 คำ เพื่อจัดทำรายการความถี่ของภาษาอังกฤษขนาดใหญ่เป็นครั้งแรก ก่อนที่คอมพิวเตอร์สมัยใหม่จะทำให้โครงการดังกล่าวทำได้ง่ายขึ้นมาก ( Nation 1997 ) ผลงานในศตวรรษที่ 20 ล้วนประสบปัญหาจากความล้าสมัย โดยเฉพาะอย่างยิ่งคำที่เกี่ยวข้องกับเทคโนโลยี เช่น "blog" ซึ่งในปี 2014 มีความถี่เป็นอันดับที่ 7665 [ 9 ]ใน Corpus of Contemporary American English [ 10 ]ได้รับการบันทึกไว้ครั้งแรกในปี 1999 [ 11 ] [ 12 ] [ 13 ]และไม่ปรากฏในรายการทั้งสามรายการนี้

หนังสือรวมคำศัพท์สำหรับครู จำนวน 30,000 คำ (ธอร์นไดค์และลอร์จ, 1944)
หนังสือ Teacher Word Book ประกอบด้วยคำหลัก 30,000 คำ หรือกลุ่มคำประมาณ 13,000 กลุ่ม (Goulden, Nation และ Read, 1990) มีการวิเคราะห์คำเขียนจำนวน 18 ล้านคำด้วยมือ ขนาดของแหล่งข้อมูลทำให้หนังสือเล่มนี้มีประโยชน์มากขึ้น แต่เนื่องจากอายุของหนังสือและการเปลี่ยนแปลงทางภาษา ทำให้ความสามารถในการใช้งานลดลง ( Nation 1997 )
รายชื่อบริการทั่วไป (ภาคตะวันตก, 1953)
รายชื่อคำศัพท์ทั่วไป (General Service List) ประกอบด้วยคำหลัก 2,000 คำ แบ่งออกเป็นสองชุด ชุดละ 1,000 คำ มีการวิเคราะห์คลังข้อมูลคำเขียน 5 ล้านคำในช่วงทศวรรษ 1940 โดยระบุอัตราการเกิด (%) สำหรับความหมายต่างๆ และชนิดของคำ มีการใช้เกณฑ์ต่างๆ อย่างรอบคอบนอกเหนือจากความถี่และขอบเขตในการวิเคราะห์คลังข้อมูล ดังนั้น แม้จะมีอายุมาก มีข้อผิดพลาดบ้าง และคลังข้อมูลเป็นข้อความเขียนทั้งหมด แต่ก็ยังคงเป็นฐานข้อมูลที่ยอดเยี่ยมสำหรับการวัดความถี่ของคำ ความถี่ของความหมาย และการลดสัญญาณรบกวน ( Nation 1997 ) รายชื่อนี้ได้รับการปรับปรุงในปี 2013 โดย ดร. ชาร์ลส์ บราวน์ ดร. เบรนท์ คัลลิแกน และโจเซฟ ฟิลลิปส์ ในชื่อ รายชื่อ คำศัพท์ทั่วไปฉบับ ใหม่ (New General Service List )
หนังสือความถี่ในการใช้คำศัพท์มรดกอเมริกัน (แครอล, เดวีส์ และริชแมน, 1971)
คลังข้อมูลประกอบด้วยคำต่อเนื่อง 5 ล้านคำ จากข้อความที่เขียนขึ้นที่ใช้ในโรงเรียนของสหรัฐอเมริกา (ระดับชั้นต่างๆ วิชาต่างๆ) คุณค่าของคลังข้อมูลนี้อยู่ที่การมุ่งเน้นไปที่สื่อการสอนในโรงเรียน และการติดแท็กคำตามความถี่ของการปรากฏของแต่ละคำ ในแต่ละระดับชั้น และในแต่ละวิชา ( Nation 1997 )
คลังข้อมูล LOB ของบราวน์ (ฟรานซิสและคูเซรา, 1982) และคลังข้อมูลที่เกี่ยวข้อง
ปัจจุบันแหล่งข้อมูลเหล่านี้มีคำศัพท์ 1 ล้านคำจากคลังข้อมูลที่เขียนขึ้นซึ่งแสดงถึงสำเนียงภาษาอังกฤษที่แตกต่างกัน แหล่งข้อมูลเหล่านี้ใช้ในการสร้างรายการความถี่ ( Nation 1997 )

ภาษาฝรั่งเศส

ชุดข้อมูลแบบดั้งเดิม

New & Pallierได้ทำการตรวจสอบแล้วความพยายามในช่วงทศวรรษ 1950-1960 ได้เริ่มต้นขึ้นด้วยFrançais fondamentalซึ่งประกอบด้วยรายการ FF1 ที่มีคำศัพท์ความถี่สูง 1,500 คำ และเพิ่มเติมด้วยรายการ FF2 ในภายหลังที่มีคำศัพท์ความถี่ปานกลาง 1,700 คำ รวมถึงกฎไวยากรณ์ที่ใช้บ่อยที่สุด[ 14 ]มีการอ้างว่าคำศัพท์ทางไวยากรณ์ 70 คำคิดเป็น 50% ของประโยคการสื่อสาร[ 15 ] [ 16 ]ในขณะที่คำศัพท์ 3,680 คำครอบคลุมประมาณ 95-98% [ 17 ]มีรายการคำศัพท์ความถี่ 3,000 คำ[ 18 ]

กระทรวงศึกษาธิการของฝรั่งเศสยังได้จัดทำรายการจัดอันดับกลุ่มคำที่ใช้บ่อยที่สุด 1,500 กลุ่มซึ่งจัดทำโดยนักพจนานุกรมÉtienne Brunet [ 19 ] Jean Baudot ได้ทำการศึกษาตามแบบจำลองของการศึกษา Brown ของอเมริกา โดยมีชื่อว่า "Fréquences d'utilisation des mots en français écrit contemporain" [ 20 ]

เมื่อไม่นานมานี้ โครงการLexique3ได้จัดเตรียมคำศัพท์ภาษาฝรั่งเศสจำนวน 142,000 คำ พร้อมด้วยการสะกดการออกเสียงการแบ่งพยางค์ส่วนของคำพูดเพศจำนวนครั้งที่ปรากฏในคลังข้อมูลต้นฉบับ อันดับความถี่คำศัพท์ ที่เกี่ยวข้อง ฯลฯ ซึ่งสามารถเข้าถึงได้ภายใต้ใบอนุญาตแบบเปิดCC-by-sa- 4.0 [ 21 ]

ซับเล็กซ์

Lexique3 นี้เป็นการศึกษาต่อเนื่องซึ่งเป็นที่มาของการเคลื่อนไหว Subtlexที่กล่าวถึงข้างต้นNew และคณะ (2007)ได้สร้างวิธีการนับแบบใหม่ทั้งหมดโดยอิงจากคำบรรยายภาพยนตร์ออนไลน์

ภาษาสเปน

มีการศึกษาวิจัยหลายชิ้นเกี่ยวกับความถี่ของคำศัพท์ภาษาสเปน ( Cuetos et al. 2011 ) [ 22 ]

ชาวจีน

คลังข้อมูลภาษาจีนได้รับการศึกษามานานแล้วจากมุมมองของรายการความถี่ วิธีการเรียนรู้คำศัพท์ภาษาจีนในอดีตนั้นอิงตามความถี่ของตัวอักษร ( Allanic 2003 ) จอห์น เดอฟราน ซิส นักจีนวิทยาชาวอเมริกัน ได้กล่าวถึงความสำคัญของความถี่ในการเรียนรู้และการสอนภาษาจีนในฐานะภาษาต่างประเทศในหนังสือWhy Johnny Can't Read Chinese ( DeFrancis 1966 ) ในฐานะเครื่องมือความถี่ Da ( Da 1998 ) และกระทรวงศึกษาธิการของไต้หวัน ( TME 1997 ) ได้จัดทำฐานข้อมูลขนาดใหญ่ที่มีการจัดอันดับความถี่ของตัวอักษรและคำศัพท์ รายการคำศัพท์ HSKจำนวน 8,848 คำที่มีความถี่สูงและปานกลางในสาธารณรัฐประชาชนจีนและ รายการ TOPของสาธารณรัฐจีน (ไต้หวัน)ซึ่งมีคำศัพท์ภาษาจีนดั้งเดิมทั่วไปประมาณ 8,600 คำ เป็นอีกสองรายการที่แสดงคำศัพท์และตัวอักษรภาษาจีนทั่วไป ตามกระแส SUBTLEX Cai & Brysbaert 2010ได้ทำการศึกษาอย่างละเอียดเกี่ยวกับความถี่ของคำศัพท์และตัวอักษรภาษาจีนเมื่อเร็วๆ นี้

อื่น

Wiktionaryมีรายการความถี่ในหลายภาษา[ 23 ]

คำที่ใช้บ่อยที่สุดในภาษาต่างๆ โดยอิงจากวิกิพีเดียหรือคลังข้อมูลรวม[ 24 ]

ดูเพิ่มเติม

หมายเหตุ

  1. ^ "Crr » ความถี่ของคำในคำบรรยาย" . เก็บถาวรจากต้นฉบับเมื่อ 2021-04-17 . เรียกดูเมื่อ2012-05-22 .
  2. ^ Brysbaert, Marc. "ความถี่ของคำในคำบรรยาย" . crr.ugent.be . เก็บถาวรจากต้นฉบับเมื่อ 2023-04-15 . เรียกดูเมื่อ2025-10-11 .
  3. โบอาดา, โรเจอร์; กวาช, มาร์ก; ฮาโร, ฮวน; เดเมสเตร, โจเซฟ; เฟอร์เร, ปิลาร์ (1 กุมภาพันธ์ 2020). "SUBTLEX-CAT: ความถี่คำคำบรรยายและความหลากหลายตามบริบทสำหรับภาษาคาตาลัน " วิธีวิจัยพฤติกรรม52 (1): 360– 375. ดอย : 10.3758/s13428-019-01233-1 . ISSN 1554-3528 . PMID30895456 .S2CID 84843788 .   
  4. ^ van Heuven, Walter JB; Payne, Joshua S; Jones, Manon W (พฤษภาคม 2024). "SUBTLEX-CY: ฐานข้อมูลความถี่คำใหม่สำหรับภาษาเวลส์"วารสารจิตวิทยาเชิงทดลองรายไตรมาส 77 ( 5): 1052– 1067. doi : 10.1177/17470218231190315 . ISSN 1747-0218 . PMC 11032624 . PMID 37649366 .   
  5. ^ Kim, Jin-seo; Choi, Anna Seo Gyeong; Cho, Sunghye (พฤษภาคม 2024). "KoFREN: มาตรฐานความถี่คำภาษาเกาหลีที่ครอบคลุมซึ่งได้มาจากคลังข้อมูลคำพูดอิสระขนาดใหญ่" . ELRA: 9926– 9931. doi : 10.63317/4f55ejcfp5wh .{{cite journal}}: การอ้างอิงวารสารต้องใช้|journal=( ความช่วยเหลือ )
  6. อาเมนตา, ซิโมนา; มันเดรา, ปาเวล; คูเลอร์ส, เอ็มมานูเอล; บริสแบร์ต, มาร์ก; เครปัลดี, ดาวิเด (7 มกราคม 2565) "ซับเท็กซ์-ไอที" .
  7. ^ Bontrager, Terry (1 เมษายน 1991). "การพัฒนาของรายการความถี่คำก่อนรายการ Thorndike-Lorge ปี 1944" . จิตวิทยาการอ่าน . 12 (2): 91– 116. doi : 10.1080/0270271910120201 . ISSN 0270-2711 . 
  8. ^ สมุดคำศัพท์ของครูที่มีคำศัพท์ 30,000คำ
  9. ^ "คำและวลี: ความถี่ ประเภท คำที่ใช้ร่วมกัน การค้นหาคำที่ตรงกัน คำพ้องความหมาย และ WordNet "
  10. ^ "คลังข้อมูลภาษาอังกฤษอเมริกันร่วมสมัย (COCA) "
  11. ^ "มันคือลิงก์ต่างหากล่ะ โง่จริง" . The Economist. 20 เมษายน 2549. สืบค้นเมื่อ5 มิถุนายน 2551 .
  12. ^ Merholz, Peter (1999). "Peterme.com" . Internet Archive . เก็บถาวรจากต้นฉบับเมื่อ 13 ตุลาคม 1999 . เรียกดูเมื่อ5 มิถุนายน 2008 .
  13. ^ Kottke, Jason (26 สิงหาคม 2546). "kottke.org" . สืบค้นเมื่อ5 มิถุนายน 2551 .
  14. "เลอ ฟรองซัวส์ ฟอนดาเมนตัล" . เก็บถาวรจากต้นฉบับเมื่อ 2010-07-04
  15. Ouzoulias, André (2004), Comprendre et aider les enfants en hardé scolaire: Le Vocabulaire fondamental, 70 mots essentiels (PDF) , Retz- อ้างอิงจาก VAC Henmon (ลิงก์เสีย ไม่มีสำเนาใน Internet Archive 10 สิงหาคม 2023)
  16. รายการ "70 mots essentiels" อ้างอิงจาก VAC Henmon
  17. ^ "ข้อเท็จจริงทั่วไป "
  18. ^ "ไฟล์ PDF คำศัพท์ภาษาฝรั่งเศส 3000 คำ "
  19. "Maitrise de la langue à l'école: Vocabulaire" . Ministère de l'éducation nationale.
  20. Baudot, J. (1992), Fréquences d'utilisation des mots en français écrit contemporain , Presses de L'Université, ISBN 978-2-7606-1563-2
  21. ^ "Lexique "
  22. ^ "รายการความถี่ในการใช้คำศัพท์ภาษาสเปน" . Vocabularywiki.pbworks.com .
  23. ^ Wiktionary:รายการความถี่ , 21 กรกฎาคม 2024
  24. ^ คำศัพท์ที่ใช้บ่อยที่สุดในภาษาต่างๆ , ezglot
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Word_list&oldid=1360747206 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ รายการคำศัพท์

รายการ คำศัพท์ คือรายการคำใน พจนานุกรม โดยทั่วไปจะเรียงลำดับตามความถี่ของการปรากฏ (ไม่ว่าจะตาม ระดับ หรือเป็นรายการจัดอันดับ) รายการคำศัพท์ถูกรวบรวมโดย...

ปัจจัย

Nation ( Nation 1997 ) ตั้งข้อสังเกตถึงความช่วยเหลืออันน่าทึ่งที่ได้รับจากความสามารถในการคำนวณ ซึ่งทำให้การวิเคราะห์คลังข้อมูลทำได้ง่ายขึ้นมาก เขาได้ยกตัวอย่างประเด็นสำคัญหลายประการที่มีอิทธิพลต่อการสร้างรายการความถี่:

คลังข้อมูล

งานวิจัยส่วนใหญ่ที่มีอยู่ในปัจจุบันนั้นอิงตาม คลังข้อความ ที่เป็นลายลักษณ์อักษร ซึ่งหาได้ง่ายกว่าและประมวลผลได้ง่ายกว่า

หน่วยคำศัพท์

ไม่ว่าในกรณีใด หน่วยพื้นฐานของ "คำ" ควรได้รับการกำหนด สำหรับอักษรละติน คำมักประกอบด้วยตัวอักษรหนึ่งตัวหรือหลายตัวคั่นด้วยช่องว่างหรือเครื่องหมายวรรคตอน แต่ก็อาจมีข้อยกเว้น เช่น คำว่า "can't" ในภาษาอังกฤษและ " aujourd'hui " ในภาษาฝรั่งเศสมีเครื่องหมายวรรคตอน...