อ่าน 6 นาที
สเตต้า
Stata ( / ˈ s t eɪ t ə / , [ 2 ] STAY -ta , หรืออีกแบบหนึ่งคือ / ˈ s t æ t ə / , บางครั้งเขียนเป็น STATA [ 3 ] [ 4 ] ) เป็นซอฟต์แวร์ ทางสถิติ อเนกประสงค์ที่พัฒนาโดย StataCorp...
สเตต้า
| สเตต้า | |
|---|---|
Stata 19 บนWindows | |
| ผู้เขียนต้นฉบับ | วิลเลียม กูลด์[ 1 ] |
| นักพัฒนา | สเตตาคอร์ป |
| ปล่อย | พ.ศ. 2528 |
| เวอร์ชันเสถียร | 19.0 / 8 เมษายน 2568 |
| เขียนเป็น | ซี |
| ระบบปฏิบัติการ | วินโดวส์ , มอสซาเรลล่า , ลินุกซ์ |
| พิมพ์ | การวิเคราะห์ทางสถิติการวิเคราะห์เชิงตัวเลข |
| ใบอนุญาต | กรรมสิทธิ์ |
| เว็บไซต์ | www.stata.com |
Stata ( / ˈ s t eɪ t ə / , [ 2 ] STAY -ta , หรืออีกแบบหนึ่งคือ/ ˈ s t æ t ə / , บางครั้งเขียนเป็น STATA [ 3 ] [ 4 ] ) เป็นซอฟต์แวร์ ทางสถิติอเนกประสงค์ที่พัฒนาโดย StataCorp สำหรับการจัดการข้อมูล การแสดงภาพ สถิติ และการรายงานอัตโนมัติ นักวิจัยในหลายสาขาใช้ซอฟต์แวร์นี้ รวมถึงชีวการแพทย์เศรษฐศาสตร์ระบาดวิทยาและสังคมวิทยา[ 5 ]
Stata ได้รับการพัฒนาครั้งแรกโดย Computing Resource Center ในแคลิฟอร์เนีย และเวอร์ชันแรกออกวางจำหน่ายในปี 1985 [ 6 ]ในปี 1993 บริษัทได้ย้ายไปที่College Station รัฐเท็กซัสและเปลี่ยนชื่อเป็น Stata Corporation ซึ่งปัจจุบันรู้จักกันในชื่อ StataCorp [ 1 ]การออกเวอร์ชันใหม่ในปี 2003 มีระบบกราฟิกใหม่และกล่องโต้ตอบสำหรับคำสั่งทั้งหมด[ 6 ]ตั้งแต่นั้นมา ได้มีการออกเวอร์ชันใหม่ทุกๆ สองปี[ 7 ]เวอร์ชันปัจจุบันคือ Stata 19 ซึ่งออกวางจำหน่ายในเดือนเมษายน 2025 [ 8 ]
ภาพรวมทางเทคนิคและศัพท์เฉพาะ
ส่วนติดต่อผู้ใช้
นับตั้งแต่เริ่มพัฒนา Stata ได้ใช้ส่วนติดต่อผู้ใช้แบบบรรทัดคำสั่งแบบบูรณาการมาโดยตลอด แต่ตั้งแต่เวอร์ชัน 8.0 เป็นต้นไป Stata ได้เพิ่มส่วนติดต่อผู้ใช้แบบกราฟิก (GUI)ซึ่งใช้เมนูและกล่องโต้ตอบเพื่อให้เข้าถึงคำสั่งในตัวได้มากมาย สามารถดูหรือแก้ไขชุดข้อมูลในรูปแบบสเปรดชีตได้ และตั้งแต่เวอร์ชัน 11 เป็นต้นไป สามารถเรียกใช้คำสั่งอื่นๆ ได้ในขณะที่เปิดโปรแกรมดูข้อมูลหรือโปรแกรมแก้ไขข้อมูลอยู่
โครงสร้างข้อมูลและการจัดเก็บข้อมูล
จนกระทั่งมีการเปิดตัวเวอร์ชัน 16 [ 9 ] Stata สามารถเปิดชุดข้อมูล ได้เพียงชุดเดียว ในแต่ละครั้ง Stata อนุญาตให้มีความยืดหยุ่นในการกำหนดประเภทข้อมูลให้กับข้อมูลcompressคำสั่งของ Stata จะกำหนดข้อมูลใหม่โดยอัตโนมัติให้กับประเภทข้อมูลที่ใช้หน่วยความจำน้อยลงโดยไม่สูญเสียข้อมูล Stata ใช้ประเภทการจัดเก็บจำนวนเต็มซึ่งใช้พื้นที่เพียงหนึ่งหรือสองไบต์แทนที่จะเป็นสี่ไบต์ และความแม่นยำเดี่ยว (4 ไบต์) แทนที่จะเป็นความแม่นยำคู่ (8 ไบต์) เป็นค่าเริ่มต้นสำหรับตัวเลข ทศนิยม
ภาษาเอาต์พุตที่เป็นกรรมสิทธิ์ของ Stata เรียกว่า SMCL ซึ่งย่อมาจาก Stata Markup and Control Language และออกเสียงว่า "สมิคเคิล" [ 10 ]
รูปแบบข้อมูลของ Stata จะเป็น แบบ ตาราง เสมอ Stata เรียกคอลัมน์ของข้อมูลในตารางว่าตัวแปร
ความเข้ากันได้ของรูปแบบข้อมูล
โปรแกรม Stata สามารถนำเข้าข้อมูลได้หลายรูปแบบ รวมถึง รูปแบบข้อมูล ASCII (เช่น รูปแบบ CSVหรือ รูปแบบ ฐานข้อมูล ) และรูปแบบสเปรดชีต (รวมถึง รูปแบบ Excel ต่างๆ )
รูปแบบไฟล์ที่เป็นกรรมสิทธิ์ของ Stata มีการเปลี่ยนแปลงไปตามกาลเวลา แม้ว่า Stata ทุกเวอร์ชันจะไม่ได้มีรูปแบบชุดข้อมูลใหม่ก็ตาม Stata ทุกเวอร์ชันสามารถอ่านรูปแบบชุดข้อมูลเก่าทั้งหมดได้ และสามารถเขียนทั้งรูปแบบชุดข้อมูลปัจจุบันและรูปแบบชุดข้อมูลก่อนหน้าล่าสุดได้โดยใช้saveoldคำสั่ง[ 11 ]ดังนั้น Stata เวอร์ชันปัจจุบันจึงสามารถเปิดชุดข้อมูลที่สร้างขึ้นด้วยเวอร์ชันเก่าได้เสมอ แต่เวอร์ชันเก่าไม่สามารถอ่านชุดข้อมูลรูปแบบใหม่ได้
Stata สามารถอ่านและเขียนชุดข้อมูลในรูปแบบ SAS XPORT ได้โดยตรง โดยใช้คำสั่ง fdauseและfdasave
โปรแกรม วิเคราะห์ทางเศรษฐศาสตร์อื่นๆ บางโปรแกรม เช่นgretlสามารถนำเข้าไฟล์รูปแบบ Stata ได้โดยตรง
ประวัติศาสตร์
การพัฒนา Stata เริ่มขึ้นในปี 1984 โดยเริ่มแรกโดย William (Bill) Gould และต่อมาโดย Sean Becketti ซอฟต์แวร์นี้มีจุดประสงค์เพื่อแข่งขันกับโปรแกรมทางสถิติสำหรับคอมพิวเตอร์ส่วนบุคคล เช่นSYSTATและMicroTSP [ 6 ] Stata เขียนด้วย ภาษาโปรแกรม CและเปิดตัวสำหรับMS-DOSในปี 1985 โดยมีคำสั่ง 44 คำสั่ง[ 6 ]ตั้งแต่นั้นมา Stata เวอร์ชันต่างๆ ได้ถูกปล่อยออกมาสำหรับระบบที่ใช้Unix เวอร์ชันต่างๆเช่นLinux distributions, WindowsและMacOS [ 6 ]ไฟล์ Stata ทั้งหมดเป็นอิสระจากแพลตฟอร์ม
| ผนวก | ผู้กำกับ | ไฟล์อิน | พล็อต | ม้วน |
| บี๊บ | ทำ | ป้อนข้อมูล | คำถาม | สรุป |
| โดย | หยด | ฉลาก | ถอยหลัง | จัดทำตาราง |
| การจับกุม | ลบ | รายการ | เปลี่ยนชื่อ | ทดสอบ |
| ยืนยัน | ทางออก | มาโคร | แทนที่ | พิมพ์ |
| แปลง | ขยาย | ผสาน | วิ่ง | ใช้ |
| สัมพันธ์กัน | รูปแบบ | แก้ไข | บันทึก | |
| นับ | สร้าง | มากกว่า | ชุด | |
| อธิบาย | ช่วย | ไฟล์เอาต์พุต | เรียงลำดับ |
มีการออกเวอร์ชันหลักของ Stata ทั้งหมด 19 ครั้งระหว่างปี 1985 ถึง 2025 และมีการอัปเดตโค้ดและเอกสารเพิ่มเติมระหว่างเวอร์ชันหลัก[ 7 ]ในช่วงแรก ๆ บางครั้งมีการขายชุดโปรแกรม Stata เพิ่มเติมในรูปแบบ "ชุด" หรือแจกจ่ายในรูปแบบแผ่นดิสก์สนับสนุน เมื่อมีการออก Stata 6 ในปี 1999 updateก็เริ่มมีการส่งมอบให้กับผู้ใช้ผ่านทางเว็บ[ 6 ]
มีการเพิ่มคำสั่งหลายร้อยคำสั่งลงใน Stata ตลอดระยะเวลา 37 ปีที่ผ่านมา[ 12 ] [ 13 ] การพัฒนาบางอย่างได้รับการพิสูจน์แล้วว่ามีความสำคัญเป็นพิเศษและยังคงกำหนดรูปแบบประสบการณ์ผู้ใช้ในปัจจุบัน ซึ่งรวมถึงความสามารถในการขยาย การเป็นอิสระจากแพลตฟอร์มและชุมชนผู้ใช้ที่ กระตือรือร้น [ 6 ]
ความสามารถในการขยาย
คำสั่ง นี้programถูกนำมาใช้ใน Stata 1.2 ทำให้ผู้ใช้สามารถเพิ่มคำสั่งของตนเองได้[ 6 ] [ 14 ]ไฟล์ ado ตามมาใน Stata 2.1 ซึ่งอนุญาตให้โหลดโปรแกรมที่ผู้ใช้เขียนลงในหน่วยความจำโดยอัตโนมัติ ไฟล์ ado ที่ผู้ใช้เขียนจำนวนมากถูกส่งไปยังStatistical Software Components Archiveซึ่งดูแลโดย Boston College StataCorp ได้เพิ่มsscคำสั่งเพื่ออนุญาตให้เพิ่มโปรแกรมที่ชุมชนมีส่วนร่วมโดยตรงภายใน Stata [ 15 ] Stata รุ่นใหม่กว่าอนุญาตให้ผู้ใช้เรียกใช้สคริปต์ Python โดยใช้คำสั่ง รวมถึงอนุญาตให้ IDE ของ Python เช่น Jupyter Notebooks นำเข้าคำสั่ง Stata ได้[ 16 ]แม้ว่า Stata จะไม่รองรับ R โดยตรง แต่ก็มีส่วนขยายที่ผู้ใช้เขียนขึ้นเพื่อใช้สคริปต์ R ใน Stata [ 17 ]
ชุมชนผู้ใช้งาน
การพัฒนาที่สำคัญหลายอย่างเริ่มต้นโดยชุมชนผู้ใช้ที่กระตือรือร้นของ Stata [ 6 ] Stata Technical Bulletinซึ่งมักจะมีคำสั่งที่ผู้ใช้สร้างขึ้น ได้รับการแนะนำในปี 1991 และออกปีละ 6 ครั้ง ต่อมาได้เปิดตัวใหม่ในปี 2001 ในชื่อStata Journalซึ่งเป็นวารสารวิชาการที่ได้รับการตรวจสอบโดยผู้ทรงคุณวุฒิ เป็นสิ่งพิมพ์รายไตรมาสที่มีคำอธิบายคำสั่งที่ชุมชนร่วมกันสร้างขึ้นและเคล็ดลับสำหรับการใช้งาน Stata อย่างมีประสิทธิภาพ ในปี 1994 ได้มีการเริ่มใช้ listserv เป็นศูนย์กลางสำหรับผู้ใช้ในการแก้ไขปัญหาการเขียนโค้ดและปัญหาทางเทคนิคแบบร่วมมือกัน ในปี 2014 ได้มีการเปลี่ยนเป็นเว็บบอร์ด ในปี 1995 Statacorp เริ่มจัดงานประชุมผู้ใช้และนักพัฒนาซึ่งจัดขึ้นเป็นประจำทุกปี มีเพียงงานประชุม Stata Conference ประจำปีที่จัดขึ้นในสหรัฐอเมริกาเท่านั้นที่จัดโดย StataCorp การประชุมกลุ่มผู้ใช้อื่นๆ จัดขึ้นเป็นประจำทุกปีในสหรัฐอเมริกา (Stata Conference) สหราชอาณาจักร เยอรมนี และอิตาลี และจัดขึ้นไม่บ่อยนักในอีกหลายประเทศ ผู้จัดจำหน่าย Stata ในท้องถิ่นจะเป็นเจ้าภาพจัดการประชุมกลุ่มผู้ใช้ในประเทศของตนเอง
| เวอร์ชั่น | วันที่วางจำหน่าย | เลือกคุณสมบัติใหม่หรือที่ได้รับการปรับปรุง |
|---|---|---|
| 1.0 | มกราคม พ.ศ. 2528 |
|
| 1.1 | กุมภาพันธ์ พ.ศ. 2528 |
|
| 1.2 | พฤษภาคม 1985 |
|
| 1.3 | สิงหาคม พ.ศ. 2528 |
|
| 1.4 | สิงหาคม พ.ศ. 2529 |
|
| 1.5 | กุมภาพันธ์ พ.ศ. 2530 |
|
| 2.0 | มิถุนายน พ.ศ. 2531 |
|
| 2.1 | กันยายน 1990 |
|
| 3.0 | มีนาคม พ.ศ. 2535 |
|
| 3.1 | สิงหาคม พ.ศ. 2536 |
|
| 4.0 | มกราคม พ.ศ. 2538 |
|
| 5.0 | ตุลาคม พ.ศ. 2539 |
|
| 6.0 | มกราคม พ.ศ. 2542 |
|
| 7.0 | ธันวาคม พ.ศ. 2543 |
|
| 8.0 | มกราคม พ.ศ. 2546 |
|
| 8.1 | กรกฎาคม พ.ศ. 2546 |
|
| 8.2 | ตุลาคม พ.ศ. 2546 |
|
| 9.0 | เมษายน 2548 |
|
| 9.1 | กันยายน 2548 | |
| 9.2 | เมษายน 2549 | |
| 10.0 | มิถุนายน 2550 |
|
| 10.1 | สิงหาคม 2551 | |
| 11.0 | กรกฎาคม 2552 |
|
| 11.1 | มิถุนายน 2553 | |
| 11.2 | มีนาคม 2554 | |
| 12.0 | กรกฎาคม 2554 |
|
| 12.1 | มกราคม 2555 | |
| 13.0 | มิถุนายน 2556 |
|
| 13.1 | ตุลาคม 2556 | |
| 14.0 | เมษายน 2558 |
|
| 14.1 | ตุลาคม 2558 | |
| 14.2 | กันยายน 2559 | |
| 15.0 | มิถุนายน 2560 |
|
| 15.1 | พฤศจิกายน 2560 | |
| 16.0 | มิถุนายน 2562 |
|
| 16.1 | กุมภาพันธ์ 2020 | |
| 17.0 | เมษายน 2564 |
|
| 18.0 | เมษายน 2566 |
|
ผลิตภัณฑ์ซอฟต์แวร์
Stata มีทั้งหมดสี่เวอร์ชัน ได้แก่ Stata/MP, Stata/SE, Stata/BE และ Numerics by Stata [ 18 ]ในขณะที่ Stata/MP อนุญาตให้ประมวลผลแบบขนานในตัวสำหรับคำสั่งบางอย่าง แต่ Stata/SE และ Stata/BE มีข้อจำกัดและจำกัดการใช้งานไว้ที่คอร์เดียวเท่านั้น[ 19 ] Stata/MP รันคำสั่งบางอย่างได้เร็วกว่าประมาณ 2.4 เท่า หรือประมาณ 60% ของประสิทธิภาพสูงสุดตามทฤษฎี เมื่อรันกระบวนการแบบขนานบนคอร์ CPU สี่คอร์ เมื่อเทียบกับเวอร์ชัน SE หรือ BE [ 19 ] Numerics by Stata อนุญาตให้ผสานรวมคำสั่ง Stata เข้ากับเว็บได้
เวอร์ชัน SE และ BE แตกต่างกันในปริมาณหน่วยความจำที่ชุดข้อมูลอาจใช้ แม้ว่า Stata/MP จะสามารถจัดเก็บข้อมูลได้ 10 ถึง 20 พันล้านรายการและตัวแปรได้มากถึง 120,000 ตัว แต่ Stata/SE และ Stata/BE สามารถจัดเก็บข้อมูลได้มากถึง 2.14 พันล้านรายการและจัดการตัวแปรได้ 32,767 ตัวและ 2,048 ตัวตามลำดับ จำนวนตัวแปรอิสระสูงสุดในแบบจำลองคือ 65,532 ตัวแปรใน Stata/MP, 10,998 ตัวแปรใน Stata/SE และ 798 ตัวแปรใน Stata/BE [ 18 ]
ราคาและการออกใบอนุญาตของ Stata ขึ้นอยู่กับวัตถุประสงค์การใช้งาน ได้แก่ ธุรกิจ รัฐบาล/องค์กรไม่แสวงหาผลกำไร การศึกษา หรือนักศึกษา ใบอนุญาตผู้ใช้รายเดียวสามารถต่ออายุได้รายปีหรือตลอดไป ใบอนุญาตประเภทอื่น ๆ ได้แก่ ใบอนุญาตเดียวสำหรับการใช้งานโดยผู้ใช้พร้อมกัน ใบอนุญาตไซต์ ใบอนุญาตผู้ใช้รายเดียวแบบปริมาณสำหรับการกำหนดราคาแบบกลุ่ม หรือห้องปฏิบัติการนักศึกษา[ 20 ]
ตัวอย่างโค้ด
ชุดคำสั่งต่อไปนี้เกี่ยวข้องกับการจัดการข้อมูลอย่างง่าย[ 21 ]
sysuse auto // เปิดชุดข้อมูลอัตโนมัติที่ให้มาbrowse // เรียกดูชุดข้อมูล (เปิดหน้าต่างแก้ไขข้อมูล)describe // อธิบายชุดข้อมูลและตัวแปรที่เกี่ยวข้องsummarize // ข้อมูลสรุปเกี่ยวกับตัวแปรเชิงตัวเลขcodebook make foreign // ข้อมูลสรุปเกี่ยวกับตัวแปร make (สตริง) และ foreign (ตัวเลข)browse if missing (rep78) // เรียกดูเฉพาะข้อมูลที่มีข้อมูลขาดหายไปสำหรับตัวแปร rep78 list make if missing (rep78) // แสดงรายการยี่ห้อรถยนต์ที่มีข้อมูลขาดหายไปสำหรับตัวแปร rep78คำสั่งชุดถัดไปจะกล่าวถึงสถิติเชิงพรรณนา
สรุปราคาโดยละเอียด // สถิติสรุปโดยละเอียดสำหรับราคาที่เปลี่ยนแปลงได้tabulate foreign // ตารางความถี่ทางเดียวสำหรับตัวแปร foreign tabulate rep78 foreign, row // ตารางความถี่สองทางสำหรับตัวแปร rep78 และ foreignsummarize mpg if foreign == 1 // ข้อมูลสรุปเกี่ยวกับอัตราสิ้นเปลืองน้ำมันเชื้อเพลิง (mpg) หากรถยนต์เป็นรถยนต์ต่างประเทศ (เครื่องหมาย "==" ใช้ทดสอบความเท่าเทียมกัน) by foreign, sort : summarize mpg // เหมือนข้างต้น แต่ใช้คำนำหน้า "by" tabulate foreign, summarize (mpg) // เหมือนข้างต้น แต่ใช้คำสั่ง tabulateการทดสอบสมมติฐานอย่างง่าย:
ttest mpg, by (foreign) // การทดสอบ T-test เพื่อหาความแตกต่างของค่าเฉลี่ยระหว่างรถยนต์ในประเทศกับรถยนต์ต่างประเทศการสร้างกราฟข้อมูล:
twoway (scatter mpg weight) // แผนภูมิกระจายแสดงความสัมพันธ์ระหว่าง mpg และน้ำหนักtwoway (scatter mpg weight) โดย (ต่างประเทศ, รวม ) // กราฟสามกราฟสำหรับรถยนต์ในประเทศ รถยนต์ต่างประเทศ และรถยนต์ทั้งหมดการถดถอยเชิงเส้น:
สร้าง wtsq = weight ^ 2 // สร้างตัวแปรใหม่สำหรับน้ำหนักยกกำลังสอง ถดถอยmpg weight wtsq foreign, vce (robust) // การถดถอยเชิงเส้นของ mpg บน weight, wtsq และ foreign ทำนาย mpghat // สร้างตัวแปรใหม่ที่มีค่าที่ทำนายได้ของ mpg สองทาง (scatter mpg weight) (line mpghat weight, sort ), by (foreign) // วาดกราฟข้อมูลและเส้นที่เหมาะสม
ดูเพิ่มเติม
- รายชื่อโปรแกรมวิเคราะห์ทางสถิติ
- การเปรียบเทียบโปรแกรมวิเคราะห์ทางสถิติ
- การวิเคราะห์ข้อมูล
- สถิติเชิงพรรณนา
อ่านเพิ่มเติม
- Bittmann, Felix (2019). Stata - บทนำฉบับย่อ . บอสตัน: DeGruyter Oldenbourg. ISBN 978-3-11061-729-0.
- ปินซอน, เอ็นริเก, เอ็ด. (2558) สามสิบปีกับ Stata: ย้อนหลัง คอลเลจสเตชัน เท็กซัส: สำนักพิมพ์ Stata ไอเอสบีเอ็น 978-1-59718-172-3.
- แฮมิลตัน, ลอว์เรนซ์ ซี. (2013). สถิติด้วย STATA . บอสตัน: Cengage. ISBN 978-0-84006-463-9.
ลิงก์ภายนอก
- เว็บไซต์อย่างเป็นทางการ
- วารสาร Stata
- สเตต้าเพรส
- เอกสารทางเทคนิคของ Stata
- คลังเก็บส่วนประกอบซอฟต์แวร์ทางสถิติ
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ สเตต้า
Stata ( / ˈ s t eɪ t ə / , [ 2 ] STAY -ta , หรืออีกแบบหนึ่งคือ / ˈ s t æ t ə / , บางครั้งเขียนเป็น STATA [ 3 ] [ 4 ] ) เป็นซอฟต์แวร์ ทางสถิติ อเนกประสงค์ที่พัฒนาโดย StataCorp...
ส่วนติดต่อผู้ใช้
นับตั้งแต่เริ่มพัฒนา Stata ได้ใช้ส่วนติดต่อผู้ใช้แบบบรรทัดคำสั่งแบบบูรณาการมาโดยตลอด แต่ตั้งแต่เวอร์ชัน 8.
โครงสร้างข้อมูลและการจัดเก็บข้อมูล
จนกระทั่งมีการเปิดตัวเวอร์ชัน 16 [ 9 ] Stata สามารถเปิด ชุดข้อมูล ได้เพียงชุดเดียว ในแต่ละครั้ง Stata อนุญาตให้มีความยืดหยุ่นในการกำหนดประเภทข้อมูลให้กับข้อมูล compress คำสั่งของ Stata...
ความเข้ากันได้ของรูปแบบข้อมูล
โปรแกรม Stata สามารถนำเข้าข้อมูลได้หลายรูปแบบ รวมถึง รูปแบบข้อมูล ASCII (เช่น รูปแบบ CSV หรือ รูปแบบ ฐานข้อมูล ) และรูปแบบสเปรดชีต (รวมถึง รูปแบบ Excel ต่างๆ )