กลับไปหน้าบทความ

อ่าน 3 นาที

ข้อมูลแผง

ในทางสถิติและเศรษฐศาสตร์เชิงปริมาณข้อมูลแบบพาเนลและข้อมูลตามยาว ต่างก็เป็น ข้อมูลหลายมิติที่เกี่ยวข้องกับการวัดในช่วงเวลาต่างๆ ข้อมูลแบบพาเนลเป็นส่วนย่อยของข้อมูลตามยาว

ข้อมูลแผง

ในทางสถิติและเศรษฐศาสตร์เชิงปริมาณข้อมูลแบบพาเนลและข้อมูลตามยาว[ 1 ] [ 2 ] ต่างก็เป็น ข้อมูลหลายมิติที่เกี่ยวข้องกับการวัดในช่วงเวลาต่างๆ ข้อมูลแบบพาเนลเป็นส่วนย่อยของข้อมูลตามยาว โดยที่การสังเกตเป็นของกลุ่มตัวอย่างเดียวกันในแต่ละครั้ง

ข้อมูล อนุกรมเวลาและข้อมูลภาคตัดขวางสามารถมองได้ว่าเป็นกรณีพิเศษของข้อมูลแบบพาเนลที่มีมิติเดียวเท่านั้น (สมาชิกหรือบุคคลในพาเนลหนึ่งคนสำหรับอนุกรมเวลา และข้อมูลภาคตัดขวางมีจุดเวลาหนึ่งจุดสำหรับข้อมูลแบบพาเนล) การค้นคว้าเอกสารมักเกี่ยวข้องกับข้อมูลอนุกรมเวลา ข้อมูลภาคตัดขวาง หรือข้อมูลแบบพาเนล

การศึกษาที่ใช้ข้อมูลแบบพาเนลเรียกว่าการศึกษาแบบระยะยาวหรือการศึกษาแบบพาเนล

ตัวอย่าง

แผงสมดุล MRPP
บุคคล ปี รายได้ อายุ เพศ
120161300271
120171600281
120182000291
220162000382
220172300392
220182400402
แผง MRPP ที่ไม่สมดุล
บุคคล ปี รายได้ อายุ เพศ
120161600231
120171500241
22016ปี ค.ศ. 1900412
220172000422
220182100432
320173300341

ใน ตัวอย่าง ขั้นตอนการเรียงสับเปลี่ยนการตอบสนองหลายรายการ ( MRPP ) ข้างต้น แสดงชุดข้อมูลสองชุดที่มีโครงสร้างแบบพาเนล และวัตถุประสงค์คือการทดสอบว่ามีความแตกต่างอย่างมีนัยสำคัญระหว่างบุคคลในข้อมูลตัวอย่างหรือไม่ ลักษณะเฉพาะบุคคล (รายได้ อายุ เพศ) ถูกเก็บรวบรวมสำหรับบุคคลต่างๆ และปีต่างๆ ในชุดข้อมูลแรก บุคคลสองคน (1, 2) ถูกสังเกตทุกปีเป็นเวลาสามปี (2016, 2017, 2018) ในชุดข้อมูลที่สอง บุคคลสามคน (1, 2, 3) ถูกสังเกตสองครั้ง (บุคคลที่ 1) สามครั้ง (บุคคลที่ 2) และหนึ่งครั้ง (บุคคลที่ 3) ตามลำดับ ในช่วงสามปี (2016, 2017, 2018) โดยเฉพาะอย่างยิ่ง บุคคลที่ 1 ไม่ได้รับการสังเกตในปี 2018 และบุคคลที่ 3 ไม่ได้รับการสังเกตในปี 2016 หรือ 2018

แผงข้อมูลสมดุล (เช่น ชุดข้อมูลแรกข้างต้น) คือชุดข้อมูลที่ สมาชิก แต่ละคนในแผง (เช่น บุคคล) จะถูกสังเกตทุกปี ดังนั้น หากแผงข้อมูลสมดุลประกอบด้วยสมาชิกและช่วงเวลา จำนวนการสังเกต ( ) ในชุดข้อมูลจึงมีค่าเท่ากับ

แผงข้อมูลที่ไม่สมดุล (เช่น ชุดข้อมูลที่สองข้างต้น) คือชุดข้อมูลที่อย่างน้อยหนึ่งสมาชิกในแผงไม่ได้ถูกสังเกตในทุกช่วงเวลา ดังนั้น หากแผงข้อมูลที่ไม่สมดุลมีสมาชิกในแผงและช่วงเวลา จำนวนการสังเกต ( ) ในชุดข้อมูล จะเป็นไปตามอสมการที่เข้มงวดต่อไปนี้ :

ชุดข้อมูลทั้งสองข้างต้นมีโครงสร้างในรูปแบบยาว (long format ) ซึ่งแต่ละแถวจะแทนข้อมูลหนึ่งค่าต่อช่วงเวลา อีกวิธีหนึ่งในการจัดโครงสร้างข้อมูลแบบพาเนล (panel data) คือรูปแบบกว้าง (wide format)ซึ่งแต่ละแถวจะแทนหน่วยการสังเกตหนึ่งหน่วยสำหรับทุกช่วงเวลา (ในตัวอย่างนี้ รูปแบบกว้างจะมีเพียงสอง (ตัวอย่างแรก) หรือสาม (ตัวอย่างที่สอง) แถวข้อมูล พร้อมคอลัมน์เพิ่มเติมสำหรับตัวแปรที่เปลี่ยนแปลงตามเวลาแต่ละตัว (รายได้ อายุ))

การวิเคราะห์

แผงมีรูปแบบ

โดยที่คือมิติของแต่ละบุคคล และคือมิติของเวลา แบบจำลองการถดถอยข้อมูลแบบพาเนลทั่วไปเขียนได้เป็น โดยสามารถตั้งสมมติฐานที่แตกต่างกันได้เกี่ยวกับโครงสร้างที่แน่นอนของแบบจำลองทั่วไปนี้ แบบจำลองที่สำคัญสองแบบคือแบบจำลองผลกระทบคงที่และ แบบ จำลอง ผลกระทบสุ่ม

พิจารณาแบบจำลองข้อมูลแผงทั่วไป:

เป็นผลกระทบเฉพาะบุคคลที่ไม่เปลี่ยนแปลงตามเวลา (เช่น ในกลุ่มประเทศต่างๆ อาจรวมถึงภูมิศาสตร์ สภาพภูมิอากาศ ฯลฯ) ซึ่งคงที่ตลอดเวลา ในขณะที่เป็นองค์ประกอบสุ่มที่เปลี่ยนแปลงตามเวลา

หากไม่สามารถสังเกตตัวแปรได้ และมีความสัมพันธ์กับตัวแปรอิสระอย่างน้อยหนึ่งตัว จะทำให้เกิดอคติจากตัวแปรที่ถูกละเลยใน การวิเคราะห์ถดถอย OLS มาตรฐาน อย่างไรก็ตาม วิธีการวิเคราะห์ข้อมูลแบบพาเนล เช่น ตัวประมาณค่าแบบผลกระทบคงที่ หรือตัวประมาณค่าแบบความแตกต่างอันดับแรกสามารถใช้เพื่อควบคุมอคตินี้ได้

หากตัวแปร ไม่มีความสัมพันธ์กับตัวแปรอิสระใดๆ วิธีการถดถอยเชิงเส้นแบบกำลังสองน้อยที่สุดธรรมดา (Ordinary Least Squares Linear Regression) สามารถใช้เพื่อให้ได้ค่าประมาณพารามิเตอร์การถดถอยที่ไม่เอนเอียงและสอดคล้องกันได้ อย่างไรก็ตาม เนื่องจากตัวแปร มีค่าคงที่ตลอดเวลา จึงจะทำให้เกิดความสัมพันธ์แบบอนุกรม (Serial Correlation) ในเทอมความคลาดเคลื่อนของการถดถอย ซึ่งหมายความว่ามีเทคนิคการประมาณค่าที่มีประสิทธิภาพมากกว่า วิธีการผลกระทบแบบสุ่ม (Random Effects) เป็นหนึ่งในวิธีการดังกล่าว ซึ่งเป็นกรณีพิเศษของกำลังสองน้อยที่สุดแบบทั่วไปที่ทำได้ (Feasible Generalized Least Squares)ซึ่งควบคุมโครงสร้างของความสัมพันธ์แบบอนุกรมที่เกิดจากตัวแปรได้

ข้อมูลแผงแบบไดนามิก

ข้อมูลพาเนลแบบไดนามิก หมายถึงกรณีที่ ใช้ ค่าที่ล่าช้าของตัวแปรตามเป็นตัวแปรอิสระ:

การมีตัวแปรตามที่ล่าช้าอยู่จะละเมิดสมมติฐานความเป็นเอกพันธ์ อย่างเคร่งครัด กล่าวคือ อาจเกิด ความเป็นเอกพันธ์ภายในได้ ตัวประมาณค่าแบบผลกระทบคงที่และตัวประมาณค่าแบบผลต่างอันดับแรกต่างก็อาศัยสมมติฐานความเป็นเอกพันธ์อย่างเคร่งครัด ดังนั้น หากเชื่อว่าตัวแปรตามมีความสัมพันธ์กับตัวแปรอิสระตัวใดตัวหนึ่ง จะต้องใช้วิธีการประมาณค่าแบบอื่น ตัวแปรเครื่องมือหรือเทคนิค GMM มักถูกใช้ในสถานการณ์นี้ เช่นตัวประมาณค่า Arellano–Bondในการประมาณค่านี้ เราควรมีข้อมูลที่ถูกต้องเกี่ยวกับตัวแปรเครื่องมือด้วย

ชุดข้อมูลที่มีการออกแบบแบบแผง

ชุดข้อมูลที่มีการออกแบบแผงหลายมิติ

หมายเหตุ

  1. ดิกเกิล, ปีเตอร์ เจ.; เฮเกอร์ตี, แพทริค; เหลียง, กุงยี; ซีเกอร์, สก็อตต์ แอล. (2002) การวิเคราะห์ข้อมูลตามยาว (ฉบับที่ 2) สำนักพิมพ์มหาวิทยาลัยออกซ์ฟอร์ด. พี  2 . ไอเอสบีเอ็น 0-19-852484-6.
  2. ^ Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). การวิเคราะห์เชิงระยะยาวประยุกต์ . โฮโบเคน: John Wiley & Sons. หน้า 2. ISBN 0-471-21487-6.
  • พีเอสไอดี
  • คลิปส์
  • แพร์แฟม
  • แบบสำรวจการจ้างงานเกาหลี
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Panel_data&oldid=1308580025 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ข้อมูลแผง

ในทางสถิติและเศรษฐศาสตร์เชิงปริมาณข้อมูลแบบพาเนลและข้อมูลตามยาว ต่างก็เป็น ข้อมูลหลายมิติที่เกี่ยวข้องกับการวัดในช่วงเวลาต่างๆ ข้อมูลแบบพาเนลเป็นส่วนย่อยของข้อมูลตามยาว

ตัวอย่าง

ใน ตัวอย่าง ขั้นตอนการเรียงสับเปลี่ยนการตอบสนองหลายรายการ ( MRPP ) ข้างต้น แสดงชุดข้อมูลสองชุดที่มีโครงสร้างแบบพาเนล และวัตถุประสงค์คือการทดสอบว่ามีความแตกต่างอย่างมีนัยสำคัญระหว่างบุคคลในข้อมูลตัวอย่างหรือไม่ ลักษณะเฉพาะบุคคล (รายได้ อายุ เพศ)...

ข้อมูลแผงแบบไดนามิก

ข้อมูลพาเนลแบบไดนามิก หมายถึงกรณีที่ ใช้ ค่าที่ล่าช้า ของตัวแปรตามเป็นตัวแปรอิสระ:

ชุดข้อมูลที่มีการออกแบบแบบแผง

คณะกรรมการเศรษฐกิจและสังคม เยอรมัน (SOEP) แบบสำรวจพลวัตครัวเรือน รายได้ และแรงงานในออสเตรเลีย (HILDA) แบบสำรวจครัวเรือนของอังกฤษ (British Household Panel Survey - BHPS) แบบสำรวจรายได้และการเข้าร่วมโครงการ (SIPP) ฐานข้อมูลตลาดแรงงานตลอดชีวิต (LLMDB)...