تعریف و تفاوت داده های پنل، داده های مقطعی و داده های سری زمانی #
بر اساس نوع داده های در دسترس برای تحلیل، روش های تحلیل داده تعیین می شوند . معروفترین داده ها، داده های پنل، داده های مقطعی و داده های سری زمانی هستند.
داده های پنل #
داده های پنل یا تابلویی (Panel Data)، داده های چند بُعدی، شامل مشاهدات چندین پدیده در چندین دوره زمانی برای موجودیت های مشابه (شرکت ها، افراد و غیره) است. تحقیق و مطالعه ای که از داده های پانل استفاده می کند، مطالعه طولی یا مطالعه پنل (Longitudinal or Panel Study) نامیده می شود.
اگر تعداد مشاهدات زمانی برای تمام مؤلفههای موجود در پنل یکسان باشد، به آن پنل متوازن گفته میشود، اما درصورتیکه برای تعدادی از مؤلفهها برخی مشاهدات زمانی مفقود باشند، پنل را نامتوازن مینامند. در مثال جدول بالا، پنل نامتوازن است. زیرا اطلاعات خانم مریم کرمانی در سال ۱۳۹۲ موجود نیست، همینطور اطلاعات خانم سعیده رضائی درسالهای ۱۳۹۰ و ۱۳۹۲ مفقود است.
داده های مقطعی #
داده های مقطعی (Cross-Sectional Data) از طریق مشاهده موجودیت های بسیار (مانند افراد، شرکت ها، کشورها و غیره) در یک زمان یا بدون توجه به زمان جمع آوری می شوند. تجزیه و تحلیل داده های مقطعی معمولا با مقایسه تفاوت بین موضوعات/موجودیتها سروکار دارد.
به عنوان مثال، برای محاسبه سطوح اضافه وزن فعلی در یک جامعه، می توان نمونه ای شامل ۱۰۰۰ تَن را به طور تصادفی از آن جامعه (که به عنوان مقطعی از آن شناخته می شود)، انتخاب و قد و وزن آن ها را حساب کرده و درصدی از این نمونه که به عنوان دارای اضافه وزن، طبقه بندی شده را محاسبه کرد. این نمونه مقطعی، یک تصویر آنی از آن جامعه را در یک مقطع زمان ارائه می دهد. توجه داشته باشید که با داده های مقطعی نمی توان افزایش یا کاهش وزن را متوجه شد؛ بلکه فقط می توان نسبت فعلی را توصیف کرد. به مثال های زیر توجه کنید:
- – نرخ بیکاری کشورهای جهان سوم در سال ۲۰۲۳
- – نمره زبان انگلیسی همه دانشجویان دانشگاه تهران در ترم اول سال تحصیلی ۱۴۰۱-۱۴۰۰
- – میزان سود همه شرکت های بورسی در سال ۱۳۹۶
داده های سری زمانی #
سری زمانی (Time Series)، یک توالی از نقاط داده است که در زمان های خاص ثبت شده اند. یا به عبارت دیگر، ترتیب زمانی گروهی از داده ها برحسب رخداد هر نقطه داده است.
سری زمانی می تواند پیوسته یا گسسته باشد. در یک سری زمانی گسسته، مجموعه زمان ها یک مجموعه گسسته است و اندازه گیری ها معمولا در زمان های متوالی در فواصل یکنواخت قرار دارند. در سری زمانی پیوسته، مشاهدات در طول زمان مثلا در بازه زمانی (۱و۰) ثبت می شوند.
از آنجاکه داده های سری زمانی یک ترتیب زمانی طبیعی دارند، از داده های معمول که نظم طبیعی در مشاهدات وجود ندارد، متمایز هستند. همچنین به طورکلی، مدل سری زمانی این واقعیت را نشان می دهد که مشاهدات با فاصله زمانی نزدیک تر، با هم ارتباط بیشتری به نسبت مشاهدات در فاصله زمانی دورتر دارند. به علاوه، مدل های سری زمانی اغلب به طور طبیعی زمان بندی یک طرفه دارند، به طوری که مقادیر یک دوره معین به نوعی مشتق از مقادیر گذشته (و نه مقادیر آینده) بیان می شوند.
به مثال های زیر توجه کنید:
- – دمای هوای روزانه یا بارش ماهانه در یک مکان خاص
- – داده های سالانه جمعیت ایران
- – قیمت روزانه سهام
- – نرخ هفتگی بهره
- – درآمد سالانه ملی
- – آمار روزانه فروش