سوال ۲: پیشپردازش دادهها (Preprocessing)
تیم شما وارد مرحلهای جدید شده است! پس از تحلیل اولیه دادههای کندلاستیک سهام TechX، متوجه شدهاید که دادههای دریافتی بهطور کامل منظم و پاک نیستند. ممکن است برخی سطرها شامل مقادیر خالی (Null) باشند، یا ستونهایی دارای دادههای ناسازگار و یا فرمتهای نادرست بهویژه در ستون تاریخ باشند. این مشکل میتواند روند تحلیلهای بعدی و مدلهای پیشبینی شما را تحتالشعاع قرار دهد. برای حل این مسئله، تیم شما تصمیم گرفته که دادهها را پیشپردازش کند؛ یعنی:
وظیفه شما کمک به تیم است تا دادهها را تمیز کرده و در قالبی منظم برای تحلیلهای پیشرفتهتر آماده کند.
ورودی شامل چندین سطر است که هر سطر دارای ۵ فیلد به ترتیب زیر است:
ممکن است برخی از فیلدها خالی (یا حاوی رشتهای خالی) باشند. در ابتدا از کاربر درخواست میشود که تعداد سطرهایی که میخواهد وارد کند را اعلام نماید. سپس به تعداد همان سطر از کاربر داده گرفته میشود.
خروجی باید شامل سطر عنوان (header) و سپس تمامی سطرهای پاکشده و مرتب شده (بر اساس تاریخ به صورت صعودی) باشد. هر سطر بهصورت یک خط چاپ شود.
در ابتدا از کاربر خواسته میشود که تعداد سطرها را وارد کند:
سپس ۴ سطر داده به شکل زیر وارد میشود:
سطر سوم (با تاریخ 2025-01-02) به دلیل داشتن مقدار خالی در ستون Low حذف شده است. سطرهای باقیمانده بر اساس تاریخ به ترتیب صعودی (2025-01-01، 2025-01-03، 2025-01-04) مرتب شدهاند.