یکی از چالشهای همیشگی دیجیکالا، پیشبینی فروش محصولات مختلف در بازههای زمانی گوناگون است. این پیشبینی از جهتهای مختلفی دارای اهمیت است؛ از مهمترینهای آنها میتوان به یاری رساندن به فروشندهها جهت موجود داشتن محصولات مختلف، که باعث سودرسانی حداکثری به فروشنده و دیجیکالا میشود، و کمک به عدم تأخیر در تأمین سفارشات مشتریان اشاره کرد.
در این مسئله دادههای فروش ۵ سال گذشته دیجیکالا برای ۵۰ فروشنده مختلف در اختیار شما قرار میگیرد. این دادهها را میتوانید از لینک زیر دانلود کنید.
[دادههای فروش ۵ ساله](https://quera.ir/assignment/20120/download_problem_initial_project/66274/)
این فایل آرشیو دارای ۳ فایل داده است. فایل اول **train.csv** است که شامل دادههای آموزش مسئله است. این فایل دارای ستونهای زیر است.
1. id: شناسه سطر
2. date: تاریخ رکورد
3. seller: فروشنده
4. item: شناسه محصول
5. sales: تعداد محصول فروخته شده
فایل دوم **test.csv** است که شامل سطرهایی است که باید میزان فروش آنها پیشبینی شود. این فایل دارای ستونهایی مانند فایل آموزش است و تنها ستون sales در آن وجود ندارد و شما باید آن را پیشبینی کنید.
فایل سوم **answer_style.csv** است که نشان دهنده فرمت فایلی است که شما باید آپلود نمایید. برای سادگی بیشتر فرمت را زیر نیز توضیح میدهیم.
## خروجی نمونه ۱
```
id,sales
0,100
1,100
2,100
3,100
4,100
5,100
```
این فایل دارای ۲ ستون است. که به شکل بالا باید پر شوند. اعداد هر دو ستون به شکل صحیح باید وجود داشته باشند و همه id های موجود در فایل تست، باید در این فایل نیز وجود داشته باشند و مقدار sales آنها موجود باشند تا جواب شما داوری شود. شما باید فایل پر شده را در فرمت csv آپلود نمایید.
برای اندازه گیری کیفیت پاسخ شما با توجه به صورت مسئله از معیار **SMAPE** استفاده میشود.
ارسال پاسخ برای این سؤال
در حال حاضر شما دسترسی ندارید.