# صورت مسئله
فرض کنید شما قرار است قیمتگذار کالاهای دیجیکالا باشید. با کمک گرفتن از دادههای محصولات مشابه و قیمتهای آنها، قیمت باقی محصولات را با توجه به نوع و ویژگیهای محصول محاسبه کنید.
# ورودی
فایل ورودی به نام `train.csv`، دارای سه ستون است:
1. `id`: شامل یک شماره یکتا به ازای هر سطر است.
2. `product_description`: به فرمت یک `dictionary` میباشد و شامل دستهبندی، برند و سایر مشخصات محصول میباشد.
3. `price`: شامل قیمت محصول است.
همچنین یک فایل به نام `test.csv` به شما داده شده است که شامل دو ستون اول ذکر شده در بالا میباشد. از شما خواسته شده است مدلی طراحی کنید که قیمت این محصولات را تخمین بزند.
برای دریافت دادههای آموزش و آزمون روی [این لینک](https://quera.org/contest/assignments/39253/download_problem_initial_project/132527/?noconvert=true) کلیک کنید.
# خروجی
فایل خروجی باید دارای نام `output.csv` باشد. این فایل باید دارای دو ستون `id` و `price` باشد. `id` باید همان شماره یکتای محصولات فایل `test` با همان ترتیب باشد و `price` قیمت محاسبه شده توسط مدل شما برای آن محصول است.
توجه کنید که مغایرت نام فایل، نام ستونها، ترتیب محصولات، و یا آوردن دو قیمت برای یک محصول باعث میشود به طور کامل امتیاز این بخش را از دست بدهید.
# ارزیابی
برای ارزیابی خروجیهای شما از معیار ارزیابی **Mean Absolute Percentage Error (MAPE)** استفاده میشود، که این عدد هر چه به صفر نزدیکتر باشد عملکرد شما بهتر بوده است.
![{\displaystyle {\mbox{MAPE}}={\frac {100\%}{n}}\sum _{t=1}^{n}\left|{\frac {A_{t}-F_{t}}{A_{t}}}\right|}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5ada3996551e35503a1605edd4e35a26f1215d36)
نمره این سوال بر اساس فرمول زیر محاسبه میشود که هر چه به صد در صد نزدیکتر باشد، یعنی شما بهتر عمل کردهاید و به همان نسبت امتیاز این سوال را کسب میکنید.
$$ SCORE = 100 - MAPE $$
قیمتگذاری کالاهای دیجیکالا