+ محدودیت زمان: ندارد.
+ محدودیت حافظه: ندارد.
----------
سال هاست در جهان موازی پرتویی نیست و مردم ناچارند صرفا با آواها (اصوات) احساسات یکدگیر را تشخیص دهند. تشخیص احساسات مردم از طریق آوا ها دشوار است(هر چند در حضور پرتو هم دشوار است!). به همین دلیل علی علاقمند به پردازش آوا ها و استخراج احساسات از روی آنها شده است، برای اینکه او بتواند پردازش مناسبی بر روی احساست انجام دهد نیاز به دادگان مناسب دارد از همین روی در اینترنت برای یافتن داده مناسب بسیار جستجو کرد و به مجموعه ShEMO رسید([اینجا](https://arxiv.org/abs/1906.01155)
را ببینید).
برای راحتی کار شما او بخشی از آن را حذف و تعدیل کرد (راستش احساساتی را انتخاب کرد که براش مهم تر بودن!). او که از پس این کار بسیار دشوار یعنی یافتن دادگان مناسب بر آمده است بسیار خسته است اما سریعا به مدل مناسب نیازمند است؛ برای همین به شما مراجعه کرده است.
# دادگان:
همچنان که می دانید به علت حجم بالای دادگان آموزش و آزمون ، لینک دانلود آن از روز قبل در اختیار شما قرار گرفته بود.
فایل های آغازین سوال(شامل رمز دادگان آموزش و output.csv) را از [اینجا]( [این لینک](/contest/assignments/24489/download_problem_initial_project/82526/) ) دریافت کنید.
رمز فایل دادگان آزمون (test) نیز دو ساعت قبل از پایان آزمون در اختیار شما قرار خواهد گرفت.
نام فایل های صوتی برای مثال به فرمت زیر است:
```
1200FS.wav
```
بخش عددی به معنای id فایل است؛
اولین کارکتر از الفبای انگلیسی مشخص کننده جنسیت
| محتوا | برچسب |
|:------------------:|:------------------:|
| مرد | (M(male |
| زن | (F(female |
و حرف بعدی نشانگر برچسبِ احساسِ منسوب به این آوا است.
| محتوا | برچسب |
|:-----------------:|:------------------:|
| خشم | (A(anger |
| شادی | (H(happiness |
| غم | (S(sadness |
| شگفتی | (W(surprise |
| بی تفاوت | (N(neutral |
بنابراین مثال بالا متعلق به یک خانم در حالت غمگین است.
# ارزیابی:
برای محاسبه کیفیت پاسخ این سوال از log loss استفاده میکنیم:
$$
L(Y, P) = - \frac{1}{N} \sum_{i=0}^{N-1} \sum_{k=0}^{K-1} y_{i,k} \log p_{i,k}
$$
$$p_{i,0} = 1 - p_{i,1} , y_{i,0} = 1 - y_{i,1}$$
*اینجا
$y_{i,k}$
برابر یک است اگر نمونه
$i$
دارای برچسب
$k$
است و در غیر این صورت صفر است.*
*همچنین
$ p_{i,k}$
بیانگر احتمال آن است که نمونه
$i$
دارای برچسب
$k$
باشد.*
در نهایت امتیاز شما به طریق زیر محاسبه خواهد شد.
$$exp{(-0.3* ((2*loss)^{0.5}))} * 200$$
# خروجی:
برای ارسال پاسخ های خود از فایل output.csv استفاده کنید. هر سطر این فایل برابر با یکی از نمونه های آزمون و هر ستون آن (به جز file_id) برابر با یکی از احساس ها است که شما باید احتمال تعلق نمونه ها به هر احساس را پر کنید. ستون file-id *(با فرمت int)* برابر است با id هر آوا در فایل test بنابراین مراقب باشید که ترتیب نمونه های که احساس آن را پیش بینی میکنید درست انتساب یابند. فایل output.csv را با نام output زیپ و ارسال کنید.