| فایل اولیهی پروژه را میتوانید از [این لینک](/contest/assignments/98479/download_problem_initial_project/330491/) دانلود کنید.|
| :--: |
رایلی دیگر آن دختربچه کوچک نیست! او حالا یک جوان ۲۳ ساله است که در دنیای پیچیده و پرهیاهوی شبکههای اجتماعی زندگی میکند. مرکز فرماندهی ذهن او با بحرانی بیسابقه روبرو شده است.
هزاران پیام، توییت و کامنت از دنیای بیرون (توییتر، اینستاگرام و ...) به سمت مرکز سرازیر شدهاند. سیستم قدیمی دستهبندی خاطرات که مسئولیتش با **Joy (شادی)** و **Sadness (غم)** بود، زیر بار این حجم از دادههای پیچیده و متناقض از کار افتاده است.
بدتر از همه اینکه **سیستمهای مدرن و گرانقیمت "تغییرشکلدهنده" (Transformers/BERT)** به دلیل مصرف انرژی بیش از حد و تحریمهای بخش فنی، **خاموش شدهاند!**
ما اکنون به روشهای کلاسیک اما قدرتمند مهندسی اعصاب نیاز داریم. شما به عنوان **مهندس ارشد بخش حافظه بلندمدت** استخدام شدهاید. وظیفه شما این است که سیستمی طراحی کنید که بتواند گویهای خاطرات (متون) را بخواند و آنها را به درستی در ۷ جزیره شخصیتی رایلی دستهبندی کند.
آیا میتوانید بدون کمک گرفتن از رباتهای غولپیکر (مدلهای زبانی بزرگ)، نظم را به ذهن رایلی برگردانید؟

----------
شما یک دیتاست شامل نظرات و متون فارسی از شبکههای اجتماعی دریافت میکنید. هدف مدل شما تشخیص دقیق احساس نهفته در هر متن است. این یک مسئله **Classification** با ۷ کلاس مختلف است.
خروجی مدل شما باید دقیقاً یکی از موارد زیر باشد:
%align_right_start%
1. **ANGRY** (خشم 😡)
2. **FEAR** (ترس 😨)
3. **HAPPY** (شادی 😄)
4. **HATE** (تنفّر/انزجار 🤮)
5. **SAD** (غم 😢)
6. **SURPRISE** (تعجب/شگفتی 😲)
7. **OTHER** (سایر/خنثی 😐)
%align_end%
برای اینکه مهارت واقعی شما در درک معماری شبکههای عصبی سنجیده شود، قوانین سختگیرانهای برای این سوال وضع شده است. استفاده از هرگونه مدل مبتنی بر ترنسفورمر (*Transformer-based*) ممنوع است. مدل هایی مثل BERT, ParsBERT, RoBERTa, ALBERT, GPT, XLNet و ... ممنوع است. اما استفاده از *Embeddingهای* از پیش آموزشدیده **استاتیک** موردی ندارد.
### **معیار ارزیابی**
از آنجا که احساسات در دنیای واقعی به یک اندازه توزیع نشدهاند (دیتاست نامتوازن است)، معیار داوری **F1-Score با میانگینگیری Macro** است.
$$\text{Macro F1} = \frac{\sum_{i=1}^{n} F1_i}{n}$$
+ این یعنی عملکرد مدل شما روی کلاسهای کمتعداد (مثل ترس و تنفر) به اندازه کلاسهای پرتعداد (مثل سایر) اهمیت دارد.
+ **حد نصاب:** اگر امتیاز F1-Macro مدل شما کمتر از **0.20** باشد، یعنی سیستم شما قادر به تفکیک احساسات نیست و نمره **0** دریافت خواهید کرد.
### **فرمت ارسال**
شما باید یک فایل با فرمت `.csv` ارسال کنید که شامل هدر باشد و دقیقاً دو ستون داشته باشد:
1. `ID`: شناسه منحصربهفرد متن (که در فایل تست داده شده است).
2. `label`: پیشبینی مدل شما (با حروف بزرگ انگلیسی).
**نمونه فایل ارسالی صحیح:**
```
ID,label
1000,HAPPY
1001,OTHER
1002,ANGRY
1003,HATE
...
```
**نکات فنی:**
+ تعداد سطرهای فایل ارسالی باید دقیقاً برابر با تعداد سطرهای فایل تست باشد.
+ ارسال فایل `notebook.ipynb` که کد مدل و مراحل آموزش در آن مشخص باشد، **الزامی** است. داوران کد شما را چک میکنند و در صورت استفاده از مدلهای ممنوعه، امتیاز صفر لحاظ میشود.
ارسال پاسخ برای این سؤال
در حال حاضر شما دسترسی ندارید.