| فایل اولیهی تمرین را میتوانید از [این لینک](/contest/assignments/91552/download_problem_initial_project/310516/) دانلود کنید. |
| :--: |
شهر ما در حال هوشمندتر شدن است و ما در مرکز این تحول، وظیفه تحلیل الگوهای پیچیده ترافیکی و رفتاری شهروندان را بر عهده داریم. هدف ما درک دقیق جریان حرکت در شهر است. اما سیستمهای فعلی ما با یک چالش اساسی روبرو هستند: آنها در درک تفاوت میان **سکون موقت** و **حضور دائمی** دچار مشکل هستند. برای الگوریتمهای ما، عابری که منتظر سبز شدن چراغ راهنمایی است، با یک مجسمه در کنار خیابان تفاوتی ندارد و پس از چند ثانیه به عنوان بخشی از پسزمینه نادیده گرفته میشود.
هدف این سوال، توسعه یک سیستم بینایی ماشین است که بتواند اشیاء متحرک در سکانسهای ویدیویی را با دقت بالا شناسایی، جداسازی (*Segment*) و ردیابی (*Track*) کند. سیستم شما باید قادر به تفکیک چندین شیء متحرک از یکدیگر و همچنین تشخیص وضعیت سکون موقت آنها باشد.
این سوال برای ارزیابی عملکرد الگوریتمها در شرایط چالشبرانگیز دنیای واقعی طراحی شده است. الگوریتم شما باید بتواند بر مشکلاتی مانند تغییرات ناگهانی نور، لرزش دوربین، پسزمینههای پویا (مانند حرکت شاخ و برگ درختان) و مهمتر از همه، **اشیاء متحرک که به طور موقت متوقف میشوند**، غلبه کند. حفظ هویت و تشخیص صحیح وضعیت هر شیء در طول ویدیو، معیار اصلی موفقیت شما خواهد بود.
----------
درون فایل دیتاست، مجموعهای از ویدیوهای چالشبرانگیز به عنوان **مجموعه داده تست (Test Dataset)** قرار داده شده است. شما باید برای هر یک از این ویدیوها، یک «ماسک تحلیل حرکت» تولید کنید که به ما امکان درک دقیق رویدادهای صحنه را بدهد.
برای هر ویدیوی ورودی، شما باید یک ویدیوی ماسک خروجی با همان ابعاد و تعداد فریم تولید کنید. در این ویدیوی خروجی، هر پیکسل باید بر اساس قوانین زیر به دقت رنگآمیزی شده باشد:
+ **پیکسلهای سیاه (0,0,0):** معرف پسزمینه (Background) هستند و تمام عناصر ثابت یا بیاهمیت صحنه هستند.
+ **پیکسلهای قرمز (255,0,0):** معرف شیء متحرک با برچسب ۱ در طول سکانس.
+ **پیکسلهای سبز (0,255,0):** معرف شیء متحرک با برچسب ۲ در طول سکانس.
+ **پیکسلهای زرد (255,255,0):** معرف شیء متحرک با برچسب ۳ در طول سکانس.
+ **پیکسلهای سفید (255,255,255):** معرف اشیاء متحرکی که در حالت سکون باقی ماندهاند.


#### **دادههای آموزشی**
ما به توانایی و استراتژی شما ایمان داریم. به همین دلیل، هیچ مجموعه داده آموزشی از پیشتعیینشدهای وجود ندارد. **انتخاب مدل، معماری و مجموعه داده آموزشی برای تعلیم سیستمتان کاملاً به عهده شماست.** شما آزاد هستید تا از هر منبع داده عمومی، مدل از پیش آموزشدیده یا تکنیکی که فکر میکنید بهترین نتیجه را در زمان محدود مسابقه به ارمغان میآورد، استفاده کنید. این بخشی از چالش است: انتخاب هوشمندانه ابزار مناسب برای کار.
#### **برخی از نکات کلیدی و قوانین**
+ **ثبات هویت:** برچسب (و در نتیجه رنگ) یک شیء خاص باید در تمام طول ویدیو تا زمانی که در حال حرکت است، **ثابت** بماند.
+ **بازیابی وضعیت:** هنگامی که یک شیء ردیابیشده (مثلاً قرمز) متوقف میشود، باید به رنگ سفید درآید و به محض حرکت مجدد، باید بلافاصله به همان رنگ قبلی خود (قرمز) بازگردد.
----------
#### **معیار ارزیابی**
ارزیابی پاسخهای ارسالی بر اساس معیار استاندارد **میانگین اشتراک بر روی اجتماع (Mean Intersection over Union - mIoU)** انجام خواهد شد. این فرآیند به صورت خودکار و بر اساس مقایسه پیکسل به پیکسل فریمهای ارسالی شما با فریمهای مرجع (*Ground Truth*) صورت میگیرد.
\**منطق امتیازدهی هر فریم:**
+ **اگر فریم مرجع حاوی شیء باشد:** امتیاز آن فریم بر اساس **mIoU** محاسبه میشود که میانگین میزان همپوشانی (IoU) برای تمام کلاسهای رنگی موجود در فریم است.
+ **اگر فریم مرجع خالی (سیاه) باشد اما فریم ارسالی شما حاوی شیء باشد:** این یک خطای بزرگ (*False Positive*) محسوب شده و امتیاز آن فریم **صفر** خواهد بود.
+ **اگر هم فریم مرجع و هم فریم ارسالی شما هر دو خالی باشند:** این فریم در محاسبه امتیاز نهایی **نادیده گرفته میشود**.
در نهایت امتیاز نهایی به شکل زیر محاسبه میشود:
\[
FinalScore = mean IoU_{on all frames} * 100
\]
#### **فرمت ارسال پاسخ**
در نهایت شما باید با توجه ویدئوهای قرار داده شده را با سگمنت کنید و فریمهای سگمنت شده را دقیقا با توجه به پوشهبندی اعلام شده و ابعاد و اسامی یکسان ارسال کنید. برای اینکه سیستم داوری بتواند پاسخ شما را به درستی ارزیابی کند، لطفاً ساختار فایل ارسالی خود را دقیقاً مطابق با دستورالعمل زیر آماده کنید.پاسخ خود را باید در قالب یک فایل فشرده (با فرمت **.zip**) ارسال نمایید. ساختار داخلی این فایل باید به شکل زیر باشد:
```
submission.zip
└── notebook.ipynb
└── submission/
├── I_BS_01/
│ ├── I_BS_01_1.png
│ ├── I_BS_01_2.png
│ └── ... (rest of the frames)
│
├── I_SM_03/
│ ├── I_SM_03_1.png
│ ├── I_SM_03_2.png
│ └── ... (rest of the frames)
│
└── ... (and the other folders)
```
#### **نکات بسیار مهم**
+ ابعاد فریمهای ارسالی باید با ابعادی که فریمهای سازنده ویدئو دارد یکسان باشد.
+ حتماً باید یک پوشه اصلی به نام `submission` وجود داشته باشد و ۲۹ پوشه دیگر درون آن قرار گیرند.
+ تعداد فریمهای موجود در هر یک از پوشههای ارسالی شما باید **دقیقاً** با تعداد فریمهای پوشه مرجع متناظر آن برابر باشد.
+ هرگونه عدم تطابق در نامگذاری پوشهها یا فریمها منجر به خطای داوری و کسب امتیاز صفر خواهد شد.
ارسال پاسخ برای این سؤال
در حال حاضر شما دسترسی ندارید.