| فایل اولیهی سوال را میتوانید از [این لینک](/contest/assignments/71220/download_problem_initial_project/250601/) دانلود کنید.|
| :--: |
در این سوال قصد داریم با استفاده از مجموعهدادهای از عملکرد بازیکنهای بسکتبال لیگ آمریکا (*NBA*) در ۱۰ فصل ۲۰۰۰ الی ۲۰۰۹، اطلاعاتی راجعبه این لیگ بهدست آوریم.
این مجموعهداده شامل ۱۸۳۰ سطر و ۱۸ ستون است که هر سطر آن شامل اطلاعات یک بازیکن در یک فصل است. توضیحات مربوط به ستونها نیز در نوتبوک این سوال آمده است.
## نحوهی ارسال پاسخ
برای پاسخ به این سوال ابتدا فایل نوتبوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آنچه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جوابساز (آخرین سلول فایل نوتبوک) فایل `result.zip` ساخته شده را ارسال نمایید.
<details class="red">
<summary>
**هشدار مهم**
</summary>
توجه داشته باشید که پیش از اجرای سلول جوابساز، تغییرات اعمال شده در نوتبوک را با استفاده از کلید میانبر `ctrl+s` ذخیره کرده باشید در غیر این صورت، در پایان مسابقه **نمره** شما به **صفر** تغییر خواهد کرد.
همچنین اگر از کولب برای اجرای این فایل نوتبوک استفاده میکنید، قبل از ارسال فایل `result.zip`، آخرین نسخهی نوتبوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.
</details>
بسکتبالیستها
| فایل اولیهی سوال را میتوانید از [این لینک](/contest/assignments/71220/download_problem_initial_project/250602/) دانلود کنید.|
| :--: |
یک ناشر با ۵ نویسنده همکاری میکند. او به تازگی متنهای جدیدی از این نویسندگان دریافت کرده است. اما از روی حواسپرتی فراموش کرده است که هر متن به کدام نویسنده تعلق دارد. او تصمیم گرفته است که از دانش یادگیری ماشین خود استفاده کند و نویسندهی هر متن را پیدا کند. برای این کار او یک مجموعه دادهی آموزشی تولید کرده است که هر سطر آن مربوط به یکی از متنهای پیشین هر نویسنده است. این مجموعه ۳۸۱ ستون دارد که یک ستون نشاندهندهی نویسنده و ستونهای دیگر نشان میدهند که یک کلمهی به خصوص در متن وجود دارد یا خیر.
شما باید به این ناشر کمک کنید که مدلی آموزش دهد تا با دریافت اطلاعات وجود یا عدم وجود این کلمات در یک متن، نویسندهی آن را پیشبینی کند.
## معیار ارزیابی
برای ارزیابی مدل شما از معیار `F1 Score` استفاده میشود و مدل میانگینگیری نیز بهصورت `macro` است.
برای نمرهگیری در این سوال مدل شما باید دارای `F1 Score` حداقل ۰.۴ باشد و در این حالت نمرهی نهایی بر اساس فرمول زیر محاسبه میگردد:
$$round(f1score, 3) \times 100$$
اگر مدل شما به حدنصاب نرسد، نمرهی دریافتی **صفر** خواهد بود.
<details class="red">
<summary>
**توجه**
</summary>
در طول مسابقه امتیازی که مشاهده میکنید، فقط نتیجهی ارزیابی مدل شما روی ۳۰ درصد از دادههای آزمون است. بعد از پایان زمان مسابقه، **امتیاز نهایی** شما روی ۷۰ درصد مابقی محاسبه میشود.
این کار به منظور جلوگیری از بیشبرازش (`overfitting`) و حفظ عمومیت مدل انجام میشود تا مطمئن شویم مدلهایی که دچار بیشبرازش شدهاند، در امتیازدهی نهایی، افت میکنند.
</details>
## نحوهی ارسال پاسخ
برای پاسخ به این سوال ابتدا فایل نوتبوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آنچه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جوابساز (آخرین سلول فایل نوتبوک) فایل `result.zip` ساخته شده را ارسال نمایید.
<details class="red">
<summary>
**هشدار مهم**
</summary>
توجه داشته باشید که پیش از اجرای سلول جوابساز، تغییرات اعمال شده در نوتبوک را با استفاده از کلید میانبر `ctrl+s` ذخیره کرده باشید در غیر این صورت، در پایان مسابقه **نمره** شما به **صفر** تغییر خواهد کرد.
همچنین اگر از کولب برای اجرای این فایل نوتبوک استفاده میکنید، قبل از ارسال فایل `result.zip`، آخرین نسخهی نوتبوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.
</details>
دردسر سردبیر
| فایل اولیهی سوال را میتوانید از [این لینک](/contest/assignments/71220/download_problem_initial_project/250603/) دانلود کنید.|
| :--: |
پدر و مادر امیرعلی به او قول داده بودند تا اگر معدلش در امتحانات بالا بشود، به او دوچرخه هدیه بدهند. اما امیرعلی طاقت ندارد تا آخر امتحانات صبر کند و میخواهد همین الان متوجه بشود چقدر شانس دارد تا معدل بالایی بهدست آورد. برای همین از شما میخواهد تا مدلی را آموزش دهید که با استفاده از اطلاعات دانشآموز در طول سال تحصیلی، معدل نهایی آن را تخمین بزند.
## معیار ارزیابی
برای ارزیابی مدل شما از معیار `R2 Score` استفاده میشود. برای نمرهگیری در این سوال مدل شما باید دارای `R2 Score` حداقل ۰.۴ باشد و در این حالت نمرهی نهایی بر اساس فرمول زیر محاسبه میگردد:
$$round(r2score, 3) \times 100$$
اگر مدل شما به حدنصاب نرسد، نمرهی دریافتی **صفر** خواهد بود.
<details class="red">
<summary>
**توجه**
</summary>
در طول مسابقه امتیازی که مشاهده میکنید، فقط نتیجهی ارزیابی مدل شما روی ۳۰ درصد از دادههای آزمون است. بعد از پایان زمان مسابقه، **امتیاز نهایی** شما روی ۷۰ درصد مابقی محاسبه میشود.
این کار به منظور جلوگیری از بیشبرازش (`overfitting`) و حفظ عمومیت مدل انجام میشود تا مطمئن شویم مدلهایی که دچار بیشبرازش شدهاند، در امتیازدهی نهایی، افت میکنند.
</details>
## نحوهی ارسال پاسخ
برای پاسخ به این سوال ابتدا فایل نوتبوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آنچه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جوابساز (آخرین سلول فایل نوتبوک) فایل `result.zip` ساخته شده را ارسال نمایید.
<details class="red">
<summary>
**هشدار مهم**
</summary>
توجه داشته باشید که پیش از اجرای سلول جوابساز، تغییرات اعمال شده در نوتبوک را با استفاده از کلید میانبر `ctrl+s` ذخیره کرده باشید در غیر این صورت، در پایان مسابقه **نمره** شما به **صفر** تغییر خواهد کرد.
همچنین اگر از کولب برای اجرای این فایل نوتبوک استفاده میکنید، قبل از ارسال فایل `result.zip`، آخرین نسخهی نوتبوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.
</details>
معدلیابی
| فایل اولیهی این سوال را میتوانید از [این لینک](/contest/assignments/71220/download_problem_initial_project/250600/) دانلود کنید.|
| :--: |
در شهرهای بزرگ مانند لس آنجلس، درک و پیشبینی فعالیتهای مجرمانه برای بهبود امنیت عمومی و بهینهسازی تخصیص منابع حیاتی است. در این مناطق، سازمانهای مجری قانون حجم زیادی از دادههای مربوط به حوادث جنایی را جمعآوری میکنند. این دادهها معمولاً شامل اطلاعاتی مانند تاریخ، زمان و محل حادثه، مشخصات دموگرافیک قربانی، نوع سلاح استفاده شده و وضعیت پرونده میباشند. با تجزیه و تحلیل این دادهها، میتوان الگوها و روندهای رفتار مجرمانه را شناسایی کرد. هدف این مسئله توسعهی یک مدل یادگیری ماشینی است که میتواند نوع جرم را بر اساس جزئیات مختلف حادثه پیشبینی کند.
## معیار ارزیابی
برای ارزیابی مدل شما از معیار `F1 Score` استفاده میشود و مدل میانگینگیری نیز بهصورت `macro` است.
برای نمرهگیری در این سوال مدل شما باید دارای `F1 Score` حداقل ۰.۲۵ باشد و در این حالت نمرهی نهایی بر اساس فرمول زیر محاسبه میگردد:
$$round(f1score, 3) \times 250$$
اگر مدل شما به حدنصاب نرسد، نمرهی دریافتی **صفر** خواهد بود.
<details class="red">
<summary>
**توجه**
</summary>
در طول مسابقه امتیازی که مشاهده میکنید، فقط نتیجهی ارزیابی مدل شما روی ۳۰ درصد از دادههای آزمون است. بعد از پایان زمان مسابقه، **امتیاز نهایی** شما روی ۷۰ درصد مابقی محاسبه میشود.
این کار به منظور جلوگیری از بیشبرازش (`overfitting`) و حفظ عمومیت مدل انجام میشود تا مطمئن شویم مدلهایی که دچار بیشبرازش شدهاند، در امتیازدهی نهایی، افت میکنند.
</details>
## نحوهی ارسال پاسخ
برای پاسخ به این سوال ابتدا فایل نوتبوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آنچه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جوابساز (آخرین سلول فایل نوتبوک) فایل `result.zip` ساخته شده را ارسال نمایید.
<details class="red">
<summary>
**هشدار مهم**
</summary>
توجه داشته باشید که پیش از اجرای سلول جوابساز، تغییرات اعمال شده در نوتبوک را با استفاده از کلید میانبر `ctrl+s` ذخیره کرده باشید در غیر این صورت، در پایان مسابقه **نمره** شما به **صفر** تغییر خواهد کرد.
همچنین اگر از کولب برای اجرای این فایل نوتبوک استفاده میکنید، قبل از ارسال فایل `result.zip`، آخرین نسخهی نوتبوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.
</details>
جرمشناسی
| فایل اولیهی سوال را میتوانید از [این لینک](/contest/assignments/71220/download_problem_initial_project/250604/) دانلود کنید.|
| :--: |
یک سایت رزرو اقامتگاه برای آنکه بتواند تشخیص دهد اقامتگاهی که در سایتش ثبت شده با قیمت مناسبی اجاره میشود از شما خواسته تا به کمکشان بروید. برای این کار مجموعهدادهای از اطلاعات اقامتگاههایی که تا به الان در سایتشان ثبت شده را به شما میدهند و از شما میخواهند مدلی را آموزش دهید که بتواند از روی مشخصات یک اقامتگاه، قیمت آن را پیشبینی کند.
## معیار ارزیابی
برای ارزیابی مدل شما از معیار `R2 Score` استفاده میشود. برای نمرهگیری در این سوال مدل شما باید دارای `R2 Score` حداقل ۰.۴ باشد و در این حالت نمرهی نهایی بر اساس فرمول زیر محاسبه میگردد:
$$round(r2score, 3) \times 250$$
اگر مدل شما به حدنصاب نرسد، نمرهی دریافتی **صفر** خواهد بود.
<details class="red">
<summary>
**توجه**
</summary>
در طول مسابقه امتیازی که مشاهده میکنید، فقط نتیجهی ارزیابی مدل شما روی ۳۰ درصد از دادههای آزمون است. بعد از پایان زمان مسابقه، **امتیاز نهایی** شما روی ۷۰ درصد مابقی محاسبه میشود.
این کار به منظور جلوگیری از بیشبرازش (`overfitting`) و حفظ عمومیت مدل انجام میشود تا مطمئن شویم مدلهایی که دچار بیشبرازش شدهاند، در امتیازدهی نهایی، افت میکنند.
</details>
## نحوهی ارسال پاسخ
برای پاسخ به این سوال ابتدا فایل نوتبوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آنچه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جوابساز (آخرین سلول فایل نوتبوک) فایل `result.zip` ساخته شده را ارسال نمایید.
<details class="red">
<summary>
**هشدار مهم**
</summary>
توجه داشته باشید که پیش از اجرای سلول جوابساز، تغییرات اعمال شده در نوتبوک را با استفاده از کلید میانبر `ctrl+s` ذخیره کرده باشید در غیر این صورت، در پایان مسابقه **نمره** شما به **صفر** تغییر خواهد کرد.
همچنین اگر از کولب برای اجرای این فایل نوتبوک استفاده میکنید، قبل از ارسال فایل `result.zip`، آخرین نسخهی نوتبوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.
</details>