| فایل اولیهی سوال را میتوانید از [این لینک](/contest/assignments/71153/download_problem_initial_project/250607/) دانلود کنید.|
| :--: |
در این سوال قصد داریم با استفاده از مجموعهدادهای از عملکرد بازیکنهای بسکتبال لیگ آمریکا (*NBA*) در ۱۰ فصل ۲۰۰۰ الی ۲۰۰۹، اطلاعاتی راجعبه این لیگ بهدست آوریم.
این مجموعهداده شامل ۱۸۳۰ سطر و ۱۸ ستون است که هر سطر آن شامل اطلاعات یک بازیکن در یک فصل است. توضیحات مربوط به ستونها نیز در نوتبوک این سوال آمده است.
## نحوهی ارسال پاسخ
برای پاسخ به این سوال ابتدا فایل نوتبوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آنچه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جوابساز (آخرین سلول فایل نوتبوک) فایل `result.zip` ساخته شده را ارسال نمایید.
<details class="red">
<summary>
**هشدار مهم**
</summary>
توجه داشته باشید که پیش از اجرای سلول جوابساز، تغییرات اعمال شده در نوتبوک را با استفاده از کلید میانبر `ctrl+s` ذخیره کرده باشید در غیر این صورت، در پایان مسابقه **نمره** شما به **صفر** تغییر خواهد کرد.
همچنین اگر از کولب برای اجرای این فایل نوتبوک استفاده میکنید، قبل از ارسال فایل `result.zip`، آخرین نسخهی نوتبوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.
</details>
بسکتبالیستها
| فایل اولیهی سوال را میتوانید از [این لینک](/contest/assignments/71153/download_problem_initial_project/250608/) دانلود کنید.|
| :--: |
یک ناشر با ۵ نویسنده همکاری میکند. او به تازگی متنهای جدیدی از این نویسندگان دریافت کرده است. اما از روی حواسپرتی فراموش کرده است که هر متن به کدام نویسنده تعلق دارد. او تصمیم گرفته است که از دانش یادگیری ماشین خود استفاده کند و نویسندهی هر متن را پیدا کند. برای این کار او یک مجموعه دادهی آموزشی تولید کرده است که هر سطر آن مربوط به یکی از متنهای پیشین هر نویسنده است. این مجموعه ۳۸۱ ستون دارد که یک ستون نشاندهندهی نویسنده و ستونهای دیگر نشان میدهند که یک کلمهی به خصوص در متن وجود دارد یا خیر.
شما باید به این ناشر کمک کنید که مدلی آموزش دهد تا با دریافت اطلاعات وجود یا عدم وجود این کلمات در یک متن، نویسندهی آن را پیشبینی کند.
## معیار ارزیابی
برای ارزیابی مدل شما از معیار `F1 Score` استفاده میشود و مدل میانگینگیری نیز بهصورت `macro` است.
برای نمرهگیری در این سوال مدل شما باید دارای `F1 Score` حداقل ۰.۴ باشد و در این حالت نمرهی نهایی بر اساس فرمول زیر محاسبه میگردد:
$$round(f1score, 3) \times 100$$
اگر مدل شما به حدنصاب نرسد، نمرهی دریافتی **صفر** خواهد بود.
<details class="red">
<summary>
**توجه**
</summary>
در طول مسابقه امتیازی که مشاهده میکنید، فقط نتیجهی ارزیابی مدل شما روی ۳۰ درصد از دادههای آزمون است. بعد از پایان زمان مسابقه، **امتیاز نهایی** شما روی ۷۰ درصد مابقی محاسبه میشود.
این کار به منظور جلوگیری از بیشبرازش (`overfitting`) و حفظ عمومیت مدل انجام میشود تا مطمئن شویم مدلهایی که دچار بیشبرازش شدهاند، در امتیازدهی نهایی، افت میکنند.
</details>
## نحوهی ارسال پاسخ
برای پاسخ به این سوال ابتدا فایل نوتبوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آنچه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جوابساز (آخرین سلول فایل نوتبوک) فایل `result.zip` ساخته شده را ارسال نمایید.
<details class="red">
<summary>
**هشدار مهم**
</summary>
توجه داشته باشید که پیش از اجرای سلول جوابساز، تغییرات اعمال شده در نوتبوک را با استفاده از کلید میانبر `ctrl+s` ذخیره کرده باشید در غیر این صورت، در پایان مسابقه **نمره** شما به **صفر** تغییر خواهد کرد.
همچنین اگر از کولب برای اجرای این فایل نوتبوک استفاده میکنید، قبل از ارسال فایل `result.zip`، آخرین نسخهی نوتبوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.
</details>
دردسر سردبیر
| فایل اولیهی سوال را میتوانید از [این لینک](/contest/assignments/71153/download_problem_initial_project/250609/) دانلود کنید.|
| :--: |
پدر و مادر امیرعلی به او قول داده بودند تا اگر معدلش در امتحانات بالا بشود، به او دوچرخه هدیه بدهند. اما امیرعلی طاقت ندارد تا آخر امتحانات صبر کند و میخواهد همین الان متوجه بشود چقدر شانس دارد تا معدل بالایی بهدست آورد. برای همین از شما میخواهد تا مدلی را آموزش دهید که با استفاده از اطلاعات دانشآموز در طول سال تحصیلی، معدل نهایی آن را تخمین بزند.
## معیار ارزیابی
برای ارزیابی مدل شما از معیار `R2 Score` استفاده میشود. برای نمرهگیری در این سوال مدل شما باید دارای `R2 Score` حداقل ۰.۴ باشد و در این حالت نمرهی نهایی بر اساس فرمول زیر محاسبه میگردد:
$$round(r2score, 3) \times 100$$
اگر مدل شما به حدنصاب نرسد، نمرهی دریافتی **صفر** خواهد بود.
<details class="red">
<summary>
**توجه**
</summary>
در طول مسابقه امتیازی که مشاهده میکنید، فقط نتیجهی ارزیابی مدل شما روی ۳۰ درصد از دادههای آزمون است. بعد از پایان زمان مسابقه، **امتیاز نهایی** شما روی ۷۰ درصد مابقی محاسبه میشود.
این کار به منظور جلوگیری از بیشبرازش (`overfitting`) و حفظ عمومیت مدل انجام میشود تا مطمئن شویم مدلهایی که دچار بیشبرازش شدهاند، در امتیازدهی نهایی، افت میکنند.
</details>
## نحوهی ارسال پاسخ
برای پاسخ به این سوال ابتدا فایل نوتبوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آنچه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جوابساز (آخرین سلول فایل نوتبوک) فایل `result.zip` ساخته شده را ارسال نمایید.
<details class="red">
<summary>
**هشدار مهم**
</summary>
توجه داشته باشید که پیش از اجرای سلول جوابساز، تغییرات اعمال شده در نوتبوک را با استفاده از کلید میانبر `ctrl+s` ذخیره کرده باشید در غیر این صورت، در پایان مسابقه **نمره** شما به **صفر** تغییر خواهد کرد.
همچنین اگر از کولب برای اجرای این فایل نوتبوک استفاده میکنید، قبل از ارسال فایل `result.zip`، آخرین نسخهی نوتبوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.
</details>
معدلیابی
| فایل اولیهی سوال را میتوانید از [این لینک](/contest/assignments/71153/download_problem_initial_project/250605/) دانلود کنید.|
| :--: |
وبسایت *IMDb* قصد دارد سیستمی برای پیشبینی امتیازی که کاربران به هر فیلم میدهند، طراحی کند. این سیستم بر اساس متنی که کاربر در نقد هر فیلم مینویسد، امتیاز آن را پیشبینی میکند. هدف وبسایت از ایجاد این سیستم این است که در صورت تطابق نداشتن امتیاز دادهشده توسط کاربر با متن نوشتهشده، از صحت و دقت نظر او اطمینان حاصل کند، که مبادا کاربر امتیازی را به اشتباه ثبت کند.
در این سوال، شما با استفاده از دادههای مربوط به مجموعهای از نقدهای کاربران و امتیازات دادهشده در این وبسایت، باید مدلی را آموزش دهید که بتواند امتیاز نقدهای جدید را پیشبینی کند.
## معیار ارزیابی
برای ارزیابی مدل شما از معیار `R2 Score` استفاده میشود. برای نمرهگیری در این سوال مدل شما باید دارای `R2 Score` حداقل ۰.۴ باشد و در این حالت نمرهی نهایی بر اساس فرمول زیر محاسبه میگردد:
$$round(r2score, 3) \times 200$$
اگر مدل شما به حدنصاب نرسد، نمرهی دریافتی **صفر** خواهد بود.
<details class="red">
<summary>
**توجه**
</summary>
در طول مسابقه امتیازی که مشاهده میکنید، فقط نتیجهی ارزیابی مدل شما روی ۳۰ درصد از دادههای آزمون است. بعد از پایان زمان مسابقه، **امتیاز نهایی** شما روی ۷۰ درصد مابقی محاسبه میشود.
این کار به منظور جلوگیری از بیشبرازش (`overfitting`) و حفظ عمومیت مدل انجام میشود تا مطمئن شویم مدلهایی که دچار بیشبرازش شدهاند، در امتیازدهی نهایی، افت میکنند.
</details>
## نحوهی ارسال پاسخ
برای پاسخ به این سوال ابتدا فایل نوتبوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آنچه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جوابساز (آخرین سلول فایل نوتبوک) فایل `result.zip` ساخته شده را ارسال نمایید.
<details class="red">
<summary>
**هشدار مهم**
</summary>
توجه داشته باشید که پیش از اجرای سلول جوابساز، تغییرات اعمال شده در نوتبوک را با استفاده از کلید میانبر `ctrl+s` ذخیره کرده باشید در غیر این صورت، در پایان مسابقه **نمره** شما به **صفر** تغییر خواهد کرد.
همچنین اگر از کولب برای اجرای این فایل نوتبوک استفاده میکنید، قبل از ارسال فایل `result.zip`، آخرین نسخهی نوتبوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.
</details>
به فیلم چند میدی؟
| فایل اولیهی سوال را میتوانید از [این لینک](/contest/assignments/71153/download_problem_initial_project/250606/) دانلود کنید.|
| :--: |
برج بلند بابل ساخته شده بود تا آنقدر بلند باشد که به بهشت برسد. معمار این برج در تمامی ضلعهای شرقی هر طبقه یک کتابخانه قرار داده بود. برج تمام نشده بود اما کتابخانههای هر طبقه تکمیل شده بودند که خدا متاسفانه از این اقدام انسانها برای رسیدن به بهشت خشمگین شد و به کلی این برج را نابود کرد. کتابدار بدبخت که موفق شده بود جان سالم بهدر ببرد، حالا خود را موظف میبیند که همه کتابهای باقیمانده را دوباره بر اساس ژانر و محتوا مرتب کند. به این کتابدار کمک کنید تا بر اساس خلاصه هر کتاب دستهبندی آن را مشخص کند.
## معیار ارزیابی
برای ارزیابی مدل شما از معیار `F1 Score` استفاده میشود و مدل میانگینگیری نیز بهصورت `weighted` است. این معیار برای هر یک ستونهایی که باید پیشبینی کنید بهصورت جداگانه محاسبه میشود و میانگین آنها به عنوان امتیاز مدل (`Score`) در نظر گرفته میشود.
برای نمرهگیری در این سوال مدل شما باید دارای `Score` حداقل ۰.۶ باشد و در این حالت نمرهی نهایی بر اساس فرمول زیر محاسبه میگردد:
$$round(score, 3) \times 200$$
اگر مدل شما به حدنصاب نرسد، نمرهی دریافتی **صفر** خواهد بود.
<details class="red">
<summary>
**توجه**
</summary>
در طول مسابقه امتیازی که مشاهده میکنید، فقط نتیجهی ارزیابی مدل شما روی ۳۰ درصد از دادههای آزمون است. بعد از پایان زمان مسابقه، **امتیاز نهایی** شما روی ۷۰ درصد مابقی محاسبه میشود.
این کار به منظور جلوگیری از بیشبرازش (`overfitting`) و حفظ عمومیت مدل انجام میشود تا مطمئن شویم مدلهایی که دچار بیشبرازش شدهاند، در امتیازدهی نهایی، افت میکنند.
</details>
## نحوهی ارسال پاسخ
برای پاسخ به این سوال ابتدا فایل نوتبوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آنچه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جوابساز (آخرین سلول فایل نوتبوک) فایل `result.zip` ساخته شده را ارسال نمایید.
<details class="red">
<summary>
**هشدار مهم**
</summary>
توجه داشته باشید که پیش از اجرای سلول جوابساز، تغییرات اعمال شده در نوتبوک را با استفاده از کلید میانبر `ctrl+s` ذخیره کرده باشید در غیر این صورت، در پایان مسابقه **نمره** شما به **صفر** تغییر خواهد کرد.
همچنین اگر از کولب برای اجرای این فایل نوتبوک استفاده میکنید، قبل از ارسال فایل `result.zip`، آخرین نسخهی نوتبوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.
</details>