بسکتبالیست‌ها


فایل اولیه‌ی سوال را می‌توانید از این لینک دانلود کنید.

در این سوال قصد داریم با استفاده از مجموعه‌داده‌ای از عملکرد بازیکن‌های بسکتبال لیگ آمریکا (NBA) در ۱۰ فصل ۲۰۰۰ الی ۲۰۰۹، اطلاعاتی راجع‌به این لیگ به‌دست‌ آوریم.

این مجموعه‌داده شامل ۱۸۳۰ سطر و ۱۸ ستون است که هر سطر آن شامل اطلاعات یک بازیکن در یک فصل است. توضیحات مربوط به ستون‌ها نیز در نوت‌بوک این سوال آمده است.

نحوه‌ی ارسال پاسخ🔗

برای پاسخ به این سوال ابتدا فایل نوت‌بوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آن‌چه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جواب‌ساز (آخرین سلول فایل نوت‌بوک) فایل result.zip ساخته شده را ارسال نمایید.

هشدار مهم

توجه داشته باشید که پیش از اجرای سلول جواب‌ساز، تغییرات اعمال شده در نوت‌بوک را با استفاده از کلید میان‌بر ctrl+s ذخیره کرده باشید در غیر این صورت، در پایان مسابقه نمره شما به صفر تغییر خواهد کرد.

همچنین اگر از کولب برای اجرای این فایل نوت‌بوک استفاده می‌کنید، قبل از ارسال فایل result.zip، آخرین نسخه‌ی نوت‌بوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.

دردسر سردبیر


فایل اولیه‌ی سوال را می‌توانید از این لینک دانلود کنید.

یک ناشر با ۵ نویسنده همکاری می‌کند. او به تازگی متن‌های جدیدی از این نویسندگان دریافت کرده است. اما از روی حواس‌پرتی فراموش کرده است که هر متن به کدام نویسنده تعلق دارد. او تصمیم گرفته است که از دانش یادگیری ماشین خود استفاده کند و نویسنده‌ی هر متن را پیدا کند. برای این کار او یک مجموعه داده‌ی آموزشی تولید کرده است که هر سطر آن مربوط به یکی از متن‌های پیشین هر نویسنده است. این مجموعه ۳۸۱ ستون دارد که یک ستون نشان‌دهنده‌ی نویسنده و ستون‌های دیگر نشان می‌دهند که یک کلمه‌ی به خصوص در متن وجود دارد یا خیر.

شما باید به این ناشر کمک کنید که مدلی آموزش دهد تا با دریافت اطلاعات وجود یا عدم وجود این کلمات در یک متن، نویسنده‌ی آن را پیش‌بینی کند.

معیار ارزیابی🔗

برای ارزیابی مدل شما از معیار F1 Score استفاده می‌شود و مدل میانگین‌گیری نیز به‌صورت macro است. برای نمره‌گیری در این سوال مدل شما باید دارای F1 Score حداقل ۰.۴ باشد و در این حالت نمره‌ی نهایی بر اساس فرمول زیر محاسبه می‌گردد:

round(f1score,3)×100round(f1score, 3) \times 100

اگر مدل شما به حدنصاب نرسد، نمره‌ی دریافتی صفر خواهد بود.

توجه

در طول مسابقه امتیازی که مشاهده می‌کنید، فقط نتیجه‌ی ارزیابی مدل شما روی ۳۰ درصد از داده‌های آزمون است. بعد از پایان زمان مسابقه، امتیاز نهایی شما روی ۷۰ درصد مابقی محاسبه می‌شود.

این کار به منظور جلوگیری از بیش‌برازش (overfitting) و حفظ عمومیت مدل انجام می‌شود تا مطمئن شویم مدل‌هایی که دچار بیش‌برازش شده‌اند، در امتیازدهی نهایی، افت می‌کنند.

نحوه‌ی ارسال پاسخ🔗

برای پاسخ به این سوال ابتدا فایل نوت‌بوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آن‌چه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جواب‌ساز (آخرین سلول فایل نوت‌بوک) فایل result.zip ساخته شده را ارسال نمایید.

هشدار مهم

توجه داشته باشید که پیش از اجرای سلول جواب‌ساز، تغییرات اعمال شده در نوت‌بوک را با استفاده از کلید میان‌بر ctrl+s ذخیره کرده باشید در غیر این صورت، در پایان مسابقه نمره شما به صفر تغییر خواهد کرد.

همچنین اگر از کولب برای اجرای این فایل نوت‌بوک استفاده می‌کنید، قبل از ارسال فایل result.zip، آخرین نسخه‌ی نوت‌بوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.

معدل‌یابی


فایل اولیه‌ی سوال را می‌توانید از این لینک دانلود کنید.

پدر و مادر امیرعلی به او قول داده بودند تا اگر معدلش در امتحانات بالا بشود، به او دوچرخه هدیه بدهند. اما امیرعلی طاقت ندارد تا آخر امتحانات صبر کند و می‌خواهد همین الان متوجه بشود چقدر شانس دارد تا معدل بالایی به‌دست آورد. برای همین از شما می‌خواهد تا مدلی را آموزش دهید که با استفاده از اطلاعات دانش‌آموز در طول سال تحصیلی، معدل نهایی آن را تخمین بزند.

معیار ارزیابی🔗

برای ارزیابی مدل شما از معیار R2 Score استفاده می‌شود. برای نمره‌گیری در این سوال مدل شما باید دارای R2 Score حداقل ۰.۴ باشد و در این حالت نمره‌ی نهایی بر اساس فرمول زیر محاسبه می‌گردد:

round(r2score,3)×100round(r2score, 3) \times 100

اگر مدل شما به حدنصاب نرسد، نمره‌ی دریافتی صفر خواهد بود.

توجه

در طول مسابقه امتیازی که مشاهده می‌کنید، فقط نتیجه‌ی ارزیابی مدل شما روی ۳۰ درصد از داده‌های آزمون است. بعد از پایان زمان مسابقه، امتیاز نهایی شما روی ۷۰ درصد مابقی محاسبه می‌شود.

این کار به منظور جلوگیری از بیش‌برازش (overfitting) و حفظ عمومیت مدل انجام می‌شود تا مطمئن شویم مدل‌هایی که دچار بیش‌برازش شده‌اند، در امتیازدهی نهایی، افت می‌کنند.

نحوه‌ی ارسال پاسخ🔗

برای پاسخ به این سوال ابتدا فایل نوت‌بوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آن‌چه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جواب‌ساز (آخرین سلول فایل نوت‌بوک) فایل result.zip ساخته شده را ارسال نمایید.

هشدار مهم

توجه داشته باشید که پیش از اجرای سلول جواب‌ساز، تغییرات اعمال شده در نوت‌بوک را با استفاده از کلید میان‌بر ctrl+s ذخیره کرده باشید در غیر این صورت، در پایان مسابقه نمره شما به صفر تغییر خواهد کرد.

همچنین اگر از کولب برای اجرای این فایل نوت‌بوک استفاده می‌کنید، قبل از ارسال فایل result.zip، آخرین نسخه‌ی نوت‌بوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.

به فیلم چند میدی؟


فایل اولیه‌ی سوال را می‌توانید از این لینک دانلود کنید.

وب‌سایت IMDb قصد دارد سیستمی برای پیش‌بینی امتیازی که کاربران به هر فیلم می‌دهند، طراحی کند. این سیستم بر اساس متنی که کاربر در نقد هر فیلم می‌نویسد، امتیاز آن را پیش‌بینی می‌کند. هدف وب‌سایت از ایجاد این سیستم این است که در صورت تطابق نداشتن امتیاز داده‌شده توسط کاربر با متن نوشته‌شده، از صحت و دقت نظر او اطمینان حاصل کند، که مبادا کاربر امتیازی را به اشتباه ثبت کند.

در این سوال، شما با استفاده از داده‌های مربوط به مجموعه‌ای از نقدهای کاربران و امتیازات داده‌شده در این وب‌سایت، باید مدلی را آموزش دهید که بتواند امتیاز نقدهای جدید را پیش‌بینی کند.

معیار ارزیابی🔗

برای ارزیابی مدل شما از معیار R2 Score استفاده می‌شود. برای نمره‌گیری در این سوال مدل شما باید دارای R2 Score حداقل ۰.۴ باشد و در این حالت نمره‌ی نهایی بر اساس فرمول زیر محاسبه می‌گردد:

round(r2score,3)×200round(r2score, 3) \times 200

اگر مدل شما به حدنصاب نرسد، نمره‌ی دریافتی صفر خواهد بود.

توجه

در طول مسابقه امتیازی که مشاهده می‌کنید، فقط نتیجه‌ی ارزیابی مدل شما روی ۳۰ درصد از داده‌های آزمون است. بعد از پایان زمان مسابقه، امتیاز نهایی شما روی ۷۰ درصد مابقی محاسبه می‌شود.

این کار به منظور جلوگیری از بیش‌برازش (overfitting) و حفظ عمومیت مدل انجام می‌شود تا مطمئن شویم مدل‌هایی که دچار بیش‌برازش شده‌اند، در امتیازدهی نهایی، افت می‌کنند.

نحوه‌ی ارسال پاسخ🔗

برای پاسخ به این سوال ابتدا فایل نوت‌بوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آن‌چه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جواب‌ساز (آخرین سلول فایل نوت‌بوک) فایل result.zip ساخته شده را ارسال نمایید.

هشدار مهم

توجه داشته باشید که پیش از اجرای سلول جواب‌ساز، تغییرات اعمال شده در نوت‌بوک را با استفاده از کلید میان‌بر ctrl+s ذخیره کرده باشید در غیر این صورت، در پایان مسابقه نمره شما به صفر تغییر خواهد کرد.

همچنین اگر از کولب برای اجرای این فایل نوت‌بوک استفاده می‌کنید، قبل از ارسال فایل result.zip، آخرین نسخه‌ی نوت‌بوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.

کتابدار برج بابِل


فایل اولیه‌ی سوال را می‌توانید از این لینک دانلود کنید.

برج بلند بابل ساخته شده بود تا آن‌قدر بلند باشد که به بهشت برسد. معمار این برج در تمامی ضلع‌های شرقی هر طبقه یک کتابخانه قرار داده بود. برج تمام نشده بود اما کتابخانه‌های هر طبقه تکمیل شده بودند که خدا متاسفانه از این اقدام انسان‌ها برای رسیدن به بهشت خشمگین شد و به کلی این برج را نابود کرد. کتابدار بدبخت که موفق شده بود جان سالم به‌در ببرد، حالا خود را موظف می‌بیند که همه کتاب‌های باقی‌مانده را دوباره بر اساس ژانر و محتوا مرتب کند. به این کتابدار کمک کنید تا بر اساس خلاصه هر کتاب دسته‌بندی آن را مشخص کند.

معیار ارزیابی🔗

برای ارزیابی مدل شما از معیار F1 Score استفاده می‌شود و مدل میانگین‌گیری نیز به‌صورت weighted است. این معیار برای هر یک ستون‌هایی که باید پیش‌بینی کنید به‌صورت جداگانه محاسبه می‌شود و میانگین آن‌ها به عنوان امتیاز مدل (Score) در نظر گرفته می‌شود. برای نمره‌گیری در این سوال مدل شما باید دارای Score حداقل ۰.۶ باشد و در این حالت نمره‌ی نهایی بر اساس فرمول زیر محاسبه می‌گردد:

round(score,3)×200round(score, 3) \times 200

اگر مدل شما به حدنصاب نرسد، نمره‌ی دریافتی صفر خواهد بود.

توجه

در طول مسابقه امتیازی که مشاهده می‌کنید، فقط نتیجه‌ی ارزیابی مدل شما روی ۳۰ درصد از داده‌های آزمون است. بعد از پایان زمان مسابقه، امتیاز نهایی شما روی ۷۰ درصد مابقی محاسبه می‌شود.

این کار به منظور جلوگیری از بیش‌برازش (overfitting) و حفظ عمومیت مدل انجام می‌شود تا مطمئن شویم مدل‌هایی که دچار بیش‌برازش شده‌اند، در امتیازدهی نهایی، افت می‌کنند.

نحوه‌ی ارسال پاسخ🔗

برای پاسخ به این سوال ابتدا فایل نوت‌بوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آن‌چه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جواب‌ساز (آخرین سلول فایل نوت‌بوک) فایل result.zip ساخته شده را ارسال نمایید.

هشدار مهم

توجه داشته باشید که پیش از اجرای سلول جواب‌ساز، تغییرات اعمال شده در نوت‌بوک را با استفاده از کلید میان‌بر ctrl+s ذخیره کرده باشید در غیر این صورت، در پایان مسابقه نمره شما به صفر تغییر خواهد کرد.

همچنین اگر از کولب برای اجرای این فایل نوت‌بوک استفاده می‌کنید، قبل از ارسال فایل result.zip، آخرین نسخه‌ی نوت‌بوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.