بسکتبالیست‌ها


فایل اولیه‌ی سوال را می‌توانید از این لینک دانلود کنید.

در این سوال قصد داریم با استفاده از مجموعه‌داده‌ای از عملکرد بازیکن‌های بسکتبال لیگ آمریکا (NBA) در ۱۰ فصل ۲۰۰۰ الی ۲۰۰۹، اطلاعاتی راجع‌به این لیگ به‌دست‌ آوریم.

این مجموعه‌داده شامل ۱۸۳۰ سطر و ۱۸ ستون است که هر سطر آن شامل اطلاعات یک بازیکن در یک فصل است. توضیحات مربوط به ستون‌ها نیز در نوت‌بوک این سوال آمده است.

نحوه‌ی ارسال پاسخ🔗

برای پاسخ به این سوال ابتدا فایل نوت‌بوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آن‌چه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جواب‌ساز (آخرین سلول فایل نوت‌بوک) فایل result.zip ساخته شده را ارسال نمایید.

هشدار مهم

توجه داشته باشید که پیش از اجرای سلول جواب‌ساز، تغییرات اعمال شده در نوت‌بوک را با استفاده از کلید میان‌بر ctrl+s ذخیره کرده باشید در غیر این صورت، در پایان مسابقه نمره شما به صفر تغییر خواهد کرد.

همچنین اگر از کولب برای اجرای این فایل نوت‌بوک استفاده می‌کنید، قبل از ارسال فایل result.zip، آخرین نسخه‌ی نوت‌بوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.

دردسر سردبیر


فایل اولیه‌ی سوال را می‌توانید از این لینک دانلود کنید.

یک ناشر با ۵ نویسنده همکاری می‌کند. او به تازگی متن‌های جدیدی از این نویسندگان دریافت کرده است. اما از روی حواس‌پرتی فراموش کرده است که هر متن به کدام نویسنده تعلق دارد. او تصمیم گرفته است که از دانش یادگیری ماشین خود استفاده کند و نویسنده‌ی هر متن را پیدا کند. برای این کار او یک مجموعه داده‌ی آموزشی تولید کرده است که هر سطر آن مربوط به یکی از متن‌های پیشین هر نویسنده است. این مجموعه ۳۸۱ ستون دارد که یک ستون نشان‌دهنده‌ی نویسنده و ستون‌های دیگر نشان می‌دهند که یک کلمه‌ی به خصوص در متن وجود دارد یا خیر.

شما باید به این ناشر کمک کنید که مدلی آموزش دهد تا با دریافت اطلاعات وجود یا عدم وجود این کلمات در یک متن، نویسنده‌ی آن را پیش‌بینی کند.

معیار ارزیابی🔗

برای ارزیابی مدل شما از معیار F1 Score استفاده می‌شود و مدل میانگین‌گیری نیز به‌صورت macro است. برای نمره‌گیری در این سوال مدل شما باید دارای F1 Score حداقل ۰.۴ باشد و در این حالت نمره‌ی نهایی بر اساس فرمول زیر محاسبه می‌گردد:

round(f1score,3)×100round(f1score, 3) \times 100

اگر مدل شما به حدنصاب نرسد، نمره‌ی دریافتی صفر خواهد بود.

توجه

در طول مسابقه امتیازی که مشاهده می‌کنید، فقط نتیجه‌ی ارزیابی مدل شما روی ۳۰ درصد از داده‌های آزمون است. بعد از پایان زمان مسابقه، امتیاز نهایی شما روی ۷۰ درصد مابقی محاسبه می‌شود.

این کار به منظور جلوگیری از بیش‌برازش (overfitting) و حفظ عمومیت مدل انجام می‌شود تا مطمئن شویم مدل‌هایی که دچار بیش‌برازش شده‌اند، در امتیازدهی نهایی، افت می‌کنند.

نحوه‌ی ارسال پاسخ🔗

برای پاسخ به این سوال ابتدا فایل نوت‌بوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آن‌چه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جواب‌ساز (آخرین سلول فایل نوت‌بوک) فایل result.zip ساخته شده را ارسال نمایید.

هشدار مهم

توجه داشته باشید که پیش از اجرای سلول جواب‌ساز، تغییرات اعمال شده در نوت‌بوک را با استفاده از کلید میان‌بر ctrl+s ذخیره کرده باشید در غیر این صورت، در پایان مسابقه نمره شما به صفر تغییر خواهد کرد.

همچنین اگر از کولب برای اجرای این فایل نوت‌بوک استفاده می‌کنید، قبل از ارسال فایل result.zip، آخرین نسخه‌ی نوت‌بوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.

معدل‌یابی


فایل اولیه‌ی سوال را می‌توانید از این لینک دانلود کنید.

پدر و مادر امیرعلی به او قول داده بودند تا اگر معدلش در امتحانات بالا بشود، به او دوچرخه هدیه بدهند. اما امیرعلی طاقت ندارد تا آخر امتحانات صبر کند و می‌خواهد همین الان متوجه بشود چقدر شانس دارد تا معدل بالایی به‌دست آورد. برای همین از شما می‌خواهد تا مدلی را آموزش دهید که با استفاده از اطلاعات دانش‌آموز در طول سال تحصیلی، معدل نهایی آن را تخمین بزند.

معیار ارزیابی🔗

برای ارزیابی مدل شما از معیار R2 Score استفاده می‌شود. برای نمره‌گیری در این سوال مدل شما باید دارای R2 Score حداقل ۰.۴ باشد و در این حالت نمره‌ی نهایی بر اساس فرمول زیر محاسبه می‌گردد:

round(r2score,3)×100round(r2score, 3) \times 100

اگر مدل شما به حدنصاب نرسد، نمره‌ی دریافتی صفر خواهد بود.

توجه

در طول مسابقه امتیازی که مشاهده می‌کنید، فقط نتیجه‌ی ارزیابی مدل شما روی ۳۰ درصد از داده‌های آزمون است. بعد از پایان زمان مسابقه، امتیاز نهایی شما روی ۷۰ درصد مابقی محاسبه می‌شود.

این کار به منظور جلوگیری از بیش‌برازش (overfitting) و حفظ عمومیت مدل انجام می‌شود تا مطمئن شویم مدل‌هایی که دچار بیش‌برازش شده‌اند، در امتیازدهی نهایی، افت می‌کنند.

نحوه‌ی ارسال پاسخ🔗

برای پاسخ به این سوال ابتدا فایل نوت‌بوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آن‌چه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جواب‌ساز (آخرین سلول فایل نوت‌بوک) فایل result.zip ساخته شده را ارسال نمایید.

هشدار مهم

توجه داشته باشید که پیش از اجرای سلول جواب‌ساز، تغییرات اعمال شده در نوت‌بوک را با استفاده از کلید میان‌بر ctrl+s ذخیره کرده باشید در غیر این صورت، در پایان مسابقه نمره شما به صفر تغییر خواهد کرد.

همچنین اگر از کولب برای اجرای این فایل نوت‌بوک استفاده می‌کنید، قبل از ارسال فایل result.zip، آخرین نسخه‌ی نوت‌بوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.

جرم‌شناسی


فایل اولیه‌ی این سوال را می‌توانید از این لینک دانلود کنید.

در شهرهای بزرگ مانند لس آنجلس، درک و پیش‌بینی فعالیت‌های مجرمانه برای بهبود امنیت عمومی و بهینه‌سازی تخصیص منابع حیاتی است. در این مناطق، سازمان‌های مجری قانون حجم زیادی از داده‌های مربوط به حوادث جنایی را جمع‌آوری می‌کنند. این داده‌ها معمولاً شامل اطلاعاتی مانند تاریخ، زمان و محل حادثه، مشخصات دموگرافیک قربانی، نوع سلاح استفاده شده و وضعیت پرونده می‌باشند. با تجزیه و تحلیل این داده‌ها، می‌توان الگوها و روندهای رفتار مجرمانه را شناسایی کرد. هدف این مسئله توسعه‌ی یک مدل یادگیری ماشینی است که می‌تواند نوع جرم را بر اساس جزئیات مختلف حادثه پیش‌بینی کند.

معیار ارزیابی🔗

برای ارزیابی مدل شما از معیار F1 Score استفاده می‌شود و مدل میانگین‌گیری نیز به‌صورت macro است. برای نمره‌گیری در این سوال مدل شما باید دارای F1 Score حداقل ۰.۲۵ باشد و در این حالت نمره‌ی نهایی بر اساس فرمول زیر محاسبه می‌گردد:

round(f1score,3)×250round(f1score, 3) \times 250

اگر مدل شما به حدنصاب نرسد، نمره‌ی دریافتی صفر خواهد بود.

توجه

در طول مسابقه امتیازی که مشاهده می‌کنید، فقط نتیجه‌ی ارزیابی مدل شما روی ۳۰ درصد از داده‌های آزمون است. بعد از پایان زمان مسابقه، امتیاز نهایی شما روی ۷۰ درصد مابقی محاسبه می‌شود.

این کار به منظور جلوگیری از بیش‌برازش (overfitting) و حفظ عمومیت مدل انجام می‌شود تا مطمئن شویم مدل‌هایی که دچار بیش‌برازش شده‌اند، در امتیازدهی نهایی، افت می‌کنند.

نحوه‌ی ارسال پاسخ🔗

برای پاسخ به این سوال ابتدا فایل نوت‌بوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آن‌چه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جواب‌ساز (آخرین سلول فایل نوت‌بوک) فایل result.zip ساخته شده را ارسال نمایید.

هشدار مهم

توجه داشته باشید که پیش از اجرای سلول جواب‌ساز، تغییرات اعمال شده در نوت‌بوک را با استفاده از کلید میان‌بر ctrl+s ذخیره کرده باشید در غیر این صورت، در پایان مسابقه نمره شما به صفر تغییر خواهد کرد.

همچنین اگر از کولب برای اجرای این فایل نوت‌بوک استفاده می‌کنید، قبل از ارسال فایل result.zip، آخرین نسخه‌ی نوت‌بوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.

شبی چند؟


فایل اولیه‌ی سوال را می‌توانید از این لینک دانلود کنید.

یک سایت رزرو اقامتگاه برای آنکه بتواند تشخیص دهد اقامتگاهی که در سایتش ثبت شده با قیمت مناسبی اجاره می‌شود از شما خواسته تا به کمکشان بروید. برای این کار مجموعه‌داده‌ای از اطلاعات اقامتگاه‌هایی که تا به الان در سایتشان ثبت شده را به شما می‌دهند و از شما می‌خواهند مدلی را آموزش دهید که بتواند از روی مشخصات یک اقامتگاه، قیمت آن را پیش‌بینی کند.

معیار ارزیابی🔗

برای ارزیابی مدل شما از معیار R2 Score استفاده می‌شود. برای نمره‌گیری در این سوال مدل شما باید دارای R2 Score حداقل ۰.۴ باشد و در این حالت نمره‌ی نهایی بر اساس فرمول زیر محاسبه می‌گردد:

round(r2score,3)×250round(r2score, 3) \times 250

اگر مدل شما به حدنصاب نرسد، نمره‌ی دریافتی صفر خواهد بود.

توجه

در طول مسابقه امتیازی که مشاهده می‌کنید، فقط نتیجه‌ی ارزیابی مدل شما روی ۳۰ درصد از داده‌های آزمون است. بعد از پایان زمان مسابقه، امتیاز نهایی شما روی ۷۰ درصد مابقی محاسبه می‌شود.

این کار به منظور جلوگیری از بیش‌برازش (overfitting) و حفظ عمومیت مدل انجام می‌شود تا مطمئن شویم مدل‌هایی که دچار بیش‌برازش شده‌اند، در امتیازدهی نهایی، افت می‌کنند.

نحوه‌ی ارسال پاسخ🔗

برای پاسخ به این سوال ابتدا فایل نوت‌بوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آن‌چه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جواب‌ساز (آخرین سلول فایل نوت‌بوک) فایل result.zip ساخته شده را ارسال نمایید.

هشدار مهم

توجه داشته باشید که پیش از اجرای سلول جواب‌ساز، تغییرات اعمال شده در نوت‌بوک را با استفاده از کلید میان‌بر ctrl+s ذخیره کرده باشید در غیر این صورت، در پایان مسابقه نمره شما به صفر تغییر خواهد کرد.

همچنین اگر از کولب برای اجرای این فایل نوت‌بوک استفاده می‌کنید، قبل از ارسال فایل result.zip، آخرین نسخه‌ی نوت‌بوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.