فایل اولیهی این سوال را میتوانید از این لینک دانلود کنید. |
---|
امیرعلی که به تازگی از دانشگاه فارغالتحصیل شده، میخواهد یک استارتآپ جدید راه بیاندازد اما از شکست خیلی میترسد. به همین دلیل راجع به آن بسیار تحقیق کرده که نتیجهی آن یک مجموعهداده است که شامل اطلاعات تعداد زیادی از استارتآپهای موفق یا شکست خورده میباشد. حال امیرعلی از شما میخواهد تا با استفاده از این مجموعهداده مدلی را طراحی کنید که با داشتن دادههای چند ماه اول آن پیشبینی کند که این استارتآپ موفق خواهد شد یا نه؟
برای ارزیابی مدل شما از معیار F1 Score
استفاده میشود و مدل میانگینگیری نیز بهصورت macro
است.
برای نمرهگیری در این سوال مدل شما باید دارای F1 Score
حداقل 0.40 باشد و در این حالت نمرهی نهایی بر اساس فرمول زیر محاسبه میگردد:
اگر مدل شما به حدنصاب نرسد، نمرهی دریافتی صفر خواهد بود.
در طول مسابقه امتیازی که مشاهده میکنید، فقط نتیجهی ارزیابی مدل شما روی ۳۰ درصد از دادههای آزمون است. بعد از پایان زمان مسابقه، امتیاز نهایی شما روی ۷۰ درصد مابقی محاسبه میشود.
این کار به منظور جلوگیری از بیشبرازش (overfitting
) و حفظ عمومیت مدل انجام میشود تا مطمئن شویم مدلهایی که دچار بیشبرازش شدهاند، در امتیازدهی نهایی، افت میکنند.
برای پاسخ به این سوال ابتدا فایل نوتبوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آنچه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جوابساز (آخرین سلول فایل نوتبوک) فایل result.zip
ساخته شده را ارسال نمایید.
توجه داشته باشید که پیش از اجرای سلول جوابساز، تغییرات اعمال شده در نوتبوک را با استفاده از کلید میانبر ctrl+s
ذخیره کنید در غیر این صورت، در پایان مسابقه نمره شما به صفر تغییر خواهد کرد.
همچنین اگر از کولب برای اجرای این فایل نوتبوک استفاده میکنید، قبل از ارسال فایل result.zip
، آخرین نسخهی نوتبوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.