فایل اولیهی سوال را میتوانید از این لینک دانلود کنید. |
---|
در این چالش، شما به عنوان یک دانشمند داده با قلبی مشتاق برای نجات جانها، ماموریت دارید که دادههای گزارشدهی ملی مرگهای خشونتآمیز را تجزیه و تحلیل کنید. این دادهها شامل خلاصهای از گزارشهای انتظامی و پزشکی قانونی میباشد که مربوط به خودکشیهای انجامشده توسط جوانان است. هدف از این تجزیه و تحلیل، شناسایی عوامل کلیدی است که میتواند به پیشگیری از خودکشی در آینده کمک کند.
دادههای ارائهشده شامل روایتهای مختلف و غیرقابل شناسایی است که توسط کارشناسان دولتی تهیه شدهاند. این دادهها خلاصهای از ماجراهای تلخی هستند که باید با دقت و حساسیت بررسی شوند.
معیار ارزیابی
معیار ارزیابی برای مدل شما از Accuracy استفاده میشود. برای موفقیت در این معیار، مدل شما باید حداقل دقت معادل 0.60 یا بالاتر داشته باشد. نمرهی نهایی شما بر اساس فرمول Accuracy محاسبه میگردد: در صورتی که مدل شما به حدنصاب تعیین شده (دقت 0.60) نرسد، نمرهی دریافتی شما صفر خواهد بود.
توجه
در طول مسابقه امتیازی که مشاهده میکنید، فقط نتیجهی ارزیابی مدل شما روی ۳۰ درصد از دادههای آزمون است. بعد از پایان زمان مسابقه، امتیاز نهایی شما روی ۷۰ درصد مابقی محاسبه میشود.
این کار به منظور جلوگیری از بیشبرازش (overfitting
) و حفظ عمومیت مدل انجام میشود تا مطمئن شویم مدلهایی که دچار بیشبرازش شدهاند، در امتیازدهی نهایی، افت میکنند.
نحوهی ارسال پاسخ
برای پاسخ به این سوال ابتدا فایل نوتبوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آنچه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جوابساز (آخرین سلول فایل نوتبوک) فایل result.zip
ساخته شده را ارسال نمایید.
هشدار مهم
توجه داشته باشید که پیش از اجرای سلول جوابساز، تغییرات اعمال شده در نوتبوک را با استفاده از کلید میانبر ctrl+s
ذخیره کنید در غیر این صورت، در پایان مسابقه نمره شما به صفر تغییر خواهد کرد.
همچنین اگر از کولب برای اجرای این فایل نوتبوک استفاده میکنید، قبل از ارسال فایل result.zip
، آخرین نسخهی نوتبوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.
ارسال پاسخ برای این سؤال