فایل اولیه‌ی سوال را می‌توانید از این لینک دانلود کنید.

فرض کنید شما تحلیل‌گر داده یک فروشگاه آنلاین هستید. دیتاستی در اختیار دارید که اطلاعات مربوط به سفارشات مشتریان را در آن ثبت کرده‌اید. با استفاده از روش‌های خوشه‌بندی، مشتریان را بر اساس رفتار خریدشان خوشه‌بندی کنید.

معیار ارزیابی

برای ارزیابی مدل شما از معیار silhouette استفاده می‌شود و با استفاده از آن آمتیاز شما به روش زیر محاسبه می‌شود:

Normalized Score=100×(Silhouette Score+1)2 \text{Normalized Score} = \frac{100 \times (\text{Silhouette Score} + 1)}{2}

برای نمره‌گیری در این سوال مدل شما باید دارای امتیاز نهایی حداقل ۸۵ باشد و اگر مدل شما به حدنصاب نرسد، نمره‌ی دریافتی صفر خواهد بود.

توجه

در طول مسابقه امتیازی که مشاهده می‌کنید، فقط نتیجه‌ی ارزیابی مدل شما روی ۳۰ درصد از داده‌های آزمون است. بعد از پایان زمان مسابقه، امتیاز نهایی شما روی ۷۰ درصد مابقی محاسبه می‌شود.

این کار به منظور جلوگیری از بیش‌برازش (overfitting) و حفظ عمومیت مدل انجام می‌شود تا مطمئن شویم مدل‌هایی که دچار بیش‌برازش شده‌اند، در امتیازدهی نهایی، افت می‌کنند.

نحوه‌ی ارسال پاسخ

برای پاسخ به این سوال ابتدا فایل نوت‌بوک قرار گرفته در فایل اولیه را باز کنید و سپس مراحل را مطابق آن‌چه که از شما خواسته شده انجام دهید. در نهایت، پس از اجرای سلول جواب‌ساز (آخرین سلول فایل نوت‌بوک) فایل result.zip ساخته شده را ارسال نمایید.

هشدار مهم

توجه داشته باشید که پیش از اجرای سلول جواب‌ساز، تغییرات اعمال شده در نوت‌بوک را با استفاده از کلید میان‌بر ctrl+s ذخیره کرده باشید در غیر این صورت، در پایان مسابقه نمره شما به صفر تغییر خواهد کرد.

همچنین اگر از کولب برای اجرای این فایل نوت‌بوک استفاده می‌کنید، قبل از ارسال فایل result.zip، آخرین نسخه‌ی نوت‌بوک خود را دانلود کرده و داخل فایل ارسالی قرار دهید.


ارسال پاسخ برای این سؤال
فایلی انتخاب نشده است.