• محدودیت زمان: ندارد
  • محدودیت حافظه: ندارد

محمد، دیتا ساینتیست استارت آپی به نام الک دولک است. این شرکت قصد دارد ابزاری را در اختیار سایر شرکت ها قرار دهد تا بتوانند افراد جویای کار را در هر حوزه شغلی ارزیابی (الک) بکنند. حال از محمد خواسته شده تا مدلی برای ارزیابی دیتا ساینتیست ها طراحی بکند. این مدل برای هر دیتا ساینتیست یک بردار دارای ده ویژگی عددی بین ۰ تا بیست را اندازه‌گیری می کند و یک تخمین به عنوان خروجی بازمیگرداند که تخمینی از شاخص خفنی آن دیتا ساینتیست است. حال محمد ویژگی ها و شاخص خفنی مربوط به هزار دیتا ساینتیست را در اختیار دارد و با کمی بررسی متوجه شده است که می تواند با استفاده از رگرسیون خطی، مدلی مناسب برای تخمین شاخص خفنی طراحی نماید. او بردارهای همه دیتاساینتیست‌ها را کنار هم قرار داده است تا یک ماتریس 1000×101000\times10 به نام XX تشکیل شود، و شاخص های خفنی را نیز به همین شکل پشت هم قرار داده است تا یک بردار با اندازه 10001000 به نام YY تشکیل شود. محمد می‌داند که برای حل رگرسیون خطی باید بردار WW با اندازه 1010 را بیابد به طوری که:Y=X×WY = X\times W او همچنین می‌داند که برای محاسبه WW می‌تواند از رابطه زیر استفاده بکند (دقت کنید که همه ضرب ها ضرب ماتریسی هستند و XTX^T ترانهاده ماتریس XX است.):

W=(XTX)1XTYW = {({X^T}X})^{-1}X^TY

حال که سر محمد بسیار شلوغ است، به او کمک بکنید و مقدار WW را بیابید. به عنوان ورودی فایل train.csv در اختیار شما قرار گرفته می‌شود که دارای هزار ردیف و یازده ستون است. (داده های مربوط به این سوال را می توانید از این لینک دریافت کنید). هر ردیف مربوط به یک دیتا ساینتیست، ستون های اول تا دهم مربوط به یک ویژگی و ستون یازدهم مربوط به شاخص خفنی می‌باشد. در پاسخ فقط فایل خروجی خود را با نام output.txt برای ما ارسال کنید که در آن عدد نوشته شده در خط ii ام برابر با WiW_i است. نمونه‌ای از پاسخ ارسال شده را می‌توانید در زیر مشاهده نمایید.

0.011546
0.351223
0.032101
0.043211
0.052152
0.065645
0.073453
0.084232
0.092342
0.123444
Plain text

ارسال پاسخ برای این سؤال
فایلی انتخاب نشده است.