[قوانین شرکت در مسابقات](https://quera.ir/course/assignments/2693/problems/33523)
در زمان مسابقه میتوانید سوالهای خود را از قسمت "سوال بپرسید" مطرح کنید.
پیش از پایان مسابقه، کد سوالات خود را در بخش "آپلود کد سوالات پاسخ داده شده" آپلود کنید.
بعد از مسابقه در ساعت ۲۰:۰۰ امروز وبیناری برای حل بخشی از سوالات مسابقه و پاسخگویی به سوالات شما تدارک دیدهایم که میتوانید از طریق این [لینک](https://www.skyroom.online/ch/quera/codecup5-datasci) شرکت نمایید. دقت کنید که در هنگام ورود باید گزینه مهمان را انتخاب نمایید.
قوانین شرکت در مسابقات
در زمان مسابقه میتوانید سوالهای خود را از قسمت "سوال بپرسید" مطرح کنید.
پیش از پایان مسابقه، کد سوالات خود را در بخش "آپلود کد سوالات پاسخ داده شده" آپلود کنید.
بعد از مسابقه در ساعت ۲۰:۰۰ امروز وبیناری برای حل بخشی از سوالات مسابقه و پاسخگویی به سوالات شما تدارک دیدهایم که میتوانید از طریق این لینک شرکت نمایید. دقت کنید که در هنگام ورود باید گزینه مهمان را انتخاب نمایید.
+ محدودیت زمان: ندارد
+ محدودیت حافظه: ندارد
محمد، دیتا ساینتیست استارت آپی به نام **الک دولک** است. این شرکت قصد دارد ابزاری را در اختیار سایر شرکت ها قرار دهد تا بتوانند افراد جویای کار را در هر حوزه شغلی ارزیابی (الک) بکنند. حال از محمد خواسته شده تا مدلی برای ارزیابی دیتا ساینتیست ها طراحی بکند. این مدل برای هر دیتا ساینتیست یک بردار دارای ده ویژگی عددی بین ۰ تا بیست را اندازهگیری می کند و یک تخمین به عنوان خروجی بازمیگرداند که تخمینی از **شاخص خفنی** آن دیتا ساینتیست است. حال محمد ویژگی ها و شاخص خفنی مربوط به هزار دیتا ساینتیست را در اختیار دارد و با کمی بررسی متوجه شده است که می تواند با استفاده از رگرسیون خطی، مدلی مناسب برای تخمین شاخص خفنی طراحی نماید. او بردارهای همه دیتاساینتیستها را کنار هم قرار داده است تا یک ماتریس $1000\times10$ به نام $X$ تشکیل شود، و شاخص های خفنی را نیز به همین شکل پشت هم قرار داده است تا یک بردار با اندازه $1000$ به نام $Y$ تشکیل شود. محمد میداند که برای حل رگرسیون خطی باید بردار $W$ با اندازه $10$ را بیابد به طوری که:$$Y = X\times W$$
او همچنین میداند که برای محاسبه $W$ میتواند از رابطه زیر استفاده بکند (دقت کنید که همه ضرب ها ضرب ماتریسی هستند و $X^T$ ترانهاده ماتریس $X$ است.):
$$W = {({X^T}X})^{-1}X^TY$$
حال که سر محمد بسیار شلوغ است، به او کمک بکنید و مقدار $W$ را بیابید. به عنوان ورودی فایل **train.csv** در اختیار شما قرار گرفته میشود که دارای هزار ردیف و یازده ستون است. (داده های مربوط به این سوال را می توانید [اینجا](https://quera.ir/assignment/21631/download_problem_initial_project/78349/?noconvert=true) دریافت کنید). هر ردیف مربوط به یک دیتا ساینتیست، ستون های اول تا دهم مربوط به یک ویژگی و ستون یازدهم مربوط به شاخص خفنی میباشد. در پاسخ **فقط** فایل خروجی خود را با نام **output.txt** برای ما ارسال کنید که در آن عدد نوشته شده در خط $i$ ام برابر با $W_i$ است. نمونهای از پاسخ ارسال شده را میتوانید در زیر مشاهده نمایید.
```
0.011546
0.351223
0.032101
0.043211
0.052152
0.065645
0.073453
0.084232
0.092342
0.123444
```
شرکت الک دولک
- محدودیت زمان: ندارد
- محدودیت حافظه: ندارد
محمد، دیتا ساینتیست استارت آپی به نام الک دولک است. این شرکت قصد دارد ابزاری را در اختیار سایر شرکت ها قرار دهد تا بتوانند افراد جویای کار را در هر حوزه شغلی ارزیابی (الک) بکنند. حال از محمد خواسته شده تا مدلی برای ارزیابی دیتا ساینتیست ها طراحی بکند. این مدل برای هر دیتا ساینتیست یک بردار دارای ده ویژگی عددی بین ۰ تا بیست را اندازهگیری می کند و یک تخمین به عنوان خروجی بازمیگرداند که تخمینی از شاخص خفنی آن دیتا ساینتیست است. حال محمد ویژگی ها و شاخص خفنی مربوط به هزار دیتا ساینتیست را در اختیار دارد و با کمی بررسی متوجه شده است که می تواند با استفاده از رگرسیون خطی، مدلی مناسب برای تخمین شاخص خفنی طراحی نماید. او بردارهای همه دیتاساینتیستها را کنار هم قرار داده است تا یک ماتریس 1000×10 به نام X تشکیل شود، و شاخص های خفنی را نیز به همین شکل پشت هم قرار داده است تا یک بردار با اندازه 1000 به نام Y تشکیل شود. محمد میداند که برای حل رگرسیون خطی باید بردار W با اندازه 10 را بیابد به طوری که:Y=X×W
او همچنین میداند که برای محاسبه W میتواند از رابطه زیر استفاده بکند (دقت کنید که همه ضرب ها ضرب ماتریسی هستند و XT ترانهاده ماتریس X است.):
W=(XTX)−1XTY
حال که سر محمد بسیار شلوغ است، به او کمک بکنید و مقدار W را بیابید. به عنوان ورودی فایل train.csv در اختیار شما قرار گرفته میشود که دارای هزار ردیف و یازده ستون است. (داده های مربوط به این سوال را می توانید اینجا دریافت کنید). هر ردیف مربوط به یک دیتا ساینتیست، ستون های اول تا دهم مربوط به یک ویژگی و ستون یازدهم مربوط به شاخص خفنی میباشد. در پاسخ فقط فایل خروجی خود را با نام output.txt برای ما ارسال کنید که در آن عدد نوشته شده در خط i ام برابر با Wi است. نمونهای از پاسخ ارسال شده را میتوانید در زیر مشاهده نمایید.
ارسال پاسخ برای این سؤال
در حال حاضر شما دسترسی ندارید.