[قوانین شرکت در مسابقات](https://quera.ir/course/assignments/2693/problems/33523)
در زمان مسابقه میتوانید سوالهای خود را از قسمت "سوال بپرسید" مطرح کنید.
پیش از پایان مسابقه، کد سوالات خود را در بخش "آپلود کد سوالات پاسخ داده شده" آپلود کنید.
بعد از مسابقه در ساعت ۲۰:۰۰ امروز وبیناری برای حل بخشی از سوالات مسابقه و پاسخگویی به سوالات شما تدارک دیدهایم که میتوانید از طریق این [لینک](https://www.skyroom.online/ch/quera/codecup5-datasci) شرکت نمایید. دقت کنید که در هنگام ورود باید گزینه مهمان را انتخاب نمایید.
در زمان مسابقه میتوانید سوالهای خود را از قسمت "سوال بپرسید" مطرح کنید.
پیش از پایان مسابقه، کد سوالات خود را در بخش "آپلود کد سوالات پاسخ داده شده" آپلود کنید.
بعد از مسابقه در ساعت ۲۰:۰۰ امروز وبیناری برای حل بخشی از سوالات مسابقه و پاسخگویی به سوالات شما تدارک دیدهایم که میتوانید از طریق این لینک شرکت نمایید. دقت کنید که در هنگام ورود باید گزینه مهمان را انتخاب نمایید.
محمد تصمیم گرفته است تا در کنار کار خود در شرکت الک دولک، در اوقات فراغت خود به تحلیل بازار بورس جهانی بپردازد. محمد از تاثیر رخدادهای مهم جهانی بر روی بازار بورس به خوبی مطلع است و به همین علت، مجموعه دادهای را در راستای تحلیل بورس آماده کرده است. در این مجموعه داده هر سطر مربوط به یک روز است که در آن ۲۵ سرفصل خبری مهم مربوط آن روز را از خبرگزاریهای مطرح استخراج کرده است. همچنین یک ستون به نام Label وجود دارد که مشخص می کند شاخص کل بورس در آن روز صعودی بوده یا نزولی. شرح دقیق ستونهای این مجموعه داده در جدول زیر آمده است.
|توضیح|ستون|
|--- |--- |
|وضعیت شاخص کلی بورس در آن روز. $0$ یعنی شاخص نزولی و $1$ یعنی شاخص صعودی بوده است| $Label$ |
| تاریخ به میلادی | $Date$ |
| یک تیتر خبری مهم مربوط به آن روز| $Top_{i} \;\;\;\;\;\; 0 \lt i \lt26$ |
حالا سر محمد بسیار شلوغ است و از شما که دیتا ساینتیست خبرهای هستید میخواهد تا مدلی جهت پیش بینی صعودی یا نزولی بودن شاخص کل بورس ارائه دهید. با استفاده از دادههای موجود در فایل **train.csv** مدل خود را آموزش دهید.یک فایل **test.csv** نیز قرار داده شده است که ورودیهای تست شما میباشد. در پاسخ خود فایلی با نام **output.csv** بارگذاری نمایید. این فایل باید فقط یک ستون داشته باشد که سطر $i$ ام آن مربوط به پیشبینی شما برای سطر $i$ ام از داده تست میباشد. داده های مربوط به سوال را می توانید از [اینجا](https://quera.ir/assignment/21631/download_problem_initial_project/78351/?noconvert=true) دریافت کنید. برای ارزیابی پاسخ شما از معیار F1 استفاده خواهد شد. این معیار به صورت زیر تعریف میشود:
$$F_1 = 2 \times \frac{precision \times recall}{precision + recall}$$
تحلیل بورسی
محمد تصمیم گرفته است تا در کنار کار خود در شرکت الک دولک، در اوقات فراغت خود به تحلیل بازار بورس جهانی بپردازد. محمد از تاثیر رخدادهای مهم جهانی بر روی بازار بورس به خوبی مطلع است و به همین علت، مجموعه دادهای را در راستای تحلیل بورس آماده کرده است. در این مجموعه داده هر سطر مربوط به یک روز است که در آن ۲۵ سرفصل خبری مهم مربوط آن روز را از خبرگزاریهای مطرح استخراج کرده است. همچنین یک ستون به نام Label وجود دارد که مشخص می کند شاخص کل بورس در آن روز صعودی بوده یا نزولی. شرح دقیق ستونهای این مجموعه داده در جدول زیر آمده است.
توضیح
ستون
وضعیت شاخص کلی بورس در آن روز. 0 یعنی شاخص نزولی و 1 یعنی شاخص صعودی بوده است
Label
تاریخ به میلادی
Date
یک تیتر خبری مهم مربوط به آن روز
Topi0<i<26
حالا سر محمد بسیار شلوغ است و از شما که دیتا ساینتیست خبرهای هستید میخواهد تا مدلی جهت پیش بینی صعودی یا نزولی بودن شاخص کل بورس ارائه دهید. با استفاده از دادههای موجود در فایل train.csv مدل خود را آموزش دهید.یک فایل test.csv نیز قرار داده شده است که ورودیهای تست شما میباشد. در پاسخ خود فایلی با نام output.csv بارگذاری نمایید. این فایل باید فقط یک ستون داشته باشد که سطر i ام آن مربوط به پیشبینی شما برای سطر i ام از داده تست میباشد. داده های مربوط به سوال را می توانید از اینجا دریافت کنید. برای ارزیابی پاسخ شما از معیار F1 استفاده خواهد شد. این معیار به صورت زیر تعریف میشود:
F1=2×precision+recallprecision×recall