تحلیل بورسی


محمد تصمیم گرفته است تا در کنار کار خود در شرکت الک دولک، در اوقات فراغت خود به تحلیل بازار بورس جهانی بپردازد. محمد از تاثیر رخدادهای مهم جهانی بر روی بازار بورس به خوبی مطلع است و به همین علت، مجموعه داده‌ای را در راستای تحلیل بورس آماده کرده است. حالا سر محمد بسیار شلوغ است و از شما که دیتا ساینتیست خبره‌ای هستید می‌خواهد تا مدلی جهت پیش بینی صعودی یا نزولی بودن شاخص کل بورس ارائه دهید. با استفاده از داده‌های موجود در فایل train.csv مدل خود را آموزش دهید.یک فایل test.csv نیز قرار داده شده است که ورودی‌های تست شما می‌باشد.

توضیح تصویر

دادگان🔗

داده های مربوط به سوال را می توانید از این لینک دریافت کنید.

در این مجموعه داده هر سطر مربوط به یک روز است که در آن ۲۵ سرفصل خبری مهم مربوط آن روز را از خبرگزاری‌های مطرح استخراج کرده است. همچنین یک ستون به نام Label وجود دارد که مشخص می کند شاخص کل بورس در آن روز صعودی بوده یا نزولی. شرح دقیق ستون‌های این مجموعه داده در جدول زیر آمده است.

توضیح ستون
وضعیت شاخص کلی بورس در آن روز. 00 یعنی شاخص نزولی و 11 یعنی شاخص صعودی بوده است LabelLabel
یک تیتر خبری مهم مربوط به آن روز Topi0<i<26Top_{i} \;\;\;\;\;\; 0 \lt i \lt26

ارزیابی🔗

برای ارزیابی پاسخ شما از معیار F1 استفاده خواهد شد. این معیار به صورت زیر تعریف می‌شود: F1=2×precision×recallprecision+recallF_1 = 2 \times \frac{precision \times recall}{precision + recall}

خروجی🔗

پیش‌بینی‌های مدل خود بر روی دادگان آزمایش (‍‍test.csv) را در فایلی با نام output.csv قرار دهید. این فایل باید دارای یک ستون با نام Label باشد که ردیف i ام آن پیش‌بینی شما (صعودی یا نزولی بودن شاخص - به ترتیب ۱ یا ۰) برای تیتر خبری ردیف i ام از دادگان آزمایش باشد. (دقت کنید که ستون باید حتما دارای header باشد). بعد از آماده‌سازی فایل output.csv، آن را برای ما بارگذاری کنید.

هشدار ارسال کد

فراموش نکنید کد این سوال را در تمرین آخر (بارگذاری کد)، بارگذاری کنید. در صورتی که پس از پایان زمان مسابقه، فایل کدها توسط شما بارگذاری نشده باشد، از جدول مسابقات حذف خواهید شد.

ارسال پاسخ برای این سؤال
در حال حاضر شما دسترسی ندارید.