اگر علاقهمند به تحلیل داده و فوتبال باهم هستید، این مسابقه میتواند چالش خیلی خوبی برای شما باشد.
برای مطالعه قوانین شرکت در مسابقه به اینجا مراجعه کنید.
در زمان مسابقه میتوانید سوالهای خود را از قسمت "سوال بپرسید" مطرح کنید.
همچنین پیش از پایان مسابقه، کد سوالات خود را در بخش "بارگذاری کد سوالات" قرار دهید.
یک هفته بعد از پایان مسابقه و داوری سوالهای نقل و انتقالات و نیمکت توسط هیئت داوران، نفرات برتر از طریق بلاگ کوئرا اعلام و جوابهای افراد برتر جهت نشر دانش با شما از آن طریق به اشتراک گذاشته خواهد شد.
یک ساعت پس از اتمام مسابقه، وبینار آموزشی برگزار خواهد شد که ابتدا آمار مسابقه را بررسی میکنیم و در ادامه راه حل سوالات را خواهیم دید. برای شرکت در وبینار، به صورت کاربر مهمان از طریق لینک زیر اقدام به ورود کنید: https://vc.sharif.edu/ch/quera
فرض کنید که در راه رسیدن به مسابقات جهانی فوتبال، کاپیتان سوباسا تصمیم به استفاده از تحلیل داده برای ارتقای سطح فنی تیم خود گرفته است و به همین منظور شما به عنوان دانشمند داده تیم جذب شدهاید.
در هفته اول کاری خود، شما از تعدادی کارآموز درخواست میکنید که فیلم تمامی بازیهای فصل قبل لیگ را مشاهده کنند و اطلاعات مرتبط با شوتها در هر بازی را به صورت دستی ثبت کنند. خروجی کار در قالب csv
، تحویل شما شده است.
این مسابقه دارای ۴ سوال میباشد و شما میتوانید دادگان این مسابقه (یکسان برای تمامی سوالها به جز سوال نیمکت) را از این لینک دریافت کنید.
هر ردیف دادگان آموزش train.csv
، یک رویداد شوت و مشخصات آن، طبق جدول زیر میباشد:
نام ستون | توضیح ستون |
---|---|
matchId | شناسه بازی |
playerId | شناسه بازیکن شوتزننده |
playType | موقعیت بازی که در آن ضربه زده شد (جریان بازی، پنالتی، ضربه آزاد مستقیم، مستقیم از کرنر) |
bodyPart | بخشی از بدن که با آن شوت زده شدهاست (پای چپ، پای راست، سَر، سایر) |
x | موقعیت شوت در زمین به متر (مختصات x ) |
y | موقعیت شوت در زمین به متر (مختصات y ) |
interveningOpponents | تعداد بازیکنان حریف که در لحظه شوتزدن مانع دید شوتزننده به دروازه شده بودند |
interveningTeammates | تعداد همتیمیهایی که در لحظه شوت زدن مانع دید شوتزننده به دروازه شده بودند |
interferenceOnShooter | میزان دخالت مستقیم تیم مدافع بر روی شوتزننده (کم - هیچ بازیکن تیم حریف در یک متری شوتزننده نیست، متوسط - یک بازیکن حریف در ۱متری شوتزننده قرار دارد، زیاد - بیشتر از یک بازیکن حریف در ۱متری شوتزننده قرار دارند) |
minute | دقیقه زدن شوت |
second | ثانیه زدن شوت |
outcome | نتیجه شوت (برخورد به دفاع، موقعیت از دست رفته، برخورد به تیردروازه، مهار توسط دروازهبان، گُل، گُل بهخودی) |
مبدا مختصات (۰,۰) مرکز دروازهی تحت شوت میباشد و مختصات (x,y)، فاصله طولی (x) و عرضی (y) محل زدن شوت تا مبدا مختصات را به متر تعیین میکند، به عنوان مثال، موقعیت پنالتی در مختصات (۱۱,۰) میباشد.
برای آشنایی بیشتر با زمین فوتبال و ابعاد قسمتهای مختلف آن، شما به عکس زیر از ویکیپدیای فارسی دسترسی دارید.
در صورتی که با ورزش فوتبال آشنایی ندارید، می توانید قوانین آن را در ویکیپدیایفارسی از اینجا بخوانید.
در ابتدای کار، شما میخواهید با بررسی اولیه به اکتشاف در مجموعه دادگان آموزش (train.csv
) بپردازید و به سوالات زیر پاسخ بدهید (مثال خروجی هر سوال، در زیر آن آورده شدهاست).
در نظر داشته باشید که در این مرحله، گُل به خودی به عنوان گُل شوتزننده در نظر گرفته نمیشود و همچنین با مجموعه دادگان آزمایش (test.csv
) در این مرحله کاری نداریم.
چندبازیکن در مجموعهدادگان وجود دارند؟
کدام بازیکن، بیشترین تعداد گُل را زده است؟
کدام بازیکنان به ترتیب، بیشترین نرخ تبدیل شوت به گُل و کمترین آن را داشتند؟ (بدون فاصله قبل و بعد از ,
- همانند نمونه زیر)
فاصله اقلیدسی دورترین شوت تا مرکز دروازه چهقدر بوده است؟ (فقط قسمت عدد صحیح)
این مرحله در مجموع، شامل ۴ سوال (هر سوال، ۲۵ امتیاز) میباشد. در صورتی که به تمامی سوالات پاسخ صحیح بدهید، بایستی ۱۰۰ امتیاز از این مرحله کسب کنید.
برای ارسال پاسخ ، جواب هر سوال را مشابه مثال، در یک سطر از فایل text بنویسید. در نهایت یک فایل text چهار خطی با نام output.txt را برای ما بارگذاری کنید. در صورتی که جواب سوالی را نمیدانید در سطر مربوطه ۱- وارد کنید.
در خط i ام جواب سوال i ام نوشته شده است.
چون پاسخ سوال دوم و سوم را نمیدانستید، به جای آن عدد -۱ نوشته اید!