فرض کنید که در راه رسیدن به مسابقات ‌جهانی فوتبال، کاپیتان سوباسا تصمیم به استفاده از تحلیل داده برای ارتقای سطح‌ فنی تیم خود گرفته است و به همین منظور شما به عنوان دانشمند‌ داده‌ تیم جذب شده‌اید.

کاپیتان‌سوباسا

در هفته اول کاری خود، شما از تعدادی کارآموز درخواست می‌کنید که فیلم تمامی بازی‌های فصل قبل لیگ را مشاهده کنند و اطلاعات مرتبط با شوت‌ها در هر بازی را به صورت دستی ثبت کنند. خروجی کار در قالب csv، تحویل شما شده است.

این مسابقه دارای ۴ سوال می‌باشد و شما می‌توانید دادگان این مسابقه (یکسان برای تمامی سوال‌ها به جز سوال نیمکت) را از این لینک دریافت کنید.

دادگان

هر ردیف دادگان آموزش train.csv، یک رویداد شوت و مشخصات آن، طبق جدول زیر می‌باشد:

نام ستون توضیح ستون
matchId شناسه بازی
playerId شناسه بازیکن شوت‌زننده
playType موقعیت بازی که در آن ضربه زده شد (جریان‌ بازی، پنالتی، ضربه‌ آزاد ‌مستقیم، مستقیم ‌از ‌کرنر)
bodyPart بخشی از بدن که با آن شوت زده شده‌است (پای چپ، پای راست، سَر، سایر)
x موقعیت شوت در زمین به متر (مختصات x)
y موقعیت شوت در زمین به متر (مختصات y)
interveningOpponents تعداد بازیکنان حریف که در لحظه شوت‌زدن مانع دید شوت‌زننده به دروازه شده بودند
interveningTeammates تعداد هم‌تیمی‌هایی که در لحظه شوت زدن مانع دید شوت‌زننده به دروازه شده بودند
interferenceOnShooter میزان دخالت مستقیم تیم مدافع بر روی شوت‌زننده (کم - هیچ بازیکن تیم حریف در یک متری شوت‌زننده نیست، متوسط - یک بازیکن حریف در ۱متری شوت‌زننده قرار دارد، زیاد - بیشتر از یک بازیکن حریف در ۱متری شوت‌زننده قرار دارند)
minute دقیقه زدن شوت
second ثانیه زدن شوت
outcome نتیجه شوت (برخورد به دفاع، موقعیت از دست رفته، برخورد به تیردروازه، مهار توسط دروازه‌بان، گُل، گُل به‌خودی)

مبدا مختصات (۰,۰) مرکز دروازه‌ی تحت شوت می‌باشد و مختصات (x,y)، فاصله طولی (x) و عرضی (y) محل زدن شوت تا مبدا مختصات‌ را به متر تعیین می‌کند، به عنوان مثال، موقعیت پنالتی در مختصات (۱۱,۰) می‌باشد.

برای آشنایی بیشتر با زمین فوتبال و ابعاد قسمت‌های مختلف آن، شما به عکس زیر از ویکی‌پدیای فارسی دسترسی دارید.

جزییات‌زمین‌فوتبال

در صورتی که با ورزش فوتبال آشنایی ندارید، می توانید قوانین آن را در ویکی‌پدیای‌فارسی از اینجا بخوانید.

صورت مسئله

در ابتدای کار، شما می‌خواهید با بررسی اولیه به اکتشاف در مجموعه دادگان آموزش (train.csv) بپردازید و به سوالات زیر پاسخ بدهید (مثال خروجی هر سوال، در زیر آن آورده شده‌است).

در نظر داشته باشید که در این مرحله، گُل ‌به ‌خودی به عنوان گُل شوت‌زننده در نظر گرفته نمی‌‌شود و همچنین با مجموعه دادگان آزمایش (test.csv) در این مرحله کاری نداریم.

  1. چند‌بازیکن در مجموعه‌دادگان وجود دارند؟
10
Plain text
  1. کدام بازیکن، بیشترین تعداد گُل را زده است؟
p_1
Plain text
  1. کدا‌م‌ بازیکنان به ترتیب، بیشترین نرخ تبدیل شوت به گُل و کمترین آن را داشتند؟ (بدون فاصله قبل و بعد از , - همانند نمونه زیر)
p_1,p_300
Plain text
  1. فاصله اقلیدسی دورترین شوت تا مرکز دروازه چه‌قدر بوده‌ است؟ (فقط قسمت عدد صحیح)
100
Plain text

این مرحله در مجموع، شامل ۴ سوال (هر سوال، ۲۵ امتیاز) می‌باشد. در صورتی که به تمامی سوالات پاسخ صحیح بدهید، بایستی ۱۰۰ امتیاز از این مرحله کسب کنید.

خروجی

برای ارسال پاسخ ، جواب هر سوال را مشابه‌ مثال، در یک سطر از فایل text بنویسید. در نهایت یک فایل text چهار خطی با نام output.txt را برای ما بارگذاری کنید. در صورتی که جواب سوالی را نمی‌دانید در سطر مربوطه ۱- وارد کنید.

نمونه خروجی ۱

10
p_1
p_1,p_300
100
Plain text

توضیحات

در خط i ام جواب سوال i ام نوشته شده است.

نمونه خروجی ۲

10
-1
-1
30
Plain text

توضیحات

چون پاسخ سوال دوم و سوم را نمی‌دانستید، به جای آن عدد -۱ نوشته اید!


ارسال پاسخ برای این سؤال
فایلی انتخاب نشده است.