در این سوال، شما به تحلیل رفتار مشتریان میپردازید.
شما به دادگان تراکنشهای یک فروشگاه آنلاین موادغذایی از این لینک دسترسی دارید. در این سوال، به تمامی خریدهایی که یک مشتری در یک روز انجام میدهد، "سبد" میگوییم:
هر ردیف دادگان، سفارش یک نوع محصول توسط یک مشتری را طبق جدول زیر نشان میدهد:
نام ستون | توضیحات ستون |
---|---|
Customer Id | شناسه مشتری |
Date | تاریخ سفارش |
Product | نام محصول |
ابتدا با استفاده از این دادگان، به ۵ سوال اکتشافی زیر پاسخ دهید (مثال خروجی هر سوال، در زیر آن آورده شدهاست).
هر کدام از این ۵ سوال بالا، دارای ۲۰ امتیاز هستند (۱۰۰ امتیاز در مجموع).
حال، به تحلیل سبد خرید مشتریان که یکی از تکنیک های کلیدی، خرده فروشان بزرگ برای کشف ارتباط بین اقلام خریداری شدهاست، میپردازید و بدین منظور، از قوانین وابستگی استفاده خواهید کرد.
به عنوان مثال، با قانون وابستگی میتوان محاسبه کرد که اگر یک مشتری پیاز و سیب زمینی را در سبد خرید خود قرار داده باشد، با چه احتمالی، او مایل به خرید گوشت همبرگر نیز خواهد بود؟ چنین اطلاعاتی میتوانند در تصمیماتی مانند ارائه تخفیف، قراردادن محصولات در کنار هم و یا پکیج کردن آنها، تاثیر بگذارند.
با مثال زیر، دو معیار قوانین وابستگی که در این سوال نیاز دارید، توضیح داده میشوند. فرض کنید که ۱۰۰ سبد دارید که ۱۰تای آنها شیر، ۸تای آنها کره و ۶ تای آنها هر دو را دارند.
معیار پشتیبانی (support
)، نشان می دهد که یک مجموعه محصول/محصولات چقدر محبوب است:
در مثال بالا، support(milk)
برابر است با ۰.۱ و support(milk,butter)
برابر است با ۰.۰۶
معیار اطمینان (confidence
)، نشان میدهد که هنگام خرید محصول/محصولات X
چقدر احتمال دارد که محصول/محصولات Y
خریداری شوند و از این امر به عنوان "الگو" یاد میکنیم:
در مثال بالا، confidence(milk->butter)
برابر است با ۰.۶
به استفاده از معیارهای support
و confidence
، به دو سوال زیر پاسخ دهید (مثال خروجی هر سوال، در زیر آن آورده شدهاست):
support
را دارند به ترتیب نزولی کدامند؟support
آنها، حداقل ۰.۰۱ میباشد. دو الگویی که بیشترین confidence
را دارند، به ترتیب نزولی کدامند؟شاید بتوانید که از الگوریتم آپریوری، برای حل سوالات تحلیل سبد خرید، استفاده کنید.
هر کدام از این ۲ سوال بالا، دارای ۵۰ امتیاز هستند (۱۰۰ امتیاز در مجموع) و در صورتی که به تمامی سوالات، این صفحه پاسخ صحیح دهید. شما بایستی که ۲۰۰ امتیاز کسب کنید.
برای ارسال پاسخ، جواب هر سوال را مشابه مثال، در یک سطر از یک فایل text
بنویسید. در نهایت یک فایل هفت خطی با نام output.txt را برای ما بارگذاری کنید (جواب سوال اول در خط اول، سوال دوم در خط دوم، ... سوال هفتم در خط هفتم).
در صورتی که جواب سوالی را نمیدانید در سطر مربوطه ۱- وارد کنید.
در خط i ام جواب سوال i ام نوشته شدهاست.
اگر نام فایل شما و ساختار محتویات آن، همانند آنچه در صورت سوال ذکر شدهاست، نباشد؛ امتیازی از سوال دریافت نخواهید کرد.