خانه توسعهدهنده رسم نمودار در پایتون بههمراه آموزش کتابخانه Matplotlib و Seaborn
رسم نمودار در پایتون بههمراه آموزش کتابخانه Matplotlib و Seaborn
در دورههای آموزش پایتون و آموزش یادگیری عمیق، یکی از مباحثی که بهصورت جامع تدریس میشود، رسم نمودار در پایتون است. نمودارها در این زبان برنامهنویسی همهکاره، یک نمایش تصویری متشکل از مجموعهای از اشیاء هستند. در این ستها، برخی از جفت اشیاء توسط پیوندها (Links) به یکدیگر متصل شدهاند.
در ادامه این مقاله از کوئرا بلاگ، به بررسی رسم نمودار در پایتون با کتابخانه های Matplotlib و Seaborn خواهیم پرداخت؛ چراکه نمودارها در این زبان برنامهنویسی، توسط این دو کتابخانه نوشته میشوند.
فهرست مطالب
Toggleرسم نمودار در پایتون به چه معناست؟
تجسم دادهها تکنیکی است که به دانشمندان داده (Data Scientists) اجازه میدهد تا دادههای خام را به گراف و دیاگرام تبدیل کنند. چنین تصاویری خواندن و درک دادهها را آسانتر میکنند.
ابزارهای بدون کد (No-Code Tools) زیادی برای تجسم دادهها و رسم نمودار در پایتون وجود دارد؛ مانند Tableau، Power BI، ChartBlocksو…. اما با این حال، جایگزین بهتری برای هرکدام وجود دارد تا بتوان با کمک آن، کنترل کاملی روی این موضوع داشت. این جایگزین در صنعت تکنولوژی، زبان برنامهنویسی پایتون است.
استفاده از زبان پایتون برای رسم نمودار و تجسم دادهها نیاز به مهارتهای برنامهنویسی دارد؛ اما آزادی کاملی هم ارائه میدهد. با استفاده از پایتون، میتوانید تجسم دادهها را تغییر، تبدیل و ایجاد کنید. بسیاری از دانشمندان داده بهدلیل همین آزادی کامل، به این راهحل روی آوردند.
یکی از دلایلی که پایتون بهترین انتخاب برای علم داده است، اکوسیستم کتابخانهای گسترده آن است.
بسیاری از کتابخانههای پایتون اجازه تغییر یا دستکاری دادهها را میدهند: Numpy، Pandas، Matplotlib، Tensorflow و….
در میان این اسامی، Matplotlib و Seaborn از سایر موارد کارآمدتر و متداولتر هستند که در بخشهای بعد، هرکدام را با جزئیات توضیح داده و به سراغ استفاده از آنها در پایتون خواهیم رفت.
بیشتر بخوانید: پایتون چیست؟ آشنایی با زبان برنامهنویسی Python
Matplotlib چیست؟
Matplotlib یک کتابخانه قدرتمند برای رسم نمودار در پایتون است که برای ایجاد انواع نمودارهای ثابت، متحرک و تعاملی استفاده میشود. هدف اصلی Matplotlib ارائه ابزارها و عملکرد به کاربران برای نمایش دادهها بهصورت گرافیکی است تا تجزیهوتحلیل و درک هریک از آنها آسانتر شود.
این کتابخانه در ابتدا توسط John D. Hunter در سال 2003 توسعه یافت و اکنون توسط جامعه بزرگی از برنامهنویسان پایتون استفاده و نگهداری میشود.
ویژگی های کلیدی Matplotlib چه مواردی را شامل میشوند؟
ویژگی مهم کتابخانه Matplotlib را در ادامه لیست کردهایم. این ویژگیها برای هر برنامهنویسی اهمیت زیادی دارد. اما در کنار این موارد، مزایا و ویژگیهای دیگری برای Matplotlib توسط متخصصان معرفی شده است که ما در این بخش، تنها به همین لیست اکتفا کردیم.
تطبیقپذیری
توسط Matplotlib میتوانیم طیف گستردهای از نمودارها از جمله نمودارهای خطی، نمودارهای پراکنده، نمودارهای میلهای، هیستوگرامها، نمودارهای دایرهای و موارد دیگر را ترسیم کنیم.
سفارشیسازی
این کتابخانه گزینههای سفارشیسازی گستردهای را برای کنترل هر جنبهای از طرح، مانند سبک خط، رنگها، نشانگرها، برچسبها و حاشیهنویسی ارائه میدهد.
هماهنگی با NumPy
Matplotlib بهطور یکپارچه با NumPy ادغام میشود و رسم آرایههای داده بهطور مستقیم را آسان میکند.
کیفیت انتشار
Matplotlib طرحهایی با کیفیت بالا و مناسب برای انتشار با کنترل دقیق بر زیباییشناسی طرح تولید میکند.
توسعهپذیر
Matplotlib بسیار توسعهپذیر است؛ زیرا با اکوسیستم بزرگی از ابزارها و امکانات افزودنی مانند Seaborn، توابع ترسیم Pandas، و Basemap برای ترسیم جغرافیایی ارائه شده است.
Cross-Platform
این کتابخانه رسم نمودار در پایتون مستقل از پلتفرم است و میتواند روی سیستمعاملهای مختلف از جمله Windows، macOS و Linux اجرا شود.
نمودارهای تعاملی
Matplotlib از نمودارهای تعاملی از طریق استفاده از ویجتها و مدیریت رویداد پشتیبانی میکند و کاربران را قادر میسازد تا دادهها را بهصورت پویا کاوش کنند.
بیشتر بخوانید: 13 مورد از سوالات مصاحبه برنامه نویسی پایتون براساس سطح و حوزه
Seaborn چیست؟
درحالیکه Matplotlib برای رسم نمودار در پایتون و تجسم دادهها بسیار محبوب است، استفاده از آن گاهی با پیچیدگی خاصی روبهرو میشود. بنابراین توسعهدهندگان سرتاسر دنیا یک کتابخانه جدید براساس Matplotlib ایجاد کردند: Seaborn.
Seaborn کتابخانهای برای ترسیم گرافیکهای آماری در پایتون است. این کتابخانه مبتنیبر Matplotlib است و با ساختارهای دادهای Pandas ادغام میشود.
این کتابخانه بهاندازه Matplotlib قدرتمند است؛ اما سادگی و ویژگیهای منحصربهفردی را به کاربران ارائه میدهد. یکی از مزایای کتابخانه Seaborn، کاوش و درک سریع دادهها است که آن را برای برنامهنویسان تازهکار جذاب میکند.
Seaborn تمام پیچیدگیهای Matplotlib را از بین میبرد. درعینحال، امکان رسم نمودار در پایتون را مطابق با تمام نیازها و اهداف توسعهدهنده فراهم میکند.
ویژگی های کلیدی Seaborn چه مواردی را شامل میشوند؟
Seaborn نقش یک مکمل را در کنار Matplotlib ایفا میکند و نه جایگزین آن. در این بخش ما به سراغ ویژگیهای کلیدی کتابخانه Seaborn خواهیم رفت تا با بینش کاملتری این موضوع را درک کنیم.
- تمهای داخلی برای استایلدهی به گرافیکهای ترسیمشده با Matplotlib
- تجسم دادههای تک متغیره و دو متغیره
- برازش و تجسم مدلهای رگرسیون خطی
- رسم دادههای آماری برای سریهای زمانی
- ادغام و عملکرد یکپارچه با ساختارهای داده NumPy و Pandas
جزئیات نمودار مناسب در پایتون چه چیزهایی هستند؟
برای رسم نمودار در پایتون باید برخی از نکات را رعایت کنید. حفظ این موارد در ترسیم یک گراف مناسب اهمیت دارند؛ زیرا خروجی دقیقتری ارائه خواهند داد. در ادامه این بخش، لیست نمودار مناسب در پایتون را آوردهایم.
- نمودارها قابل تفکیک باشند و خطوط یا جزئیات آنها روی همدیگر قرار نگیرند؛
- برای تفکیک بهتر هر نمودار، بهتر است هرکدام را با اشکال یا رنگهای متفاوت ترسیم کنید؛
- توضیحات و راهنمای هر بخش از نمودار نوشته شود. این بخشها شامل مقیاسها، محورها، نمودارها و غیره هستند؛
- ویژگیهای هر نمودار را بشناسید تا بتوانید بهترین آن را برای هر گروه دادهای برگزینید.
بیشتر بخوانید: 12 زبان برنامهنویسی برتر که باید در سال 2024 یاد بگیرید + زبانهای پرتقاضا تا 2030
انواع نمودار در پایتون
در این بخش، انواع نمودار در پایتون را توضیح خواهیم داد تا بتوانید با شناخت هرکدام، نسبتبه رسم بهترین گراف اقدام کنید.
برای شروع کار، ابتدا باید کتابخانههای لازم و مجموعه دادههای داخلی آنها را دانلود کنیم. پس طبق کدهای زیر پیش بروید:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
penguins = sns.load_dataset('penguins')
flights = sns.load_dataset('flights')
titanic = sns.load_dataset('titanic')
car_crashes = sns.load_dataset('car_crashes')
fmri = sns.load_dataset('fmri')
diamonds = sns.load_dataset('diamonds')
برای هر نوع نمودار داده، نمونه اولیه آن را با سفارشیسازی حداقلی یا نزدیک به صفر ایجاد میکنیم تا نشان دهیم هر روش چگونه کار میکند. سپس یک عنوان مربوط به هر طرح را به آن اختصاص میدهیم تا معنادارتر بهنظر برسد. برای بسیاری از مثالها، باید دادهها را از قبل پردازش کنیم (که در کد بهعنوان #Data preparation توضیح داده شده است.)
ازآنجاییکه این مطلب را به رسم نمودار در پایتون اختصاص دادیم، مایل هستیم ادامه مبحث را با آموزش Matplotlib و Seaborn ادامه دهیم. لیست زیر متداولترین نمودارها در پایتون هستند که در بخش بعد، هرکدام را با کتابخانههای مذکور ترسیم خواهیم کرد.
نمودار میلهای (Bar Chart)
نمودار میلهای رایجترین نمودار برای نمایش مقادیر عددی دادههای طبقهبندیشده است. این نمودار بیشتر برای مقایسه دستههای مختلف بهکار میرود. دستهها با میلههای مستطیلی با همان عرض و با ارتفاع (برای نمودارهای میلهای عمودی) یا طول (برای نمودارهای میلهای افقی) متناسب با مقادیر عددی که با آنها مطابقت دارد، نشان داده میشوند.
نمودار خطی (Line Plot)
نمودار خطی پیشروی یک متغیر را از چپ به راست در امتداد محور x از طریق نقاط داده متصل به بخشهای خط مستقیم نشان میدهد. این نوع معمولا بهترین انتخاب برای نمایش تغییرات یک متغیر در طول زمان است. درواقع نمودارهای خطی اغلب برای تجسم سریهای زمانی استفاده میشوند.
نمودار پراکندگی (Scatter plot)
نمودار پراکندگی روابط بین دو متغیر را بهعنوان نقاط داده در صفحه مختصات نشان میدهد. این نوع نمودار داده برای بررسی اینکه آیا دو متغیر با یکدیگر همبستگی دارند یا خیر، این همبستگی چقدر قوی است و آیا خوشههای مجزا در دادهها وجود دارد استفاده میشود.
بیشتر بخوانید: آشنایی با Overfitting (بیشبرازش) و Underfitting (کمبرازش) در یادگیری ماشین
نمودار هیستوگرام (Histogram)
هیستوگرام توزیع فراوانی مقادیر یک متغیر عددی را نشان میدهد. این نمودار در زیر Hood، دادهها را به گروههای ارزشمندی بهنام bin تقسیم میکند، تعداد نقاط مربوط به هر bin را میشمارد و هر bin را بهعنوان یک نوار عمودی با ارتفاع متناسب با مقدار شمارش برای آن bin نمایش میدهد.
نمودار جعبهای (Box Plot)
نمودار دادهای که مجموعهای از پنج آمار توصیفی از دادهها را نشان میدهد: مقادیر حداقل و حداکثر (به استثنای نقاط پرت)، میانه، ربع اول و ربع سوم. اگر کاربر بخواهد، این نمودار میتواند مقدار میانگین را هم نشان دهد.
نمودار دایرهای (Pie Chart)
این نوع توسط دایرهای تقسیمشده به بخشها، مقادیر دادهای را نشان میدهد؛ جاییکه هر بخش مربوط به دسته خاصی از دادههای طبقهبندیشده است. همچنین زاویه هر بخش نسبت آن دسته را بهعنوان بخشی از کل منعکس میکند. نمودارهای دایرهای دستهبندیهای کلی را به تصویر میکشند.
رسم نمودار در پایتون با کتابخانه Matplotlib
مبحث آموزش رسم توابع در پایتون را ابتدا با کتابخانه Matplotlib شروع میکنیم؛ زیرا این کتابخانه، برای ایجاد نمودارها بسیار انعطافپذیر و قابلتنظیم است. آموزش Matplotlib در این بخش روی ایجاد نمودارهای خطی، نمودارهای نواری و نمودارهای پراکنده تمرکز دارد. پیش از آموزش رسم نمودار با این کتابخانه، ابتدا دو مرحله تعیین مجموعه داده (Dataset) و Loading Matplotlib را خواهیم آموخت.
1. تعیین مجموعه داده در Matplotlib
برای این آموزش، از قیمتهای تاریخی شاخص داو جونز Industrial Average (DJIA) از 01-01-2022 تا 2022-12-31 استفاده خواهیم کرد.
فایل csv با نام HistoricalPrices.csv را با استفاده از کتابخانه pandas بارگذاری و اولین ردیفها را با استفاده از متد ()head مشاهده میکنیم.
import pandas as pd
djia_data = pd.read_csv('HistoricalPrices.csv')
djia_data.head()
همانطور که در خروجی میبینید، دادهها شامل چهار ستون تاریخ (Date)، بازگشایی بازار سهام (Open)، بالاترین قیمت (High)، پایینترین قیمت (Low) و بسته بودن بازار (Close) است. در ادامه توضیح مختصری در مورد هر متغیر آورده شده است.
- Date: روزی که اطلاعات قیمت سهام نشان داده میشود.
- Open: قیمت DJIA در ساعت 9:30 صبح به وقت شرقی هنگام باز شدن بازار سهام.
- High: بالاترین قیمتی که DJIA در طول روز به آن رسیده است.
- Low: کمترین قیمتی که DJIA در طول روز به آن رسیده است.
- Close: قیمت DJIA زمانی که فعالیت بازار در ساعت 4:00 عصر به وقت شرقی متوقف شد.
بهعنوان مرحله پاکسازی سریع، ما باید از متد ()rename در pandas استفاده کنیم؛ زیرا مجموعه دادهای که دانلود کردیم فضای اضافی در نام ستونها دارد.
djia_data = djia_data.rename(columns = {' Open': 'Open', ' High': 'High', ' Low': 'Low', ' Close': 'Close'})
همچنین اطمینان حاصل میکنیم که متغیر Date یک متغیر datetime است و براساس تاریخ به ترتیب صعودی مرتب میشود.
djia_data['Date'] = pd.to_datetime(djia_data['Date'])
djia_data = djia_data.sort_values(by = 'Date')
2. Loading Matplotlib
در مرحله بعد، باید pyplot Matplotlib را بارگذاری کنیم تا بتوانیم رسم نمودار در پایتون را ادامه دهیم. ماژول pyplot شامل تمام متدهای مرتبطی است که برای ایجاد نمودارها و استایل دادن به آنها نیاز داریم. ما از نام مستعار plt استفاده خواهیم کرد.
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
from datetime import datetime
در ادامه آموزش رسم توابع در پایتون، بهسراغ ترسیم اولین نمودار، یعنی نمودار خطی خواهیم رفت.
3. رسم نمودارهای خطی
نمودارهای خطی یک نوع نمودار بسیار مهم در پایتون هستند؛ زیرا در نمایش دادههای سری زمانی عملکرد بسیار خوبی دارند. در رسم این نمودار، اهمیت دادن به نحوه تغییر KPIها در طول زمان برای درک الگوهای موجود در دادهها بسیار موردتوجه است.
برای ترسیم یک Line Plot تکخطی، باید سه نکته مهم را درنظر بگیرید:
1. نحوه رسم نمودار خط ساده با یک خط را نشان دهید؛
2. مطمئن شوید که از ()plt.show استفاده کردید؛
3. توضیحات مختصری در مورد طرح ارائه دهید، از جمله تفسیر دادههای آن.
برای ترسیم نمودار تکخطی در پایتون، میتوانیم از متد ()plt.plot در Matplotlib استفاده کنیم. در این متد، آرگومان اول متغیر x و آرگومان دوم متغیر y در نمودار خطی ما خواهند بود.
هر زمان که درحال ایجاد یک نمودار هستیم، باید مطمئن شویم که ()plt.show را فراخوانی کردیم تا نمودار ترسیمشده را بینیم.
بیشتر بخوانید: 13 مورد از سوالات مصاحبه برنامه نویسی پایتون براساس سطح و حوزه
در این مثال، ما قیمت بسته شدن DJIA را در طول زمان به تصویر خواهیم کشید.
plt.plot(djia_data['Date'], djia_data['Close'])
plt.show()
ما میتوانیم توسط این دو تابع، یک نمودار چندخطی را در Plot مشابه به تصویر بکشیم. برای انجام این کار کافیست ()plt.plot را قبل از تابع ()plt.show فراخوانی کنیم.
plt.plot(djia_data['Date'], djia_data['Open'])
plt.plot(djia_data['Date'], djia_data['Close'])
plt.show()
4. افزودن Legend
اگر بخواهیم تشخیص دهیم که کدام خط نشاندهنده کدام ستون است، میتوانیم یک Legend به کدهایمان اضافه کنیم. با این کار یک برچسب رنگی در گوشه نمودار ایجاد میشود.
برای انجام آن هم ()plt.legend را مینویسیم و پارامترهای label به هر فراخوانی plt.plot() را انجام میدهیم.
plt.plot(djia_data['Date'], djia_data['Open'], label = 'Open')
plt.plot(djia_data['Date'], djia_data['Close'], label = 'Close')
plt.legend()
plt.show()
5. ترسیم نمودار میلهای
نمودارهای میلهای برای مقایسه مقادیر عددی در بین دستهها بهترین انتخاب است. همچنین آنها برای یافتن بزرگترین و کوچکترین دستهها، عملکرد بهتری نسبتبه سایر نمودارها از خود نشان میدهند.
برای انجام این بخش، دادهها را با استفاده از pandas در میانگینهای ماهانه جمع میکنیم. این کار را به هدف مقایسه عملکرد ماهانه در طول سال 2022 برای DJIA انجام میدهیم. همچنین برای ترسیم نمودار این مثال، از شش ماه اول استفاده خواهیم کرد تا ترسیم را آسانتر کنیم.
# Import the calendar package
from calendar import month_name
# Order by months by chronological order
djia_data['Month'] = pd.Categorical(djia_data['Date'].dt.month_name(), month_name[1:])
# Group metrics by monthly averages
djia_monthly_mean = djia_data \
.groupby('Month') \
.mean() \
.reset_index()
djia_monthly_mean.head(6)
6. نمودارهای خطی-عمودی
رسم نمودار در پایتون برای ترسیم نمودارهای خطی-عمودی، با استفاده از متد ()plt.bar انجام خواهد شد. اولین آرگومان متغیر محور x (Month) و پارامتر ارتفاع محور y (Close) است. سپس ()plt.show را فراخوانی میکنیم تا نمودار خود را نشان دهیم.
plt.bar(djia_monthly_mean['Month'], height = djia_monthly_mean['Close'])
plt.show()
7. نمودارهای خطی-افقی
برای ترسیم این نمودار باید دو شرط را پیاده کنید:
1. نحوه تعویض محورها را نشان دهید تا میلهها افقی باشند.
2. توضیحات مختصری در مورد طرح ارائه دهید، از جمله تفسیر شرایط.
معمولا با ترسیم نمودارهای خطی-افقی میتوانیم تفسیر نمودار و خواندن برچسبها را به شکل آسانتری نسبتبه نمودارهای دیگر انجام دهیم.
برای رسم نمودار در پایتون در نوع Bar Chart، باید از متد ()plt.hbar بهشکل زیر استفاده کنیم.
plt.barh(djia_monthly_mean_srtd['Month'], height = djia_monthly_mean_srtd['Close'])
plt.show()
8. رسم نمودارهای پراکندگی
نمودارهای پراکندگی برای شناسایی روابط بین دو متغیر عددی بسیار مفید هستند. این نمودارها میتوانند به شما این حس را بدهند که وقتی مقدار دیگری تغییر میکند، چه انتظاری از یک متغیر داشته باشید. همچنین این نوع نمودار میتواند در تصمیم شما برای استفاده از تکنیکهای مدلسازی مختلف مانند رگرسیون خطی یا غیر خطی بسیار آموزنده باشد.
رسم نمودار پراکندگی ساده
مشابه سایر نمودارها، میتوان با استفاده از ()pyplot.scatter یک نمودار پراکنده ایجاد کرد که در آن آرگومان اول متغیر محور x و آرگومان دوم متغیر محور y است. در این مثال، ما به رابطه بین قیمت DJIA در زمان بازگشایی و بسته شدن بازار سهام نگاه خواهیم کرد.
plt.scatter(djia_data['Open'], djia_data['Close'])
plt.show()
رسم نمودار پراکندگی با یک خط ترند
در رسم نمودار پراکندگی ساده، یک خط روند به نمودار اضافه میکنیم تا رابطه خطی بین متغیرهای باز و بسته را واضحتر نشان دهیم. برای این کار از متد ()numpy polyfit و ()poly1d استفاده میکنیم.
روش اول برازش چند جملهای حداقل مربعات را به ما میدهد که در آن آرگومان اول متغیر x، متغیر دوم متغیر y و متغیر سوم درجات برازش (درجه یک برای خطی) است.
روش دوم یک کلاس چندجملهای یکبعدی به ما میدهد که میتوانیم از آن برای ایجاد خط روند با استفاده از ()plt.plot استفاده کنیم.
z = np.polyfit(djia_data['Open'], djia_data['Close'], 1)
p = np.poly1d(z)
plt.scatter(djia_data['Open'], djia_data['Close'])
plt.plot(djia_data['Open'], p(djia_data['Open']))
plt.show()
رسم نمودار در پایتون با کتابخانه Seaborn
هنگامی که در محیطی کار میکنید که تجزیهوتحلیل دادههای اکتشافی هدف اصلی شما است و نیاز به طرحهای ازپیشآماده دارید، کتابخانه Seaborn گزینه بهتری نسبتبه Matplotlib خواهد بود.
در این بخش، به آموزش Seaborn و رسم نمودار در پایتون با این کتابخانه خواهیم پرداخت. برای شروع، ابتدا باید نسخه پایتون 3.7 و بالاتر را نصب کنید؛ زیرا فقط این نسخه از Python از Seaborn پشتیبانی میکند و وابستگیهای اصلی بسیار کمی دارد. نصب Seaborn بسیار ساده است و میتوانید آن را با Python’s pip manager یا conda package manager نصب کنید.
Seaborn طیف گستردهای از انواع پلات را ارائه میدهد که هرکدام میتوانند برای ترسیم دادهها و تجزیهوتحلیل اطلاعات اکتشافی استفاده شوند. بهطورکلی، هر تصویرسازی میتواند در یکی از سه دسته زیر قرار بگیرد:
1. تک متغیره – فقط x (فقط شامل یک محور اطلاعات است)؛
2. دو متغیره – x و y (شامل دو محور اطلاعات است)؛
3. سه متغیره – x، y، z (شامل سه محور اطلاعات است).
ترسیم انواع نمودار در کتابخانه Seaborn، با نوشتن توابع زیر انجام میشود:
- نمودار پراکندگی: ()scatterplot
- نمودار خطی: ()lineplot
- هیستوگرام: ()histplot
- نمودار جعبه: ()boxplot
- نقشه حرارت یا Heat Map: ()heatmap Seaborn
بیشتر بخوانید: نصب پایتون در ویندوز، لینوکس و مک + ویدیو آموزشی
تعیین مجموعه داده در Seaborn
Seaborn چندین مجموعه داده داخلی ارائه میدهد که میتوانیم برای ترسیم دادهها و تجزیهوتحلیل آماری آنها استفاده کنیم. این مجموعه دادهها در قالبهای pandas dataframes ذخیره میشوند و استفاده از آنها را با توابع ترسیم Seaborn آسان میکنند.
یکی از متداولترین مجموعه دادههایی که در تمام نمونههای رسمی Seaborn هم استفاده میشود، «Tips Dataset» نام دارد. این پکیج شامل اطلاعاتی در مورد نکات مربوط به رستورانها است. در اینجا نمونه ای از بارگیری و تجسم مجموعه داده Tips در Seaborn آورده شده است:
import seaborn as sns
# Load the Tips dataset
tips = sns.load_dataset("tips")
# Create a histogram of the total bill amounts
sns.histplot(data=tips, x="total_bill")
1. رسم نمودار پراکندگی
نمودار پراکندگی برای تجسم رابطه بین دو متغیر پیوسته استفاده میشود. هر نقطه در نمودار نشاندهنده یک نقطه داده واحد است و موقعیت نقطه در محور x و y مقادیر دو متغیر را نشان میدهد.
طرح ترسیمشده در کتابخانه Seaborn را میتوان با رنگها و نشانگرهای مختلف سفارشی کرد تا به تشخیص گروههای مختلف نقاط داده کمک کند. در Seaborn میتوان با استفاده از تابع ()scatterplot نمودارهای پراکندگی ایجاد کرد.
import seaborn as sns
tips = sns.load_dataset("tips")
sns.scatterplot(x="total_bill", y="tip", data=tips)
2. رسم نمودار خطی
نمودارهای خطی برای ترسیم روند دادهها در طول زمان یا سایر متغیرهای پیوسته استفاده میشوند. در یک نمودار خطی، هر نقطه داده توسط یک خط به هم متصل می شود و یک منحنی صاف ایجاد میکند.
import seaborn as sns
fmri = sns.load_dataset("fmri")
sns.lineplot(x="timepoint", y="signal", data=fmri)
3. ترسیم نمودار میلهای
نمودارهای میلهای برای ترسیم رابطه بین یک متغیر طبقهای و متغیر پیوسته استفاده میشود. در نمودار میلهای، هر نوار نشاندهنده میانگین یا میانه (یا هر تجمع) متغیر پیوسته برای هر دسته است.
import seaborn as sns
titanic = sns.load_dataset("titanic")
sns.barplot(x="class", y="fare", data=titanic)
4. ترسیم هیستوگرام
هیستوگرامها توزیع یک متغیر پیوسته را به تصویر میکشند. در یک هیستوگرام، دادهها به binها تقسیم میشوند. ارتفاع هر bin نشاندهنده فراوانی یا تعداد نقاط داده در آن bin است.
import seaborn as sns
iris = sns.load_dataset("iris")
sns.histplot(x="petal_length", data=iris)
5. رسم نمودار جعبهای
نمودارهای جعبهای نوعی تصویرسازی هستند که توزیع یک مجموعه داده را نشان میدهند. آنها معمولا برای مقایسه توزیع یک یا چند متغیر در دستههای مختلف استفاده میشوند.
import seaborn as sns
tips = sns.load_dataset("tips")
sns.boxplot(x="day", y="total_bill", data=tips)
6. ترسیم هیتمپ
نقشه حرارتی یک نمایش گرافیکی از دادهها است که از رنگها برای نشان دادن مقدار یک متغیر در فضای دوبعدی استفاده میکند. نقشههای حرارتی معمولا برای تجسم همبستگی بین متغیرهای مختلف در یک مجموعه داده استفاده میشوند.
import seaborn as sns
import matplotlib.pyplot as plt
# Load the dataset
tips = sns.load_dataset('tips')
# Create a heatmap of the correlation between variables
corr = tips.corr()
sns.heatmap(corr)
# Show the plot
plt.show()
آنچه در رسم نمودار در پایتون بههمراه آموزش کتابخانه Matplotlib و Seaborn آموختیم
رسم نمودار در پایتون با دو کتابخانه Matplotlib و Seaborn بسیار متداول است. هرکدام از این کتابخانهها ویژگیها و کاستیهای خود را دارند؛ بهطورمثال، با فراگیری آموزش Matplotlib، میتوانید نمودارهای پیچیده را ترسیم کنید؛ اما شرکت در کلاسهای آموزش Seaborn، به شما ترسیم نمودار و پلات بهروشی ساده و سریع را خواهد آموخت.
در رسم نمودار با پایتون، مهم است که نوع نمودار مناسب را برای دادههای خود انتخاب کنید تا بهطور موثر، یافتههای خودتان را به مخاطبان انتقال دهید. برای مثال، نمودار پراکندگی برای ترسیم رابطه بین دو متغیر پیوسته مناسبتر است؛ درحالیکه نمودار میلهای برای تجسم دادههای طبقهبندیشده انتخاب بهتری نسبتبه سایر نمودارها است.
سوالات متداولی که شما میپرسید
رسم نمودار در پایتون با کمک گرفتن از دو کتابخانه Matplotlib و Seaborn انجام میشود.
انواع نمودار در پایتون عبارتند از نمودار خطی، میلهای، هیستوگرام، پراکندگی و غیره که بسته به نیاز و هدف برنامهنویسی، هرکدام مزایا و معایب منحصربهفرد خود را دارند.
تطبیقپذیری و سفارشیسازی از مهمترین ویژگیهای کتابخانه Matplotlib هستند؛ درحالیکه تمهای داخلی برای استایلدهی به گرافیکهای ترسیمشده با Matplotlib و برازش و تجسم مدلهای رگرسیون خطی از بارزترین ویژگیهای کتابخانه Seaborn هستند.
از اسفند 99 مشغول گشتوگذار در دنیای کلمات هستم؛ با این هدف که خوب بنویسم و این چشمانداز که کمکهای موثری کنم. بعداز گذشت سه سال و مطالعه زیاد در زمینههای گوناگون بازاریابی آنلاین ازجمله رفتارشناسی مخاطب آنلاین، حالا تلاش میکنم محتوایی بنویسم که شما بخونی، لُبکلام رو متوجه بشی، لذت ببری و با دست پر صفحه رو ترک کنی؛ شایدم بقیه نوشتههام رو بخونی :)