یادگیری عمیق چیست؟ با Deep Learning آشنا شوید

24 جولای 2023

زمان مطالعه: 9 دقیقه

6721

به لطف پیشرفت‌های روز‌افزون هوش مصنوعی، امروزه تکنیک‌های جدید بسیاری را در این حوزه شاهد هستیم. همین موضوع باعث به وجود آمدن ادبیاتی جدید از واژه‌های فنی شده است. یادگیری عمیق (Deep Learning) یکی از همین واژه‌هاست که احتمالاً نام آن زیاد به گوشتان خورده باشد. اما یادگیری عمیق چیست؟ چطور کار می‌کند؟ روش‌های یادگیری عمیق چیست؟ چه کاربردها و محدودیت‌هایی دارد و تفاوت آن با یادگیری ماشین چیست و پرکاربردترین زبان‌های برنامه‌نویسی در این زمینه کدام‌اند؟

اگر کنجکاوید درمورد این مفاهیم بیشتر بدانید؛ تا انتهای این مطلب از کوئرا بلاگ، با ما همراه باشید.

فهرست مطالب

یادگیری عمیق چیست؟

یادگیری عمیق زیر‌مجموعه‌ای از یادگیری ماشین (Machine Learning) و از روش‌های هوش مصنوعی (Artificial Intelligence) است که شیوه‌ی یادگیری انسان‌ها را مورد‌تقلید قرار می‌دهد. این مفهوم، از پایه‌های اصلی علوم داده است و به ویژه در آمار و مدل‌سازی‌های پیش‌بینی‌کننده کاربرد فراوان دارد. این روش با سرعت‌دادن به فرایند‌های جمع‌آوری و تحلیل و تفسیر داده‌ها، به کمک دانشمندان داده آمده است.

به زبان ساده، یادگیری عمیق راهی برای اتوماتیک‌کردن تحلیل‌های پیش‌بینی‌کننده (Predictive Analysis) است. بر‌خلاف الگوریتم‌های خطیِ یادگیری ماشین، الگوریتم‌های سلسه‌مراتبیِ یادگیری عمیق در هر مرحله بر میزان پیچیدگی و انتزاعشان افزوده می‌شود.

برای آشنایی با یادگیری عمیق این مثال را در نظر بگیرید: کودکی نوپا برای اولین بار کلمه‌ی سگ را به زبان می‌آورد، اما معنای پشت این کلمه را نمی‌داند. او هر بار به چیز‌های مختلفی اشاره می‌کند و کلمه‌ی سگ را به زبان می‌آورد. پدر و مادر این کودک در پاسخ به هر اشاره‌ی او می‌گویند «بله، این سگ هست» و یا «نه، این سگ نیست». بعد از مدتی کودک به ویژگی‌های مشترک تمامی سگ‌ها پی می‌برد. اتفاقی که در اینجا می‌افتد این است که بدون اطلاع کودک، سلسله‌مراتبی از انتزاعات در ذهن او در حال شکل‌گیری است؛ انتزاعاتی که در هر مرحله مبتنی بر مفاهیم لایه‌های قبلی هستند. از این طریق است که مفاهیمی پیچیده و انتزاعی در ذهن کودک شکل می‌گیرد.

تفاوت یادگیری عمیق با یادگیری ماشین چیست؟

یادگیری عمیق نسبت به یادگیری ماشینِ سنتی تفاوت‌هایی دارد. در یادگیری ماشین سنتی، فرایند یادگیری نظارت‌شده (Supervised Learning) بود. برای مثال، تصور کنید می‌خواستیم به کامپیوتر آموزش دهیم تا سگ را در تصاویر شناسایی کند. برای این کار می‌بایست جزء‌به‌جزء برای کامپیوتر توضیح می‌دادیم که در جست‌و‌جوی تصاویر باید به دنبال چه ویژ‌گی‌هایی بگردد. در واقع باید ملاک تصمیم‌گیری برای وجود یا عدم وجود سگ در تصویر را برای کامپیوتر تعریف می‌کردیم.

این کار که استخراج ویژگی (Feature Extraction) نامیده می‌شود، کاری پر‌زحمت است و موفقیت کامپیوتر در آن کاملاً به تبحر برنامه‌نویس در تعریف‌کردن مجموعه ویژگی‌های سگ بستگی دارد. اما یادگیری عمیق برخلاف یادگیری ماشین نیازی به نظارت ندارد و به‌خودی‌خود می‌تواند مجموعه‌ ویژگی‌ها را تشخیص دهد. یادگیری بدون نظارت (Unsupervised Learning) نه‌تنها سریع‌تر است، بلکه دقت بالا‌تری هم دارد.

به طور کلی اگر به حوزه یادگیری عمیق علاقه‌مندید، پیشنهاد می‌کنیم که از آموزش یادگیری ماشین شروع کنید و پس از تسلط به مفاهیم آن، به آموزش یادگیری عمیق بپردازید.

مطلب مشابه: یادگیری ماشین (Machine Learning) چیست؟

نحوه‌ی کار یادگیری عمیق چیست؟

برنامه‌های کامپیوتری برای اینکه تصویر یک سگ را شناسایی کنند، باید مانند همان کودکِ مثال قبل عمل کنند. هر کدام از الگوریتم‌های یادگیری عمیق به‌صورت سلسله‌مراتبی روش تبدیل خطی را بر روی ورودی‌های خود اعمال می‌کنند و از آنچه آموخته‌‌اند در ساختن یک مدل آماری به شکل خروجی استفاده می‌کنند. گفتنی است که این فرایند تا جایی که خروجی ما به سطح قابل‌قبولی از دقت برسد، ادامه پیدا خواهد کرد. واژه‌ی عمیق در یادگیری عمیق برداشتی از همین تعداد لایه‌هایی است که داده‌ها باید از آن عبور کنند.

در یادگیری عمیق ابتدا باید داده‌های آموزشی را در اختیار برنامه‌ی کامپیوتر بگذاریم. در مثال ما، داده‌های آموزشی تصاویری با برچسب‌های «سگ» و «غیر سگ» را شامل می‌شوند که از قبل آن‌ها را تعیین کرده‌ایم. برنامه با استفاده از اطلاعاتی که از داده‌های آموزشی دریافت می‌کند، مجموعه ویژگی‌های سگ را شناخته و در نتیجه یک مدل پیش‌بینی‌کننده را طراحی می‌کند. در این مورد پیش‌بینی مدل ما به این صورت است که هر چیزی که چهار پا و یک دم داشته باشد سگ است. البته برنامه وجود چهار‌ پا و یک دم را از روی الگوهای ایجاد‌شده توسط پیکسل داده‌های دیجیتال تشخیص می‌دهد. مدل باید بار‌ها تکرار شود تا به سطح پیچیدگی و دقت مطلوب برسد.

برنامه‌های یادگیری عمیق برای اینکه به سطح دقت قابل‌قبولی برسند، باید به میزان عظیمی از داده‌های آموزشی دسترسی داشته و دارای قدرت پردازش بالایی باشند. تمامی این‌ها در عصر کلان‌داده و محاسبات ابری در دسترس برنامه‌نویسان قرار گرفته است.

تفاوت یادگیری ماشین با یادگیری یک بچه چیست؟

برای کودک ممکن است فهمیدن مفهوم سگ هفته‌ها و حتی ماه‌ها زمان ببرد. اما با استفاده از الگوریتم‌های یادگیری عمیق، برنامه‌ی کامپیوتر در ظرف چند دقیقه می‌تواند تصویر سگ را شناسایی کند. فقط کافی است که مجموعه‌ای از داده‌های آموزشی را در اختیار برنامه بگذارید تا برنامه فوراً میلیون‌ها تصویر را جست‌و‌جو کند و تصاویر مورد‌نظر را به‌درستی تشخیص دهد.

روش‌های یادگیری عمیق چیست؟

کاهش نرخ یادگیری (Learning Rate Decay)

نرخ یادگیری یک ابَر‌پارامتر (Hyperparameter) است. ابَر‌پارامتر عاملی است که سیستم را تعریف کرده و شرایط عملیات را پیش از فرایند یادگیری تعیین می‌کند. هر دفعه‌ای که در پاسخ به یک خطای برآورد‌شده در وزن مدل تغییری ایجاد می‌شود، نرخ یادگیری این میزان تغییر را محاسبه می‌کند. نرخ یادگیری بسیار بالا، بی‌ثباتی فرایند‌ آموزش و یا یادگیری کمتر از حد مطلوبی را به همراه خواهد داشت. نرخ یادگیری بسیار پایین نیز فرایند آموزش را زمان‌بر و یا حتی متوقف می‌کند.

یادگیری انتقالی (Transfer Learning)

در یادگیری انتقالی مدل‌های آموزش‌دیده‌شده‌ی قبلی را کامل می‌کنیم. در اینجا ابتدا کاربران داده‌های تازه‌ای از طبقه‌بندی‌هایی که قبلاً ناشناس بودند را به شبکه‌ی موجود ارائه می‌دهند. زمانی که سازگاری‌های جدیدی در شبکه به وجود آمد، با توجه به افزایش توانایی‌مان در طبقه‌بندی‌ می‌توانیم کار‌های جدیدی را انجام دهیم. از آنجایی که این روش به میزان داده‌ی بسیار کمتری نسبت به بقیه‌ی روش‌ها نیاز دارد، زمان محاسبه را به چند ساعت و یا چند دقیقه کاهش می‌دهد.

آموزش از ابتدا (Training from Scratch)

در روشِ آموزش از ابتدا برنامه‌نویس باید مجموعه‌ای بزرگ از داده‌های برچسب‌گذاری‌شده را گردآوری کرده و معماری شبکه را برای یادگیری مدل‌ و ویژگی‌ها پیکربندی کند. استفاده از این تکنیک برای برنامه‌هایی پیشنهاد می‌شود که جدید هستند و یا طبقات زیادی دارند. اما این نکته نیز قابل به ذکر است که این روش به دلیل اینکه به میزان بسیار زیادی از داده‌ها نیاز دارد، کمتر مورد‌استفاده قرار می‌گیرد. در این روش، فرایند آموزش می‌تواند روز‌ها و یا حتی هفته‌ها زمان ببرد.

حذف تصادفی (Dropout)

روش حذف تصادفی تلاش می‌کند تا مشکل بیش‌برازش (Overfitting) را در شبکه‌هایی که پارامتر‌های بسیار زیادی دارند بر‌طرف کند. این کار در حین آموزش و با استفاده از حذف تصادفی واحد‌ها و اتصالات آن‌ها از شبکه‌های عصبی انجام می‌شود. روش حذف تصادفی ثابت کرده است که می‌تواند عملکرد شبکه‌های عصبی را در تکالیف یادگیری نظارت‌شده ارتقا دهد. این موضوع به‌خصوص در حوزه‌هایی مانند تشخیص گفتار، طبقه‌بندی مستندات و زیست‌شناسی محاسباتی صادق است.

یادگیری عمیق شبکه‌های عصبی

در مقاله‌ی یادگیری عمیق چیست جا دارد که به شبکه‌های عصبی بپردازیم. نوعی پیشرفته از الگوریتم‌های یادگیری ماشین به نام شبکه‌های عصبی مصنوعی، پایه و اساس اغلب مدل‌های یادگیری عمیق را تشکیل می‌دهند. به همین دلیل است که گاهی یادگیری عمیق با عناوینی مانند یادگیری عصبی عمیق (Deep Neural Learning) و یا شبکه‌سازی عصبی عمیق (Deep Neural Networking) نیز خوانده می‌شود.

شبکه‌های عصبی انواع مختلفی دارند. برخی از این انواع، شبکه‌های عصبی بازگشتی (Recurrent Neural Networks)، شبکه‌های عصبی پیچشی (Convolutional Neural Networks)، شبکه‌ها‌ی عصبی مصنوعی (Artificial Neural Networks) و شبکه‌های عصبی پیشخور (Feedforward Neural Networks) هستند. با اینکه هر کدام از این شبکه‌های عصبی مزایا و کاربرد‌های مختلفی دارند، تقریباً همه‌ی آن‌ها شبیه به هم کار می‌کنند. همه‌ی این شبکه‌های عصبی از داده‌ها تغذیه کرده و امکان صحت‌یابی تفسیر داده‌ها را برای مدل فراهم می‌کنند.

شبکه‌های عصبی در فرایند‌های خود آزمون‌و‌خطا می‌کنند و به همین دلیل برای آموزش‌دیدن به حجم عظیمی از داده‌ها احتیاج دارند. تصادفی نبوده است که شبکه‌های عصبی دقیقاً زمانی مطرح شده‌اند که سازمان‌ها به سمت تحلیل‌های کلان‌داده رفته و شروع به ذخیره‌سازی انبوهی از داده‌ها کرده‌اند. در تکرار‌های اولیه‌ی مدل، حدس‌های کامپیوتر درباره‌ی محتوای یک تصویر و یا بخش‌های یک سخنرانی تا حدودی خردمندانه هستند. از همین رو داده‌های مورد‌استفاده در مرحله‌ی آموزش باید برچسب‌گذاری شوند تا مدل بتواند صحت حدس‌های خود را ارزیابی کند.

بسیاری از سازمان‌هایی که از کلان‌داده استفاده می‌کنند، به حجم عظیمی از داده‌ها دسترسی دارند. اما از آنجایی که اغلب این داده‌ها ساختار‌مند نیستند، کارآمدی چندانی ندارند. مدل‌های یادگیری عمیق نمی‌توانند توسط داده‌های غیر‌ساختار‌مند آموزش ببینند. این داده‌های غیر‌ساختارمند فقط در صورتی می‌توانند به وسیله‌ی مدل‌های یادگیری عمیق مورد تحلیل قرار بگیرند که از قبل آموزش دیده و به سطح دقت قابل‌قبولی رسیده باشند.

اهمیت یادگیری عمیق چیست؟

امروزه بسیاری از شرکت‌های بزرگ دنیا مانند گوگل، IBM ، مایکروسافت و فیسبوک از الگوریتم‌های یادگیری عمیق استفاده می‌کنند. این موضوع نشان‌دهنده میزان پیشرفته بودن، دقت بالای یادگیری عمیق و توانایی بی‌نظیراین رویکرد در تقلید تفکر انسانی است که باعث استفاده از آن در شرایط مختلف و داشتن کاربردهای بسیار می‌شود. در ادامه با بررسی این کاربردها، به اهمیت وجود یادگیری عمیق بیشتر پی می‌بریم.

کاربردهای یادگیری عمیق چیست؟

مدل‌های یادگیری عمیق اطلاعات را به شیوه‌ای شبیه به مغز انسان پردازش می‌کنند. به همین دلیل این مدل‌ها را می‌توان در بسیاری از کار‌هایی که انسان‌ها انجام می‌دهند به کار بست. در حال حاضر یادگیری عمیق در پردازش زبان طبیعی، ابزار‌های بازشناسی تصویر و نرم‌افزار‌های بازشناسی گفتار به کار می‌رود. ابزار‌های نام‌برده در حوزه‌ها‌ی متنوعی که از اتوموبیل‌های خودر‌ان گرفته تا ترجمه‌ی زبان‌ها را شامل می‌شود، به کار می‌روند.

کاربرد‌های تحلیل‌ کلان‌داده از جمله موارد‌استفاده‌ی یادگیری عمیق هستند. این کاربرد‌ها مربوط به حوزه‌‌هایی مانند پردازش زبان طبیعی، ترجمه‌ی زبان، تشخیص‌های پزشکی، سیگنال‌های معاملاتی بازار سهام، امنیت شبکه و بازشناسی تصویر هستند.

در ادامه بعضی از حوزه‌هایی که از یادگیری عمیق بهره می‌برند را معرفی کرده‌ایم:

تجربه‌ی مشتری

مدل‌های یادگیری عمیق همین حالا نیز در چت‌بات‌ها به کار می‌روند. اما انتظار داریم در آینده و با تکامل‌یافتن چت‌بات‌ها، از یادگیری عمیق برای بهبود تجربه‌ی مشتری و افزایش رضایت آن‌ها در حوزه‌های مختلف تجاری استفاده کنیم.

تولید متن

در تولید متن ما یک متن را در اختیار ماشین می‌گذاریم تا با استفاده از آن، گرامر و سبک متن را آموزش ببیند. ماشین با استفاده از این متن مدلی را طراحی می‌کند. این مدل می‌تواند به‌صورت خودکار متن جدیدی را تولید کند که با املا و گرامر و سبک متن قبلی سازگار است.

هوا‌‌فضا و ارتش

در صنعت هوا فضا، ماهواره‌ها با استفاده از یادگیری عمیق می‌توانند اشیای مورد‌نظر را تشخیص بدهند. در ارتش نیز با کمک یادگیری عمیق مکان‌های امن و نا‌امن را برای گروهان مشخص می‌کنند.

اتوماسیون صنعتی

یادگیری عمیق باعث افزایش ایمنی کارگران کارخانه‌ها و انبار‌ها می‌شود. برای مثال زمانی که کارگر یا شیء‌ای زیاد از حد به ماشین نزدیک شد، یادگیری عمیق آن را تشخیص می‌دهد.

افزودن رنگ

با استفاده از مدل‌های یادگیری عمیق می‌توانیم عکس‌ها و ویدئو‌های سیاه و سفید را رنگی کنیم. در گذشته این فرایند زمان‌بر بود و کار یدی زیادی را می‌طلبید.

تحقیقات پزشکی

محققان سرطان از یادگیری عمیق برای تشخیص خودکار سلول‌های سرطانی استفاده می‌کنند.

بینایی کامپیوتر

یادگیری عمیق دقت کامپیوتر‌ها را در کار‌هایی مانند شناسایی اشیاء و طبقه‌بندی تصاویر افزایش داده و از این طریق بینایی کامپیوتر را بهتر کرده است.

شاید علاقه‌مند باشید: کاربردهای یادگیری ماشین

محدودیت‌ها و چالش‌های یادگیری عمیق چیست؟

بزرگ‌ترین محدودیت مدل‌های یادگیری عمیق این است که آن‌ها از طریق مشاهدات خود یاد می‌گیرند. یعنی این مدل‌ها تنها چیز‌هایی را می‌دانند که در داده‌های آموزشی‌شان وجود داشته است. بنابراین اگر داده‌های کمی داشته باشید و یا داده‌های شما نماینده‌ی کلیت جامعه‌ی آماری نباشد، این مدل‌ها قابل‌تعمیم نخواهند بود.

مقوله‌ی سوگیری در مدل‌های یادگیری عمیق نیز مشکلاتی اساسی را رقم زده است. اگر یک مدل با استفاده از داده‌های دارای سوگیری آموزش ببیند، خود نیز در پیش‌بینی‌هایش دچار سوگیری خواهد شد. مدل‌های یادگیری عمیق می‌توانند تفاوت‌هایی جزئی را در داده‌ها را تشخیص دهند. اما مشکل آنجاست که در بسیاری از مواقع برنامه‌نویس از این تفاوت‌ها خبر ندارد. برای مثال یک مدل تشخیص چهره ممکن است به‌صورتی سوگیرانه بر اساس عواملی مانند نژاد و جنسیتِ افراد، ویژگی‌های شخصیتی آن‌ها را تبیین کند.

مشکل دیگری که یادگیری عمیق با آن روبروست و در متن نیز به آن اشاره شد، مربوط به نرخ یادگیری است.

اگر نرخ یادگیری خیلی بالا باشد، مدل خیلی زود هم‌گرا می‌شود و نمی‌تواند راهکار بهینه‌ای را ارائه دهد. اگر هم که نرخ یادگیری خیلی پایین باشد، فرایند را متوقف کرده و مانع دستیابی به راهکار می‌شود.

علاوه بر این مدل‌های یادگیری عمیق نیاز به سخت‌افزار‌هایی دارند که هزینه‌‌ی زیاد و مصرف انرژی بالایی دارند. برای مثال یادگیری عمیق برای افزایش بازدهی و کاهش زمان صرف‌شده، به واحد‌های پردازش گرافیکی چند‌هسته‌ای قدرتمندی نیاز دارد.

زبان‌های برنامه‌نویسی مورد استفاده در یادگیری عمیق

در یادگیری عمیق، از زبان‌های برنامه‌نویسی مختلف برای پیاده‌سازی الگوریتم‌ها استفاده می‌شود. مثلا زبان پایتون به دلیل سادگی و قابلیت استفاده بالا یکی از زبان‌های بسیار محبوب در این حوزه است.

اما علاوه بر پایتون، زبان‌های دیگری نیز برای پیاده‌سازی الگوریتم‌های یادگیری عمیق استفاده می‌شوند، از جمله:

MATLAB
C++
Java
R
Lua
TensorFlow (که به عنوان یک کتابخانه در پایتون استفاده می‌شود)

شاید علاقه‌مند باشید: بهترین زبان‌های برنامه‌نویسی برای یادگیری ماشین

جمع‌بندی

در مقاله‌ی یادگیری عمیق چیست سعی کردیم تا به معرفی این حوزه‌ی جذاب از یادگیری ماشین و هوش مصنوعی بپردازیم. یادگیری عمیق از نحوه‌ی کارکرد مغز ما انسان‌ها الهام گرفته است. می‌توان گفت که الگوریتم‌های یادگیری عمیق به‌شیوه‌ای بسیار شبیه به کودکی که در پی شناسایی دنیاست، سعی می‌کنند تا مدل‌هایی را برای پیش‌بینی امور بسازند.

خوشبختانه در عصر کلان‌داده موفق شده‌ایم تا با استفاده از انبوهی از داده‌ها، مدل‌های یادگیری عمیق قدرتمندی را بسازیم. همین مسئله باعث شده تا حوزه‌های متفاوتی از تجارت گرفته تا تحقیقات پزشکی برای همیشه دگرگون شوند. اما هنوز محدودیت‌ها و چالش‌هایی جدی در این حوزه وجود دارد و باید به خاطر داشته باشیم که الگوریتم‌های یادگیری عمیق توسط داده‌هایی که ما به آن‌ها ارائه می‌دهیم آموزش می‌بینند؛ داده‌هایی که اغلب سرشار از سوگیری هستند.

امیدواریم این مقاله برایتان مفید بوده باشد. خوشحال می‌شویم تا نظرات و سوالات خود را در قالب کامنت با ما در میان بگذارید.

منبع:

What Is Deep Learning and How Does It Work?, techtarget.com

آموزش برنامه نویسی با کوئرا کالج