آیا «دانشمند داده» هنوز جذاب‌ترین شغل قرن بیست‌و‌یک است؟

17 آگوست 2022

زمان مطالعه: 7 دقیقه

3259

این مقاله ترجمه‌ای است از مقاله‌ای با همین عنوان نوشته‌ی Thomas Davenport و Dj Patil که در ۱۵ جولای ۲۰۲۲ در مجله‌ی Harvard Business Review منتشر شد.

ده سال پیش ما مقاله‌ای با عنوان «دانشمند داده؛ جذاب‌ترین شغل قرن بیست‌و‌یک» منتشر کردیم. این شغل در آن زمان نسبتاً جدید بود، اما هرچه شرکت‌های بیشتری تصمیم می‌گرفتند داده‌های بزرگ را تفسیر کنند، نیاز به افرادی که بتوانند مهارت‌های برنامه‌نویسی، تحلیلی و آزمون‌گیری را با هم ترکیب کنند، بیشتر حس می‌شد. در آن زمان، این تقاضا تا حد زیادی محدود به خلیج سانفرانسیسکو و چند شهر ساحلی دیگر بود. به نظر می‌رسید که استارت‌آپ‌ها و شرکت‌های فناوری در آن مناطق می‌خواهند همه‌ی دانشمندان داده را استخدام کنند. بنابراین از آنجایی که کمپانی‌های بزرگ، از تحلیل‌های تجاری و اشکال و حجم جدید داده‌ها استقبال کرده بودند، احساس کردیم که نیاز به استخدام دانشمندان داده گسترش پیدا خواهد کرد.

در آن زمان، ما دانشمندان داده را به‌عنوان «متخصصین عالی‌رتبه، آموزش‌دیده و کنجکاو برای اکتشاف در دنیای کلان‌داده» تعریف کرده بودیم. شرکت‌ها شروع به تحلیل داده‌های حجیم و کم‌تر‌ساختاریافته مانند جریان‌های کلیکِ آنلاین، رسانه‌های اجتماعی، تصاویر و گفتار کرده بودند. از آنجایی که هنوز مسیر شغلی مشخصی برای افرادی که بتوانند با چنین داده‌هایی برنامه‌نویسی کرده و آن‌ها را تجزیه‌و‌تحلیل کنند وجود نداشت، دانشمندان داده سوابق تحصیلی متنوعی داشتند. در نظرسنجی غیررسمی ما از 35 دانشمند داده در آن زمان، رایج‌ترین مدرک تحصیلی، دکترا در فیزیک تجربی بود، اما ستاره‌شناسان، روانشناسان و هواشناسان نیز در نظرسنجی ما وجود داشتند. اکثر آن‌ها در رشته‌های علمی دکترا داشتند، در ریاضیات استثنایی بودند، می‌دانستند که چگونه باید کدنویسی کنند و توانایی بی‌نظیری برای دست یافتن به پتانسیل داده‌ها، مطالعه‌ی مجموعه داده‌های پیچیده و نامرتب، و ساختن الگوریتم‌های توصیه داشتند. آن‌ها همچنین افراد خلاقی بودند که در آزمون‌‌گیری مهارت داشتند.

بعد از یک دهه، اکنون این شغل بیش از هر زمان دیگری مورد تقاضای کارفرمایان و استخدام‌کنندگان است. هوش مصنوعی در کسب‌و‌کارها به‌طور فزاینده‌ای درحال محبوب‌شدن است و شرکت‌ها در هر جا و هر اندازه‌ای احساس می‌کنند که برای توسعه‌ی مدل‌های هوش مصنوعی به دانشمندان داده نیاز دارند. از سال ۲۰۱۲ تا ۲۰۱۹، آگهی‌های استخدامی برای دانشمندان داده در Indeed تا ۲۵۶ درصد افزایش یافت و اکنون اداره‌ی آمار نیروی کار ایالات متحده پیش‌بینی می‌کند که تا سال ۲۰۲۹ علم داده رشد بیشتری را نسبت به هر رشته دیگری شاهد خواهد بود. به علاوه، دانشمندان داده عموماً دستمزدهای بسیار خوبی دریافت می‌کنند؛ متوسط حقوق یک دانشمند داده‌ی با‌تجربه در کالیفرنیا تقریباً ۲۰۰,۰۰۰ دلار است.

اما پس از ده سال، بسیاری از مشکلاتِ این شغل همچنان وجود دارند. در تحقیقِ ما برای مقاله‌ی اصلی، بسیاری از دانشمندان داده اظهار داشتند که بیشتر وقت خود را صرف پاک‌سازی و آماده‌سازی داده‌ها می‌کنند و اکنون علی‌رغم پیشرفت‌های هوش مصنوعی برای بهبود مدیریت داده، هنوز هم همین طور است. علاوه بر این، بسیاری از سازمان‌ها فرهنگ داده‌محور ندارند و از اطلاعات ارائه‌شده توسط دانشمندان داده استفاده نمی‌کنند. بنابراین استخدام‌شدن و دستمزد خوب لزوماً به این معنی نیست که دانشمندان داده می‌توانند در سازمان‌ها تفاوت ایجاد کنند. در نتیجه، بسیاری از دانشمندان داده ناامید و دلسرد شده و این مسئله منجر به افزایش نرخ گردش و جابجایی آن‌ها در سازمان‌ها می‌شود.

با این حال، این شغل تغییر کرده است؛ هم در ابعاد بزرگ و هم کوچک. پیشرفت‌های بزرگی داشته و گسترش پیدا کرده است، دامنه‌ی آن بازتعریف شده است، و اهمیت مهارت‌های غیرفنی، مانند اخلاق و مدیریتِ تغییر، افزایش یافته است. بسیاری از مدیرانی که اهمیت علم داده را در کسب‌وکارشان درک می‌کنند، اکنون به‌جای یک دانشمند داده‌ی اسطوره‌ای، به ایجاد و نظارت بر تیم‌های داده‌ احتیاج دارند. آن‌ها همچنین می‌توانند در مورد عمومی‌کردن علم داده فکر کنند؛ البته همچنان با کمک دانشمندان داده.

فهرست مطالب

گسترش علم داده

در سال ۲۰۱۲، علم داده حتی در استارت‌آپ‌های مبتنی بر هوش مصنوعی، یک شغل نوظهور بود. اما امروزه، حداقل در شرکت‌هایی که تعهد زیادی به داده‌ و هوش مصنوعی دارند، کاملاً جا افتاده است. بانک‌ها، شرکت‌های بیمه، ارائه‌دهندگان مراقبت‌های بهداشتی و حتی سازمان‌های دولتی گروه‌های تحلیل داده‌ی بزرگی دارند. شرکت‌های بزرگِ خدمات مالی ممکن است صدها دانشمند داده داشته باشند. علم داده همچنین در رسیدگی به بحران‌های اجتماعی، شمارش و پیش‌بینی موارد ابتلا و مرگ‌و‌میر کووید ۱۹، رسیدگی به بلایای آب‌و‌هوایی و حتی مبارزه با اطلاعات نادرست و هک‌های سایبریِ مرتبط با حمله به اوکراین مؤثر بوده است.

در سال‌های اخیر دوره‌های آموزشی علم داده‌ی بسیاری ارائه شده‌ است. در سال ۲۰۱۲، عملاً هیچ برنامه‌ی دانشگاهی برای علم داده وجود نداشت. دانشمندان داده از سایر رشته‌های مرتبط با داده استخدام می‌شدند. اکنون صدها برنامه‌ی دانشگاهی در علم داده یا حوزه‌های مرتبط با آنالیز و هوش مصنوعی وجود دارد. بیشتر آن‌ها در مقطع کارشناسی‌ارشد ارائه می‌شوند، اما در مقاطع کارشناسی و دکترا نیز برنامه‌هایی وجود دارد. همچنین تعداد زیادی دوره‌ی آنلاین، بوت‌کمپ آموزشی و… در زمینه‌های مرتبط با علم داده وجود دارد. حتی در دبیرستان‌ها نیز دوره‌ها و برنامه‌های درسی مربوط به علوم داده ارائه می‌شود. بنابراین واضح است که هرکسی که بخواهد در زمینه‌ی علم داده آموزش ببیند، گزینه‌های زیادی برای انجام این کار خواهد داشت. با این حال، بعید است که یک برنامه‌ی آموزشی بتواند تمام مهارت‌های لازم برای ایده‌پردازی، ساخت و استقرار تحلیل‌ها، آزمون‌ها و مدل‌های مؤثر و اخلاقی را آموزش دهد. در واقع، مقایسه‌ی برنامه‌ها و دوره‌های آموزشی حتی در یک مؤسسه، چالشی برای دانشمندان داده‌ی آینده و شرکت‌هایی است که مایل به استخدام آن‌ها هستند.

دانشمندان داده و مشاغل دیگر

علم داده اکنون با مشاغل دیگر تکمیل شده است. در سال ۲۰۱۲، فرض بر این بود که دانشمندان داده می‌توانند همه‌ی وظایف را در یک پروژه‌ی علم داده انجام دهند؛ از طراحی کاربردها و ارتباط با سهام‌داران تجاری و فناوری گرفته تا توسعه‌ی الگوریتم و استقرار آن در تولید. با این حال، اکنون برای انجام بسیاری از این وظایف، مشاغلی از جمله مهندس یادگیری ماشین، متخصص هوش مصنوعی، مترجم هوش مصنوعی و مهندس داده ایجاد شده است. لینکدین در گزارش‌های خود با عنوان «Jobs on the Rise» در سال‌های ۲۰۲۱ و ۲۰۲۲، برخی از این مشاغل را در ایالات متحده به‌عنوان مشاغلی محبوب‌تر از دانشمند داده گزارش کرده است.

یکی از دلایل ایجاد و گسترش این مشاغل این است که هیچ فردی در هیچ عنوان شغلی نمی‌توانند تمام مهارت‌های مورد‌نیاز برای استقرار موفقیت‌آمیز یک سیستم هوش مصنوعی را داشته باشند. به علاوه، این موضوع که بسیاری از الگوریتم‌ها هرگز مستقر نمی‌شوند، هر روز بیشتر شناخته می‌شود. بنابراین بسیاری از سازمان‌ها تلاش می‌کنند تا نرخ استقرار را بهبود بخشند. همچنین چالش‌های روزافزونِ مدیریت سیستم‌ها و فناوری‌های داده، منجر به ایجاد یک محیط فنی پیچیده‌تر شده است. در نتیجه‌ شرکت‌ها باید تمام نقش‌های مورد‌نیاز برای استقرار مؤثر مدل‌های علم داده را در کسب‌و‌کار خود شناسایی کرده و اطمینان حاصل کنند که این نقش‌ها در تیم تعریف شده‌اند.

تغییرات در تکنولوژی

یکی از دلایل تغییر مداوم این شغل، این است که فناوری‌هایی که دانشمندان داده از آن‌ها استفاده می‌کنند، پیوسته در حال تغییر هستند. برخی از تکنولوژی‌های امروزی، ادامه‌ی روش‌های موجود در سال ۲۰۱۲ هستند؛ مانند استفاده از ابزارهای منبع‌باز و حرکت به‌سمت پردازش و ذخیره‌سازی ابری. اما در این سال‌ها شاهد تغییرات اساسی در فناوری‌های علم داده نیز بوده‌ایم؛ برای مثال، برخی از جنبه‌های علم داده به‌طور فزاینده‌ای در حال خودکار‌شدن است (AutoML). خودکارسازی علاوه بر اینکه بهره‌وری متخصصان علم داده را بهبود می‌بخشد، این امکان را برای افراد فراهم می‌کند تا با کمی آموزش به‌عنوان «دانشمندان داده‌ی شهروند یا citizen data scientists» در علم داده مشارکت کنند. هرچند ابزارهای خودکار هنوز جذابیت دانشمندان حرفه‌ای داده را کم نکرده‌اند، اما ممکن است در آینده این اتفاق بیفتد.

شرکت‌ها باید شروع به عمومی‌کردن تحلیل‌های پیشرفته‌ی هوش مصنوعی خود کنند و با تکیه بر دانشمندان داده‌ی خود از دقت مدل‌های توسعه‌یافته توسط شهروندان اطمینان حاصل کنند.

دانشمندان داده دریافته‌اند که مدل‌ها می‌توانند در محیط‌های تجاری آشفته مانند همه‌گیری کووید ۱۹ دچار تغییر شوند، بنابراین تأکید جدیدی بر نظارت بر دقت آن‌ها پس از استقرار وجود دارد. عملیات‌های یادگیری ماشین (MLOps)، نظارت مداوم بر مدل‌ها را فراهم می‌کنند. برخی از ابزارهای AutoML و MLOps حتی آزمون‌هایی را برای تشخیص بایاس الگوریتمی انجام می‌دهند.

این پیشرفت‌ها به این معنی است که کدنویسی که شاید رایج‌ترین پیش‌نیاز شغلی در یک دهه‌ی پیش بود، اکنون در علم داده کمتر ضروری است. کدنویسی اکنون به مشاغل دیگر منتقل شده و به‌طور فزاینده‌ای در حال خودکار‌شدن است؛ البته پاک‌سازی داده‌ها یک استثنا قابل‌توجه برای این روند است. تمرکز اصلیِ شغل دانشمند داده به‌سمت مدل‌سازی‌های پیش‌گویانه و ترجمه‌ی مسائل و نیازمندی‌های کسب‌و‌کار در قالب مدل‌ها، تغییر مسیر داده است. این فعالیت‌ها مشارکتی هستند، اما متأسفانه هنوز هیچ ابزار خوبی برای ساختاردهی و حمایت از فعالیت‌های مشترک در علم داده وجود ندارد.

اخلاق در علم داده

یک تغییر عمده در علم داده این است که اکنون نیاز به بعد اخلاقی در این رشته به‌طور گسترده مورد‌توجه قرار گرفته است. نقطه‌ی عطف اخلاق در علم داده، احتمالاً انتخابات ریاست‌جمهوری ایالات متحده در سال ۲۰۱۶ بود که در آن دانشمندان داده در رسانه‌های اجتماعی (به‌ویژه کمبریج آنالیتیکا و فیس‌بوک) تلاش کردند تا بر رأی‌دهندگان تأثیر بگذارند و سیاست‌های انتخاباتی را دوقطبی کنند. از آن زمان، مسائل مربوط به بایاس الگوریتمی، شفافیت و استفاده‌ی مسئولانه از تحلیل‌ها و هوش مصنوعی اهمیت بیشتری پیدا کرده است. همچنین در این سال‌ها، مقرراتی که در پاسخ به لغزش‌های اخلاقی وضع شده‌اند، افزایش یافته است.

در طول این سال‌ها شاهد تداوم و تغییر در شغل دانشمند داده بوده‌ایم. این شغل از بسیاری از جهات بسیار موفق بوده است و برخی از چالش‌های آن، مثل گسترش موقعیت‌های شغلیِ مرتبط و یا نیاز به رویکرد‌های اخلاق‌مدارانه، تا حدی ناشی از استفاده‌ی گسترده از علم داده است. بسیار بعید به نظر می‌رسد که در سال‌های آینده میزان داده‌ها، تحلیل‌ها و هوش مصنوعی در تجارت و جامعه کاهش یابد. بنابراین شغل «دانشمند داده» از نظر اهمیت در چشم‌انداز کسب‌و‌کار همچنان به رشد خود ادامه خواهد داد.

این شغل همچنان به تغییر ادامه خواهد داد. انتظار می‌رود که همچنان شاهد شکل‌گیری مداوم مسئولیت‌ها و نقش‌هایی باشیم که زمانی همگی در شغل دانشمند داده خلاصه می‌شدند. شرکت‌ها برای این مشاغل متنوع، به طبقه‌بندی دقیق مهارت‌ها نیاز دارند و باید اطمینان حاصل کنند که همه‌ی نقش‌های مورد‌نیاز، در پروژه‌های مقیاس‌بزرگ علم داده حضور دارند. دانشمندان داده‌ی حرفه‌ای بر نوآوری و خلاقیت‌های الگوریتمی تمرکز خواهند داشت. آن‌ها همچنین باید اطمینان حاصل کنند که افراد تازه‌کار و کم‌تجربه با مشکلی مواجه نشوند و مهم‌تر از همه، در جمع‌آوری مناسب داده‌ها، تجزیه‌و‌تحلیل مسئولانه، مدل‌های کاملاً استقراریافته و نتایج تجاری موفق، مشارکت کنند.

آموزش برنامه نویسی با کوئرا کالج