خانه توسعهدهنده مسیر شغلی آیا «دانشمند داده» هنوز جذابترین شغل قرن بیستویک است؟
آیا «دانشمند داده» هنوز جذابترین شغل قرن بیستویک است؟
این مقاله ترجمهای است از مقالهای با همین عنوان نوشتهی Thomas Davenport و Dj Patil که در ۱۵ جولای ۲۰۲۲ در مجلهی Harvard Business Review منتشر شد.
ده سال پیش ما مقالهای با عنوان «دانشمند داده؛ جذابترین شغل قرن بیستویک» منتشر کردیم. این شغل در آن زمان نسبتاً جدید بود، اما هرچه شرکتهای بیشتری تصمیم میگرفتند دادههای بزرگ را تفسیر کنند، نیاز به افرادی که بتوانند مهارتهای برنامهنویسی، تحلیلی و آزمونگیری را با هم ترکیب کنند، بیشتر حس میشد. در آن زمان، این تقاضا تا حد زیادی محدود به خلیج سانفرانسیسکو و چند شهر ساحلی دیگر بود. به نظر میرسید که استارتآپها و شرکتهای فناوری در آن مناطق میخواهند همهی دانشمندان داده را استخدام کنند. بنابراین از آنجایی که کمپانیهای بزرگ، از تحلیلهای تجاری و اشکال و حجم جدید دادهها استقبال کرده بودند، احساس کردیم که نیاز به استخدام دانشمندان داده گسترش پیدا خواهد کرد.
در آن زمان، ما دانشمندان داده را بهعنوان «متخصصین عالیرتبه، آموزشدیده و کنجکاو برای اکتشاف در دنیای کلانداده» تعریف کرده بودیم. شرکتها شروع به تحلیل دادههای حجیم و کمترساختاریافته مانند جریانهای کلیکِ آنلاین، رسانههای اجتماعی، تصاویر و گفتار کرده بودند. از آنجایی که هنوز مسیر شغلی مشخصی برای افرادی که بتوانند با چنین دادههایی برنامهنویسی کرده و آنها را تجزیهوتحلیل کنند وجود نداشت، دانشمندان داده سوابق تحصیلی متنوعی داشتند. در نظرسنجی غیررسمی ما از 35 دانشمند داده در آن زمان، رایجترین مدرک تحصیلی، دکترا در فیزیک تجربی بود، اما ستارهشناسان، روانشناسان و هواشناسان نیز در نظرسنجی ما وجود داشتند. اکثر آنها در رشتههای علمی دکترا داشتند، در ریاضیات استثنایی بودند، میدانستند که چگونه باید کدنویسی کنند و توانایی بینظیری برای دست یافتن به پتانسیل دادهها، مطالعهی مجموعه دادههای پیچیده و نامرتب، و ساختن الگوریتمهای توصیه داشتند. آنها همچنین افراد خلاقی بودند که در آزمونگیری مهارت داشتند.
بعد از یک دهه، اکنون این شغل بیش از هر زمان دیگری مورد تقاضای کارفرمایان و استخدامکنندگان است. هوش مصنوعی در کسبوکارها بهطور فزایندهای درحال محبوبشدن است و شرکتها در هر جا و هر اندازهای احساس میکنند که برای توسعهی مدلهای هوش مصنوعی به دانشمندان داده نیاز دارند. از سال ۲۰۱۲ تا ۲۰۱۹، آگهیهای استخدامی برای دانشمندان داده در Indeed تا ۲۵۶ درصد افزایش یافت و اکنون ادارهی آمار نیروی کار ایالات متحده پیشبینی میکند که تا سال ۲۰۲۹ علم داده رشد بیشتری را نسبت به هر رشته دیگری شاهد خواهد بود. به علاوه، دانشمندان داده عموماً دستمزدهای بسیار خوبی دریافت میکنند؛ متوسط حقوق یک دانشمند دادهی باتجربه در کالیفرنیا تقریباً ۲۰۰,۰۰۰ دلار است.
اما پس از ده سال، بسیاری از مشکلاتِ این شغل همچنان وجود دارند. در تحقیقِ ما برای مقالهی اصلی، بسیاری از دانشمندان داده اظهار داشتند که بیشتر وقت خود را صرف پاکسازی و آمادهسازی دادهها میکنند و اکنون علیرغم پیشرفتهای هوش مصنوعی برای بهبود مدیریت داده، هنوز هم همین طور است. علاوه بر این، بسیاری از سازمانها فرهنگ دادهمحور ندارند و از اطلاعات ارائهشده توسط دانشمندان داده استفاده نمیکنند. بنابراین استخدامشدن و دستمزد خوب لزوماً به این معنی نیست که دانشمندان داده میتوانند در سازمانها تفاوت ایجاد کنند. در نتیجه، بسیاری از دانشمندان داده ناامید و دلسرد شده و این مسئله منجر به افزایش نرخ گردش و جابجایی آنها در سازمانها میشود.
با این حال، این شغل تغییر کرده است؛ هم در ابعاد بزرگ و هم کوچک. پیشرفتهای بزرگی داشته و گسترش پیدا کرده است، دامنهی آن بازتعریف شده است، و اهمیت مهارتهای غیرفنی، مانند اخلاق و مدیریتِ تغییر، افزایش یافته است. بسیاری از مدیرانی که اهمیت علم داده را در کسبوکارشان درک میکنند، اکنون بهجای یک دانشمند دادهی اسطورهای، به ایجاد و نظارت بر تیمهای داده احتیاج دارند. آنها همچنین میتوانند در مورد عمومیکردن علم داده فکر کنند؛ البته همچنان با کمک دانشمندان داده.
فهرست مطالب
Toggleگسترش علم داده
در سال ۲۰۱۲، علم داده حتی در استارتآپهای مبتنی بر هوش مصنوعی، یک شغل نوظهور بود. اما امروزه، حداقل در شرکتهایی که تعهد زیادی به داده و هوش مصنوعی دارند، کاملاً جا افتاده است. بانکها، شرکتهای بیمه، ارائهدهندگان مراقبتهای بهداشتی و حتی سازمانهای دولتی گروههای تحلیل دادهی بزرگی دارند. شرکتهای بزرگِ خدمات مالی ممکن است صدها دانشمند داده داشته باشند. علم داده همچنین در رسیدگی به بحرانهای اجتماعی، شمارش و پیشبینی موارد ابتلا و مرگومیر کووید ۱۹، رسیدگی به بلایای آبوهوایی و حتی مبارزه با اطلاعات نادرست و هکهای سایبریِ مرتبط با حمله به اوکراین مؤثر بوده است.
در سالهای اخیر دورههای آموزشی علم دادهی بسیاری ارائه شده است. در سال ۲۰۱۲، عملاً هیچ برنامهی دانشگاهی برای علم داده وجود نداشت. دانشمندان داده از سایر رشتههای مرتبط با داده استخدام میشدند. اکنون صدها برنامهی دانشگاهی در علم داده یا حوزههای مرتبط با آنالیز و هوش مصنوعی وجود دارد. بیشتر آنها در مقطع کارشناسیارشد ارائه میشوند، اما در مقاطع کارشناسی و دکترا نیز برنامههایی وجود دارد. همچنین تعداد زیادی دورهی آنلاین، بوتکمپ آموزشی و… در زمینههای مرتبط با علم داده وجود دارد. حتی در دبیرستانها نیز دورهها و برنامههای درسی مربوط به علوم داده ارائه میشود. بنابراین واضح است که هرکسی که بخواهد در زمینهی علم داده آموزش ببیند، گزینههای زیادی برای انجام این کار خواهد داشت. با این حال، بعید است که یک برنامهی آموزشی بتواند تمام مهارتهای لازم برای ایدهپردازی، ساخت و استقرار تحلیلها، آزمونها و مدلهای مؤثر و اخلاقی را آموزش دهد. در واقع، مقایسهی برنامهها و دورههای آموزشی حتی در یک مؤسسه، چالشی برای دانشمندان دادهی آینده و شرکتهایی است که مایل به استخدام آنها هستند.
دانشمندان داده و مشاغل دیگر
علم داده اکنون با مشاغل دیگر تکمیل شده است. در سال ۲۰۱۲، فرض بر این بود که دانشمندان داده میتوانند همهی وظایف را در یک پروژهی علم داده انجام دهند؛ از طراحی کاربردها و ارتباط با سهامداران تجاری و فناوری گرفته تا توسعهی الگوریتم و استقرار آن در تولید. با این حال، اکنون برای انجام بسیاری از این وظایف، مشاغلی از جمله مهندس یادگیری ماشین، متخصص هوش مصنوعی، مترجم هوش مصنوعی و مهندس داده ایجاد شده است. لینکدین در گزارشهای خود با عنوان «Jobs on the Rise» در سالهای ۲۰۲۱ و ۲۰۲۲، برخی از این مشاغل را در ایالات متحده بهعنوان مشاغلی محبوبتر از دانشمند داده گزارش کرده است.
یکی از دلایل ایجاد و گسترش این مشاغل این است که هیچ فردی در هیچ عنوان شغلی نمیتوانند تمام مهارتهای موردنیاز برای استقرار موفقیتآمیز یک سیستم هوش مصنوعی را داشته باشند. به علاوه، این موضوع که بسیاری از الگوریتمها هرگز مستقر نمیشوند، هر روز بیشتر شناخته میشود. بنابراین بسیاری از سازمانها تلاش میکنند تا نرخ استقرار را بهبود بخشند. همچنین چالشهای روزافزونِ مدیریت سیستمها و فناوریهای داده، منجر به ایجاد یک محیط فنی پیچیدهتر شده است. در نتیجه شرکتها باید تمام نقشهای موردنیاز برای استقرار مؤثر مدلهای علم داده را در کسبوکار خود شناسایی کرده و اطمینان حاصل کنند که این نقشها در تیم تعریف شدهاند.
تغییرات در تکنولوژی
یکی از دلایل تغییر مداوم این شغل، این است که فناوریهایی که دانشمندان داده از آنها استفاده میکنند، پیوسته در حال تغییر هستند. برخی از تکنولوژیهای امروزی، ادامهی روشهای موجود در سال ۲۰۱۲ هستند؛ مانند استفاده از ابزارهای منبعباز و حرکت بهسمت پردازش و ذخیرهسازی ابری. اما در این سالها شاهد تغییرات اساسی در فناوریهای علم داده نیز بودهایم؛ برای مثال، برخی از جنبههای علم داده بهطور فزایندهای در حال خودکارشدن است (AutoML). خودکارسازی علاوه بر اینکه بهرهوری متخصصان علم داده را بهبود میبخشد، این امکان را برای افراد فراهم میکند تا با کمی آموزش بهعنوان «دانشمندان دادهی شهروند یا citizen data scientists» در علم داده مشارکت کنند. هرچند ابزارهای خودکار هنوز جذابیت دانشمندان حرفهای داده را کم نکردهاند، اما ممکن است در آینده این اتفاق بیفتد.
شرکتها باید شروع به عمومیکردن تحلیلهای پیشرفتهی هوش مصنوعی خود کنند و با تکیه بر دانشمندان دادهی خود از دقت مدلهای توسعهیافته توسط شهروندان اطمینان حاصل کنند.
دانشمندان داده دریافتهاند که مدلها میتوانند در محیطهای تجاری آشفته مانند همهگیری کووید ۱۹ دچار تغییر شوند، بنابراین تأکید جدیدی بر نظارت بر دقت آنها پس از استقرار وجود دارد. عملیاتهای یادگیری ماشین (MLOps)، نظارت مداوم بر مدلها را فراهم میکنند. برخی از ابزارهای AutoML و MLOps حتی آزمونهایی را برای تشخیص بایاس الگوریتمی انجام میدهند.
این پیشرفتها به این معنی است که کدنویسی که شاید رایجترین پیشنیاز شغلی در یک دههی پیش بود، اکنون در علم داده کمتر ضروری است. کدنویسی اکنون به مشاغل دیگر منتقل شده و بهطور فزایندهای در حال خودکارشدن است؛ البته پاکسازی دادهها یک استثنا قابلتوجه برای این روند است. تمرکز اصلیِ شغل دانشمند داده بهسمت مدلسازیهای پیشگویانه و ترجمهی مسائل و نیازمندیهای کسبوکار در قالب مدلها، تغییر مسیر داده است. این فعالیتها مشارکتی هستند، اما متأسفانه هنوز هیچ ابزار خوبی برای ساختاردهی و حمایت از فعالیتهای مشترک در علم داده وجود ندارد.
اخلاق در علم داده
یک تغییر عمده در علم داده این است که اکنون نیاز به بعد اخلاقی در این رشته بهطور گسترده موردتوجه قرار گرفته است. نقطهی عطف اخلاق در علم داده، احتمالاً انتخابات ریاستجمهوری ایالات متحده در سال ۲۰۱۶ بود که در آن دانشمندان داده در رسانههای اجتماعی (بهویژه کمبریج آنالیتیکا و فیسبوک) تلاش کردند تا بر رأیدهندگان تأثیر بگذارند و سیاستهای انتخاباتی را دوقطبی کنند. از آن زمان، مسائل مربوط به بایاس الگوریتمی، شفافیت و استفادهی مسئولانه از تحلیلها و هوش مصنوعی اهمیت بیشتری پیدا کرده است. همچنین در این سالها، مقرراتی که در پاسخ به لغزشهای اخلاقی وضع شدهاند، افزایش یافته است.
در طول این سالها شاهد تداوم و تغییر در شغل دانشمند داده بودهایم. این شغل از بسیاری از جهات بسیار موفق بوده است و برخی از چالشهای آن، مثل گسترش موقعیتهای شغلیِ مرتبط و یا نیاز به رویکردهای اخلاقمدارانه، تا حدی ناشی از استفادهی گسترده از علم داده است. بسیار بعید به نظر میرسد که در سالهای آینده میزان دادهها، تحلیلها و هوش مصنوعی در تجارت و جامعه کاهش یابد. بنابراین شغل «دانشمند داده» از نظر اهمیت در چشمانداز کسبوکار همچنان به رشد خود ادامه خواهد داد.
این شغل همچنان به تغییر ادامه خواهد داد. انتظار میرود که همچنان شاهد شکلگیری مداوم مسئولیتها و نقشهایی باشیم که زمانی همگی در شغل دانشمند داده خلاصه میشدند. شرکتها برای این مشاغل متنوع، به طبقهبندی دقیق مهارتها نیاز دارند و باید اطمینان حاصل کنند که همهی نقشهای موردنیاز، در پروژههای مقیاسبزرگ علم داده حضور دارند. دانشمندان دادهی حرفهای بر نوآوری و خلاقیتهای الگوریتمی تمرکز خواهند داشت. آنها همچنین باید اطمینان حاصل کنند که افراد تازهکار و کمتجربه با مشکلی مواجه نشوند و مهمتر از همه، در جمعآوری مناسب دادهها، تجزیهوتحلیل مسئولانه، مدلهای کاملاً استقراریافته و نتایج تجاری موفق، مشارکت کنند.