امروزه شرکتهای موفق جهان نسبت به دیتا ساینس یا همان علم داده ارزش زیادی قائل هستند. یکی از مهمترین دلایل آن، امکان شناخت بیشتر مشتریان، خدماترسانی بهتر به آنها و کسب سود بیشتر است. دیتا ساینتیست به افرادی اطلاق میشود که از دادههای مختلف، اطلاعاتی را در رابطههای جنبههای گوناگون کسبوکار و مشتریان جمعآوری و تحلیل میکنند. علاوه بر این، دیتا ساینتیستها با استفاده از دانش فنی خود، میتوانند سناریوهای احتمالی آینده را نیز پیشبینی کنند. از آنجایی که اطلاعات مهمترین دارایی هر شرکتی است، موقعیت شغلی دیتا ساینتیست نیز روز به روز درحال تبدیل شدن به یکی از پرتقاضاترین مشاغل است. ضمنا از درآمد خوب آن نیز نباید غافل شویم.
فهرست مطالب
دیتا ساینتیست Data Scientist کیست و چه وظایفی دارد؟
دیتا ساینتیست فردی حرفهای است که با بهرهگیری از روشهای علمی، استدلالهای آماری و ابزارهای محاسباتی، بینشهایی را از دادههای ساختاریافته و بدون ساختار استخراج میکند. او پلی میان آمار، علوم کامپیوتر و دانش حوزهای ایجاد میکند و دادههای خام را به درکی کاربردی تبدیل میسازد که در تصمیمگیریها میتوان از آنها استفاده کرد. مهارتهای پرسشگری و استفاده از تکنیکهای الگوریتمی برای استفاده بهینه از دادههای پیچیده و نامرتب ضروری هستند.
نخستین مرحله کار یک دیتا ساینتیست، با گردآوری و پاکسازی (Data Cleaning) داده آغاز میشود. این یعنی جمعآوری دادههای مرتبط از پایگاههای داده، APIها، وب اسکرپینگ یا ابزارهای سازمانی مانند سیستمهای ERP سپس آمادهسازی آنها (اصلاح خطاها، یکسانسازی قالبها، مدیریت دادههای ناقص) بهگونهای که برای تحلیل قابل استفاده باشند.
وقتی دادهها آماده شدند، مرحله تحلیل اکتشافی داده (Exploratory Data Analysis یا EDA) آغاز میشود به معنای بررسی ساختار و ویژگیهای داده، ترسیم روندها، شناسایی نقاط غیرعادی و شکلدهی فرضیههای اولیه. بسته به نیاز کسبوکار یا الگوهای پنهانی که آشکار میشوند، دیتا ساینتیست مدلهای پیشرفتهای طراحی و پیادهسازی میکند: از الگوریتمهای پیشبینی و سیستمهای طبقهبندی گرفته تا خوشهبندی، شبیهسازی یا حتی راهکارهای هوش مصنوعی، با هدف پیشبینی نتایج یا کشف الگوهای رفتاری.
بخش بعدی کار دیتا ساینتیست، انتقال موثر نتایج است. که با مصورسازی از طریق داشبوردها محقق میشود. انتقال درست نتایج تحلیل دادهه به ذینفعان، باعث قابل فهم شدن آنها و در نتیجه گرفتن تصمیمات درست میشود. به عبارت دیگر ارائه نتایج تحلیل داده به روشی غیر کارآمد، ممکن است ارزش آن را از بین ببرد و موجب تلف شدن تلاشهای دیتا ساینتیست شود.
اما کار دیتا ساینتیستها فقط به تحلیل فنی دادهها محدود نمیشود. آنها میتوانند در زمینه استراتژی سازمانی هم فعالیت کنند و با همکاریهایی که با تیمهای مختلف سازمان دارند، به راهبرد سازمانی و تصمیمگیری کلان کمک کنند. در واقع این موضوع به میزان دادهمحور بودن سازمان مربوط میشود. همه سازمانهای موفق با این رویکرد چشمانداز آینده خود را مبتنی بر شواهد و دادهها تعیین میکنند.
وظایف اصلی یک دیتا ساینتیست |
|
جمعآوری و پاکسازی داده |
طبقهبندی دادهها |
تحلیل اکتشافی دادهها |
مصورسازی دادهها |
ارائه نتایج تحلیل داده به ذینفعان |
همکاری استراتژیک با بخشهای مختلف سازمان |
آینده شغلی دیتا ساینتیست در ایران و جهان
با توجه به اینکه روند تقاضا برای دیتا ساینتیستها رو به رشد است، اداره آمار کار ایالات متحده پیشبینی میکند که بین سالهای ۲۰۲۴ تا ۲۰۳۴ اشتغال در این حوزه 34 درصد رشد خواهد داشت و دانشمندان داده را در رتبه چهارم سریعترین مشاغل رو به رشد در اقتصاد آمریکا قرار میدهد. علاوه بر این طبق گزارشی از دانشگاه توئنته هلند، تقاضا برای دیتا ساینتیستها در نقشهای متنوع صنعتی و تحقیقاتی رشد قابل توجهی دارد.
در مورد دستمزد نیز دیتاساینتیستهای تازهکار در آمریکا در سال 2025 بهطور متوسط سالانه حدود 152 هزار دلار دریافت میکنند که نسبت به سال قبل 35 هزار دلار افزایش داشته است. علاوه بر این، میانگین حقوق دیتا ساینتیستهای با تجربه متوسط و بالا به ترتیب 193 هزار و 215 هزار دلار برآورد شده است. این دادهها نشانگر این واقعیت هستند که کارفرمایان ارزش زیادی برای دیتا ساینس یا همان علم داده قائل هستند. در ایران نیز اخیرا توجه مدیران به این موضوع جلب شده و احتمالا تا چند سال دیگر شاهد اوجگیری تقاضا برای دانشمندان علم داده باشیم.
دیتا ساینتیستها همچنین میتوانند در حوزه یادگیری عمیق (Deep Learning)، پردازش زبان طبیعی (NLP) و یادگیری ماشین (Machine Learning) نیز ورود نمایند و با توجه به ترندهای جهانی و داغ شدن هوش مصنوعی، از دانش خود در زمینههایی مثل فینتک، سلامت، خردهفروشی، مخابرات، تولید، انرژی و رسانه استفاده نمایند. اگر به یادگیری کاربردی این موضوعات علاقهمند هستید، دوره آموزش یادگیری عمیق با پایتون Deep Learning by Python و دوره آموزش یادگیری ماشین با پایتون Machine Learning by Python را از دست ندهید.
ظهور هوش مصنوعی و روند به سرعت رو به گسترش آن، علم داده را هم مانند بسیاری از مشاغل دیگر تحت تاثیر قرار خواهد داد. بدیهی است که در آیندهای نزدیک، هوش مصنوعی جای مشاغل روتین و تکراری را خواهد گرفت. اما دیتا ساینتیستهای حرفهای میتوانند از هوش مصنوعی به عنوان ابزاری مکمل برای توسعه فعالیتهای خود و بهبود بهرهوری استفاده نمایند. به عبارتی دیگر با بازتعریف فرآیندهای کاری، دیتا ساینتیستها میتوانند از هوش مصنوعی به عنوان پلهای برای جهش علم داده استفاده کنند و با آن سازگار شوند.
مهارتهای ضروری برای تبدیل شدن به یک دیتا ساینتیست موفق
در مقاله علم داده جهان ما را متحول کرده است؟ اشاره کردیم که دانشمندان داده باید با دانش و مهارتهای ارتباطی خاص صنعت، کنجکاو و نتیجهگرا باشند که به آنها امکان میدهد نتایج بسیار فنی را برای همتایان غیرفنی خود توضیح دهند. علم داده نیز مانند تمام حرفههای دیگر، شامل مجموعهای از مهارتها میشود که برای موفقیت ضروری هستند. این مهارتها نیز شامل هر دو نوع مهارتهای نرم و مهارتهای سخت میشوند. مهارتهای نرم برای یک دیتا ساینتیست از آن حهت ضروری هستند که بدون شبکهسازی، ارتباط تیمی و ارائه صحیح نتایج تحلیل داده، نمیتوان در این زمینه به موفقیت رسید. در مورد مهارتهای فنی هم نکات بسیار زیادی وجود دارد که در این بخش به بیان مختصر و مفید مهمترین آنها میپردازیم.
- تسلط به زبان برنامهنویسی پایتون Python
پایتون یک زبان متنباز، مفسر و سطح بالاست، به همین خاطر بسیاری یادگیری برنامهنویسی را از پایتون شروع میکنند. پایتون یک زبان همهفنحریف و قدرتمند میباشد و در بسیاری از حوزهها کاربرد دارد. از جمله فریمورکهای محبوب پایتون، Django میباشد که در برنامهنویسی سمت سرور از آن استفاده میگردد. این فریمورک بهطور جامع در دوره آموزش پایتون PYTHON پیشرفته تدریس میشود. همچنین در ساخت اپلیکیشنهای موبایل، یادگیری ماشین، ساخت بازیهای رایانهای، بیگدیتا و همچنین در اقتصاد و به خصوص در بورس بسیار مورد استفاده قرار میگیرد. از مزیتهای پایتون این است که برنامههای نوشتهشده توسط آن به سبک ماژولار هستند؛ یعنی کدهای نوشتهشده در یک پروژه میتواند در پروژههای دیگر هم مورد استفاده قرار بگیرد. پایتون کتابخانههایی مثل NumPy و Matplotlib دارد که محبوبترین کتابخانهها بین دیتاساینتیستها هستند.
- تسلط زبان برنامهنویسی R
زبان برنامهنویسی R، زبانی جهت تحلیل دادهها و فعالیتهای آماری است. با استفاده از زبان برنامهنویسی R میتوانید مسئلههای مربوط به دادهها را حل کنید. یادگیری زبان R دشوار است، مخصوصا زمانی که قبل از آن تجربه برنامهنویسی با زبان دیگری را نداشته باشید.
- تسلط به اس کیو ال SQL
دیتابیس SQL یکی از قویترین و رایجترین نرمافزارهای پایگاه داده است که بهصورت عمده مورد استفاده سیستمهای مختلف اعم از وبسایتها، نرمافزارهای ویندوز و دیگر ماژولهایی که به ذخیره اطلاعات در پایگاه داده نیاز دارند قرار میگیرد. این نرمافزار به دلیل اهمیت در مراحل طراحی و پیادهسازی بسیاری از سیستمهای هوشمند، مورد توجه قرار میگیرد. همانطور که در دوره آموزش اس کیو ال MY SQL تدریس میشود، نرم افزار SQL Server یکی از قدرتمندترین و پرکاربردترین سیستمهای مدیریت پایگاه داده است که وظیفه ذخیرهسازی و بازیابی دادهها را به درخواست برنامههای کاربردی دیگر بر عهده دارد، این برنامهها میتوانند بر روی همان کامپیوتر یا در سراسر یک شبکه اجرا شوند.
- یادگیری ماشین و هوش مصنوعی
برای اینکه به دیتا ساینتیست ماهری تبدیل شوید، یادگیری هوش مصنوعی کمک فراوانی میکند. یادگیری هوش مصنوعی و تسلط به الگوریتمها و مفاهیم آن کاری دشوار و زمانبر است، اما کتابخانه تنسورفلو (TensorFlow) در پایتون میتواند یادگیری هوش مصنوعی را با استفاده از روشهای موجود تا حدی آسان کند. همانطور که در دوره آموزش ابزارهای هوش مصنوعی برای مدیران مورد تدریس قرار میگیرد، هوش مصنوعی (AI) دیگر تنها یک فناوری پیچیده نیست؛ بلکه ابزاری کلیدی برای تصمیمگیریهای هوشمند و بهینه در مدیریت سازمانها است.
- مصورسازی دادهها Data Visualization
مهارت مصورسازی دادهها برای یک دیتا ساینتیست موضوعی بسیار مهم است. بدون آن میتواند تحلیل کند، مدل بسازد و پیشبینی انجام دهد، اما نمیتواند نتایج را به شکلی قابلفهم و متقاعدکننده منتقل کند. در واقع، مصورسازی پلی است میان دنیای پیچیده ریاضی و آماری و ادراک انسانها. در دوره آموزش ام اس پاور بی آی MS POWER BI با یادگیری تکنیکهای مدلسازی، تحلیل و بصریسازی، شما قادر خواهید بود تصمیمات بهتری در کسب و کار خود بگیرید و به بهبود عملکرد سازمانتان کمک کنید.
ویژگیهای شخصیتی و رفتاری یک دیتا ساینتیست حرفهای
همانطور که پیشتر نیز اشاره شد، موفقیت در علم داده ویژگیهای رفتاری خاصی را میطلبد. یک دیتا ساینتیست موفق، باید فردی با دقت و جزئینگر باشد، پشتکار و صبر فراوانی داشته باشد و برای این که بتواند دید کلی از مسئله به مدیران خود دهد باید خلاقیت بالایی داشته باشد. علاوه بر این موارد، سایر ویژگیهای کلیدی عبارتند از:
- کنجکاوی ذهنی
- تفکر تحلیلی قوی
- انعطافپذیری و سازگاری با تغییر
- مدیریت زمان و اولویتبندی هوشمندانه
جمعبندی
در این مقاله به معرفی ماهیت و توضیح اهمیت علم داده پرداختیم. همچنین مهارتهای مورد نیاز برای موفقیت در این حوزه و تبدیل شدن به یک دیتا ساینتیست را معرفی کردیم. داشتن مدرک دکترا و یا کارشناسی ارشد جهت فعالیت حرفهای در حوزه دیتا ساینس لازم میباشد و و بهتر است کارشناسی خود را در یکی از این حوزه های آیتی، علوم کامپیوتر، ریاضیات، فیزیک، آمار، مهندسی صنایع یا مدیریت صنعتی گذرانده باشید اما بدیهی است که مهارتهای عملی و کاربردی که در دورههای گروه آموزشی پارس پژوهان نیز به آنها پرداخته میشود، اولویت بالاتری نسبت به مدارک دانشگاهی دارند. همینطور باید قبل از این که وارد حوزه دیتا ساینس شوید، اطلاعات و دانش مورد نیاز درباره این حوزه را داشته باشید.
نویسنده: رضا صفایی، کارشناس مدیریت صنعتی