آیا Data Science در حال مرگ است؟ آیا شغل Data Science بیش از حد اشباع شده است؟ و آیا برای ورود به این بحث دیر شده است؟ اخیراً این سؤالات متداول ترین سؤالات در YouTube، Twitter، LinkedIn و حتی اینستاگرام در میان برنامه نویسان و تحلیل گران داده بوده است. به نظر می رسد که این سؤالات شک برانگیز آنها از سه منبع اصلی ناشی می شود:

۱- آنها فکر می کنند که “روند تحلیل داده ” به پایان رسیده است و جامعه آن به بزرگترین سطح ممکن رسیده است.

۲- آنها می شنوند که بسیاری از وظایف Data Science ممکن است خودکار شوند، بنابراین معتقدند اتوماسیون جایگزین نیاز به مهارت های اینچنینی خواهد شد.

۳- فکر می کنند مشاغل مربوطه بیش از حد اشباع شده و یا در آینده ای نزدیک به این سطح از اشباع برسد.

در این مقاله ارزیابی می‌کنیم که آیا این ادعاها صحت دارد یا خیر. همچنین تلاش می کنیم تا روشن کنیم که این دغدغه ها برای دانشمندان داده چه معنایی به همراه دارد.

قبل از هر چیز بهتر است کمی در مورد Data Science بیشتر بدانیم. در ویدیو زیر به معرفی اجمالی این موضوع پرداخته شده است.

آیا Data Science رو به افول است؟

قبل از اینکه به بررسی نظرات شخصی کارشناسان و منتقدان در این خصوص بپردازیم، مهم است که به داده ها نگاهی بیندازیم. بیایید به Google Trends نگاه کنیم تا ببینیم که آیا Data Science هنوز یک موضوع معتبر است یا خیر.

فقط با نگاه کردن به نمودار بالا، می بینیم که علاقه به این رشته در طول ۵ سال گذشته بسیار ثابت بوده است. می بینیم که یادگیری ماشین نیز روند مشابهی را دنبال کرده است. به طور اجمالی، این نتیجه برای Data Science در آینده قابل پیش بینی است. هیچ صعود یا نزول شدیدی وجود ندارد.

این می تواند نشان دهد که مقوله در آینده نزدیک به طور ناگهانی ناپدید نخواهد شد. در هر صورت، در طول زمان کاهش تدریجی وجود خواهد داشت، که در حال حاضر هیچ مدرکی در مورد آن وجود ندارد.

وقتی هوش مصنوعی را به ترکیب اضافه می‌کنیم، یک روند صعودی کاملاً واضح را می‌توان در نمودار بالا مشاهده کرد. به طور روایی، این می تواند یک مطلب خوب یا بد باشد. خبر خوب این است که اکثر دانشمندان داده در حال کار بر روی پروژه های هوش مصنوعی موجود هستند. اگر این وضعیت ادامه پیدا کند، این نوید خوبی برای دانشمندان داده است. از طرف دیگر، اگر تخصص بیشتری در هوش مصنوعی مورد نیاز باشد.

پس از این تحلیل بر روی روند پیشرفت و یا پسرفت این حوزه، ما این مساله را به عنوان یک نقطه آزمایشی برای تثبیت علم داده در نظر می گیریم. استفاده از داده ها برای تصمیم گیری البته ملاک مطمئنی نیست. 

آیا اتوماسیون در Data Science به کار گرفته خواهد شد؟

AutoML، ابزار های بدون نیاز به کدنویسی، و پلتفرم های کلان داده در چند سال اخیر به طور فزاینده ای محبوب شده اند. بسیاری از مردم بر این باورند که پیشرفت در این ابزارها جایگزین بسیاری از کارهایی خواهد شد که دانشمندان داده در حال حاضر انجام می دهند.

آیا این ادعا ها محلی از اعتبار دارند؟

بهترین کاری که می توانیم انجام دهیم این است که به سایر زمینه های مشابه نگاه کنیم تا ببینیم آیا فناوری روز دنیا آن ها را مختل کرده است یا خیر. یکی از مواردی که همیشه برای بررسی مناسب است حسابداری است. تقریباً همه کارهایی که در این زمینه انجام می شود جایگزین فناوری شده است. با این حال، هنوز تقاضای فزاینده ای برای حسابداران و حسابرسان وجود دارد.

Data Science را نیز می توان به همین صورت بررسی نمود. حتی اگر ابزار ها به کسی کمک کنند تا تجزیه و تحلیل را انجام دهد، مشکلاتی پیش خواهد آمد. آیا این در تفسیر نتایج راحت خواهند بود؟ آیا این ابزار ها قادر خواهند بود محدودیت‌ های مدل‌ها یا نتایج عجیب و غریبی که می‌گیرند را درک کنند؟

مطالعه موردی دیگر در خصوص توسعه دهندگان وب خواهد بود. در تئوری، رابط‌های کاربری گرافیکی وجود دارد که به شما امکان می‌دهد به تنهایی یک وب‌ سایت بسازید که ظاهر بسیار خوبی دارد، اما توسعه‌ دهندگان وب هنوز هم تقاضای بالایی دارند.

ایجاد سفارشی سازی های منحصر به فرد برای وب سایت ها، حتی با بهترین ابزارهای توسعه وب گرافیکی، هنوز دشوار است. شرکت‌ ها کنترل بیشتری روی وب‌ سایت‌ ها و محصولات خود دارند، به خصوص زمانی که آنها توسط خودشان طراحی شده و توسعه داده می شوند.

در مورد آینده ای قابل پیش بینی، اتوماسیون برای حل مشکلات در مقیاس عمومی عالی است، اما آن ها با راه حل های بسیار خاص و سفارشی سازی های منحصر به فرد دست و پنجه نرم می کنند. برای شخصی که در گاراژ خود یک وب سایت برای تجارت خود ایجاد می کند، این ابزار ها عالیست، اما برای یک شرکت Fortune 500، تقریباً تمام ابزارهای اتوماسیون محدود کننده و ناکارآمد خواهند بود.

چه خوب و چه بد، Data Science بسیار در مورد موارد لبه تکنولوژی و تجزیه و تحلیل منحصر به فرد است. در حالی که AutoML می‌تواند برای دریافت مدل‌ های پایه و پیشفرض عالی باشد، تفاوت‌ های ظریف در داده‌ ها همچنان به چشمان فردی با تجربه واقعی Data Science نیازمند است.

هم حسابداری و هم توسعه وب منعطف تر هستند تا در فناوری حل شوند. فناوری همچنین برای مدت طولانی تری وجود داشته است تا آن ها را مختل کند. با وجود ابزارهای جدید، این زمینه ها همچنان در حال رشد هستند و من انتظار دارم Data Science نیز چنین باشد.

در واقع، ابزارهای جدید می توانند کار علم داده را ارزشمندتر کنند. ابزارهایی که به ما امکان می‌دهند بینش‌ ها را راحت‌ تر برای کارفرمایان توضیح دهیم، یک موهبت خواهند بود. در حالی که فکر نمی‌کنم فناوری‌ های جدید نیاز به دانشمندان داده را کاهش دهند، من فکر می‌کنم که نقش دانشمند داده احتمالاً تغییر خواهد کرد.

به‌ جای سرمایه‌گذاری زمان زیادی برای مدل‌ های آموزشی (وظیفه‌ای که AutoML به خوبی انجام می‌دهد)، فکر می‌کنم دانشمندان داده در آینده زمان بیشتری را صرف انجام ۳ کار خواهند کرد:

۱- تمرکز بر تحلیل اکتشافی

۲- توضیح اینکه چگونه مدل‌ ها برای کسب‌وکار ارزش ایجاد می‌کنند.

۳- پیاده سازی این مدل ها (چیزی نزدیک تر به کاری که یک مهندس ML انجام می دهد)

جمع بندی:

از تجزیه و تحلیل ذکر شده ، پیشبینی ما کاملاً واضح است که علم داده برای مدتی طولانی وجود خواهد داشت. امیدواریم این مقاله به شما کمک کرده باشد که به روشی متفاوت به آینده علم داده فکر کنید. ما شما را تشویق می کنیم که در مورد این موضوع تحقیق کنید و آنچه را که در حرفه خود برای شما مناسب است انجام دهید.