Akankah Ilmuwan Data Masih Dalam Permintaan di 2022?

Inilah yang harus Anda ketahui sebelum memutuskan jalur karier

Beberapa tahun yang lalu, ilmu data menjadi sangat populer. Ada banyak hype seputar bidang ini, dan orang-orang dari berbagai latar belakang bergegas untuk melakukan transisi ke ilmu data.

Gelar master ilmu data mulai menjadi semakin populer, dan tidak ada kelangkaan kursus online di Internet. Siswa berbondong-bondong ke situs seperti Coursera, Datacamp, dan Udemy untuk mendapatkan sertifikasi ilmu data dan memasuki pasar kerja.

Namun, orang-orang saat ini sudah mulai menjadi semakin skeptis tentang lapangan.

Saya telah membaca arti c les menggambarkan “ kematian ilmu data.” Beberapa orang percaya bahwa ilmu data hanyalah tren yang lewat, dan bahwa hype akan segera mereda sebelum bidang lain menggantikannya.

Saya juga membaca artikel yang mendorong pelajar untuk mengejar karir di bidang teknik data atau MLOps, karena bidang ini adalah “hal besar berikutnya,” dan akan bertahan lebih lama dari karir ilmu data.

Saya menghabiskan banyak waktu untuk terobsesi apakah saya harus terus belajar ilmu data, atau menginvestasikan waktu saya untuk mempelajari keterampilan berbeda yang ada untuk tetap ada.

Sekarang, setelah lebih dari satu tahun bekerja di industri data, saya ingin berbagi wawasan tentang topik ini — terutama untuk pemula di bidang ini yang sering diberi nasihat yang kontradiktif dan ragu-ragu untuk mengejar karir ilmu data.

Berikut adalah beberapa pertanyaan yang akan saya coba jawab dalam artikel ini:

  • Apakah rekayasa data adalah hal besar berikutnya? Haruskah saya memfokuskan upaya saya untuk menjadi seorang insinyur data daripada seorang ilmuwan data?
  • Saat alat ML otomatis mulai menjadi lebih maju, apakah mereka akan menggantikan ilmuwan data?
  • Apakah pasar ilmu data terlalu jenuh, dan apakah masih mungkin untuk mendapatkan pekerjaan tingkat pemula di lapangan?

Rekayasa Data vs. Ilmu Data

Saya telah membaca banyak sudut pandang yang berbeda secara online tentang rekayasa data menggantikan ilmu data sebagai pekerjaan terpanas abad ke-21.

Setelah bekerja sama dengan tim teknik data dan ilmu data, saya sampai pada kesimpulan bahwa kedua bidang tersebut sama-sama berharga.

Perusahaan membutuhkan insinyur data. Mereka membutuhkan orang-orang yang mampu mengambil data dalam jumlah besar dan membuatnya dapat digunakan.

Analis data dan ilmuwan data kemudian perlu menggunakan data ini untuk menghasilkan nilai bisnis. Mereka menciptakan produk akhir yang menguntungkan bagi organisasi.

Alasan mengapa rekayasa data begitu digembar-gemborkan sekarang adalah karena perusahaan tidak memiliki cukup banyak dari mereka.

Di masa lalu, organisasi-organisasi ini terlalu menghargai ilmuwan data. Mereka mempekerjakan ilmuwan data untuk membangun model yang menguntungkan ketika mereka tidak memiliki saluran data yang tepat.

Ilmuwan data mengkhususkan diri dalam pembuatan model, dan tidak dapat berbuat banyak dengan sejumlah besar data real-time dan tidak terstruktur yang mengalir masuk. Ini berarti bahwa mereka tidak dapat menambahkan banyak nilai ke organisasi — karena data tidak disiapkan dengan cara bahwa mereka membutuhkannya.

Sekarang perusahaan mulai menyadari hal ini, mereka lebih menekankan pada perekrutan insinyur data.

Ini tidak berarti bahwa ilmuwan data berlebihan. Keterampilan membangun model mereka masih menguntungkan bagi organisasi — ini baru muncul kemudian, setelah data siap digunakan.

Kedua karir ini diminati, dan memberikan nilai tambah bagi perusahaan. Terserah Anda untuk memilih apa yang paling Anda sukai.

Akankah otomatisasi menggantikan ilmuwan data?

Alat seperti DataRobot dan AutoML menjadi semakin populer. Lebih banyak perusahaan telah mulai berinvestasi pada alat ini untuk membangun model prediktif.

Hal ini menimbulkan kekhawatiran baru — Apakah masih ada ruang bagi ilmuwan data di dalam organisasi? Atau akankah alat-alat ini menggantikan pekerjaan yang mereka lakukan?

Saya telah menggunakan DataRobot sebelumnya. Alat ini diposisikan untuk membantu analis bisnis membangun model prediktif tanpa pengetahuan tentang pembelajaran mesin atau ilmu data.

Berikut adalah beberapa temuan saya setelah bekerja dengan DataRobot:

Ini adalah alat yang sangat sederhana untuk digunakan. Mengimpor data dalam berbagai format dan membuat model ML dengan mudah hanya dengan beberapa klik.
Penyetelan parameter diurus. DataRobot mencari melalui rentang nilai untuk setiap hyperparameter dan memilih nilai paling optimal yang akurat untuk data Anda. Ini mengurangi jumlah pekerjaan manual yang perlu Anda lakukan.

Namun, terlepas dari fitur hebat dari pembelajaran mesin otomatis ini, mereka tidak akan dapat menggantikan ilmuwan data untuk waktu yang sangat lama.

Saya menjelajahi DataRobot untuk berbagai kasus penggunaan, dan masih harus melakukan tugas seperti menambahkan bobot fitur sendiri. Selain itu, semua pra-pemrosesan yang berlangsung hingga model siap dibangun perlu dilakukan secara manual.

Data perlu disesuaikan dan dipecah sesuai dengan kasus penggunaan bisnis. Ilmuwan data biasanya menghabiskan lebih banyak waktu untuk melakukan persiapan data sesuai dengan kebutuhan, dan lebih sedikit waktu untuk membangun model.

Pengangkatan berat ini masih perlu dilakukan oleh data scientist, dan 80% tugas yang umumnya dilakukan oleh data scientist tidak dapat diotomatisasi.

Saat menggunakan DataRobot, saya masih harus mengubah parameter secara manual (seperti nilai ambang model dan bobot fitur) berdasarkan hasil yang saya butuhkan.

Kebijaksanaan manusia masih diperlukan ketika bekerja dengan alat-alat ini.

Selama Anda memiliki pengetahuan domain di bidang yang Anda kerjakan, bersama dengan keterampilan analitis dan pemrograman, Anda tidak dapat digantikan oleh alat otomatis.

Alat ini mungkin membantu mempercepat alur kerja Anda dan mengurangi jumlah sumber daya komputasi yang Anda gunakan, tetapi alat ini dimaksudkan untuk melengkapi pekerjaan yang Anda lakukan, bukan menggantikannya.

Apakah masih ada permintaan untuk ilmuwan data?

90% dari data dunia telah dibuat dalam dua tahun terakhir saja, dan jumlah ini diproyeksikan akan meningkat.

Data digunakan untuk membuat perubahan besar di banyak industri — perawatan kesehatan, keuangan, pemasaran, bisnis, dll.

Saya bekerja di bidang pemasaran, dan menangani jutaan titik data yang dihasilkan setiap hari. Titik data ini digunakan untuk mengamati perilaku pelanggan dan menghasilkan strategi penargetan yang berbeda.

Perusahaan perlu merekrut individu yang dapat memperoleh nilai dari titik data ini.

Seorang analis bisnis saja tidak akan dapat melakukan ini, karena mereka tidak memiliki pengetahuan teknis.

Selama Anda dapat menangani sejumlah besar data dan memecahkan masalah dengan bantuan data ini, ada ruang untuk Anda di industri ini.

Namun, Anda harus melampaui pembuatan model. Anda harus memiliki keahlian domain. Anda perlu tahu cara mencari data eksternal dengan keahlian teknis Anda. Anda harus memiliki komunikasi yang kuat dan keterampilan memecahkan masalah.

Ini adalah keterampilan yang akan membedakan Anda dari rata-rata calon ilmu data.

Ilmu data dalam praktiknya sangat berbeda dengan ilmu data secara teori.

Saat bekerja di industri, tidak masalah jika Anda bekerja sepanjang hari untuk membuat model Anda 1% lebih akurat dari sebelumnya. Hal-hal ini mungkin penting dalam kompetisi Kaggle, tetapi itu tidak penting bagi para pemangku kepentingan.

Hal-hal seperti relevansi setiap fitur dengan model Anda, keterjelasan model, dan penerapan model Anda ke skenario dunia nyata jauh lebih penting.

Seorang ilmuwan data yang memiliki keterampilan ini tidak tergantikan.

Kesimpulan

Ilmu data tidak sekarat. Namun, bidang ini mengalami pergeseran, dan perusahaan mulai mencari orang yang dapat memecahkan masalah dengan data.

Ini tidak hanya mencakup pembuatan model. Saat menghadapi masalah bisnis, jawabannya tidak selalu terletak pada pembuatan model pembelajaran mesin.

Terkadang, kueri atau visualisasi SQL sederhana mungkin memberi tahu Anda semua yang perlu Anda ketahui. Mempekerjakan teknik ML untuk mengatasi setiap masalah data mahal dan memakan waktu, itulah sebabnya Anda perlu memiliki pengetahuan lebih dari itu.

Tidak ada alat otomatis yang dapat menggantikan keahlian seorang ilmuwan data, selama Anda terus belajar dan menciptakan solusi berbasis data – Magnet Info

Leave a Reply

Your email address will not be published. Required fields are marked *