Automasi: masa depan sains data dan pembelajaran mesin?

Pembelajaran mesin telah menjadi salah satu kemajuan terbesar dalam sejarah pengkomputeran dan kini dilihat dapat memainkan peranan penting dalam bidang data dan analitik besar. Analisis data besar adalah cabaran besar dari perspektif perusahaan. Sebagai contoh, aktiviti seperti memahami sebilangan besar format data yang berbeza, menganalisis penyediaan data dan menyaring data yang berlebihan boleh memerlukan sumber daya. Merekrut pakar saintis data adalah cadangan yang mahal dan bukan kaedah untuk setiap syarikat. Pakar percaya bahawa pembelajaran mesin dapat mengotomatisasi banyak tugas yang berkaitan dengan analitik - rutin dan kompleks. Pembelajaran mesin automatik dapat membebaskan sumber daya yang besar yang dapat digunakan untuk pekerjaan yang lebih kompleks dan inovatif. Pembelajaran mesin nampaknya bergerak ke arah ini sepanjang masa.

Automasi dalam konteks teknologi maklumat

Dalam IT, automasi adalah penyambungan sistem dan perisian yang berbeza, yang memungkinkan mereka melakukan tugas-tugas tertentu tanpa campur tangan manusia. Dalam IT, sistem automatik dapat melakukan pekerjaan sederhana dan kompleks. Contoh pekerjaan sederhana mungkin mengintegrasikan borang dengan PDF dan mengirim dokumen ke penerima yang betul, sementara menyediakan sandaran di luar laman web mungkin merupakan contoh pekerjaan yang kompleks.

Untuk menjalankan tugas anda dengan betul, anda perlu memprogram atau memberi arahan yang jelas kepada sistem automatik. Setiap kali sistem automatik diperlukan untuk mengubah skop tugasnya, program atau set arahan perlu diperbarui oleh seseorang. Walaupun sistem automatik berkesan dalam tugasnya, kesalahan dapat terjadi dengan pelbagai alasan. Apabila kesalahan berlaku, punca perlu dikenal pasti dan diperbetulkan. Jelas, untuk menjalankan tugasnya, sistem automatik bergantung sepenuhnya kepada manusia. Semakin kompleks sifat kerja, semakin tinggi kemungkinan kesalahan dan masalah.

Contoh automasi umum dalam industri IT adalah automasi pengujian antara muka pengguna berasaskan web. Kes ujian dimasukkan ke dalam skrip automasi dan antara muka pengguna diuji dengan sewajarnya. (Untuk lebih lanjut mengenai penerapan praktik pembelajaran mesin, lihat Pembelajaran Mesin dan Hadoop dalam Pengesanan Penipuan Generasi Seterusnya.)

Argumen yang memihak kepada automasi adalah bahawa ia melakukan tugas rutin dan berulang dan membebaskan pekerja untuk melakukan tugas yang lebih kompleks dan kreatif. Namun, juga berpendapat bahawa automasi telah mengecualikan sebilangan besar tugas atau peranan yang sebelumnya dilakukan oleh manusia. Sekarang, dengan pembelajaran mesin memasuki pelbagai industri, automasi dapat menambahkan dimensi baru.

Masa depan pembelajaran mesin automatik?

Inti pembelajaran mesin adalah keupayaan sistem untuk terus belajar dari data dan berkembang tanpa campur tangan manusia. Pembelajaran mesin mampu bertindak seperti otak manusia. Sebagai contoh, mesin cadangan di laman web e-dagang dapat menilai pilihan dan citarasa unik pengguna dan memberikan cadangan mengenai produk dan perkhidmatan yang paling sesuai untuk dipilih. Dengan adanya kemampuan ini, pembelajaran mesin dipandang ideal untuk mengautomasikan tugas-tugas kompleks yang berkaitan dengan data dan analitik yang besar. Ia telah mengatasi batasan utama sistem automatik tradisional yang tidak membenarkan campur tangan manusia secara berkala. Terdapat beberapa kajian kes yang menunjukkan kemampuan pembelajaran mesin untuk melakukan tugas analisis data yang kompleks, yang akan dibincangkan kemudian dalam makalah ini.

Seperti yang telah disebutkan, analitik data besar adalah cadangan yang mencabar untuk perniagaan, yang sebagian dapat didelegasikan ke sistem pembelajaran mesin. Dari perspektif perniagaan, ini dapat membawa banyak faedah seperti membebaskan sumber sains data untuk tugas yang lebih kreatif dan misi, beban kerja yang lebih tinggi, kurang masa untuk menyelesaikan tugas dan keberkesanan kos.

Kajian kes

Pada tahun 2015, penyelidik MIT mula mengerjakan alat sains data yang dapat membuat model data ramalan dari sejumlah besar data mentah menggunakan teknik yang disebut algoritma sintesis fitur dalam. Para saintis mendakwa algoritma dapat menggabungkan ciri terbaik pembelajaran mesin. Menurut para saintis, mereka telah mengujinya pada tiga set data yang berbeza dan memperluas ujian untuk memasukkan lebih banyak. Dalam makalah yang akan dibentangkan di Persidangan Internasional tentang Sains Data dan Analisis, para penyelidik James Max Kanter dan Kalyan Veeramachaneni mengatakan, "Dengan menggunakan proses penalaan automatik, kami mengoptimalkan keseluruhan jalan tanpa keterlibatan manusia, yang memungkinkan untuk membuat generalisasi ke kumpulan data yang berbeda".

Mari kita lihat kerumitan tugas: algoritma mempunyai apa yang dikenali sebagai keupayaan penyesuaian automatik, dengan bantuan mana wawasan atau nilai dapat diperoleh atau diekstrak dari data mentah (seperti usia atau jantina), setelah itu data ramalan model boleh dibuat. Algoritma menggunakan fungsi matematik yang kompleks dan teori kebarangkalian yang disebut Gaussian Copula. Oleh itu, mudah difahami tahap kerumitan yang dapat dikendalikan oleh algoritma. Teknik ini juga telah memenangi hadiah dalam pertandingan.

Pembelajaran mesin boleh menggantikan kerja rumah

Sedang dibahas di seluruh dunia bahawa pembelajaran mesin dapat menggantikan banyak pekerjaan kerana melakukan tugas dengan kecekapan otak manusia. Sebenarnya, ada beberapa kebimbangan bahawa pembelajaran mesin akan menggantikan para saintis data, dan sepertinya ada dasar untuk perhatian tersebut.

Bagi pengguna rata-rata yang tidak mempunyai kemahiran menganalisis data tetapi mempunyai berbagai keperluan analisis dalam kehidupan seharian mereka, tidak mungkin menggunakan komputer yang dapat menganalisis sejumlah besar data dan memberikan data analisis. Walau bagaimanapun, teknik Pemprosesan Bahasa Asli (NLP) dapat mengatasi batasan ini dengan mengajar komputer untuk menerima dan memproses bahasa manusia semula jadi. Dengan cara ini, pengguna rata-rata tidak memerlukan fungsi atau kemahiran analitik yang canggih.

IBM percaya bahawa keperluan para saintis data dapat dikurangkan atau dihapuskan melalui produknya, Platform Analisis Bahasa Asli Watson. Menurut Marc Atschuller, naib presiden analitik dan risikan perniagaan di Watson, "Dengan sistem kognitif seperti Watson, anda hanya mengajukan soalan anda - atau jika anda tidak mempunyai pertanyaan, anda hanya memuat naik data anda dan Watson dapat melihatnya dan simpulkan apa yang mungkin anda ingin ketahui. "

Kesimpulannya

Automasi adalah langkah logik seterusnya dalam pembelajaran mesin dan kita sudah mengalami kesan dalam kehidupan seharian kita - laman web e-commerce, cadangan rakan Facebook, cadangan rangkaian LinkedIn dan kedudukan carian Airbnb. Mengingat contoh yang diberikan, tidak ada keraguan bahawa ini dapat dikaitkan dengan kualiti output yang dihasilkan oleh sistem pembelajaran mesin automatik. Untuk semua kualiti dan faedahnya, idea pembelajaran mesin yang menyebabkan pengangguran besar nampaknya terlalu berlebihan. Mesin telah menggantikan manusia di banyak bahagian kehidupan kita selama beberapa dekad, tetapi manusia telah berkembang dan menyesuaikan diri agar tetap relevan dalam industri ini. Menurut pandangan, pembelajaran mesin untuk semua gangguannya hanyalah gelombang lain yang akan disesuaikan dengan orang.


Masa penghantaran: Ogos-03-2021