HARI ini, istilah pembelajaran mesin atau biasa dipanggil machine learning menjadi bualan para pelajar yang mengambil jurusan sains komputer atau mereka yang berkecimpung dalam bidang teknologi maklumat. Persoalannya di sini, apa itu pembelajaran mesin? Pembelajaran mesin adalah satu cabang ilmu kecerdasan buatan atau Artificial Intelligence (AI). Ini bermakna, pembelajaran mesin merupakan disiplin kecerdasan buatan yang menggunakan data untuk melatih mesin membuat keputusan tertentu.
Kita sedar bahawa pembelajaran mesin adalah komponen penting dalam bidang data science yang semakin meningkat hari ini. Mereka yang ingin membuat ramalan atau klasifikasi boleh menggunakan teknik pembelajaran mesin dengan melatih algoritma tertentu. Terdapat empat jenis teknik pembelajaran mesin yang biasa diketengahkan dalam mana-mana rujukan iaitu supervised learning, unsupervised learning, semi-supervised learning dan reinforcement learning.
Apa itu supervised learning? Supervised learning adalah satu teknik yang membenarkan ramalan masa depan dibuat oleh mesin berdasarkan tingkah laku atau ciri yang dianalisis dalam satu set data. Ramalan yang dibuat oleh mesin diperolehi berdasarkan kepada dua ciri penting iaitu input yang dianalisis dan output yang menjadi ramalan akan datang. Sebagai contoh, kita sediakan satu set data yang mengandungi beberapa ciri seperti bentuk, warna, rasa, berat dan label. Set data ini perlu dibahagikan kepada dua set iaitu set latihan dan set ujian.
Di sini, kita boleh kategorikan bentuk, warna, rasa dan berat adalah input, manakala label adalah output yang diramalkan. Satu senario mudah yang boleh dikaitkan dengan kategori input dan output tersebut adalah bagaimana untuk klasifikasikan jenis buah-buahan berdasarkan label seperti pisang, tembikai, oren, epal dan lemon. Maka, mesin perlu dilatih untuk menjana model pembelajaran mesin agar dapat membuat klasifikasi secara tepat berdasarkan label di dalam set data.
Ia berbeza pula dengan unsupervised learning, yang mana model pembelajaran mesin mampu membuat klasifikasi yang tidak mempunyai label dalam set data yang digunakan atau biasa dipanggil unlabeled data. Ini bermaksud, pembelajaran mesin jenis ini tidak mempunyai pemboleh ubah output (output variable), yang mana set data hanya mengandungi input yang dianalisis untuk membuat klasifikasi.
Manakala, semi-supervised learning adalah jenis pembelajaran mesin yang menggunakan set data yang mempunyai label sebagai output dan sebahagian set data itu tidak mempunyai label sebagai output untuk membuat klasifikasi. Sebagai contoh, label di dalam set data hanya disediakan untuk pisang, tembikai dan oren, manakala epal dan lemon tidak dilabelkan. Dengan erti kata yang lain, ianya adalah gabungan antara konsep supervised learning dan unsupervised learning.
Sekarang kita berbicara tentang reinforcement Learning. Jenis pembelajaran mesin ini adalah sangat berbeza dengan tiga jenis pembelajaran mesin yang telah dibincangkan di atas. Ia merupakan algoritma yang membuat mesin atau komputer belajar dengan sendiri berdasarkan ejen (agent) dan persekitaran (environment) untuk menghasilkan aksi (action) dan ganjaran (reward).
Sebagai contoh, kita ingin melatih mesin untuk mengenal pasti bentuk objek sama ada ianya berbentuk bulat, berbentuk segi tiga atau berbentuk segi empat tepat. Dengan erti kata yang lain, pembelajaran mesin jenis ini lebih kepada kaedah trial dan error untuk menemukan penyelesaian. Tedapat beberapa aplikasi yang telah dicipta menggunakan teknik pembelajaran mesin. Ia termasuklah ramalan kaji cuaca, ramalan jualan produk, mengenal pasti sel kanser, klasifikasi jenis serangan siber dan mengenal pasti suara. Sebagai kesimpulan, pembelajaran mesin merupakan teknologi atau teknik yang luar biasa dalam bidang kecerdasan buatan yang dapat meningkatkan kehidupan kita seiring perkembangan teknologi terkini.
Oleh: Ts. Dr. Mohd Azahari Mohd Yusof
Pensyarah Kanan
Jabatan Keselamatan Maklumat dan Teknologi Web
Fakulti Sains Komputer dan Teknologi Maklumat
Universiti Tun Hussein Onn Malaysia (UTHM)