Pengenalan Machine Learning
Algoritma dan Data Set
“Machine Learning is field of study that gives computers ability to learn without being explicitly programmed” — IBM
Halo, kali ini saya akan coba share mengenai “Pengenalan Machine Learning”. Sekarang ini banyak sekali orang-orang menggunakan Machine Learning untuk menyelesaikan beragam masalah yang di hadapi. Sebenarnya apa sih Machine Learning itu? Machine Learning berdasarkan definisi dari laman web IBM dalam tulisan nya “What Is Machine Learning” [link], menyatakan bahwa Machine Learning adalah suatu bidang studi yang memberikan komputer kemampuan untuk belajar tanpa harus di program secara explisit. Prinsip ini menirukan cara belajar manusia. Manusia belajar melalui informasi yang di terima oleh guru, orang tua, lingkungan, dan lain sebagainya yang pada akhirnya akan membuat manusia dapat bertindak sesuai pengalaman yang pernah diajarkan atau dilakukan sebelumnya.
Contoh Implementasi Machine Learning
Virtual Personal Assistants
Perangkat cerdas seperti Siri, Alexa, Google Now merupakan contoh implementasi Machine Learning untuk Virtual Personal Assistants. Dalam penerapanya perangkat tersebut dapat membantu manusia untuk memberikan informasi info kemacetan, menjadwalkan perksa ke dokter, mengontrol perangkat rumah seperti lampu, TV, dan alarm dan lain sebagainya.
Image Recognition
Penerapan di bidang Image Recognition seperti untuk Deteksi Plat Nomor Kendaraan, Pengenalan Karakter (OCR), Pengenalan Wajah untuk sistem absensi dan lain sebagainya.
Search Engine
Udah taulah ya Google, Search Engine yang sering kita pakai ini memungkinkan kita dapat mengakses berbagai informasi dengan hanya menginputkan keyword di mesin pencari. dengan berbagai macam informasi yang bahkan dapat di personalisasi sesuai dengan preferensi kita.
Learning Untuk Komputer
Machine Learning di kelompokan menjadi 3 jenis, yaitu :
- Supervised Machine Learning
- Unsupervised Machine Learning
- Reinforcement Machine Learning
Saat menerapkan Machine Learning untuk menyelesaikan sebuah permasalahan, akan di lakukan tahapan berikut :
- Representation
- Evaluation
- Optimization
Representation
Representation adalah metoda yang digunakan oleh algoritma machine learning terkait dengan persamaan Matematika. Beberapa algoritma yang sering digunakan antara lain :
- K-means
- Decision Tree
- Bayesian Models
- Neural Networks
- Support Vector Machine
Evaluation
Evaluation merupakan tahapan untuk mengukur seberapa akurat model yang dihasilkan dari algoritma yang dipilih. Pemilihan algoritma yang tepat dapat menentukan keakurasian dari model yang dihasilkan. Tentu saja ini berkaitan dengan karakteristik data yang hendak kita proses. Untuk itu diperlukan evaluasi algoritma yang digunakan.
Beberapa tools yang dapat digunakan untuk evalusi, yaitu :
- Confusion Matrix
- Precision and Recall
Optimization
Optimization berkenaan dengan teknik teknik yang digunakan untuk membuat model yang dihasilkan dapat berjalan efektif dan efisien. Bisa mengenai kecepatan pemrosesan, Penentuan parameter, dan hal lainya.
Data Set
Algoritma Machine Learning tidak berarti apa-apa tanpa data. Data ini disebut sebagai “Data set” atau “Dataset”. Dalam tiap Algoritma Machine Learning memliki kebutuhan berbeda satu dengan lainya berkaitan dengan banyaknya data, ada yang memerlukan data sangat banyak ada juga algoritma yang cukup dengan dataset berukuran kecil.
Istilah pada Data Set
Data Set dapat di analogikan sebagai table yang memiliki kolom dan baris. Analogi ini memudahkan kita melihat representasi data secara sederhana. Istilah pada data set, yaitu :
Instance : Setiap baris data pada table disebut sebagai instance. Instance menunjukan sebuah pengamatan dari domain permasalahan.
Feature : Setiap kolom pada table di sebut sebagai feature. Feature merupakan komponen dari pengamatan. Feature berisi input data (predictors) dan sebagian lagi adalah hasil prediksi (ouput)
Dataset : Kumpulan instance yang membentuk data set.
Data Type : tipe data yang ada pada tiap Feature.
Porsi Pada Data Set
Porsi data set dibagi menjadi tiga bagian, yaitu :
Training set : adalah data set yang digunakan selama proses belajar (Training)
Validation set : adalah data set yang digunakan untuk memvalidasi atau mengevaluasi dari model yang dipilih, istilah lainya adalah Cross Validation
Test set : adalah data set yang digunakan untuk menguji model yang di bentuk dari hasil training.
Sekilas antara Validation set dan Test set tampak sama, padahal sebenernya berbeda dan di peruntukan untuk hal yang berbeda pula. Test set sendiri merupakan kunci untuk mengetahui apakah model yang dibentuk sudah cukup baik atau belum.
Porsi data set dapat ditentukan secara random, pada umumnya pakar Machine Learning akan memilih porsi sebagai berikut :
Trainig set : 50%
Validation set : 25%
Test set : 25%
Trainig set dan validation set dikelompokan dalam fase training yang outputnya adalah model. Sedangkan Test set di kelompokan pada fase testing.
Sumber :
- Rangkuman Buku “Pengantar Machine Learning” karangan Bedy Purnama, S.SI.,MT (penerbit INFORMATIKA)
- https://www.r-bloggers.com/101-machine-learning-algorithms-for-data-science-with-cheat-sheets/
- https://semiengineering.com/deep-learning-spreads/
- https://www.clariba.com/machine-learning-for-business