26/09/2023

REGRESI BERGANDA DAN MACHINE LEARNING

 REGRESI BERGANDA DAN MACHINE LEARNING

Analisis regresi bertujuan untuk memprediksi nilai variable tak bebas, jika variabel bebas diketahui datanya. Persamaan regresi yang memenuhi kriteria BLUE (Best, Linier, Unbiased, Estimated) dapat dijadikan alat prediksi yang baik. Dari laman www.statisticssolutions.com mengemukakan, Three major uses for regression analysis are 

  1. Determining the strength of predictors, 
  2. Forecasting an effect, and 
  3. Trend forecasting 

Persamaan regresi merupakan suatu persamaan yang menerangkan atau menjelaskan hubungan antara variabel bebas dan variabel tak bebas. Persamaan regresi dapat digunakan untuk memprediksi atau mengestimasi nilai dari variabel tak bebas berdasarkan informasi dari variabel bebas. Persamaan regresi linear merupakan suatu persamaan yang berupa garis lurus, sedangkan persamaan regresi nonlinear bukan merupakan persamaan garis lurus.

Model Persamaan Regresi Berganda  :


Visualisasi Regresi berganda


Contoh aplikasi dari regresi linear berganda

  • Membuat persamaan untuk memprediksi atau mengestimasi nilai indeks prestasi mahasiswa berdasarkan jumlah jam belajar dalam sehari dan intelligence quotient (IQ). Di samping itu dapat diketahui faktor-faktor yang memberikan kontribusi paling besar dalam hal pengaruhnya terhadap indeks prestasi mahasiswa.
  • Membuat model untuk memprediksi atau mengestimasi laba perusahaan berdasarkan umur perusahaan, tingkat penjualan, dan besarnya perusahaan. Di samping itu, dapat diketahui seberapa besar kontribusi yang diberikan dari faktor umur perusahaan terhadap naik/turunnya laba perusahaan, dengan mengontrol pengaruh tingkat penjualan dan besarnya perusahaan. Dapat juga diketahui seberapa besar kontribusi yang diberikan dari faktor tingkat penjualan perusahaan terhadap naik/turunnya laba perusahaan, dengan mengontrol pengaruh umur perusahaan dan besarnya perusahaan.
  • Membuat persamaan untuk memprediksi atau mengestimasi harga saham suatu perusahaan berdasarkan laba per-lembar saham dan jumlah kas dividen yang diberikan. Di samping itu, dapat diketahui seberapa besar kontribusi yang diberikan dari faktor laba per-lembar saham terhadap naik/turunnya harga saham, dengan mengontrol pengaruh jumlah kas dividen yang diberikan.
  • Pada kasus makro ekonomi, kita dapat megestimasi pertumbuhan ekonomi dengan melihat kontribusi variabel bebas seperti inflasi, pendapatan, suku bunga. dll.

Regresi dan Mechine Learning

Ada berbagai jenis algoritma Machine Learning yang digunakan dalam berbagai aplikasi, seperti algoritma regresi, klasifikasi, clustering, dan deep learning.

Algoritma machine learning adalah sekumpulan aturan yang digunakan oleh sistem machine learning untuk mengambil keputusan atau membuat prediksi. Algoritma dalam machine learning dapat dibagi menjadi tiga kategori yaitu supervised learning, unsupervised learning, Reinforce Learning. 

Supervised learning adalah algoritma yang digunakan untuk membuat prediksi berdasarkan data latihan yang sudah ditandai dengan label atau target yang diinginkan. Sedangkan unsupervised learning adalah algoritma yang digunakan untuk menemukan struktur atau pola dalam data yang tidak dikenal sebelumnya. Ada berbagai jenis algoritma machine learning yang digunakan dalam berbagai aplikasi, seperti algoritma regresi, klasifikasi, clustering, dan deep learning.

Jenis-Jenis Algoritma yang Digunakan dalam Machine Learning
Ada beberapa jenis algoritma yang digunakan dalam machine learning, diantaranya:

  1. Algoritma Regresi: Algoritma ini digunakan untuk memprediksi nilai numerik seperti harga saham, harga properti, atau jumlah penjualan. Algoritma ini digunakan untuk membuat model prediksi yang dapat digunakan untuk membuat keputusan bisnis.
  2. Algoritma Klasifikasi: Algoritma ini digunakan untuk memprediksi kelas suatu objek seperti mengklasifikasikan email sebagai spam atau tidak spam, atau mengklasifikasikan pasien sebagai menderita penyakit tertentu atau tidak. Algoritma ini digunakan untuk mengambil keputusan yang berkaitan dengan klasifikasi.
  3. Algoritma Clustering: Algoritma ini digunakan untuk mengelompokkan objek yang serupa seperti mengelompokkan pelanggan berdasarkan preferensi pembelian, atau mengelompokkan sampel data berdasarkan karakteristik. Algoritma ini digunakan untuk mengidentifikasi pola dan menemukan struktur dalam data.
  4. Deep Learning: Algoritma ini digunakan untuk menyelesaikan masalah yang sangat kompleks seperti pengenalan wajah, pengenalan suara, atau pengolahan bahasa alami. Algoritma ini digunakan untuk membuat sistem yang dapat belajar secara otomatis dan meningkatkan performanya dengan waktu.
  5. Algoritma Decision Tree: Algoritma ini digunakan untuk membuat suatu diagram pohon yang menyajikan keputusan berdasarkan kondisi-kondisi yang diberikan. Algoritma ini digunakan untuk mengambil keputusan yang berkaitan dengan klasifikasi atau regresi
  6. Algoritma Gradient Boosting: Algoritma ini digunakan untuk membuat sekumpulan model yang dapat digabungkan untuk memprediksi hasil. Algoritma ini digunakan untuk membuat model yang lebih kompleks dan akurat dibandingkan dengan menggunakan model tunggal.
  7. Algoritma Random Forest: Algoritma ini digunakan untuk membuat sekumpulan decision tree yang dapat digabungkan untuk memprediksi hasil. Algoritma ini digunakan untuk membuat model yang lebih kompleks dan akurat dibandingkan dengan menggunakan model tunggal.
  8. Algoritma Neural Network : Algoritma ini digunakan untuk menyelesaikan  masalah yang kompleks seperti pengenalan wajah, pengenalan suara, atau pengolahan bahasa alami. Algoritma ini digunakan untuk membuat sistem yang dapat belajar secara otomatis dan meningkatkan performanya dengan waktu. Neural network dapat digunakan untuk pemrosesan gambar, teks, suara dan video. Neural network juga dapat digunakan untuk tugas-tugas yang memerlukan pembelajaran dari data yang tidak terstruktur.
Berikut Tipe Machine Learning, Variabel target dan Algoritma yang digunakan.

Regresi yang Baik untuk Prediksi

Secara visual regresi yang baik memenuhi asumsi Statistik dan Asumsi Klasik sebagaimana dirangkum pada gambar berikut:


Hal terpenting yang perlu diperhatikan sebelum memilih model analisa regresi adalah memperhatikan tipe data atau tipe variabel target (Tipe Dependen Variabel) yang digunakan. Secara visual dapat dilihat pada gambar berikut:
Referensi:
https://www.alamyin.com/2023/05/analisa-tren-dengan-algoritma-regresi.html
https://devopedia.org/types-of-regression
https://www.analyticsvidhya.com/blog/2022/01/different-types-of-regression-models/
https://medium.com/@codekalimi/list-of-machine-learning-models-61b51ad492f1
https://www.researchgate.net/publication/336160040_Feature_selection_with_the_R_package_MXM/figures?lo=1

0 comments: