Wednesday, 18 March 2020

Tutorial Machine Learning Python : Regresi Linear

Rendi Anwar

Pengenalan

Machine Learning  secara sederhana dapat diartikan sebuah proses komputer untuk belajar dari data (learn from data). Pada kesempatan kali ini, kami akan memperkenalkan salah satu metode dalam Machine Learning yaitu Surpervised Learning-Linear Regression atau Data yang berlabel menggunakan Regresi Linear. Namun, untuk saat ini kami hanya akan memberikan contoh untuk metode regresi linear sederhana terlebih dahulu artinya variabel terikat hanya bergantung pada satu variabel bebas.

Regresi Linear

Disini kami akan mencoba memprediksi jumlah kecacatan produksi terhadap pengaruh suhu.
Library yang kami gunakan yaitu ScikitLearn untuk menghitung regresinya, Pandas untuk membaca file CSV yang berisi sample data, Numpy untuk mengolah data dari CSV ,Matplotlib untuk memodelkan suatu data dalam bentuk grafik scatter,dan Statmodel untuk mencari nilai 

Import libarry yang kita butuhkan tadi

Kita ambil data dengan format csv dengan printah data = pd.read_csv() dimana parameternya yaitu sebuah lokasi file csv yang kalian simpan dalam komputer kalian. setelah itu lakukan perintah data.head() untuk menampilkan data.

Berikut adalah file yang  kami buat dan berhasil kami panggil. yaitu nam filenya  regresi.csv 


Agar kelihatan lebih baik kalian bisa hapus kolom Unnamed : 3 dengan perintah :
data.drop(['Unnamed: 3'], axis=1) yang artinya menghapus kolom Unnamed: 3 dan tampilannya akan berubah menjadi seperti ini



Tampilan data menjadi terlihat lebih elegan dimana dalam hal ini data yang digunakan sebenarnya yaitu dari tanggal 1 - 30, karena keterbatas ruang maka kami hanya menampilkan dari tanggal 1 - 11 saja.

Selanjutnya kita tampilkan pada grafik scatter dengan menggunakan perintah sebagai berikut :












Pada perintah diatas kita membuat sebuah grafik scatter dimana data yang akan dgunakan sebagai sumbu-x yaitu data pada kolom "Rerata Suhu" dan sumbu-y yaitu data pada kolom "Jumlah Cacat Produksi" dan membuat label pada pada grafik tersebut
Maka hasilnya akan seperti ini



 Lalu untuk mencari persamaan linearnya kita gunakan kode di bawah ini



Pada program di atas kita akan membuat data ['Rerata Suhu'] dan data['Jumlah Cacat Produksi'] dalam bentuk matrix 1x1 kemudian kedua nilai ini masing-masing ditaruh dalam variabel X dan Y, lalu kita fitting dengan dengan fungsi LinearRegression() dan menampilkan datanya dengan fungsi print().

Hasil dari eksekusi kode di atas yaitu diperoleh persamaan linearnya :

Jumlah Cacat Produksi = 1.4498* (Rerata  Suhu) - 24.381

sekarang kita mencari nilai R^2 untuk melihiat hubungan kedua variabel di atas , jika nilainya mendekti 1 maka model yang dibuat sudah relevan.

untuk menghitunganya kita menggunakan perintah sebagai berikut :



Outputnya :

nilai R² yang diperoleh yaitu 0.913 nilai yang baik artinya model yang dibuat sudah relevan.

Dari perhitungan di atas diperoleh persamaan regresinya yaitu

y=  1.4498x -24.381

atau 

Jumlah Cacat Produksi = 1.4498* (Rerata  Suhu) - 24.381

artinya jika kita ingin memperediksi di suhu berapa jumlah cacat produksi mencapai 2 maka kita dapat menghitungnya

2 = 1.4498(Rerata Suhu) - 24.381
1.4498(Rerata Suhu) = 26.381
Rerata Suhu = (26.381/1.4498)
Rerata Suhu = 18.2° C

Artinya jumlah cacat produksi mencapai 2 unit itu saat suhu 18.2° C

Rendi Anwar / Author & Editor

0 comments:

Post a Comment

Coprights @ 2016, Blogger Templates Designed By Templateism | Distributed By Gooyaabi Templates