Monday 13 November 2017

Rumus regresi logistik binário opções no Brasil


Regresi linier seperti yang kita ketahui tidak dapat menyelesaikan kasus dimana variabel dependente bersifat dikotomi dan kategori dengan dua atau lebih kemungkinan (ex. Sukses atau Gagal terpilih atau tidak terpilih lulus atau tidak lulus melakukan pembelian atau tidak mendapat promosi atau tidak, dan lain-lain) . Regresi logistik umumnya melibatkan berbagai macam variabel prediktor baik numerik ataupun kategorik, termasuk varibel dummy. Pada regresi linier, variabel prediktor yang digunakan biasanya numerik, tetapi jika kita melibatkan campuran antara numerik maupun kategorik kita dapat menggunakan regresi logistik. Regresi logistik membentuk persamaan atau fungsi dengan pendekatan máxima verossimilhança, yang memaksimalkan peluang pengklasifikasian objek yang diamati menjadi kategori yang sesuai kemudian mengubahnya menjadi koefisien regresi yang sederhana. Dua nilai yang biasa digunakan sebagai variabel dependen yang diprediksi adalah 0 dan 1 (ex. 1berhasil, 0gagal). Regresi logistik menghasilkan rasio peluang (odds ratios) antara keberhasilan atau kegagalan suatu dari analisis. Dapat kita contohkan dengan seorang tokoh yang ingin menjadi presiden, akan lebih baik peluangnya jika menjadi ketua partai politik tertentu. Disini odds ratio yang dimaksud adalah seberapa besar peluang tokoh tersebut dengan mempertimbangkan variabel prediktor yang ada. Regresi logistik akan membentuk variabel prediktorrespon (log (p (1-p)) yang merupakan kombinasi linier dari variabel independen. Nilai variabel prediktor ini kemudian ditransformasikan menjadi probabilitas dengan fungsi logit. Asumsi-asumsi dalam regresi logistik Tidak mengasumsikan hubungan linier antar variabel dependen dan Variabel independente dependen harus bersifat dikotomi (2 variabel) Variabel independente tidak harus memiliki keragaman yang sama antar kelompok variabel Kategori dalam variabel independente harus terpisah satu sama lain atau bersifat eksklusif Sampel yang diperlukan dalam jumlah relativo besar, mínimo dibutuhkan hingga 50 sampel dados untuk sebuah variabel Prediktor (bebas). Persamaan Regresi Logistik Regresi logistik menghasilkan rasio peluang yang dinyatakan dengan transformasi fungsi logaritma (log), dengan demikian fungsi transformasi log ataupun Em diperlukan untuk p-value, dengan demikian dapat dinyatakan bahwa logit (p) merupakan log dari peluang ( Odds ratio) Relação de verossimilhança de atau dengan kemungkinan terbesar nilai peluang adalah 1, dengan demikian persamaan regresi logistik menjadi: logit (p) log (p1-p) ln (p1-p) dimana p bernilai antara 0-1. Modelo yang digunakan pada regresi logistik adalah: Log (P 1 8211 p) 0 1X1 2X2 8230. kXk Dimana p adalah kemungkinan bahwa Y 1, dan X1, X2, X3 adalah variabel independen, dan b adalah koefisien regresi. Contings de log de Konsep, Ratio de Odds Logit (probabilidades de log) merupakan koefisien slope (b) dari persamaan regresi. Slope disini adalah perubahan nilai rata-rata dari Y dari satu unidade perubahan nilai X. Regresi logistik melihat perubahan pada nilai variabel dependem yang ditransformasi menjadi peluang, bukan nilai aslinya seperti pada regresi linier. Sebagai ilustrasi jika nilai peluang adalah 0,25, maka nilai odds adalah 3 (25. 75), sedangkan jika nilai peluang 50, maka nilai odds adalah 1 (50. 50), atau jika nilai peluang 0,33, maka nilai odds adalah 2 (33. 67) dengan total keseluruhan nilai peluang adalah 1. Nilai odds ratio biasanya dapat kita lihat pada kolom B pada 8216variables na equação8217 saída SPSS. Modelo de Kecocokan (ajuste do modelo) e probabilidade de diversão. Probabilidade de ter um problema com a terapia. Seperti yang kita ketahui pada kurva regresi linier kita lihat adanya hubungan linier, peningkatan pada sumbu Y akan diikuti dengan peningkatan pada sumbu X dan sebaliknya. Tetapi pada regresi logistik dengan nilai Y antara 0 dan 1, pendekatan linier tidak bisa kita gunakan. Oleh karena itu metode máxima probabilidade sangat berguna dalam menentukan kecocokan modelo yang tepat bagi persamaan yang kita miliki. Hipotesis dalam regresi logistik antara lain: h0 ketika persamaan regresi bernilai 0 logit (p) 0. h1 persamaan regresi berbeda nyata dari 0 logit (p) 8800 0. Regresi logistik merupakan regresi não linier dimana modelo yang ditentukan akan mengikuti pola kurva linier seperti gambar Di bawah ini. Regresi logistik juga menghasilkan rasio peluang (odds ratios) terkait dengan nilai setiap prediktor. Peluang (probabilidades) dari suatu kejadian diartikan sebagai probabilitas hasil yang muncul yang dibagi dengan probabilitas suatu kejadian tidak terjadi. Secara umum, rasio peluang (odds ratios) merupakan sekumpulan peluang yang dibagi oleh peluang lainnya. Rasio peluang bagi prediktor diartikan sebagai jumlah relativo dimana peluang hasil meningkat (rasio peluang gt 1) atau turun (rasio peluang lt 1) ketika nilai variabel prediktor meningkat sebesar 1 unidade. Lebih jelasnya kita dapat mengikuti ilustrasi berikut ini: Kita ingin mengetahui apakah berat badan (weightgain) sapi para peternak di kota elgrow bertambah signifikan atau tidak, dengan variabel prediktor adalah sexo yang terdiri atas masculino (M) atau feminino (F), obit cate (Antihelmíntico) secara rutin sesuai dosis yang dinyatakan dengan sim dan não, dan biaya pemeliharaan por bulan yang dinyatakan dalam EUA. Kali ini kita akan menjalankan modelo logit menggunakan bantuan software IBM SPSS versi 23, untuk yang masih menggunakan SPSS seri di bawahnya jangan khawatir, masih kurang lebih sama koq cara aplikasinya, kamu bisa download datanya disini 1. tahap impor dados (misalnya dari excel), Buka SPSS kamu, arquivo gt ler dados de texto, pada kotak diálogo abrir dados, arquivos de tipo gt pilih excel, maka datanya muncul di layar, pilih lalu klik gt aberto, kemudian dimunculkan lagi jendela abrir dados, lista de verificação seperti gambar gt ok, dados telah Masuk dalam record spss, berikut adalah dataview, lihat sususannya tidak beraturan, kamu bisa atur dalam variável view: atur label, desimal, dan lain-lain dalam variabel view, 2. Tahap Analisis, Analise gt regression gt logística binária, Setelah muncul jendela logistic Regressão, masukkan weightgain kedalam dependen, dan variabel kategorik yaitu sexo dan anthelmintic ke kotak covariados, lalu klik categórico, untuk menyesuaikan tipe dados varibel kategorik, Di jendela Definir covariáveis ​​variáveis ​​pilih categoria de referência primeiro, kemudian klik muda gt continuar, klik próximo lalu masukkan variabel kontinyu custo, ke dalam covariações, opção kemudiana, kemudian continuar gt ok, maka outputnya akan ditampilkan, modelo Qui-Square sebesar 18,440, angka ini menjelaskan kemampuan Modelo dalam memprediksi variabel dependen weightgain. Dengan signifikansi 0,000 lt 0,05, berarti terdapat peningkatan signifikansi dengan penambahan variabel sexo, dan anthelmintic, ke dalam model. -2 log de probabilidade menjelaskan signifikansi modelo layaknya R-sq pada regresi linier OLS. Tabel Hosmer e Lemeshow test menunjukkan nilai penambahan signikansi modelo dari konstanta, dan modelo sesudah ditambahkan variabel independen sex dan anthelmintic. Penambahannya cukup kecil dengan signifikansi 0,631 (gt0,05). Kita lihat kembali pada variáveis ​​de saída na equação modelo de menunjukkan sesuai hipotesis nulo atau modelo tanpa prediktor, Variáveis ​​de saída não na equação menunjukkan signifikansi masing-masing varibel independen terhadap weightgain. Dari tabel dapat kita lihat bahwa variabel anthelmintic (1) memberikan peningkatan yang signikan terhadap modelo (0,000), sedangkan sexo (1) tidak signifikan (0,298). Tetapi secara keseluruhan signifikan terhadap modelo perbaikan (estatísticas globais, sig 0,000). Variáveis ​​de saída de Dari na equação persamaan yang kita peroleh adalah (lihat nilai pada kolom B): Probabilidades de logs (ganho de peso) B0 B1sex (1) B2anthelmintic (1) B3cost atau dengan nilai aslinya Odds de registro -3g 502 0,116sex (1) 2,638, hemiltémico (1) 0,011, preço Jika (1) 1 (codificação de saída lihat), antihelmíntico (1) 1 (codificação de saída lihat), dan costUS 100, maka persamaannya menjadi: Probabilidades de logs (ganho de peso) -3,502 0,116 (1) 2,638 (1) 0,011 (100) Odds de registro (peso) -3,502 0,116 2,638 1,1 Jika kita hilangkan log maka persamaan akan dalam bentuk eksponensial: probabilidades (peso) e -3,502 0,116 2,638 1,1 Interpretasi dari Persamaan Untuk setiap perubahan por unidade Pada variabel sex (1) (koding dummy untuk variabel Mjantan), akan meningkatkan weightgain sebesar 0,116. Untuk setiap kenaikan pada variabel anthelmintic (1) sebesar 1 unidade, maka akan meningkatkan weightgain sebesar 2.638. Untuk setiap penambahan sebesar US1 terhadap variabel cost, maka akan meningkatkan peluang weightgain sebesar 0,011. Dann nilai signifikansi dapat kita simpulkan bahwa variabel yang signikan berpengaruh terhadap log odds (weightgain) adalah pemberian obat cacing secara rutin (antihelmíntico (1)), dan cost dengan nilai signifikansi berturut-turut 0,02 dan 0,018 (pada tingkat signifikansi 95). Kemudian mari kita interpretasikan nilai exp (B) variáveis ​​de saída do pada nas equações diáreas: Variabel sex (1) yang mengacu pada MaleJantan, memiliki kecenderungan untuk mendapatkan pertambahan berat badan (weightg ain) 1,122 kali daripada Femalebetina yang menjadi kategori referensi kita (ini Adalah koding dummy, dimana 0 untuk F dan 1 untuk M). Variabel anthelmintic (1) yang mengacu pada sim, dimana pemberian obat cacing secara teratur dan sesuai dosis memiliki peluang sebesar 13,988 kali daripada kategori referensi kita yang mengacu pada não, dimana no dinyatakan sebagai tidak memberikan asupan obat cacing secara rutin dan sesuai dosis. Variabel ini sangat signifikan mempengaruhi log odds (weightgain) dengan nilai signifikansi 0,002. Variabel cost cenderung meningkatkan weightgain sebesar 0,030 kali dengan nilai signifikansi yang baik yaitu 0,018 lt 0,05. (Yoso) download materi dalam bentuk pdf di bawah ini gtgtgtKonsep Regresi Logistik BinerDikotomi Analisis regresi logistik merupakan metode analisis yang biasanya digunakan oleh mahasiswa dalam menyelesaikan skripsi berkaitan Dengan skripsi tentang persepsi. Bahasa gaul metode ini biasa disebut reglog. Untuk pembahasan kali akan dibahas materi reglog dulu. Dan akan dilakukan untuk contoh kasusnya dengan software SPSS. Mudy-mudahan bisa membantu para cendikiawan muda termasuk penulis sendiri. hehehhe Analisis regresi logistik digunakan untuk menjelaskan hubungan antara variabel respon eang berupa dados dikotomikbiner dengan variabel bebas yang berupa data berskala intervalo dan atau kategorik (Hosmer dan Lemeshow, 1989). Variabel yang dikotomikbiner adalah variabel yang hanya mempunyai dua kategori saja, yaitu kategori yang menyatakan kejadian sukses (Y1) dan kategori yang menyatakan kejadian gagal (Y0). Modelo modelo modelo Modelo modelo padrão modelo padrão modelo padrão padrão padrão, padrão do modelo de pada. Sebaran bernoulli termasuk dalam salah satu dari sebaran keluarga eksponensial. Variabel respon Y ini, diasumsikan mengikuti distribusi Bernoulli. Timbul pertanyaan: Perbedaan antara regresi logistik dengan analisis regresi biasa kenapa tidak pakai analisis regresi biasa aja Sebenarnya untuk masalah diatas bisa digunakan analisis regresi OLS. Tapi harus memenuhi asumsi bahwa 0 lt E (Yi 247 Xi) lt 1. Namun persyaratan tersebut sulit untuk terpenuhi. Sehingga metode regresi OLS kurang cocok untuk dados kuantitatif dan lebih baik menggunakan metode regresi logistik. Contoh Kasus dalam regresi logsitik biner: Pengaruh Tingkat Pendidikan, Lapangan Kerja yg dimasuki, Pendapatan, Pengeluaran, Jumlah ART terhadap status kemiskinan (MiskinTIdak Miskin). Pengaruh Pendapatan Keluarga, Banyaknya Anggota Keluarga, Jenis rumah, Usia Kepala Keluarga terhadap Kepemilikan rumah (Punya rumahtidak) Berdasarkan dua contoh tersebut mungjkin sudah membuka pikiran untuk kasus seperti apa regresi logistik digunakan. Intinya variabel dependencea dikotomi artinya memiliki dua kategori seperti pada kasus diatas yang ditebal. Kenapa cuma dua kategori aja tidak bisa lebih dari tiga kategori Untuk metode ini tidak bisa karena hanya bisa dua sesuai dengan namanya. Untuk masalah diatas ada metode lain yang bisa digunakan yaitu regresi logistik ordinal. Bagaimana langkah-langkah atau prosedur statistiknya sebagai referensi buat skripsi. hehehe Bentuk umum modelo peluang regresi logistik dengan p variabel penjelas, diformulasikan sebagai berikut: dengan (x) adalah peluang kejadian sukses dengan nilai probabilita 08804 (x) 88041 dan j adalah nilai parameter dengan J 1,2. P. (X) merupakan fungsi yang non linier, sehingga perlu dilakukan transformasi ke dalam bentuk logit untuk memperoleh fungsi yang linier ágar dapat dilihat hubungan antara variabel bebas dan variabel tidak bebas. Dengan melakukan transformasi dari logit (x), maka didapat persamaan yang lebih sederhana, yaitu: Jika dari beberapa variabel bebas ada yang berskala nominal atau ordinal, maka variabel tersebut tidak akan tepat jika dimasukkan dalam modelo logit karena angka-angka yang digunakan untuk menyatakan tingkatan Tersebut hanya sebagai identifikasi dan tidak mempunyai nilai numerik dalam situasi seperti ini diperlukan variabel manequim. Untuk variabel bebas dengan skala ordinal maupun nominal dengan k kategori, akan diperlukan sebanyak k-1 variabel manequim. Asseg-asumsi dalam regresi logistik: Tidak mengasumsikan hubungan linier antar variabel dependen de independent Variabel dependen harus bersifat dikotomi (2 variabel) Variabel independente tidak harus memiliki keragaman yang sama antar kelompok variabel Kategori dalam variabel independente harus terpisah satu sama lain atau bersifat eksklusif Sampel yang Diperlukan dalam jumlah relatif besar, mínimo dibutuhkan hingga 50 sampel dados untuk sebuah variabel prediktor (bebas). Parâmetro de Pendugaan Metodo untuk mengestimasi parâmetro-parâmetro yang tidak diketahui dalam modelo regresi logistik ada 3 yaitu: 1. Metode kemungkinan maksimum (Método de máxima probabilidade) 2. Metode kuadrat terkecil tertimbang noniterasi 3. Método analítico fungsi diskriminan (Discriminante Análise de Fucção) Pada dasarnya metode maksimum Probabilidade de se tornar um método de troca de dados, de acordo com o método do método mínimo quadrado, com método sedan, com método de menor comprimento quadrado método Hanya menggunakan satu kali iterasi. Kedua metode ini asymptoticaly equivalente. Artinya jika ukuran sampel besar keduanya akan menghasilkan estimator yang identik. Penggunaan fungsi diskriminan mensyaratkan variabel penjelas yang kuantitatif berdistribusi normal. Oleh karena itu, penduga dari fungsi diskriminan akan sobre estimativa bila variabel penjelas tidak berdistribusi normal. Dari Ketiga metodei di atas, metode yang banyak digunakan adalah metode maksimum likelihood dengan alasan lebih praktis (Nachrowi dan Usman, 2002). Metode maksimu likelihoood ini menduga parâmetro denegan nilai yang memaksimumkan fungsi verossimilhança (função de verossimilhança). Uji Signifikansi Modelo Untuk mengetahui pengaruh variabel bebas terhadap variabel tidak bebas secara bersama-sama (em geral) di dalam modelo, dapat menggunakan Uji Ratio de verossimilhança. Hipotesisnya adalah sebagai berikut: Ho: 1 2. P0 (tidak ada pengaruh veriabel bebas secara simultan terhadap variabel tak bebas) H1: mínimo ada satu j 8800 0 (ada pengaruh paling sedikit satu veriabel bebas terhadap variabel tak bebas) Untuk j 1,2. P Statistik uji yang digunakan adalah: Lo Maksimum Lieklihood dari modelo reduksi (modelo reduzido) atau modelo yang terdiri dari konstanta saja Lp Maksimum Probabilidade dari modelo penuh (modelo completo) atau dengan semua variabel bebas. Statistik G2 ini mengikuti distribusi Khi-kuadrat dengan derajad bebas p sehingga hipotesis ditolak jika p-valor lt, yang berarti variabel bebas X secara bersama-sama mempengaruhi variabel tak bebas Y. Uji Parsial de Pembentukan Modelo Pada umumnya, tujuan analsis statistik adalah untuk mencari Modelo yang cocok dan keterpautan yang kuat antara modelo dengan data yang ada. Parâmetro keberartiano de Pengujian (koefisien) secar parsial dapat dilakukan melalui Uji Wald dengan hipotesisnya sebagai berikut: Ho: j 0 (variabel bebas ke j tidak mempunyai pengaruh secara signifikan terhadap variabel tidak bebas) H1: j 8800 0 (variabel bebas ke j mempunyai pengaruh secara Signifikan terhadap variabel tidak bebas) Untuk j 1,2. P Dengan statistik uji sebagai berikut: Hipotesis akan ditolak jika p-value lt yang berarti variabel bebas Xj secara parcial mempengaruhi variabel tidak bebas Y. Odds Ratio Odds ratio merupakan ukuran risiko atau kecenderungan untuk mengalami kejadian 8216sukses 8216 antara satu kategori dengan kategori lainnya, didefinisikan Sebagai ratio dari odds untuk xj 1 terhadap xj 0. Odds ratio ini menyatakan risiko atau kecenderungan pengaruh observasi dengan xj 1 adalah berapa kali lipat jika dibandingkan dengan observasi dengan xj 0. Untuk variabel bebas yang berskala kontinyu maka interpretasi dari koefisien j pada modelo regresi logistik Adalah setiap kenaikan c unidade pada variabel bebas akan menyebabkan risiko terjadinya Y 1, adalah exp (cj) kali lebih besar. Odds ratio dilambangkan dengan, didefinisikan sebagai perbandingan dua nilai odds xj 1 dan xj 0, sehingga: Siang mas. Saya Echa. Ingin menanyakan..pada penelitian saya (dados não paramétricos, var dependen dan independen keduanya rasio) didapat hasil korelasi spearman yg bermakna. Saya ingin melanjutkan regresinya..tp setelah saya uji regresi liniernya trnyt residualnya uji Kolmogorov tidak terdistribusi normal juga..hehhe. Sebaiknya saya menggunakan regresi apa ya mas apakah hrs menggunakan regresi logistik (dados pdhal saya rasio) .. mhn pencerahannya ya mas..tksh bnyk Siang. Kalau datanya rasio mungkin lebih baik menggunakan korelasi pearson. Kalau datanya tidak normal bisa dicoba transformasi dulu variabelnya mas. Assalamu39alaikum. Ka, Mau Tanya. Di logit, kalo salah satu variabel prediktor yang bentuknya logaritma natural (ln), misanya variabel pengeluaran dalam bentuk ln, itu gimana interpretasi odds ratio nya apa sama aja kaya di analisis regresi linier misal odds ratio nya 3, berarti tiap kenaikan satu persen pengeluaran, Kecenderungan quotsuksesquot akan meningkat sebesar 3 kali. Apa seperti itu terimakasih. Jazakumullaahu khairan. Wa39alaikumsalam, knapa di-ln-kn dek corrigindo variabelnya yang mentah saja, tidak usah ditransformasi, supaya reglognya tidak mubazir. Sama2 dek. Di-ln-kn, tujuannya biar mempermudah interpretasi ka, tapi ternyata malah bingung cara nginterprestinya. Kalo gak di-ln-kn, ketika odds nya 2, berarti intrpretasinya: setiap pertambahan quotsatuquot rupiah pengeluaran, meningkatkan kecenderungan quotsuksesquot sebesar 2x, apakah seperti itu maksud dari quotreglognya mubadzirquot itu gmn makanya tidak usah di-ln-kan dek, selain jd makin Susah interpretasi, biasanya transformasi dilakukan untuk menormalkan dados, sementara metode reglog tidak butuh asumsi normalitas. Reglog itu metode yang persyaratannya paling ringan di antara metode regresi lain, jadi kalau datanya diperlakukan seperti ketika memakai regresi biasa (yg syaratnya banyak) itu menurut saya mubazir. Assalamu39alaykum Mas Chalik Mawardi. Mohon izin saya ikut nanya juga ya, sedang menyusun skripsi. Ada beberapa pertanyaan: 1. Apakah Data berskala Ordinal bisa hanya terdiri dari dua kategori Contohnya para pelamar PNS dikategorikan menjadi quotlulus tesquot dan quottidak lulus tesquot. 2. Variabel penelitian saya hanya terdiri dari satu variabel dependem de satu variabel independen. Variabel dependennya sebenarnya terdiri dari 4 kategori, tetapi bisa juga diolah menjadi dikotomi. Sedangkan untuk variabel independennya interval, tetapi juga bisa diolah menjadi dhikotom. Mohon saran Mas Chalik sebaiknya saya menggunakan metode statistik apa Terima kasih sebelumnya. Wa 39alaikummsalam 1. Tidak, ordinal itu maksudnya, kategori, tapi memiliki tingkatan, berapapun banyaknya kategori tersebut. Misal, ranking de dados siswai, IP mahasiswai, jabatan pekerja, jenjang pendidikan (sd, smp, sma), dsb 2. Kalau dilihat dari jenis datanya, bisa pakai regresi logistik atau probit assalamualaikum, mas saya mau nanya. Saya masih belum paham soal penggunaan variabel manequim. Jadi penelitian saya tu datanya ordinal dengan satu variabel independen dan satu variabel dependen. Tapi penelitian saya ini dilakukan pada dua kelompok yaitu kelompok sasaran dan kelompok kontrol. Sebelumnya saya meneliti korelasi variabel x terhadap y pada kelompok sasaran, selanjutnya saya bandingkan dengan kelompok kontrol mana yang pengaruhnya lebih besar terhadap variabel y. Dosen saya menyarankan untuk di manequim, tapi saya blm paham mas. Mohon pncerahannya bgmn caranya, trus apakah bisa menggunakan spss atau gimana mas terimakasih sebelumnya. Pagi Pak, saya mau bertanya bagaimana cara mengolah regresso logistik dengan variabel dependen 2 kategori tapi variabel independennya ada tiga kategori. Misal dependennya menerima opini ir preocupação diberi kode 1 dan menerima opini não preocupação permanente 0 lalu independennya kondisi keuangan bangkrut diberi kode 1, rawan diberi kode 0, sehat diberi kode -1. Mohon pencerahannya pak, makasi untuk kemudahan coba ganti kode variabel independennya menjadi 1, 2 dan 3. jumlah pilihan pada variabel independen tidak masalah masih bisa dijalankan dengan programa populer seperti SPSS. Coba buka SPSS gt trus analisis gt regressi gt logistic biner (logística binária). Taruh variabel independen di covariate. Itu jika ingin menggunakan logistik biner. Jika ingin menggunakan logistik geral maka bisa buka spss trus analisis gt logística gt geral gt taruh di covariate digunakan jika variabel kategorik. Coba dulu yaaSebagai kelanjutan dari tulisan mengenai modelo pilihan kualitatif, pada bagian ini, akan dijelaskan contoh modelo binário logit dan estimasinya dengan menggunakan programa SPSS. Sebagai contoh ilustratif, misalnya ingin diprediksi pengaruh umur, jenis kelamin dan pendapatan terhadap pembelian mobil. Berdasarkan hasil survai terhadap 48 responden, didapatkan datanya sebagai berikut: Dimana: Y 1, jika konsumen membeli mobil, 0 jika konsumen tidak membeli mobil X1 umur responden dalam tahun X2 1, jika konsumen berjenis kelamin wanita, 0 jika konsumen berjenis kelamin pria X3 0 Jika konsumen berpendapatan rentah, 1 jika konsumen berpendapatan sedang 2 jika konsumen berpendapatan tinggi Tahapan-tahapan estimasi dalam SPSS sebagai berikut: 1. Setelah data diinput dalam lembar kerja SPSS kemudian klik Analise gt Regression gt Logística binária. Selanjutnya akan muncul tampilan berikut: 2. Masukkan Y sebagai dependente da variável dengan cara klik Y di kotak kiri, kemudian klik tanda panah desodorante kotak Dependente. Masukkan X1, X2 dan X3 kedalam kotak Covariates, dengan cara klik masing-masing variável, kemudian klik tanda panah disamping kotak covariações. 3. Selanjutnya, karena variabel X3 merupakan peubah kategori (ordinal) dengan lebih dari dua kategori (yaitu 0pendapatan rendah, 1pendapatan sedang dan 2pendapatan tinggi) maka diubah terlebih dahulu ke dalam 2 varibel dummy, untuk mengembangkan modelo yang logis dan mudah diinterpretasi, sebagai berikut : (Ini sama dengan prosedur regresi dengan variabel bebas dummy sebelumnya) X31 1, jika konsumen berpendapatan menengah 0, jika selainnya X32 1, jika konsumen berpendapatan tinggi 0, jika selainnya Dalam programa SPSS untuk mengkonversi ini dengan cara klik Categorical dari tampilan diatas, maka Akan muncul tamilan berikut: Selanjutnya, klik X3, klik tanda panah desacoplando Covariates categóricos. Pilih Reference Category dengan Primeiro, kemudian klik Alterar dan Continuar. Selanjutnya klik OK. 4. Akan Keluar output SPSS untuk regresso logit sebagai berikut (disini hanya ditampilkan bagian-bagian terpenting saja yang akan dibahas): Imprimindo di tabel pertama diatas menjelaskan transformasi variabel X3 dengan kategori 0,1 dan 2 menjadi dua variabel manequim yaitu X31 dan X32. Seperti yang terlihat dari tabel tersebut, variabel X31 bernilai 1 por categoria 1 (pendapatan menengah) dan 0 untuk kategori lainnya. Variabel X32 bernilai 1 untuk kategori 2 (pendapatan tinggi) dan 0 untuk kategori lainnya. Dengan demikian, kategori 0 (pendapatan rentah) akan bernilai 0 baik pada variabel X31 dan X32. Imprimindo di tabel kedua diatas merupakan nilai Khi-kuadrat (2) dari modelo regresi. Sebagaimana halnya modelo regresi linear dengan metode OLS, kita juga dapat melakukan pengujian arti penting model secara keseluruhan. Jika metode OLS menggunakan uji F, maka pada modelo logit menggunakan uji G. Statistik G ini menyebar menurut sebaran Khi-kuadrat (2). Karenanya dalam pengujiannya, nilai G dapat dibandingkan dengan nilai 2 tabel pada tertentu dan derajat bebas k-1. (Kriteria pengujian dan cara pengujian persis sama dengan uji F pada metode regresi OLS). Tetapi, kita juga bisa melihat nilai p-value dari nilai G ini yang biasanya ditampilkan oleh sofware-software estatística, termasuk SPSS. Saída Dari SPSS, didapatkan nilai 2 sebesar 18,131 dengan p-value 0,001. Karena nilai ini jauh dibawah 10 (jika menggunakan pengujian dengan 10), atau jauh dibawah 5 (jika menggunakan pengujian dengan 5), maka dapat disimpulkan bahwa modelo regresi logistik secara keseluruhan dapat menjelaskan atau memprediksi keputusan konsumen dalam membeli mobil. Imprimindo di tabel ketiga memberikan estimasi koefisien modelo dan pengujian hipotesis parsial dari koefisien modelo. Dalam pelaporannya, modelo regresi logistiknya dapat dituliskan sebagai berikut: saída Dari SPSS diatas menjadi sebagai berikut: Modelo ini merupakan modelo peluang membeli mobil (P (xi) yang dipengaruhi oleh faktor-faktor umur, jenis kelamin dan pendapatan. Modelo tersebut adalah bersifat non - Parâmetro de dalam linear. Selanjutnya, untuk menjadikan modelo tersebut linear, dilakukan transformasi dengan logaritma natural, (transformasi ini yang menjadi hal penting dalam regresi logistik dan dikenal dengan istilah 8221logit transformation8221), sehingga menjadi (pembahasan lebih rinci, silakan dibaca buku-buku ekonometrik) : 1-P (xi) adalah peluang tidak membeli mobil, sebagai kebalikan dari P (xi) sebagai peluang membeli mobil. Oleh karenanya, em P (xi) 1-P (xi) secara sederhana merupakan log dari perbandingan antara peluang membeli mobil dengan Peluang tidak membeli mobil. Oleh karenanya juga, koefisien dalam persamaan ini menunjukkan pengaruh dari umur, jenis kelamin dan pendapatan terhadap peluang Person particular membeli mobil yang dibandingkan dengan peluang tidak membeli mobil. Selanjutnya, untuk menguji faktor mana yang berpengaruh nyata terhadap keputusan pilihan membeli mobil tersebut, dapat menggunakan uji significikansi dari parâmetro koefisien secara parsial dengan statistik uji Wald, yang serupa dengan statistik uji t atau uji Z dalam regresi linear biasa, yaitu dengan membagi koefisien terhadap standar Erro que masing-masing koefisien. Dari saída SPSS ditampilkan nilai Wald dan p-valorenya. Berdasarkan nilai p-value (dan menggunakan kriteria pengujian 10), dapat dilihat seluruh variabel (kecuali X31), berpengaruh nyata (memiliki p-value dibawah 10) terhadap keputusan membeli mobil. Lalu, bagaimana interpretasi koefisien regresi logit dari persamaan di atas. Dalam modelo regresi linear, koefisien i menunjukkan perubahan nilai variabel dependente sebagai akibat perubahan satu satuan variabel independente. Hal yang sama sebenarnya juga berlaku dalam modelo regresi logit, tetapi secara matematis sulit diinterpretasikan. Koefisien dalam modelo logit menunjukkan perubahan dalam logit sebagai akibat perubahan satu satuan variabel independente. Interpretasi yang tepat untuk koefisien ini tentunya tergantung pada kemampuan menempatkan arti dari perbedaan antara dua logit. Oleh karenanya, dalam model logit, dikembangkan pengukuran yang dikenal dengan nama odds ratio (). Odds ratio untuk masing-masing variabel ditampilkan oleh SPSS sebagaimana yang terlihat tabel diatas (kolom Exp (B)). Odds ratio dapat dirumuskan: e, dimana e adalah bilangan 2.71828 dan adalah koefisien masing-masing variabel. Sebagai contoh, odds ratio untuk variabel X2 e-0.1602 0,201 (lihat output SPSS). Dalam kasus variabel X2 (jenis kelamin dimana 1 wanita dan 0 pria), dengan odds ratio sebesar 0,201 dapat diartikan bahwa peluang wanita untuk membeli mobil adalah 0,201 kali dibandingkan pria, jika umur dan pendapatan mereka sama. Artinya wanita memiliki peluang lebih rendahi dalam membeli mobil dibandingkan pria. Dalam kasus variabel X1 (umur), dengan odds ratio sebesar 1,153 dapat diartikan bahwa konsumen yang berumur lebih tua satu tahun peluang membeli mobilnya adalah 1,153 kali dibandingkan konsumen umur yang lebih muda (satu tahun), jika pendapatan dan jenis kelamin mereka sama. Artinya orang yang lebih tua memiliki peluang yang lebih tinggi dalam membeli mobil. Dalam konteks umur ini (yang merupakan variabel dengan skala ratio), hati-hati menginterpretasikan nilai perbedaan peluangnya. Jika perbedaan umur lebih dari 1 tahun, misalnya 10 tahun, maka odds rationya akan menjadi 4,14, yang diperoleh dari perhitungan sbb: e (10 x 0,142). Artinya peluang membeli mobil konsumen yang berumur lebih tua 10 tahun adalah 4,14 kali dibandingkan konsumen yang lebih muda (10 tahun) darinya. Selanjutnya, dalam konteks variabel pendapatan, terlihat bahwa X31 tidak berpengaruh signifikan. Artinya, peluang membeli mobil antara konsumen pendapatan sedang dan pendapatanvenanth adalah sama saja. Sebaliknya, untuk X32, dapat diinterpretasikan bahwa peluang membeli mobil konsumen pendapatan tinggi adalah 6,45 kali dibandingkan pendapatan rentah, jika umur dan jenis kelaminnya sama. KONSEP REGRESI LOGISTIK CONTOH DENGAN SPSS 16 (Kasus Binary Reglog) Malam ni sobat semua. Wah wah wah. Pada gimana nih kabarnya Moga baik dan sehat-sehat saja ya hehehe. Yap, s ekarang kita belajar lagi yuk materi yang baru. Nah, kali ini saya mau ngebahas dan ngasi contoh untuk metode statistik Regresi Logistik. Kalau sobat pernah baca postingan saya tentang regressão múltipla. Maka bedanya ada pada skala dados varibel terikatnya soluço. Untuk regresi logistik, skala data variabel terikat (Y) adalah kategorik (não metrik). Ya bisa dua kategori, lebih dari dua (categoria de banyak) dan bisa juga skala datanya ordinal kategorik. Terkait konsep, sebenarnya sama saja dengan regresi biasa (sederhana maupun berganda), há uma melhat pengaruh dari variabel-variabel bebas terhadap variabel terikat. Regresi logistik ini juga dipakai sebagai alternativo analisis multivariado yaitu analisis diskriminan (pembeda). Nah, sebagai pengantar pengetahuan saja, dalam analisis diskriminan kan dibutuhkan asumsi kenormalan multivariat. Nah, b edanya dengan uji asumsi kenormalan biasa seperti ini k alau uji asumsi kenormalan biasa, yang diuji kenormalannya adalah residual dari variabel terikatdependennya sedangkan untuk multivariante normal, yang diuj kenormalannya adalah seluruh variabel bebasnya. Asumsi multivariat normal ini terkadang sulit dipenuhi dalam analisis diskriminan karena variabel bebas yang digunakan merupakan gabungan antara skala dados kategoriknon metrik dan kontinyumetrik. Dalam regresi logistik dikenal konsep Odds Ratio yang sama artinya dengan probabilitas atau kecenderungan. A propósito. Análise de t erkait injetável discriminal ink akan dibahas secara khusus pada postingan berikutnya. Sabar aja ya hehe. Kalau seandainya, dalam penelitian sobat, pakainya ada dua kategori pada variabel terikatnya misalnya 8220lulus8221 dan 8220tidak lulus8221, regressão logística binária de maka dinamakan. Kalau semisalnya lebih dari dua kategori alias banyak dinamakan regresão logística multinomial. Nah, satu lagi, kalau skala data variabel terikatnya ordinal (peringkat), dinamakan ordinal regressão logística. Oke deh kali ini saya berikan contoh pengerjaannya. Monggo, datanya download disini Kalo sobat sudah ambil dan lihat datanya, ada tiga buah variabel yakni hasil tes tertulis, jenis kelas dan nilai tes praktikum. Disini saya mengambil sampel secara acak yakni 30 mahasiswa jurusan tehnik sipil suatu kampus. Hasil tes tertulis yang adalah variabel terikat merupakan kategorik (dua kategori yaitu 1lulus dan 0tidak lulus), jenis kelas juga kategorik (1reguler dan 0non reguler) dan nilai tes praktikum adalah non kateginy (kontinyu). Berikut cuplikan tampilan visualização de dados comparável a uma informação variável: japra: jadi dalam analisis reglog kita menggunakan variabel bebas yang berskala dados kualitatif (nominal atau ordinal) sehingga kita tidak bisa menghitung varians dan rerata dari variabel yang berskala data kualitatif. Selanjutnya, dalam uji asumsi yang lain misalnya multikol, itu hanya digunakan kalau kita menggunakan variabel bebas dengan skala dados yang sama bukan gabungan (beberapa kuantitatif dan ada juga yang kualitatif). Uji F Dan T sama dengan yang di OLS anonim: kalau untuk melihat besarnya pengaruh suatu variabel bebas kamu bisa lihat nilai koefisiennya modelnya saja dan coba sandingkan dengan teori yang ada. Ingat bahwa statistik itu hanya ferramentas sehingga harus selalu dilakukan uji kebaikan modelo estatística, bisa dgn melihat nilai R quadrado, tabela de classificação bahkan mengembalikan hubungan variabel bebas terhadap tidak bebas ke dalam esensi keilmuannya (apa benar pengaruhnya benar seperti yang ditunjukkan oleh model statistik). Demikian. Salam Salam kenal mas ... Saya punya tugas seberapa besar pengaruh website promosi yg saya buat terhadap jumlah transaksi penjualan perharinya selama 1bulan. Jd Y nya saya bikin 1 dari website saya 0 dari media lain, buat X nya saya buat kuisioner skla likert dengan 2 variável dr website saya, jadi ketika ada pembeli yg membeli barang saya kasikan kuisionernya. Apakah bisa analisis reg log inunk mencari besran pengaruh website promosi saya terhadap jmlah transaksi penjualan perharinya selama satu bulan. Trimss

No comments:

Post a Comment