Salah interpretasi p-value

normal

Image: N. Johnston, http://www.statdistributions.com/normal/

 

Ionnidis (2005, PLoS Medicine) bilang, “most published research claims are false”. Paper yang kesimpulannya salah jumlahnya lebih dari 50% dari semua publikasi. Ini jumlah yang ga main-main. Menanggapi hal itu, Goodman & Greenland S (2007) menyebutkan bahwa salah satu penyebabnya adalah kesalahan dalam penggunaan dan interpretasi p-value.

Oke, p-value dalam analisa statistik sangat populer. Hampir semua analisa statitstik mnyertakan p-value. Namun, ternyata sebagian besar dari kita, salah penggunaan dan interpretasi p-value.

Lalu Berdasarkan Goodman (2008), berikut adalah beberapa salah interpretasi yang umum terjadi:
#1. Perbedaan yang tidak signifikan (misalnya, p > 0.05) berarti tidak ada perbedaan antar kelompok data.
Ini adalah anggapan yang salah. Memang ada konsensus, bahwa makin besar nilai p-value = makin tidak signifikan, TAPI ini bukan berarti tidak ada perbedaan antar kelompok perlakuan. Yang sering dilupakan adalah nilai confidence intervals, padahal itu penting untuk melihat ada tidaknya perbedaan.

#2. Jika p-value nilainya kecil (misalnya p =< 0.05), maka peluang Ho salah juga kecil, sehingga Ho ditolak.
Ini adalah anggapan yang salah. Kita tidak bisa menolak Ho berdasarkan nilai p-value semata. Karena, by definition,
p-value dihitung berdasarkan asumsi bahwa Ho benar, sehingga nilai p-value tidak menunjukkan peluang Ho benar atau salah.

#3. Jika p-value nilainya besar, maka peluang Ho benar juga besar, sehingga Ho diterima
Ini adalah interpretasi yang salah. Perhitungan p-value tidak menunjukkan besar/kecilnya peluang Ho. Karena, by definition, p-value adalah peluang munculnya data yang kita peroleh pada saat eksperimen jika Ho adalah benar. Bukan peluang Ho salah/benar.

#4. Untuk menarik kesimpulan, harus didasarkan pada nilai p-value.
Ini juga anggapan yang terlalu dangkal. Kesimpulan tentang efek suatu perlakuan tidak bisa didasarkan semata pada p-value. Yang benar adalah, kesimpulan ditarik setelah mengumpulkan sebanyak mungkin informasi yang relevan, termasuk dari studi lain. Kita bisa membuat kesimpulan yang reliable (dan valid), meskipun nilai p-value > 0.05.

Patut diingat p-value dihitung dengan asumsi yang kadang tidak sesuai dengan kondisi riil karena:
– p-value berasumsi pada hypothetical data semata (bukan data riil)
– p-value tidak menilai kualitas data/bukti statistik.

Selain itu, yang lebih penting juga dalam riset adalah melihat seberapa besar perbedaan antar kelompok sampel, bukan signifikan tidaknya perbedaan tersebut.

Kalau mau lebih detail dan serius, silahkan google. Ada banyak paper yang mengulas ini, contohnya disini: http://www.seminhematol.org/article/S0037-1963(08)00062-0/abstract

****

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s