[Buku Bahasa Indonesia] Thinking Fast and Slow - Daniel Kahneman

Spesialisasi Tom W

Perhatikan sebuah teka-teki sederhana berikut.

Tom W adalah seorang mahasiswa pascasarjana di universitas utama di negara bagian Anda. Silakan urutkan sembilan bidang spesialisasi pascasarjana berikut berdasarkan kemungkinan bahwa Tom W saat ini menjadi mahasiswa di masing-masing bidang tersebut. Gunakan angka 1 untuk yang paling mungkin dan 9 untuk yang paling tidak mungkin.

  • administrasi bisnis
  • ilmu komputer
  • teknik
  • humaniora dan pendidikan
  • hukum
  • kedokteran
  • ilmu perpustakaan
  • ilmu fisik dan ilmu hayati
  • ilmu sosial dan pekerjaan sosial

Pertanyaan ini mudah, dan Anda segera mengetahui bahwa ukuran relatif jumlah mahasiswa pada masing-masing bidang merupakan kunci untuk menyelesaikannya. Sejauh yang Anda ketahui, Tom W dipilih secara acak dari para mahasiswa pascasarjana di universitas tersebut—seperti satu kelereng yang diambil dari sebuah guci.

Untuk memutuskan apakah sebuah kelereng lebih mungkin berwarna merah atau hijau, Anda perlu mengetahui berapa banyak kelereng dari masing-masing warna yang terdapat dalam guci. Proporsi kelereng dari jenis tertentu disebut tingkat dasar (base rate). Demikian pula, dalam persoalan ini tingkat dasar humaniora dan pendidikan adalah proporsi mahasiswa bidang tersebut di antara seluruh mahasiswa pascasarjana.

Jika tidak ada informasi khusus mengenai Tom W, Anda akan mengandalkan tingkat dasar itu dan menebak bahwa ia lebih mungkin terdaftar di humaniora dan pendidikan daripada di ilmu komputer atau ilmu perpustakaan, karena secara keseluruhan jumlah mahasiswa pada bidang humaniora dan pendidikan lebih banyak daripada pada dua bidang lainnya. Menggunakan informasi tingkat dasar adalah langkah yang paling wajar ketika tidak tersedia informasi lain.

Selanjutnya muncul sebuah tugas yang sama sekali tidak berkaitan dengan tingkat dasar.

Berikut adalah sketsa kepribadian Tom W yang ditulis pada tahun terakhirnya di sekolah menengah oleh seorang psikolog, berdasarkan serangkaian tes psikologis yang validitasnya tidak sepenuhnya pasti:

Tom W memiliki kecerdasan tinggi, meskipun kurang memiliki kreativitas sejati. Ia membutuhkan keteraturan dan kejelasan, serta menyukai sistem yang rapi dan tertata, di mana setiap rincian menempati tempat yang semestinya. Tulisan-tulisannya agak membosankan dan mekanis, sesekali diselingi permainan kata yang agak klise serta kilasan imajinasi bergaya fiksi ilmiah. Ia memiliki dorongan kuat untuk mencapai kompetensi. Ia tampaknya kurang peka dan kurang berempati terhadap orang lain, dan tidak menikmati interaksi sosial. Bersifat agak berpusat pada diri sendiri, namun tetap memiliki rasa moral yang mendalam.

Sekarang ambillah selembar kertas dan urutkan sembilan bidang spesialisasi berikut berdasarkan seberapa mirip deskripsi Tom W dengan gambaran mahasiswa pascasarjana yang khas di masing-masing bidang tersebut. Gunakan angka 1 untuk yang paling mungkin dan 9 untuk yang paling tidak mungkin.

Anda akan memperoleh lebih banyak manfaat dari bab ini jika Anda mencoba tugas ini secara singkat; membaca deskripsi Tom W diperlukan agar Anda dapat membuat penilaian mengenai berbagai bidang spesialisasi tersebut.

Pertanyaan ini juga cukup langsung. Anda diminta mengingat—atau mungkin membangun—stereotip mengenai mahasiswa pascasarjana dalam berbagai bidang. Ketika eksperimen ini pertama kali dilakukan pada awal 1970-an, urutan rata-rata yang diperoleh adalah sebagai berikut. Urutan Anda kemungkinan tidak jauh berbeda:

Distributor pusat penjualan segala alat listrik tenaga surya. Toko online jual listrik tenaga matahari. Produsen Produk solar sel murah.www.tokosolarcell.net . daftar Paket harga penjualan listrik tenaga matahari
  1. ilmu komputer
  2. teknik
  3. administrasi bisnis
  4. ilmu fisik dan ilmu hayati
  5. ilmu perpustakaan
  6. hukum
  7. kedokteran
  8. humaniora dan pendidikan
  9. ilmu sosial dan pekerjaan sosial

Kemungkinan besar Anda menempatkan ilmu komputer di peringkat atas karena adanya petunjuk yang bernuansa “kutu buku” (“permainan kata yang klise”). Memang, deskripsi Tom W sengaja ditulis agar sesuai dengan stereotip tersebut. Bidang lain yang biasanya ditempatkan cukup tinggi adalah teknik (“sistem yang rapi dan tertata”). Anda mungkin juga berpikir bahwa Tom W tidak cocok dengan gambaran Anda tentang mahasiswa ilmu sosial dan pekerjaan sosial (“kurang peka dan kurang berempati terhadap orang lain”). Stereotip profesional tampaknya tidak banyak berubah dalam hampir empat puluh tahun sejak saya merancang deskripsi Tom W.

Tugas mengurutkan sembilan karier ini cukup kompleks dan jelas memerlukan disiplin serta organisasi berpikir yang berurutan—kemampuan yang hanya dimiliki oleh Sistem 2. Namun petunjuk-petunjuk yang disisipkan dalam deskripsi tersebut (permainan kata klise dan lainnya) dimaksudkan untuk memicu asosiasi dengan suatu stereotip, yaitu aktivitas otomatis dari Sistem 1.

Instruksi untuk tugas kesamaan ini mengharuskan Anda membandingkan deskripsi Tom W dengan stereotip dari berbagai bidang spesialisasi.

Jika Anda menelaah kembali deskripsi Tom W, Anda akan melihat bahwa ia sangat cocok dengan stereotip beberapa kelompok mahasiswa yang relatif kecil (ilmuwan komputer, pustakawan, insinyur) dan jauh kurang cocok dengan kelompok yang paling besar (humaniora dan pendidikan, ilmu sosial dan pekerjaan sosial). Memang, para peserta hampir selalu menempatkan dua bidang terbesar itu di peringkat yang sangat rendah. Tom W sengaja dirancang sebagai karakter “anti–tingkat dasar”—sangat cocok dengan bidang kecil dan sangat tidak cocok dengan spesialisasi yang paling banyak mahasiswanya.

Memprediksi Berdasarkan Representativitas

Tugas ketiga dalam rangkaian ini diberikan kepada mahasiswa pascasarjana psikologi, dan inilah yang paling penting: urutkan bidang spesialisasi berdasarkan kemungkinan bahwa Tom W saat ini adalah mahasiswa pascasarjana di masing-masing bidang tersebut.

Para anggota kelompok prediksi ini mengetahui fakta statistik yang relevan: mereka memahami tingkat dasar berbagai bidang tersebut, dan mereka juga tahu bahwa sumber deskripsi Tom W tidak sepenuhnya dapat dipercaya. Namun kami memperkirakan mereka akan berfokus sepenuhnya pada kesamaan deskripsi dengan stereotip—yang kami sebut representativitas—dengan mengabaikan baik tingkat dasar maupun keraguan terhadap kebenaran deskripsi tersebut. Dengan demikian mereka akan menempatkan bidang kecil—ilmu komputer—sebagai sangat mungkin, karena hasil itu memperoleh skor representativitas tertinggi.

Amos dan saya bekerja keras selama setahun kami tinggal di Eugene, dan kadang-kadang saya tetap berada di kantor hingga sepanjang malam. Salah satu tugas saya pada malam seperti itu adalah menyusun sebuah deskripsi yang akan mempertentangkan representativitas dengan tingkat dasar. Tom W adalah hasil upaya tersebut, dan saya menyelesaikan deskripsinya pada dini hari.

Orang pertama yang datang bekerja pagi itu adalah kolega sekaligus sahabat kami, Robyn Dawes, seorang ahli statistik yang sangat cakap dan juga skeptis terhadap keandalan penilaian intuitif. Jika ada seseorang yang akan segera melihat relevansi tingkat dasar, orang itu pastilah Robyn. Saya memanggilnya, memberinya pertanyaan yang baru saja saya ketik, dan memintanya menebak profesi Tom W.

Saya masih ingat senyum liciknya ketika ia berkata dengan agak ragu, “ilmuwan komputer?”

Itu adalah momen yang menyenangkan—bahkan yang paling tangguh pun bisa terpeleset. Tentu saja, Robyn segera menyadari kesalahannya begitu saya menyebutkan “tingkat dasar”, tetapi ia tidak memikirkannya secara spontan. Meskipun ia mengetahui sebanyak siapa pun tentang peran tingkat dasar dalam prediksi, ia tetap mengabaikannya ketika dihadapkan pada deskripsi kepribadian seorang individu. Seperti yang kami duga, ia menggantikan penilaian probabilitas yang diminta dengan penilaian representativitas.

Amos dan saya kemudian mengumpulkan jawaban atas pertanyaan yang sama dari 114 mahasiswa pascasarjana psikologi di tiga universitas besar, yang semuanya telah mengikuti beberapa mata kuliah statistik. Mereka tidak mengecewakan kami. Peringkat mereka terhadap sembilan bidang berdasarkan probabilitas tidak berbeda dari penilaian berdasarkan kesamaan dengan stereotip. Substitusi terjadi secara sempurna dalam kasus ini: tidak ada indikasi bahwa para peserta melakukan hal lain selain menilai representativitas.

Pertanyaan mengenai probabilitas (kemungkinan) memang sulit, tetapi pertanyaan mengenai kesamaan jauh lebih mudah—dan itulah yang dijawab. Ini merupakan kesalahan serius, karena penilaian kesamaan dan probabilitas tidak diatur oleh aturan logika yang sama. Sangat dapat diterima jika penilaian kesamaan tidak dipengaruhi oleh tingkat dasar maupun oleh kemungkinan bahwa deskripsi tersebut tidak akurat. Namun siapa pun yang mengabaikan tingkat dasar dan kualitas bukti ketika menilai probabilitas hampir pasti akan membuat kesalahan.

Konsep “probabilitas bahwa Tom W mempelajari ilmu komputer” bukanlah konsep yang sederhana. Para ahli logika dan statistik bahkan berbeda pendapat mengenai maknanya, dan sebagian berpendapat bahwa konsep itu sebenarnya tidak memiliki makna sama sekali. Bagi banyak pakar, probabilitas merupakan ukuran derajat keyakinan subjektif.

Ada peristiwa-peristiwa yang Anda yakini sepenuhnya—misalnya bahwa matahari terbit pagi ini—dan ada pula yang Anda anggap mustahil, seperti Samudra Pasifik tiba-tiba membeku seluruhnya. Di antara kedua ekstrem itu terdapat banyak peristiwa lain—misalnya tetangga Anda ternyata seorang ilmuwan komputer—yang Anda beri tingkat keyakinan tertentu. Tingkat keyakinan itulah yang disebut probabilitas Anda terhadap peristiwa tersebut.

Para ahli logika dan statistik telah mengembangkan berbagai definisi probabilitas yang saling bersaing, semuanya sangat presisi. Namun bagi orang awam, probabilitas (yang dalam bahasa sehari-hari sinonim dengan kemungkinan) merupakan konsep yang samar, berkaitan dengan ketidakpastian, kecenderungan, kelayakan, dan kejutan. Kesamaran ini tidak khas bagi konsep tersebut, dan juga tidak terlalu bermasalah.

Kita kira-kira memahami apa yang kita maksud ketika menggunakan kata seperti demokrasi atau keindahan, dan orang yang kita ajak bicara juga kira-kira memahami maksud kita. Selama bertahun-tahun saya mengajukan pertanyaan tentang probabilitas suatu peristiwa, tidak pernah ada seorang pun yang mengangkat tangan untuk bertanya, “Pak, apa yang Anda maksud dengan probabilitas?”—seperti yang mungkin mereka lakukan jika saya meminta mereka menilai konsep asing seperti globability. Semua orang bertindak seolah-olah mereka tahu bagaimana menjawab pertanyaan saya, meskipun kita semua memahami bahwa akan tidak adil meminta mereka menjelaskan arti kata tersebut secara tepat.

Orang-orang yang diminta menilai probabilitas tidak kebingungan, karena mereka tidak mencoba menilai probabilitas sebagaimana istilah itu digunakan oleh para statistikawan dan filsuf. Pertanyaan mengenai probabilitas atau kemungkinan memicu semacam “senapan mental”, yang menembakkan jawaban-jawaban untuk pertanyaan yang lebih mudah.

Salah satu jawaban mudah itu adalah penilaian otomatis terhadap representativitas—sesuatu yang rutin terjadi ketika kita memahami bahasa. Pernyataan (yang keliru) bahwa “orang tua Elvis Presley ingin ia menjadi dokter gigi” terasa agak lucu karena ketidaksesuaian antara gambaran Presley dan seorang dokter gigi secara otomatis terdeteksi. Sistem 1 menghasilkan kesan kesamaan tanpa niat sadar.

Heuristik representativitas berperan ketika seseorang berkata, “Dia akan memenangkan pemilihan; kelihatan sekali dia seorang pemenang,” atau “Dia tidak akan berhasil sebagai akademisi; terlalu banyak tato.” Kita mengandalkan representativitas ketika menilai potensi kepemimpinan seorang kandidat politik dari bentuk dagunya atau dari kekuatan pidatonya.

Meskipun lazim, prediksi berdasarkan representativitas tidaklah optimal secara statistik. Buku terlaris Moneyball karya Michael Lewis adalah kisah tentang ketidakefisienan cara prediksi semacam ini. Para pencari bakat dalam bisbol profesional secara tradisional meramalkan keberhasilan calon pemain sebagian berdasarkan postur tubuh dan penampilannya.

Tokoh utama dalam buku Lewis adalah Billy Beane, manajer tim Oakland A’s, yang mengambil keputusan tidak populer dengan menolak penilaian para pencari bakatnya dan memilih pemain berdasarkan statistik kinerja masa lalu. Para pemain yang dipilih Oakland A’s relatif murah karena tim lain menolaknya—mereka dianggap tidak memiliki penampilan yang “sesuai”. Namun tak lama kemudian tim tersebut mencapai hasil yang sangat baik dengan biaya yang rendah.

Dosa-Dosa Representativitas

Menilai probabilitas berdasarkan representativitas memiliki sejumlah keutamaan penting: kesan intuitif yang dihasilkannya sering—bahkan biasanya—lebih akurat daripada tebakan acak.

Dalam banyak situasi, orang yang tampak ramah memang benar-benar ramah. Atlet profesional yang sangat tinggi dan kurus jauh lebih mungkin bermain basket daripada sepak bola. Orang yang memiliki gelar doktor lebih mungkin berlangganan The New York Times dibanding mereka yang mengakhiri pendidikan setelah sekolah menengah. Pria muda lebih mungkin mengemudi secara agresif dibanding perempuan lanjut usia.

Dalam semua contoh ini—dan dalam banyak kasus lain—terdapat unsur kebenaran dalam stereotip yang mengarahkan penilaian representativitas, dan prediksi yang mengikuti heuristik ini dapat saja akurat. Namun dalam situasi lain, stereotip tersebut keliru dan heuristik representativitas justru menyesatkan, terutama jika membuat orang mengabaikan informasi tingkat dasar yang menunjuk ke arah berbeda.

Bahkan ketika heuristik ini memiliki sedikit validitas, ketergantungan eksklusif padanya berkaitan dengan pelanggaran serius terhadap logika statistik.

Salah satu dosa representativitas adalah kecenderungan berlebihan untuk memprediksi terjadinya peristiwa yang sebenarnya jarang (memiliki tingkat dasar rendah).

Perhatikan contoh berikut. Anda melihat seseorang membaca The New York Times di kereta bawah tanah New York. Mana yang merupakan taruhan lebih baik tentang orang asing yang sedang membaca itu?

Ia memiliki gelar doktor.
Ia tidak memiliki gelar sarjana.

Representativitas mungkin mendorong Anda memilih opsi pertama, tetapi itu belum tentu bijaksana. Anda seharusnya mempertimbangkan dengan serius alternatif kedua, karena jauh lebih banyak orang tanpa gelar sarjana daripada pemegang doktor yang menggunakan kereta bawah tanah New York.

Demikian pula, jika Anda harus menebak apakah seorang perempuan yang digambarkan sebagai “pecinta puisi yang pemalu” mempelajari sastra Tionghoa atau administrasi bisnis, sebaiknya Anda memilih opsi kedua. Bahkan jika setiap mahasiswi sastra Tionghoa memang pemalu dan menyukai puisi, hampir pasti terdapat jauh lebih banyak pecinta puisi yang pemalu dalam populasi mahasiswa bisnis yang jauh lebih besar.

Orang yang tidak memiliki pelatihan statistik sebenarnya cukup mampu menggunakan tingkat dasar dalam membuat prediksi—dalam kondisi tertentu. Dalam versi pertama masalah Tom W, yang tidak memberikan detail apa pun tentang dirinya, jelas bagi semua orang bahwa probabilitas Tom W berada di bidang tertentu hanyalah frekuensi tingkat dasar pendaftaran di bidang tersebut.

Namun perhatian terhadap tingkat dasar tampaknya menghilang begitu kepribadian Tom W dideskripsikan.

Pada awalnya Amos dan saya percaya—berdasarkan bukti awal kami—bahwa informasi tingkat dasar akan selalu diabaikan ketika tersedia informasi tentang kasus individual. Namun kesimpulan itu ternyata terlalu kuat.

Para psikolog telah melakukan banyak eksperimen di mana informasi tingkat dasar diberikan secara eksplisit sebagai bagian dari masalah, dan banyak peserta ternyata dipengaruhi oleh tingkat dasar tersebut, meskipun informasi tentang individu hampir selalu diberi bobot lebih besar daripada statistik semata.

Norbert Schwarz dan rekan-rekannya menunjukkan bahwa instruksi kepada orang untuk “berpikir seperti seorang statistikawan” meningkatkan penggunaan informasi tingkat dasar, sedangkan instruksi untuk “berpikir seperti seorang klinisi” menghasilkan efek sebaliknya.

Sebuah eksperimen yang dilakukan beberapa tahun lalu terhadap mahasiswa sarjana Harvard menghasilkan temuan yang mengejutkan bagi saya: peningkatan aktivasi Sistem 2 secara signifikan meningkatkan akurasi prediksi dalam masalah Tom W.

Eksperimen tersebut menggabungkan masalah lama itu dengan variasi modern mengenai kelancaran kognitif. Setengah dari para mahasiswa diminta menggembungkan pipi mereka selama mengerjakan tugas, sementara yang lain diminta mengerutkan dahi. Seperti telah kita lihat, mengerutkan dahi umumnya meningkatkan kewaspadaan Sistem 2 dan mengurangi baik rasa terlalu percaya diri maupun ketergantungan pada intuisi.

Para mahasiswa yang menggembungkan pipi (ekspresi emosional yang netral) mereplikasi hasil asli: mereka sepenuhnya mengandalkan representativitas dan mengabaikan tingkat dasar. Namun sebagaimana diprediksi para peneliti, mereka yang mengerutkan dahi menunjukkan kepekaan tertentu terhadap tingkat dasar. Ini merupakan temuan yang sangat instruktif.

Ketika suatu penilaian intuitif yang keliru terjadi, Sistem 1 dan Sistem 2 sama-sama patut dipersalahkan. Sistem 1 mengusulkan intuisi yang salah, dan Sistem 2 menyetujuinya serta mengekspresikannya dalam bentuk penilaian.

Namun kegagalan Sistem 2 dapat memiliki dua penyebab: ketidaktahuan atau kemalasan.

Sebagian orang mengabaikan tingkat dasar karena mereka menganggapnya tidak relevan ketika tersedia informasi individual. Yang lain melakukan kesalahan yang sama karena tidak sepenuhnya berfokus pada tugas. Jika mengerutkan dahi dapat membuat perbedaan, maka kemalasan tampaknya merupakan penjelasan yang tepat bagi pengabaian tingkat dasar—setidaknya di kalangan mahasiswa Harvard.

Sistem 2 mereka sebenarnya “mengetahui” bahwa tingkat dasar relevan bahkan ketika tidak disebutkan secara eksplisit, tetapi pengetahuan itu hanya diterapkan ketika mereka mencurahkan usaha khusus pada tugas tersebut.

Dosa kedua representativitas adalah ketidakpekaan terhadap kualitas bukti.

Ingat kembali aturan Sistem 1: WYSIATI — What You See Is All There Is. Dalam contoh Tom W, yang mengaktifkan mesin asosiasi Anda adalah deskripsi tentang Tom—yang mungkin akurat, mungkin juga tidak.

Pernyataan bahwa Tom W “kurang peka dan kurang berempati terhadap orang lain” mungkin sudah cukup untuk meyakinkan Anda (dan sebagian besar pembaca lainnya) bahwa ia sangat tidak mungkin menjadi mahasiswa ilmu sosial atau pekerjaan sosial. Padahal Anda secara eksplisit telah diberi tahu bahwa deskripsi tersebut tidak dapat dipercaya.

Secara prinsip Anda tentu memahami bahwa informasi yang tidak bernilai seharusnya diperlakukan sama dengan tidak adanya informasi sama sekali. Namun WYSIATI membuat prinsip itu sangat sulit diterapkan.

Kecuali Anda segera memutuskan untuk menolak suatu bukti—misalnya dengan menyimpulkan bahwa sumbernya adalah seorang pembohong—Sistem 1 Anda akan secara otomatis memproses informasi yang tersedia seolah-olah informasi itu benar.

Ada satu hal yang dapat Anda lakukan ketika meragukan kualitas bukti: biarkan penilaian probabilitas Anda tetap dekat dengan tingkat dasar. Jangan berharap disiplin semacam ini mudah dilakukan—ia menuntut upaya pemantauan diri dan pengendalian diri yang cukup besar.

Jawaban yang benar untuk teka-teki Tom W adalah bahwa Anda seharusnya tetap sangat dekat dengan keyakinan awal Anda, dengan sedikit menurunkan probabilitas awal yang tinggi untuk bidang-bidang dengan populasi besar (humaniora dan pendidikan; ilmu sosial dan pekerjaan sosial), dan sedikit menaikkan probabilitas awal yang rendah untuk spesialisasi yang jarang (ilmu perpustakaan, ilmu komputer).

Dengan kata lain, Anda tidak sepenuhnya berada pada posisi seolah-olah Anda sama sekali tidak mengetahui apa pun tentang Tom W. Namun bukti kecil yang Anda miliki tidak dapat dipercaya, sehingga tingkat dasar harus mendominasi estimasi Anda.

Bagaimana Mendisiplinkan Intuisi

Probabilitas Anda bahwa besok akan turun hujan adalah derajat keyakinan subjektif Anda, tetapi Anda tidak seharusnya membiarkan diri Anda mempercayai apa pun yang terlintas dalam pikiran.

Agar berguna, keyakinan Anda harus dibatasi oleh logika probabilitas.

Jika Anda percaya bahwa kemungkinan hujan besok adalah 40%, maka Anda juga harus percaya bahwa kemungkinan tidak hujan adalah 60%, dan Anda tidak boleh sekaligus percaya bahwa kemungkinan hujan besok pagi adalah 50%.

Demikian pula, jika Anda percaya bahwa ada kemungkinan 30% kandidat X terpilih sebagai presiden, dan kemungkinan 80% bahwa ia akan terpilih kembali jika ia menang pertama kali, maka Anda harus percaya bahwa kemungkinan ia terpilih dua kali berturut-turut adalah 24%.

“Aturan” yang relevan untuk kasus seperti masalah Tom W diberikan oleh statistika Bayesian.

Pendekatan modern yang berpengaruh dalam statistika ini dinamai berdasarkan seorang pendeta Inggris abad ke-18, Thomas Bayes, yang dianggap memberikan kontribusi besar pertama terhadap suatu persoalan penting: logika mengenai bagaimana seseorang seharusnya mengubah keyakinannya ketika menghadapi bukti baru.

Aturan Bayes menjelaskan bagaimana keyakinan awal (dalam contoh bab ini: tingkat dasar) harus dikombinasikan dengan daya diagnostik bukti, yaitu sejauh mana bukti tersebut lebih mendukung satu hipotesis dibanding alternatifnya.

Sebagai contoh, jika Anda percaya bahwa 3% mahasiswa pascasarjana terdaftar dalam ilmu komputer (tingkat dasar), dan Anda juga percaya bahwa deskripsi Tom W empat kali lebih mungkin cocok untuk mahasiswa bidang itu dibanding mahasiswa bidang lain, maka menurut aturan Bayes Anda harus percaya bahwa probabilitas Tom W adalah seorang ilmuwan komputer kini sebesar 11%.

Jika tingkat dasarnya 80%, maka derajat keyakinan baru itu akan menjadi 94,1%. Dan seterusnya.

Rincian matematisnya tidak relevan bagi buku ini. Ada dua gagasan yang perlu diingat tentang penalaran Bayesian dan cara kita sering mengacaukannya.

Pertama, tingkat dasar tetap penting, bahkan ketika tersedia bukti tentang kasus yang sedang dipertimbangkan. Hal ini sering kali tidak terasa intuitif.

Kedua, kesan intuitif kita mengenai daya diagnostik bukti sering kali dilebih-lebihkan. Kombinasi antara WYSIATI dan koherensi asosiatif membuat kita mudah mempercayai cerita yang kita bangun sendiri.

Kunci esensial bagi penalaran Bayesian yang disiplin dapat diringkas secara sederhana:

Sandarkan penilaian probabilitas suatu hasil pada tingkat dasar yang masuk akal.
Pertanyakan daya diagnostik bukti yang Anda miliki.

Kedua gagasan ini sebenarnya sangat sederhana. Saya sendiri merasa terkejut ketika menyadari bahwa saya tidak pernah diajarkan bagaimana menerapkannya, dan bahkan sekarang pun saya masih merasa tidak alamiah untuk melakukannya.

Berbicara tentang Representativitas

“Halaman rumputnya terawat rapi, resepsionisnya tampak kompeten, dan perabotannya menarik—tetapi itu tidak berarti perusahaan ini dikelola dengan baik. Saya berharap dewan direksi tidak menilai berdasarkan representativitas.”

“Perusahaan rintisan ini tampak seolah tidak mungkin gagal, tetapi tingkat dasar keberhasilan di industri ini sangat rendah. Bagaimana kita tahu bahwa kasus ini berbeda?”

“Mereka terus melakukan kesalahan yang sama: memprediksi peristiwa langka berdasarkan bukti yang lemah. Ketika buktinya lemah, seharusnya kita tetap berpegang pada tingkat dasar.”

“Saya tahu laporan ini sangat memberatkan, dan mungkin didasarkan pada bukti yang kuat, tetapi seberapa yakinkah kita? Kita harus memperhitungkan ketidakpastian itu dalam cara kita berpikir.”

Linda: Kurang Itu Lebih

Eksperimen kami yang paling terkenal sekaligus paling kontroversial melibatkan seorang wanita fiktif bernama Linda. Amos dan saya menciptakan masalah Linda untuk memberikan bukti konklusif mengenai peran heuristik dalam pengambilan keputusan dan ketidakcocokannya dengan logika. Inilah cara kami mendeskripsikan Linda:

Linda berusia tiga puluh satu tahun, lajang, terbuka, dan sangat cerdas. Ia menempuh studi filsafat. Saat menjadi mahasiswa, ia sangat peduli pada isu diskriminasi dan keadilan sosial, serta turut berpartisipasi dalam demonstrasi antinuklir.

Audiens yang mendengar deskripsi ini pada tahun 1980-an selalu tertawa karena mereka langsung tahu bahwa Linda pernah menempuh pendidikan di Universitas California, Berkeley, yang saat itu terkenal dengan mahasiswa-mahasiswa radikal yang aktif secara politik.

Dalam salah satu eksperimen kami, peserta diberikan daftar delapan skenario kemungkinan untuk Linda. Seperti pada masalah Tom W, sebagian peserta diminta mengurutkan skenario berdasarkan representativitas, sementara yang lain berdasarkan probabilitas. Masalah Linda serupa, namun dengan sedikit sentuhan berbeda.

  • Linda adalah guru sekolah dasar.
  • Linda bekerja di toko buku dan mengikuti kelas yoga.
  • Linda aktif dalam gerakan feminis.
  • Linda adalah pekerja sosial psikiatri.
  • Linda adalah anggota League of Women Voters.
  • Linda adalah teller bank.
  • Linda adalah pegawai asuransi.
  • Linda adalah teller bank dan aktif dalam gerakan feminis.

Masalah ini menunjukkan usia eksperimennya dalam beberapa aspek. League of Women Voters tidak lagi sepopuler dahulu, dan gagasan “gerakan” feminis terdengar kuno, menjadi bukti perubahan status perempuan dalam tiga puluh tahun terakhir. Meski begitu, bahkan di era Facebook, masih mudah menebak konsensus penilaian hampir sempurna: Linda sangat cocok sebagai seorang feminis aktif, cukup cocok sebagai pekerja toko buku yang mengikuti yoga, dan sangat tidak cocok sebagai teller bank atau pegawai asuransi.

Sekarang fokus pada item kritis dalam daftar: Apakah Linda lebih mirip seorang teller bank, atau lebih mirip teller bank yang aktif dalam gerakan feminis? Semua orang setuju bahwa Linda lebih cocok sebagai “teller bank feminis” daripada sesuai dengan stereotip teller bank. Teller bank stereotip biasanya bukan aktivis feminis, dan menambahkan detail ini pada deskripsi membuat cerita menjadi lebih koheren.

Perbedaan muncul pada penilaian probabilitas, karena ada hubungan logis antara kedua skenario tersebut. Pikirkan dalam istilah diagram Venn. Set teller bank feminis sepenuhnya termasuk dalam set teller bank, karena setiap teller bank feminis adalah teller bank. Oleh karena itu, probabilitas bahwa Linda adalah teller bank feminis pasti lebih rendah daripada probabilitas ia menjadi teller bank. Saat Anda merinci suatu kemungkinan secara lebih detail, probabilitasnya hanya akan menurun. Masalah ini, dengan demikian, menimbulkan konflik antara intuisi representativitas dan logika probabilitas.

Eksperimen awal kami menggunakan desain antar-subjek. Setiap peserta melihat tujuh hasil yang hanya mencakup satu item kritis (“teller bank” atau “teller bank feminis”). Sebagian mengurutkan hasil berdasarkan kesamaan, sebagian berdasarkan kemungkinan. Seperti pada kasus Tom W, rata-rata peringkat berdasarkan kesamaan dan kemungkinan identik; “teller bank feminis” menempati peringkat lebih tinggi daripada “teller bank” di keduanya.

Kemudian kami memperluas eksperimen dengan desain dalam-subjek. Kami menyusun kuesioner seperti yang Anda lihat, dengan “teller bank” di posisi keenam dan “teller bank feminis” sebagai item terakhir. Kami yakin peserta akan menyadari hubungan antara kedua hasil tersebut, dan peringkat mereka akan konsisten dengan logika. Bahkan, kami begitu yakin sehingga tidak merasa perlu melakukan eksperimen khusus.

Asisten saya sedang menjalankan eksperimen lain di laboratorium, dan ia meminta peserta untuk mengisi kuesioner Linda baru ini saat keluar laboratorium, tepat sebelum menerima bayaran. Sekitar sepuluh kuesioner menumpuk di nampan di meja asisten saya sebelum saya melihatnya sekilas dan mendapati semua peserta menilai “teller bank feminis” lebih mungkin daripada “teller bank.” Saya begitu terkejut hingga masih mengingat dengan jelas warna abu-abu meja logam itu dan posisi semua orang saat saya membuat penemuan tersebut.

Saya segera menghubungi Amos dengan penuh kegembiraan untuk memberitahunya: kami telah menempatkan logika melawan representativitas, dan representativitas menang!

Dalam terminologi buku ini, kami telah mengamati kegagalan Sistem 2: peserta memiliki kesempatan yang adil untuk mendeteksi relevansi aturan logis, karena kedua hasil termasuk dalam peringkat yang sama. Namun, mereka tidak memanfaatkan kesempatan itu. Ketika eksperimen diperluas, kami mendapati bahwa 89% mahasiswa sarjana dalam sampel kami melanggar logika probabilitas.

Kami yakin bahwa responden yang secara statistik cerdas akan lebih baik, sehingga kami memberikan kuesioner yang sama kepada mahasiswa doktoral program ilmu keputusan di Stanford Graduate School of Business, yang semuanya telah mengikuti beberapa mata kuliah lanjutan dalam probabilitas, statistik, dan teori keputusan. Sekali lagi kami terkejut: 85% dari mereka juga menilai “teller bank feminis” lebih mungkin daripada “teller bank.”

Dalam upaya yang kemudian kami sebut semakin “putus asa” untuk menghilangkan kesalahan, kami memperkenalkan Linda kepada kelompok besar orang dan menanyakan pertanyaan sederhana ini:

Alternatif mana yang lebih mungkin?
Linda adalah teller bank.
Linda adalah teller bank dan aktif dalam gerakan feminis.

Versi gamblang ini membuat Linda terkenal di beberapa kalangan dan menimbulkan kontroversi selama bertahun-tahun. Sekitar 85% hingga 90% mahasiswa sarjana di beberapa universitas besar memilih opsi kedua, bertentangan dengan logika. Menariknya, para “pendosa” tampak tak merasa malu. Ketika saya menanyakan kepada kelas besar mahasiswa sarjana saya dengan nada kesal, “Apakah kalian sadar telah melanggar aturan logika dasar?” seseorang di barisan belakang berteriak, “Jadi apa?” dan seorang mahasiswa pascasarjana yang melakukan kesalahan yang sama menjelaskan, “Saya pikir Anda hanya meminta pendapat saya.”

Kata fallacy umumnya digunakan ketika seseorang gagal menerapkan aturan logika yang jelas relevan. Amos dan saya memperkenalkan konsep conjunction fallacy, yang dilakukan ketika seseorang menilai gabungan dua peristiwa (di sini, teller bank dan feminis) lebih mungkin terjadi daripada salah satu peristiwa (teller bank) dalam perbandingan langsung. Seperti halnya ilusi Müller-Lyer, kesalahan ini tetap menarik meski Anda menyadarinya.

Naturalis Stephen Jay Gould menggambarkan perjuangannya sendiri dengan masalah Linda. Ia tahu jawaban yang benar, tentu saja, namun ia menulis, “sebuah homunculus kecil di kepalaku terus melompat-lompat, berteriak—‘tapi dia tidak bisa hanya teller bank; baca deskripsinya.’” Homunculus kecil itu tentu saja adalah Sistem 1 Gould yang berbicara dengan nada mendesak. (Terminologi dua sistem belum diperkenalkan saat ia menulis.)

Jawaban yang benar pada versi pendek masalah Linda hanya menjadi respons mayoritas pada satu studi kami: 64% mahasiswa pascasarjana di ilmu sosial di Stanford dan Berkeley menilai dengan benar bahwa “teller bank feminis” kurang mungkin terjadi daripada “teller bank.” Pada versi asli dengan delapan hasil (seperti di atas), hanya 15% mahasiswa pascasarjana serupa yang memilih jawaban itu. Perbedaan ini bersifat instruktif. Versi panjang memisahkan kedua hasil kritis dengan item perantara (pegawai asuransi), sehingga pembaca menilai setiap hasil secara independen tanpa membandingkan. Sebaliknya, versi pendek memerlukan perbandingan eksplisit yang menggerakkan Sistem 2 dan memungkinkan sebagian besar mahasiswa yang mahir statistik menghindari kesalahan. Sayangnya, kami tidak mengeksplorasi alasan dari minoritas substansial (36%) dari kelompok berpengetahuan ini yang tetap salah memilih.

Penilaian probabilitas yang diberikan responden kami, baik pada masalah Tom W maupun Linda, tepat mencerminkan penilaian representativitas (kesamaan dengan stereotip). Representativitas termasuk dalam klaster penilaian dasar yang saling terkait dan cenderung muncul bersama. Hasil yang paling representatif dipadukan dengan deskripsi kepribadian untuk menghasilkan cerita yang paling koheren. Cerita yang paling koheren tidak selalu paling mungkin terjadi, tetapi masuk akal, dan konsep koherensi, plausibilitas, serta probabilitas mudah tertukar bagi yang tidak berhati-hati.

Penggantian secara tidak kritis antara plausibilitas dan probabilitas berdampak buruk pada penilaian ketika skenario digunakan sebagai alat peramalan. Pertimbangkan dua skenario ini, yang diberikan kepada kelompok berbeda, untuk menilai probabilitasnya:

  • Banjir besar di suatu tempat di Amerika Utara tahun depan, yang menewaskan lebih dari 1.000 orang.
  • Gempa bumi di California tahun depan, yang menyebabkan banjir menewaskan lebih dari 1.000 orang.

Skenario gempa California lebih masuk akal daripada skenario Amerika Utara, meski probabilitasnya jelas lebih kecil. Sesuai dugaan, penilaian probabilitas lebih tinggi diberikan pada skenario yang lebih kaya dan lebih rinci, bertentangan dengan logika. Ini menjadi jebakan bagi peramal dan klien mereka: menambahkan detail membuat skenario lebih persuasif, tetapi kurang mungkin terjadi.

Untuk memahami peran plausibilitas, pertimbangkan pertanyaan berikut:

Alternatif mana yang lebih mungkin?

  • Mark memiliki rambut.
  • Mark memiliki rambut pirang.

dan

Alternatif mana yang lebih mungkin?

  • Jane adalah seorang guru.
  • Jane adalah guru dan berjalan kaki ke tempat kerja.

Kedua pertanyaan memiliki struktur logis yang sama seperti masalah Linda, tetapi tidak menimbulkan kesalahan, karena hasil yang lebih rinci hanya lebih rinci—tidak lebih masuk akal, koheren, atau menghasilkan cerita yang lebih baik. Evaluasi plausibilitas dan koherensi tidak memberikan jawaban pada pertanyaan probabilitas. Tanpa intuisi yang bersaing, logika tetap menang.

Kurang Itu Lebih, Terkadang Bahkan Dalam Evaluasi Bersama

Christopher Hsee, dari University of Chicago, meminta orang-orang menilai harga set alat makan yang dijual dalam program clearance di sebuah toko lokal, di mana harga set alat makan biasanya berkisar antara $30 hingga $60. Eksperimennya melibatkan tiga kelompok. Satu kelompok ditampilkan tampilan di bawah ini; Hsee menyebut ini sebagai evaluasi bersama, karena memungkinkan perbandingan antara dua set. Dua kelompok lainnya hanya ditunjukkan salah satu dari dua set; ini disebut evaluasi tunggal. Evaluasi bersama merupakan eksperimen dalam-subjek, sedangkan evaluasi tunggal bersifat antar-subjek.

Set A: 40 potong | Set B: 24 potong

  • Piring makan: 8, semua dalam kondisi baik | 8, semua dalam kondisi baik
  • Mangkok sup/salad: 8, semua dalam kondisi baik | 8, semua dalam kondisi baik
  • Piring pencuci mulut: 8, semua dalam kondisi baik | 8, semua dalam kondisi baik
  • Cangkir: 8, 2 di antaranya pecah | –
  • Piring tatakan: 8, 7 di antaranya pecah | –

Dengan asumsi semua alat makan dalam kedua set memiliki kualitas yang sama, manakah yang lebih berharga? Pertanyaan ini mudah. Anda dapat melihat bahwa Set A mencakup semua alat makan dari Set B, ditambah tujuh alat utuh tambahan, sehingga nilainya pasti lebih tinggi. Memang, peserta dalam eksperimen evaluasi bersama Hsee bersedia membayar sedikit lebih banyak untuk Set A dibanding Set B: $32 versus $30.

Hasilnya berbalik pada evaluasi tunggal, di mana Set B dinilai jauh lebih tinggi daripada Set A: $33 versus $23. Kita tahu mengapa ini terjadi. Set (termasuk set alat makan!) direpresentasikan melalui norma dan prototipe. Anda segera merasakan bahwa nilai rata-rata alat makan lebih rendah untuk Set A dibanding Set B, karena tidak ada yang ingin membayar untuk alat yang pecah. Jika rata-rata mendominasi penilaian, tidak mengherankan Set B lebih berharga. Hsee menyebut pola ini less is more. Dengan menghapus 16 item dari Set A (7 di antaranya utuh), nilainya meningkat. Temuan Hsee direplikasi oleh ekonom eksperimental John List di pasar nyata kartu bisbol. Ia melelang set sepuluh kartu bernilai tinggi, dan set identik yang ditambah tiga kartu bernilai sedang. Seperti pada eksperimen alat makan, set yang lebih besar lebih berharga dalam evaluasi bersama, tetapi lebih rendah dalam evaluasi tunggal.

Dari perspektif teori ekonomi, hasil ini mengganggu: nilai ekonomi set alat makan atau koleksi kartu bisbol merupakan variabel bersifat penjumlahan. Menambahkan item bernilai positif ke set hanya dapat meningkatkan nilainya.

Masalah Linda dan masalah alat makan memiliki struktur yang sama persis. Probabilitas, seperti halnya nilai ekonomi, merupakan variabel bersifat penjumlahan, seperti yang ditunjukkan contoh berikut:

probabilitas (Linda adalah teller) = probabilitas (Linda adalah teller feminis) + probabilitas (Linda adalah teller non-feminis)

Inilah juga alasan, seperti dalam studi alat makan Hsee, evaluasi tunggal pada masalah Linda menghasilkan pola less is more. Sistem 1 melakukan rata-rata alih-alih penjumlahan, sehingga ketika teller bank non-feminis dihapus dari set, probabilitas subjektif meningkat. Namun, sifat penjumlahan variabel lebih jelas pada uang dibanding probabilitas. Akibatnya, evaluasi bersama hanya menghilangkan kesalahan pada eksperimen Hsee, bukan pada eksperimen Linda.

Linda bukan satu-satunya kesalahan konjungsi yang bertahan dalam evaluasi bersama. Kami menemukan pelanggaran logika serupa pada banyak penilaian lain. Peserta dalam salah satu studi diminta mengurutkan empat kemungkinan hasil turnamen Wimbledon berikutnya dari yang paling hingga paling tidak mungkin. Björn Borg adalah pemain tenis dominan saat studi dilakukan.

Hasilnya:
A. Borg akan memenangkan pertandingan.
B. Borg akan kalah di set pertama.
C. Borg akan kalah di set pertama tetapi memenangkan pertandingan.
D. Borg akan memenangkan set pertama tetapi kalah dalam pertandingan.

Item kritis adalah B dan C. B adalah peristiwa yang lebih inklusif sehingga probabilitasnya harus lebih tinggi daripada peristiwa yang termasuk di dalamnya. Bertentangan dengan logika, tetapi tidak dengan representativitas atau plausibilitas, 72% peserta menilai B memiliki probabilitas lebih rendah daripada C—satu lagi contoh less is more dalam perbandingan langsung. Sekali lagi, skenario yang dinilai lebih mungkin jelas lebih masuk akal, lebih koheren dengan semua informasi yang diketahui tentang pemain tenis terbaik di dunia.

Untuk menangkis kemungkinan sanggahan bahwa conjunction fallacy disebabkan oleh salah interpretasi probabilitas, kami menyusun masalah yang memerlukan penilaian probabilitas, tetapi di mana peristiwa tidak dideskripsikan dengan kata-kata, dan istilah probabilitas sama sekali tidak muncul. Kami memberi tahu peserta tentang dadu enam sisi reguler dengan empat sisi hijau dan dua sisi merah, yang akan dilempar sebanyak 20 kali. Mereka ditunjukkan tiga urutan hijau (G) dan merah (R), dan diminta memilih satu. Mereka (secara hipotetis) akan memenangkan $25 jika urutan yang dipilih muncul. Urutannya:

  1. RGRRR
  2. GRGRRR
  3. GRRRRR

Karena dadu memiliki dua kali lebih banyak sisi hijau daripada merah, urutan pertama cukup tidak representatif—seperti Linda yang menjadi teller bank. Urutan kedua, yang terdiri dari enam lemparan, lebih sesuai dengan yang diharapkan dari dadu ini, karena mencakup dua G. Namun, urutan ini dibuat dengan menambahkan satu G di awal urutan pertama, sehingga secara logika hanya bisa lebih kecil kemungkinannya daripada urutan pertama. Ini setara dengan kasus Linda sebagai teller bank feminis. Seperti pada studi Linda, representativitas mendominasi. Hampir dua pertiga responden lebih suka bertaruh pada urutan 2 daripada urutan 1. Namun, ketika disajikan argumen untuk kedua pilihan, mayoritas besar menemukan argumen yang benar (mendukung urutan 1) lebih meyakinkan.

Masalah berikutnya menjadi terobosan, karena kami akhirnya menemukan kondisi di mana insiden conjunction fallacy jauh berkurang. Dua kelompok peserta melihat variasi sedikit berbeda dari masalah yang sama:

Insiden Kesalahan 65% pada kelompok yang melihat masalah di kiri, dan hanya 25% pada kelompok yang melihat masalah di kanan.

Mengapa pertanyaan “Berapa banyak dari 100 peserta…” terasa jauh lebih mudah dibandingkan “Berapa persentasenya…”? Penjelasan yang mungkin adalah referensi terhadap 100 individu menghadirkan representasi spasial dalam pikiran. Bayangkan sejumlah besar orang diarahkan untuk mengelompokkan diri mereka di sebuah ruangan: “Mereka yang namanya diawali huruf A hingga L diminta berkumpul di sudut kiri depan.” Mereka kemudian diberi instruksi untuk menyortir diri lebih lanjut. Hubungan inklusi kini menjadi jelas, dan Anda dapat melihat bahwa individu yang namanya dimulai dengan C akan menjadi subset dari kerumunan di sudut kiri depan. Dalam pertanyaan survei medis, korban serangan jantung berakhir di suatu sudut ruangan, dan sebagian dari mereka berusia di bawah 55 tahun. Tidak semua orang akan membayangkan gambar yang sama, tetapi banyak eksperimen berikutnya menunjukkan bahwa representasi frekuensi—sebagaimana dikenal—memudahkan untuk memahami bahwa satu kelompok sepenuhnya termasuk dalam kelompok lainnya.

Solusi dari teka-teki ini tampaknya adalah bahwa pertanyaan yang diformulasikan sebagai “berapa banyak?” membuat Anda memikirkan individu, sementara pertanyaan yang sama dalam bentuk “berapa persentase?” tidak menimbulkan hal tersebut.

Apa yang kita pelajari dari studi-studi ini tentang cara kerja Sistem 2? Satu kesimpulan, yang sebenarnya tidak baru, adalah bahwa Sistem 2 tidak begitu waspada. Mahasiswa sarjana dan pascasarjana yang berpartisipasi dalam studi conjunction fallacy kami tentu “mengetahui” logika diagram Venn, tetapi mereka tidak menerapkannya secara konsisten meskipun semua informasi relevan sudah tersedia di depan mereka. Absurdnya pola less-is-more terlihat jelas pada studi alat makan Hsee dan mudah dikenali dalam representasi “berapa banyak?”, tetapi tidak tampak bagi ribuan orang yang melakukan conjunction fallacy pada masalah Linda maupun masalah sejenis lainnya. Dalam semua kasus ini, konjungsi tampak masuk akal, dan itu cukup untuk mendapatkan persetujuan dari Sistem 2.

Kemalasan Sistem 2 juga bagian dari cerita. Jika liburan berikutnya bergantung pada jawaban yang benar, dan mereka diberi waktu tak terbatas serta diminta mengikuti logika dan tidak menjawab hingga yakin, saya yakin sebagian besar peserta akan menghindari conjunction fallacy. Namun, liburan mereka tidak tergantung pada jawaban yang benar; mereka menghabiskan sedikit waktu, dan puas menjawab seolah-olah hanya “dimitai pendapatnya.” Kemalasan Sistem 2 adalah fakta penting dalam kehidupan, dan pengamatan bahwa representativitas dapat menghalangi penerapan aturan logika yang jelas juga menarik.

Aspek menakjubkan dari kisah Linda adalah kontrasnya dengan studi alat makan yang rusak. Kedua masalah memiliki struktur sama, tetapi menghasilkan hasil berbeda. Orang yang melihat set alat makan dengan piring pecah menilai harganya sangat rendah; perilaku mereka mencerminkan aturan intuisi. Orang lain yang melihat kedua set sekaligus menerapkan aturan logika bahwa lebih banyak piring hanya menambah nilai. Intuisi menguasai penilaian dalam kondisi antar-subjek; logika berlaku dalam evaluasi bersama. Pada masalah Linda, sebaliknya, intuisi sering mengalahkan logika bahkan dalam evaluasi bersama, meskipun kami mengidentifikasi beberapa kondisi di mana logika menang.

Amos dan saya yakin bahwa pelanggaran terang-terangan terhadap logika probabilitas yang kami amati dalam masalah yang transparan itu menarik dan layak dilaporkan kepada rekan-rekan. Kami juga yakin bahwa hasil tersebut memperkuat argumen kami tentang kekuatan heuristik penilaian, dan akan meyakinkan para skeptis. Namun, kami keliru. Sebaliknya, masalah Linda menjadi studi kasus norma kontroversi.

Masalah Linda menarik perhatian besar, tetapi juga menjadi magnet bagi kritik terhadap pendekatan kami pada penilaian. Seperti yang telah kami lakukan, para peneliti menemukan kombinasi instruksi dan petunjuk yang mengurangi insiden kesalahan; beberapa berargumen bahwa, dalam konteks masalah Linda, wajar jika peserta memahami kata “probabilitas” seolah berarti “plausibilitas.” Argumen ini kadang diperluas untuk menyiratkan bahwa seluruh upaya kami keliru: jika satu ilusi kognitif yang menonjol dapat dilemahkan atau dijelaskan, ilusi lainnya pun dapat.

Penalaran ini mengabaikan fitur unik conjunction fallacy sebagai konflik antara intuisi dan logika. Bukti yang kami bangun untuk heuristik dari eksperimen antar-subjek (termasuk studi Linda) tidak ditentang—ia hanya tidak diperhatikan, dan sorotannya berkurang karena fokus eksklusif pada conjunction fallacy. Dampak bersih dari masalah Linda adalah meningkatnya visibilitas pekerjaan kami ke publik umum, dan sedikit penurunan kredibilitas pendekatan kami di kalangan ilmuwan. Ini sama sekali tidak kami duga.

Jika Anda mengunjungi ruang sidang, Anda akan melihat bahwa pengacara menerapkan dua gaya kritik: untuk meruntuhkan kasus, mereka meragukan argumen terkuat yang mendukungnya; untuk mendiskreditkan saksi, mereka menyoroti bagian terlemah dari kesaksian. Fokus pada kelemahan juga normal dalam debat politik. Saya tidak percaya hal ini tepat dalam kontroversi ilmiah, tetapi saya menerima sebagai fakta hidup bahwa norma debat dalam ilmu sosial tidak melarang gaya argumentasi politik, terutama saat isu besar dipertaruhkan—dan prevalensi bias dalam penilaian manusia adalah isu besar.

Beberapa tahun lalu saya berdiskusi secara bersahabat dengan Ralph Hertwig, kritikus konsisten masalah Linda, yang pernah saya ajak bekerja sama dalam upaya sia-sia untuk menyelesaikan perbedaan kami. Saya bertanya mengapa dia dan yang lain memilih fokus eksklusif pada conjunction fallacy, bukan pada temuan lain yang mendukung posisi kami lebih kuat. Dia tersenyum dan menjawab, “Itu lebih menarik,” menambahkan bahwa masalah Linda menarik begitu banyak perhatian sehingga kami tidak punya alasan untuk mengeluh.

Berbicara Tentang Kurang Itu Lebih


“Mereka menyusun skenario yang sangat rumit dan bersikeras menyebutnya sangat mungkin. Padahal tidak—itu hanya cerita yang masuk akal.”
“Mereka menambahkan hadiah murah ke produk mahal, dan membuat seluruh kesepakatan menjadi kurang menarik. Kurang itu lebih dalam kasus ini.”
“Dalam kebanyakan situasi, perbandingan langsung membuat orang lebih hati-hati dan lebih logis. Tetapi tidak selalu. Terkadang intuisi mengalahkan logika bahkan ketika jawaban yang benar ada di depan mata.”

Like

0

Love

0

Haha

0

Wow

0

Sad

0

Angry

0

Artikel Terkait

Comments (0)

Leave a comment