u
Bl
Arc
ve
aquo; False Fundamental of Finance and Market Forecasting Saglab Kissingsexynakedmaids Da Q User View 4076 Kissing Sexy Naked MaidsPada kejadian dengan distribusi normal Gauss, beberapa outlier dapat disingkirkan karena tidak berdampak signifikan. Pada kejadian dengan distribusi tidak-normal Cauchy, outlier tidak dapat diabaikan karena sangat berdampak signifikan. Para peneliti dan mahasiswa yang menggunakan regresi dan korelasi dapat menghilangkan ‘data nakal’ yang menyimpang jauh dari data sample (outlier). Namun regresi dan korelasi tidak dapat digunakan dalam kumpulan data dengan distribusi yang tidak-normal, karena akan menghasilkan kesimpulan yang salah. Analisis sample data pinball Pak Galton tidak dapat digunakan dalam analisis sample data pemanah buta Monsieur Cauchy. Permainan mereka memiliki keacakan yang berbeda.
Sekarang mari kita beralih dari contoh kasus permainan kepada contoh kasus riil dari distribusi normal Gauss dan distribusi tidak-normal Cauchy. Perbedaan konsep antara keduanya, sekali lagi saya tegaskan:
+ Variasi dalam distribusi normal Gauss adalah variasi jinak, sehingga memiliki deviasi yang standar. Probabilitas terjadi simpangan sampai 9 sigma adalah 1 diantara 5 milyar. Contoh, berapa sering anda melihat orang Jawa dengan tinggi badan 2,15 m (= 170 + 9 x 5 cm), atau menemui teman sekelas dengan IQ 195 (= 100 + 9.5 x 10)? Hanya ada 1 orang di antara 5 milyar penduduk dunia dengan IQ 195, namanya Christopher Langan (sebagai perbandingan Albert Einstein memiliki IQ 150). Anda dapat membaca kisah Christopher Langan dalam buku Malcolm Gladwell berjudul Outliers.
+ Saking jinaknya variasi dalam kurva Gauss, maka ekor kurva dapat dipotong menjadi hanya 3 x deviasi standar, atau paling banyak 6 x deviasi standar (ingat metode Six Sigma Motorola atau General Electric?)
+ Menghilangkan variasi yang ekstrem, tidak akan mengubah nilai rata-rata dalam distribusi normal Gauss. Andaikan IQ Christopher Langan tidak diperhitungkan, atau simpangan 9 sigma diabaikan, dalam merata-ratakan IQ species Homo Economicus, maka IQ rata-rata manusia tetap saja 100.
+ Variasi dalam distribusi tidak-normal Cauchy adalah variasi liar, sehingga deviasi di sini tidak berarti apapun. Anda tetap dapat menghitung deviasi dengan menggunakan rumus deviasi standar, namun nilai itu tidak berguna. Tidak ada deviasi yang standar dalam kurva Cauchy.
+ Saking liarnya variasi dan deviasi dalam kurva Cauchy, maka ekor kurva sangat panjang, tidak terhingga, dan tidak dapat dipotong menjadi hanya 3 atau 6 sigma. Saya akan memberi contoh kurva Cauchy yang mencapai 22 sigma. Ekor kurva Cauchy juga tidak dapat di’potong’ karena ‘gemuk’, memiliki variance dengan nilai signifikan.
+ Menghilangkan variasi yang ekstrem (outliers) akan mengubah nilai rata-rata dalam distribusi Cauchy. Sesungguhnya dalam kurva Cauchy tidak dikenal nilai rata-rata, karena begitu liarnya deviasi. Nilai average dalam kurva Cauchy, sebagaimana nilai deviasi standar, tidak memberi arti apa-apa.
Mari kita ambil contoh nyata dalam dunia olahraga. Kita ke Italia untuk melihat Liga Seri A. Sejak tahun 1929 pergelaran Liga Seri A, juara liga ini pernah dimenangkan oleh 13 klub, yakni Juventus (27 kali juara), AC Milan (17 kali juara), Inter Milan (17 kali), Genoa (9), Torino (7), Bologna (7), AS Roma (3), Fiorentina (2), Lazio (2), Napoli (2), Cagliari (1), Sampdoria (1), dan Verona (1). Bagi jumlah gelar Seri A sejak 1929-2009 dengan jumlah klub pemenang = 80 / 13. Diperoleh rata-rata setiap klub memenangkan 6,15 kali gelar juara. Apakah statistik seperti ini berguna? Tidak. Statistik semacam ini adalah sampah. Hilangkan Juventus dari perhitungan rata-rata gelar setiap klub Seri A di atas, maka anda akan memperoleh hasil rata-rata yang jauh menyimpang dari nilai semula. Kasus ini juga berlaku di seluruh Liga Dunia: Inggris, Spanyol, Perancis, Jerman, Belanda, Portugal, Turki, Skotlandia, Argentina, Brazil. Gelar juara liga, olahraga apapun, di negara manapun, memiliki distribusi tidak-normal.
Distribusi tidak normal Cauchy sering disebut sebagai Power Law distribution (ditribusi hukum pangkat). Power law distribution pada awalnya digagas oleh Vilfredo Pareto dalam menjelaskan gejala sosial dalam distribusi pendapatan. Ingat prinsip Pareto 80/20? Ya, 80% pendapatan dihasilkan oleh hanya 20% penduduk. Atau lebih parah lagi kini, 90% pendapatan dihasilkan oleh hanya 1% penduduk. Inilah The Law of Vital Few.
Lima puluh dua tahun setelah penelitain Pareto tersebut dipublikasikan, di tahun 1949 George Zipf profesor Linguistik dari Harvard menemukan bahwa prinsip yang serupa berlaku dalam tata bahasa. Menurut penelitian George Zipf, kata-kata yang sering digunakan dalam bahasa tidak banyak, sementara kata-kata yang jarang digunakan banyak sekali. George Zipf membuat model untuk dapat meramalkan penggunaan kata-kata dalam sebuah buku. Frekuensi kata yang digunakan berbanding terbalik dengan peringkat kata itu di antara semua kata lain. Misalnya, kata di peringkat 2 digunakan dalam buku dengan frekuensi ½ kali dibanding kata peringkat pertama. Kata di peringkat 3 digunakan dengan frekuensi 1/3 kali kata peringkat pertama, dan seterusnya. Hukum tata bahasa ini disebut hukum Zipf untuk menghormati penemunya.
Saya mencoba menggambar hukum Zipf ini untuk memudahkan pemahaman kita. Buat dua kolom dalam spreadsheet. Kolom pertama (sumbu X) untuk peringkat 1,2,3, dan seterusnya. Kolom kedua (sumbu Y) untuk frekuensi kata dibanding kata peringkat pertama. Hasilnya adalah gambar kurva ini.
Perhatikan bahwa kurva Zipf Law di atas mengikuti hukum pangkat Y = 1/X
Perhatikan bahwa kurva tersebut serupa dengan kurva distribusi juara liga Seri A Italia.
Kurva itu juga menggambarkan distribusi permainan The Blindfolded Archer’s Score Cauchy, memperlihakan kurva distribusi tidak normal Cauchy yang dibelah dua.
Kurva ini tidak sama dengan distribusi normal Gauss, ekornya terlalu panjang, dengan penurunan terlalu curam, tidak seperti lonceng.
Dan itulah yang berlaku dalam dunia nyata EMPIRIK: distribusi tidak normal Cauchy = power law distribution = Zipf Law dalam Linguistik = prinsip Pareto = the Law of Vital Few.
Bagaimana dengan distribusi pendapatan? Hilangkan Aburizal Bakrie, Sukanto Tanoto, Keluarga Hartono, Putera Sampoerna, Anthoni Salim, Ekatjipta Widjaja, dan Martua Sitorus dari perhitungan pendapatan perkapita penduduk Republik Indonesia, maka anda akan memperoleh hasil income perkapita yang sama sekali berbeda. Distribusi pendapatan tidak mengikuti aturan Tuan Gauss atau permainan pinball Pak Galton, melainkan mengikuti permainan Robin Hood buta Monsieur Cauchy. Beberapa outlier tidak dapat diabaikan begitu saja, karena akan memberi perbedaan signifikan. Pendapatan perkapita adalah statistik yang mengelabui, karena ia tidak memberi gambaran kemakmuran suatu bangsa. Income perkapita yang merupakan fungsi rata-rata; dalam spreadsheet digunakan fungsi = AVERAGE () ; jika digunakan dalam distribusi tidak-normal Cauchy, menghasilkan kesimpulan yang tidak berguna.
opratolo.com &r
u
Bl
Arc
ve
aquo; False Fundamental of Finance and Market Forecasting Saglab Kissingsexynakedmaids Da Q User View 4076 Kissing Sexy Naked Maidsd r u u Sexy Sexy
ppratolo.com &r
u
Bl
Arc
ve
aquo; False Fundamental of Finance and Market Forecasting Saglab Kissingsexynakedmaids Da Q User View 4076 Kissing Sexy Naked Maidsh Sexy