Statistik telah lama menjadi bahagian penting dalam kehidupan. Orang ramai menghadapinya di mana-mana. Berdasarkan statistik, kesimpulan dibuat tentang di mana dan penyakit apa yang biasa, apa yang lebih banyak permintaan di rantau tertentu atau di kalangan segmen populasi tertentu. Malah pembinaan program politik calon badan kerajaan adalah berdasarkan data statistik. Ia juga digunakan oleh rangkaian runcit semasa membeli barangan dan pengeluar dipandu oleh data ini dalam cadangan mereka.
Statistik memainkan peranan penting dalam kehidupan masyarakat dan mempengaruhi setiap ahli individunya, walaupun dalam perkara kecil. Sebagai contoh, jika mengikut statistik, kebanyakan orang lebih suka warna gelap dalam pakaian di bandar atau wilayah tertentu, maka mencari baju hujan kuning terang dengan cetakan bunga di kedai tempatan akan menjadi amat sukar. Tetapi berapa kuantitiadakah data ini menambah mempunyai kesan sedemikian? Sebagai contoh, apakah yang "signifikan secara statistik"? Apakah sebenarnya yang dimaksudkan dengan takrifan ini?
Apakah ini?
Statistik sebagai sains terdiri daripada gabungan kuantiti dan konsep yang berbeza. Salah satunya ialah konsep "kepentingan statistik". Ini ialah nama nilai pembolehubah, kebarangkalian kemunculan penunjuk lain yang boleh diabaikan.
Sebagai contoh, 9 daripada 10 orang memakai kasut getah di kaki mereka semasa berjalan pagi untuk cendawan di hutan musim luruh selepas malam hujan. Kebarangkalian bahawa pada satu ketika 8 daripada mereka memakai moccasins kanvas adalah diabaikan. Oleh itu, dalam contoh khusus ini, nombor 9 ialah apa yang dipanggil "kepentingan statistik."
Sehubungan itu, jika kita mengembangkan contoh praktikal yang diberikan lebih lanjut, kedai kasut membeli but getah menjelang akhir musim panas dalam kuantiti yang lebih banyak berbanding pada masa lain dalam setahun. Oleh itu, magnitud nilai statistik memberi kesan kepada kehidupan biasa.
Sudah tentu, dalam pengiraan yang rumit, katakan, apabila meramalkan penyebaran virus, sejumlah besar pembolehubah diambil kira. Tetapi intipati menentukan penunjuk penting data statistik adalah serupa, tanpa mengira kerumitan pengiraan dan bilangan nilai pembolehubah.
Bagaimanakah ia dikira?
Digunakan semasa mengira nilai penunjuk "kepentingan statistik" bagi persamaan. Iaitu, boleh dikatakan bahawa dalam kes ini semuanya diputuskan oleh matematik. Pilihan pengiraan yang paling mudah ialah rangkaian operasi matematik, di mana parameter berikut terlibat:
- dua jenis hasil yang diperoleh daripada tinjauan atau kajian data objektif, seperti jumlah pembelian, dilambangkan dengan a dan b;
- penunjuk saiz sampel untuk kedua-dua kumpulan – n;
- nilai bahagian sampel gabungan - p;
- ralat standard - SE.
Langkah seterusnya ialah menentukan skor ujian keseluruhan - t, nilainya dibandingkan dengan nombor 1.96. 1.96 ialah nilai purata, menyampaikan julat 95%, mengikut fungsi taburan-t Pelajar.
Persoalan sering timbul tentang apakah perbezaan antara nilai n dan p. Nuansa ini mudah dijelaskan dengan contoh. Katakan bahawa kepentingan statistik kesetiaan kepada mana-mana produk atau jenama lelaki dan wanita dikira.
Dalam kes ini, huruf akan diikuti oleh yang berikut:
- n - bilangan responden;
- p - bilangan yang berpuas hati dengan produk.
Bilangan wanita yang ditemu bual dalam kes ini akan ditetapkan sebagai n1. Sehubungan itu, lelaki - n2. Nilai yang sama akan mempunyai nombor "1" dan "2" bagi simbol p.
Membandingkan markah ujian dengan purata hamparan Pelajar menjadi apa yang dipanggil "kepentingan statistik".
Apakah yang dimaksudkan dengan pengesahan?
Keputusan sebarang pengiraan matematik sentiasa boleh disemak, ini diajar kepada kanak-kanak di sekolah rendah. Ia adalah logik untuk mengandaikanbahawa memandangkan statistik ditentukan menggunakan rantaian pengiraan, maka ia disemak.
Walau bagaimanapun, ujian untuk kepentingan statistik bukan sekadar matematik. Statistik memperkatakan sebilangan besar pembolehubah dan pelbagai kebarangkalian, yang jauh dari sentiasa bersetuju dengan pengiraan. Iaitu, jika kita kembali kepada contoh kasut getah pada permulaan artikel, maka pembinaan logik data statistik yang pembeli barangan untuk kedai akan bergantung pada boleh terganggu oleh cuaca kering dan panas, yang tidak tipikal untuk musim luruh.. Akibat fenomena ini, bilangan orang yang membeli but getah akan berkurangan dan kedai akan mengalami kerugian. Sudah tentu, formula matematik tidak dapat meramalkan anomali cuaca. Detik ini dipanggil "kesilapan".
Itu hanya kebarangkalian ralat sedemikian dan mengambil kira semakan tahap kepentingan yang dikira. Ia mengambil kira kedua-dua penunjuk yang dikira dan tahap kepentingan yang diterima, serta kuantiti yang biasa dipanggil hipotesis.
Apakah tahap keertiannya?
Konsep "tahap" termasuk dalam kriteria utama untuk kepentingan statistik. Ia digunakan dalam statistik gunaan dan praktikal. Ini ialah sejenis nilai yang mengambil kira kemungkinan penyelewengan atau ralat yang mungkin berlaku.
Tahap adalah berdasarkan pengenalpastian perbezaan dalam sampel siap sedia, ia membolehkan anda menentukan kepentingannya atau, sebaliknya, rawak. Konsep ini bukan sahaja mempunyai makna digital, tetapi juga tafsiran peliknya. Mereka menerangkanbagaimana anda perlu memahami nilai, dan tahap itu sendiri ditentukan dengan membandingkan hasil dengan indeks purata, ini mendedahkan tahap kebolehpercayaan perbezaan.
Oleh itu, kita boleh membayangkan konsep tahap dengan mudah - ia adalah penunjuk ralat atau ralat yang boleh diterima, berkemungkinan dalam kesimpulan yang diambil daripada data statistik yang diperolehi.
Apakah tahap kepentingan yang digunakan?
Kepentingan statistik pekali kebarangkalian ralat dalam amalan adalah berdasarkan tiga tahap asas.
Tahap pertama ialah ambang di mana nilainya ialah 5%. Iaitu, kebarangkalian ralat tidak melebihi tahap keertian 5%. Ini bermakna bahawa keyakinan terhadap ketidakcekapan dan kemaksuman kesimpulan yang dibuat berdasarkan data penyelidikan statistik ialah 95%.
Tahap kedua ialah ambang 1%. Sehubungan itu, angka ini bermakna seseorang itu boleh dipandu oleh data yang diperoleh semasa pengiraan statistik dengan keyakinan 99%.
Tahap ketiga - 0.1%. Dengan nilai ini, kebarangkalian ralat adalah sama dengan pecahan peratus, iaitu, ralat secara praktikal dihapuskan.
Apakah hipotesis dalam statistik?
Ralat sebagai konsep terbahagi kepada dua bidang, berkenaan penerimaan atau penolakan hipotesis nol. Hipotesis ialah konsep di belakangnya, mengikut definisi, satu set hasil tinjauan, data atau pernyataan lain disembunyikan. Iaitu, penerangan tentang taburan kebarangkalian sesuatu yang berkaitan dengan subjek perakaunan statistik.
Terdapat dua hipotesis dalam pengiraan mudah - sifar dan alternatif. Perbezaan di antara mereka adalah bahawa hipotesis nol adalah berdasarkan idea bahawa tidak ada perbezaan asas antara sampel yang terlibat dalam menentukan kepentingan statistik, dan yang alternatif adalah bertentangan sepenuhnya dengannya. Iaitu, hipotesis alternatif adalah berdasarkan kehadiran perbezaan yang ketara dalam sampel ini.
Apakah kesilapannya?
Ralat sebagai konsep dalam statistik adalah berkadar langsung dengan penerimaan hipotesis ini atau itu sebagai benar. Ia boleh dibahagikan kepada dua arah atau jenis:
- jenis pertama adalah disebabkan penerimaan hipotesis nol, yang ternyata tidak betul;
- saat - disebabkan oleh mengikut alternatif.
Jenis ralat pertama dipanggil positif palsu dan agak biasa di semua kawasan di mana statistik digunakan. Sehubungan itu, ralat jenis kedua dipanggil negatif palsu.
Mengapa kita memerlukan regresi dalam statistik?
Kepentingan statistik regresi ialah dengan bantuannya adalah mungkin untuk menentukan berapa banyak model pelbagai kebergantungan yang dikira berdasarkan data sepadan dengan realiti; membolehkan anda mengenal pasti kecukupan atau kekurangan faktor untuk perakaunan dan kesimpulan.
Nilai regresi ditentukan dengan membandingkan keputusan dengan data yang disenaraikan dalam jadual Fisher. Atau menggunakan analisis varians. Penunjuk regresi adalah penting apabilakajian dan pengiraan statistik yang kompleks yang melibatkan sejumlah besar pembolehubah, data rawak dan kemungkinan perubahan.