2009-10-19

Konfidencialumas

In statistics, a confidence interval (CI) is a particular kind of interval estimate of a population parameter. Instead of estimating the parameter by a single value, an interval likely to include the parameter is given. Thus, confidence intervals are used to indicate the reliability of an estimate. How likely the interval is to contain the parameter is determined by the confidence level or confidence coefficient. Increasing the desired confidence level will widen the confidence interval.
A confidence interval is always qualified by a particular confidence level, usually expressed as a percentage; thus one speaks of a "95% confidence interval". The end points of the confidence interval are referred to as confidence limits. For a given estimation procedure in a given situation, the higher the confidence level, the wider the confidence interval will be.

Lietuviškai tas intervalas vadinamas pasikliautinuoju intervalu.

Mes suprantame – šiuo intervalu reikia pasikliauti.

Na, statistikos mokslo mes nesuprantame, betgi pasikliautinuoju intervalu, kurį, sunkiai plušėdami, apskaičiuoja išmintingieji statista, pasikliauti reikia.

Šie sakiniai iš lietuviškos Vikipedijos:

čia t(n,P) – Stjudento koeficientas esant n-1 laisvės laipsnių (mūsų atveju n yra matavimų skaičius) ir P pasikliovimo lygmeniui. Šis koeficientas skaičiuojamas gana sudėtingai, bet jis gali būti randamas iš įvairių lentelių. Jo reikšmė dažniausiai svyruoja tarp 2 ir 3.
Būna ir sudėtingesnių matematinių metodų rezultatų patikimumui įvertinti.

Stebėtinai primena irgi lietuvišką Vikipedijos pasakojimą apie BVP skaičiavimą:

Ekonominėje geografinėje praktikoje svarbiausiu vystymosi lygio rodikliu yra BVP vienam gyventojui. BVP skaičiavimas – sudėtinga procedūra. Skaičiavimo rezultatai labai priklauso nuo to, kokia metodika yra naudojama.

Rengiant mokslinį straipsnį spaudai, visada būtina apskaičiuoti išmatuotų rezultatų pasikliautinus intervalus. Darbai, kuriose šitai nepadaryta, nelaikomi iš tiesų moksliniais ir bet kurių rimtesnių žurnalų yra atmetami.

Sąvokos migruoja.

Protekcija mums:

protèkcija sf. (1) TrpŽ įtakingo asmens teikiama globa, parama tvarkant reikalus: Jam per protekciją pavyko susirasti gerą darbą stambioje kompanijoje sp.

reiškia ką kitą, negu protection britams.

Kaip tie confidence intervals pavirto pasikliautinaisiais intervalais?

Ar tai reiškia, kad pasikliauti reikia konfidencialia informacija?

Pasąmonės lygmenyje matyt, būtent toks paaiškinimas teatrodo priimtinas.

Įdomiausia, kad to sunkiai apskaičiuojamo (šiais laikais!) Stjudento koeficiento pavadinimo atsiradimas, lyg tyčia, ir atsirado dėl konfidencialumo problemų:

Another researcher at Guinness had previously published a paper containing trade secrets of the Guinness brewery. To prevent further disclosure of confidential information, Guinness prohibited its employees from publishing any papers regardless of the contained information. This meant that Gosset was unable to publish his works under his own name. He therefore used the pseudonym Student for his publications to avoid their detection by his employer.

Kažin, Guinness-o skonį Stjudentas pataisė ar pagadino?

В англоязычной литературе байесовский доверительный интервал принято называть термином credible interval, а классический — confidence interval.

Credible.

Grįžkim prie pasikliautinojo intervalo. Tiems, kas nesimokė matematinės statistikos, trumpai paaiškinsiu, kas tai.

Manoma, kad dalykai vyksta atsitiktinai.

Daug jų vyksta.

Visų baigčių aprėpti ir Pasaulio dėsnių suprasti negalime, todėl pasirenkame keletą (keliasdešimt, kelis šimtus, tūkstantį)
baigčių ir, jas pažiūrėję, skelbiame verdiktą Pasauliui.

Pavyzdžiui, rūpi mums kuris nors Pasaulio parametras, kurį įvardijame kaip atsitiktinio dydžio parametrą.

Sakome taip: dalykas vyksta normaliai.

O, jei dabar dar nenormaliai, tai ilgainiui normalizuosis.

Susibėgs krūvon.

Tai galim galvoti, kad tas kalnelis jau yra.

Juk tai – normaliai pasiskirstęs atsitiktinis dydis!.

Nežinom tik vidurkio μ ir standartinio nuokrypio σ.

O sužinoti norim.

Na, kad žinotume, kurioje vietoje ir kokio aukščio kalnelio ieškoti.

Kodėl?

Kaip kodėl?

Gal pamiršot?

Tai - normalu!

Tai ir paskelbiame intervalą [L,U], tenkinantį lygybę

P(L< θ < U) = α, kur α – duotoji tikimybė, pavyzdžiui, 0.95, o nelygybės - negriežtos, mums parūpusio parametro vardu θ (kuris mūsų pavyzdyje gal lygus μ, o gal σ) pasikliautinuoju intervalu, kurio reikšmingumo lygmuo lygus α.

Gerai.

Gerai, kad padeda mums rasti tokį intervalą.

Tik blogai, kad pamiršta pasakyti, kad toks intervalas – ne vienintelis.

Jei galvojame, kad mūsų atsitiktinis dydis – normalus, galime tą pasikliautinąjį intervalą su lygiai tokia pačia tikimybe α “nustumti” kiek tik nori į kairę – kol kairysis jo galas nutols į “– begalybę”. Arba į dešinę, kol dešinysis jo galas nukeliaus į “+ begalybę”.

Šitai pasakyti pamirštama.

To normaliojo skirstinio pasikliautinasis intervalas [L,U] apskaičiuojamas taip, kad jo viduryje būtų to keleto stebėjimų rezultatų aritmetinis vidurkis.

Kadangi jis vadinamas pasikliautinuoju, mes pasikliauname juo ir į šonus nesidairome.

Žiūrim jo vidurin.

Apie tai, kad dalykai normalizuojasi tik kažin kada,
išvis pamirštame.

Kad tai nutinka “under certain conditions (such as being independent and identically-distributed with finite variance)” – tuo labiau neprisimename.

Pasikliauname, ir baigta.

Ieškom užsispyrę kalnelio ten, kur mums parodė.

Jokia paslaptis, kad bankų analitikai - lyg tyčia, statista.

O dabar atsakykite, prašau, į klausimą - kam ponui Jean-Claude Trichet, parašiusiam laišką mūsų Seimui, kuris ryžosi jo pasiteirauti, ar ponas nelabai užpyktų, jei mes leistume mūsų Valstybės kontrolei patikrinti, mums nuosavybės teise priklausantį Lietuvos banką, prireikė ginti “ECBS konfidencialumo režimą”, žr. 2.3 punktą antrame puslapyje?

Koks tas režimas - toks:

konfidencialùs, -ì adj. (4) viešai neskelbtinas, slaptas: Konfidencialì sutartis DŽ. O Navikas ėmė pasakoti Kanopai konfidencialių, „tik vienam jam“ prieteliškai patikimų dalykų rš.,

ar šitoks?

Komentarų nėra: