5 Przedziały ufności
Niech \(\theta\in\Theta\) oznacza parametr modelu statystycznego.
DEFINICJA
Przedział \((L,R)\) określony parą statystyk \(L\) i \(R\) takich, że \(\text{P}_{\theta}(L\leq R)=1\) dla każdego \(\theta\in\Theta\), nazywamy przedziałem ufności dla parametru \(\theta\), na poziomie ufności \(1-\alpha\) (\(0<\alpha <1\)), gdy dla każdego \(\theta\in\Theta\) \[\text{P}_{\theta}(L<\theta<R)\geq 1-\alpha.\]
Typowe wartości poziomu ufności to: 0,9; 0,95; 0,99 (zazwyczaj podawane w %).
Konstrukcja przedziałów ufności
DEFINICJA
Funkcję \(Q(\pmb X,\theta)\) nazywamy funkcją centralną dla parametru \(\theta\), gdy
- rozkład prawdopodobieństwa zmiennej losowej \(Q\) jest absolutnie ciągły i nie zależy od parametru \(\theta\),
- funkcja \(Q(\pmb X,\theta)\) jest ciągła i ściśle monotoniczna względem \(\theta\).
Uwaga! Warunek pierwszy można osłabić, żądają tylko aby rozkład graniczny zmiennej losowej \(Q\) był absolutnie ciągły. Wtedy uzyskany przedział można stosować jedynie dla dużych prób.
Konstrukcja
- Obieramy funkcję centralną \(Q(\pmb X,\theta)\).
- Wyznaczamy stałe \(a\) i \(b\) tak, aby \[P(a<Q<b)=1-\alpha.\]
- Rozwiązujemy nierówność \[a<Q(\pmb X,\theta)<b\] względem \(\theta\) otrzymując szukany przedział \[(L(\pmb X),R(\pmb X)).\]
Uwaga! Stałe \(a\) i \(b\) można dobrać na wiele sposobów. Zazwyczaj dobieramy je tak, aby \[P(Q\leq a)=P(Q\geq b)=\frac{\alpha}{2}.\]
Przykład 1.
W modelu jednej próby prostej z rozkładu wykładniczego \((1-\alpha)\cdot 100\%\) przedział ufności dla parametry \(\lambda\) ma postać: \[\left( \frac{\chi^2\left(\frac{\alpha}{2},2n\right)}{2n\bar X}; \frac{\chi^2\left(1-\frac{\alpha}{2},2n\right)}{2n\bar X} \right),\] gdzie \(\chi^2(p,n)\) oznacza kwantyl rzędu \(p\) z rozkładu \(\chi^2(n)\).
DEFINICJA
Niech \(X\sim N(0,1)\) oraz \(Y\sim \chi^2(n)\) będą niezależnymi zmiennymi losowymi.
Mówimy, że zmienna losowa \[\frac{X}{\sqrt{\frac{1}{n}Y}}\] ma rozkład t-Studenta z \(n\) stopniami swobody (ozn. \(t(n)\)).
FAKT
\[f(x)={1\over \sqrt {n\pi }}{\Gamma \bigl ({n+1\over 2}\bigr )\over \Gamma \bigl ({n\over 2}\bigr )}\bigl (1+{x^2\over n}\bigr )^{-{n+1\over 2}},\ x\in \mathbf{R}.\]
FAKT
Niech \(X_1,X_2,\ldots ,X_n\), \(n>1\) będą niezależnymi zmiennymi losowymi o jednakowym rozkładzie \(N(\mu,\sigma^2)\).
Wtedy \[\frac{\bar X-\mu}{S}\sqrt{n}\sim t(n-1).\]
Przykład 2.
W modelu jednej próby prostej z rozkładu normalnego \((1-\alpha )\cdot 100\%\) przedział ufności dla parametru \(\mu\) ma postać: \[\Bigl ( \bar X-{S\over \sqrt{n}}t(1-{\alpha \over 2},n-1), \bar X+{S\over \sqrt{n}}t(1-{\alpha \over 2},n-1) \Bigr )\] gdzie \(t(p,n)=F_t^{-1}(p)\) oznacza kwantyl rzędu \(p\) z rozkładu \(t(n)\).
FAKT
Niech \(X_1,X_2,\ldots ,X_n\), \(n>1\) będą niezależnymi zmiennymi losowymi o jednakowym rozkładzie \(N(\mu,\sigma^2)\).
Wtedy \[\frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1).\]
Przykład 3.
W modelu jednej próby prostej z rozkładu normalnego \((1-\alpha )\cdot 100\%\) przedział ufności dla parametru \(\sigma^2\) ma postać: \[\left( \frac{(n-1)S^2}{\chi^2\left(1-\frac{\alpha}{2},n-1\right)}; \frac{(n-1)S^2}{\chi^2\left(\frac{\alpha}{2},n-1\right)} \right),\] gdzie \(\chi^2(p,n)\) oznacza kwantyl rzędu \(p\) z rozkładu \(\chi^2(n)\).
Funkcje związane z przedziałami ufności:
e… (EnvStats) - pozwalają wyznaczyć przedziały ufności dla parametrów wybranego modelu.
Przykładowo:
eexp (EnvStats) - pozwala wyznaczyć przedział ufności dla parametru w modelu wykładniczym,
enorm (EnvStats) - pozwala wyznaczyć przedziały ufności dla parametrów w modelu normalnym.
Bootstrapowe przedziały ufności
Przyjmujemy \[Q(\pmb{X},\theta)=\hat{\theta}-\theta.\] Wtedy \[P(a < \hat{\theta}-\theta < b)=1-\alpha\]. \[P(\hat{\theta}-b < \theta < \hat{\theta}-a)=1-\alpha.\] Ponieważ rozkład \(\hat{\theta}-\theta\) jest, przy ustalonych wartościach \(x_1,x_2,\ldots ,x_n\), bliski rozkładowi \(\hat{\theta}^{\star}-\hat{\theta}\), zatem \[P(a < \hat{\theta}^{\star}-\hat{\theta} < b)\approx 1-\alpha.\] Stąd \[a=q(\alpha/2),\quad b=q(1-\alpha/2),\] gdzie \(q(p)\) jest kwantylem rzędu \(p\) z rozkładu \(\hat{\theta}^{\star}-\hat{\theta}\).
Uwaga: Nieznane wartości kwantyli szacujemy za pomocą percentyli uzyskanych z \(k\) realizacji próby bootstrapowej \(\pmb{X}^{\star}\).
Funkcje związane z bootstrapowymi przedziałami ufności:
boot(boot) - próba bootstrapowa,
boot.ci(boot) - bootstrapowy przedział ufności.
5.1 Wywołania w R
Klasyczne przedziały ufności
load("Awarie.RData")
attach(Awarie)
m <- mean(Czas)
n <- length(Czas)
a <- 0.05
L <- qchisq(a/2,2*n)/(2*n*m)
L
R <- qchisq(1-(a/2),2*n)/(2*n*m)
R
load("Hamulce.RData")
attach(Hamulce)
library(EnvStats)
enorm(Wynik,ci=T)
enorm(Wynik,ci=T,ci.param='variance')
Bootstrapowe przedziały ufności