3 Model statystyczny

Jeżeli próbka \(\pmb x=(x_1,\ldots ,x_n)'\) jest reprezentatywna, to stanowi ona podstawę do wnioskowania o populacji z której pochodzi. Wnioskowanie takie wymaga zbudowania modelu “zachowania się” zmiennej (cechy) \(X\) w populacji. Budowa modelu polega na przyjęciu założenia o rozkładzie (teoretycznym) zmiennej \(X\) w populacji oraz traktowaniu obserwacji jako wartości tej zmiennej.

Dokładniej: budując model statystyczny traktujemy wektor obserwacji (próbkę) \(\pmb x=(x_1,\ldots ,x_n)'\) jak realizację wektora losowego (próby) \(\pmb X=(X_1,\ldots ,X_n)'\) z nieznanego (lub jedynie częściowo nieznanego) rozkładu.

Statystyka, to każda (mierzalna) funkcja próby. Zatem w modelu, statystyka jest wielkością losową.

Model: jedna próba prosta

Modelujemy wyniki doświadczenia w którym dokonujemy \(n\)-niezależnych obserwacji badanej cechy \(X\) na losowo wybranych z populacji (jednorodnej ze względu na badana cechę) jednostkach eksperymentalnych.

Przykład 1. W celu określenia czasu bezawaryjnej pracy urządzeń po wykonaniu kapitalnego remontu, wybrano 50 urządzeń i obserwowano czas ich bezawaryjnej pracy. Wyniki (w h.) są następujące: 629, 325, 215, … ,612, 841, 492.

Budując model statystyczny tego eksperymentu zakładamy, że (w populacji) czas bezawaryjnej pracy urządzenia (cecha \(X\)) ma rozkład wykładniczy z nieznanym parametrem \(\lambda\).

Model ten ma jeden parametr: \(\lambda\).

Przykład 2. Przeprowadzono 50 niezależnych eksperymentów polegających na hamowaniu badanego typu samochodu wyposażonego w nowy typ układu hamulcowego (na suchym asfalcie, przy prędkości 40 km/h, itd.). Notowano długość drogi hamowania z dokładnością do jednego centymetra. Otrzymane wyniki to: 18.66, 17.81, 18.96, … ,17.62, 18.61, 17.99.

Budując model statystyczny tego eksperymentu zakładamy, że (w populacji) długość drogi hamowania (cecha \(X\)) ma rozkład normalny z nieznanymi parametrami \(\mu\) i \(\sigma^2\)

Uwaga! Model ten często zapisujemy w następującej postaci:

\[X_i=\mu+\varepsilon _i,\quad i=1,\ldots ,n,\]

gdzie

\(X_i\) - \(i\)-ta obserwacja badanej cechy \(X\),

\(\mu\) - wartość oczekiwana (średnia, “prawdziwa” wartość) badanej cechy \(X\),

\(\varepsilon_i\) - błędy (reszty) - niezależne zmienne losowe o jednakowym rozkładzie \(N(0,\sigma^2)\).

Model ten ma dwa parametry: \(\mu\) i \(\sigma^2\).