Statistická analýza 1

Přednášky: František Vávra, KMA, cvičení: František Vávra

Přednášky:

Přednáška

Její název

1

Opakování pravděpodobnostních pojmů I. Aparát pro spojitá rozdělení.

2

Opakování pravděpodobnostních pojmů II. Aparát pro diskrétní rozdělení.

3

Pravděpodobnostní rozdělení matematické statistiky 1. rozdělení, gama rozdělení, beta rozdělení, Studentovo t-rozdělení, F-rozdělení.

4

Pravděpodobnostní rozdělení matematické statistiky 2. Podíly náhodných proměnných. Opakování a užití centrálních limitních vět.   Souvislosti a vlastnosti základních rozdělení matematické statistiky. Některé nerovnosti pro binomické rozdělení, aproximace binomického normálním rozdělením, aproximace binomického Poissonovým rozdělením, vyjádření distribučních funkcí Poissonova a binomického   a F-rozdělením. Výpočetní schémata pro binomické, Poissonovy, geometrické pravděpodobnosti.  

5

Bodové odhady. Průměr, výběrový rozptyl, pojem statistiky, nestranný odhad, nestrannost výběrového rozptylu, vychýlenost výběrové směrodatné odchylky, rozdělení průměru a výběrového rozptylu v případě velkých výběrů, rozdělení průměru a výběrového rozptylu pro vybraná rozdělení – malé výběry.

6

Bodové odhady – některá užití pořádkových statistik. Pořádkové statistiky, rozdělení i-té pořádkové statistiky, specielně rozdělení minima a maxima, symetrická rozdělení, kvantily, výběrový medián a jeho rozdělení, bodové odhady mezí rovnoměrného rozdělení, posunuté exponenciální rozdělení.

7

Bodové odhady – některé metody konstrukce odhadů. Konzistence bodového odhadu, metoda momentů, metoda maximální věrohodnosti, MLE pro parametry normálního, exponenciálního a rovnoměrného rozdělení, zavedení a smysl pojmu postačující statistika.

8

Intervalové odhady. Pojem intervalového odhadu parametru, nejednoznačnost intervalu spolehlivosti, interval symetrický v pravděpodobnosti a v hodnotě, intuitivní konstrukce intervalových odhadů parametrů pro některá rozdělení.

9

Testování hypotéz. Jednoduchá hypotéza, jednoduchá alternativa, chyba prvního a druhého druhu, jejich vzájemné ovlivnění, kritický obor, síla testu, pojmy nejsilnější a stejnoměrně nejsilnější test, Neyman-Pearsonovo lemma, parametrické testy, silofunkce, testování v exponenciální rodině rozdělení, test poměrem věrohodností.

10

Testování hypotéz – sekvenční testy.  Waldovské testy, sekvenční testy o parametrech některých rozdělení, rozdělení součtu náhodného počtu sčítanců, vlastnosti Waldových testů, srovnání s klasickým testováním.

11

Vícerozměrná rozdělení, odhady a testy měr a modelů „závislosti“. Detailně dvourozměrné normální rozdělení, korelační koeficient a jeho bodový odhad, Fisherova transformace, intervalový odhad, test hypotézy o nekorelovanosti.

12

Neparametrické testy, rozdělení s kategoriálními proměnnými. test dobré shody, modifikace, test homogenity výběrů.

 

Cvičení:

Bloky

 Doporučená literatura:

Jiří Reif

Metody matematické statistiky, ZČU v Plzni 2004

Jaroslav Hátle, Jiří Likeš

Základy počtu pravděpodobnosti a matematické statistiky. SNTL Praha 1974.

Alfréd Rényi

Teorie pravděpodobnosti, ACADEMIA, Praha 1972

C. Radhakrishna Rao

Lineární metody statistické indukce a jejich aplikace, ACADEMIA, Praha 1978

http://en.wikipedia.org/wiki/Probability_distribution

 

Podmínky získání zápočtu a zkoušky:

Průběh zkoušky

Zkouška bude písemná, ze dvou testových částí.

1.       Test z minimálních požadovaných znalostí. Test bude mít 8 otázek nebo problémů k řešení. Při bezchybném splnění 6 bude klasifikován známkou dobře, při bezchybném splnění 7 bude klasifikován známkou velmi dobře, při bezchybném splnění 8 bude klasifikován známkou výborně. V opačném případě (splněno £ 5 otázek), bude klasifikace nevyhověl. Tento test bude probíhat bez jakýchkoliv pomůcek. (Pokud bude zápočet, bude splnění podmínek testu minimálních znalostí zakládat nárok na získání zápočtu). K testu minimálních znalostí bude patřit i prohlášení o zpracování a zvládnutí sady zadaných úloh.

2.       Test z rozšiřujících znalostí. Ten je možno podstoupit, pokud byla předchozí část klasifikována do stupně dobře včetně. Povinně při něm bude užíváno zvolené učebnice statistiky (i elektronické), jedinou výjimkou je zákaz používání textů přednášek. Test bude mít 10 otázek nebo problémů k řešení. Splnění 5,6-ti zakládá klasifikaci dobře,  splnění 7,8-mi zakládá klasifikaci velmi dobře, splnění 9,10-mi zakládá klasifikaci výborně. K testu rozšiřujících znalostí náleží i případná doplňující ústní zkouška k potvrzení prezentovaných znalostí v testové části, včetně možné kontroly zda prohlášení o zpracování a zvládnutí sady zadaných úkolů odpovídá pravdě.

3.       Ke každé části zkoušky se zkoušející může rozhodnout k ústnímu (dalšímu) dozkoušení.

 

                Výsledná známka bude stanovena jako matematický průměr známek z obou testů, zaokrouhlování, klasické matematické ( ³ *,5 nahoru, zbytek dolů). Výsledek nevyhověl z jakékoliv části, má za následek souhrnný výsledek, nevyhověl.

               

                Obě části zkoušek budou konány v jednom termínu po sobě s cca hodinovou přestávkou na opravu minimálního testu. Na minimální test bude čas jedné hodiny (60 minut). Na test rozšiřujících znalostí bude také čas jedné hodiny (60 minut). Texty opravených testů (jejich částí) obdrží studenti ke kontrole a případné reklamaci, poté je vrátí zkoušejícímu. Po studentské kontrole už nelze reklamovat výsledek části zkoušky. A ani jejího celkového výsledku. Ustanovení zkušebního řádu ZČU tím zůstávají nedotčeny. Na zkoušku (jeden termín) bude možné přihlásit maximálně 10 studentů.

Minimální požadované znalosti k získání hodnocení dobře (podmínka nutná, nikoliv postačující):

 

  1. Důsledné rozlišování mezi pravděpodobnostními pojmy a jejich statistickými proti‑póly (př. střední hodnota a průměr jako její odhad, …)
  2. „Klasická“ pravděpodobnostní rozdělení:
    1. Spojitá

                                                               i.      Rovnoměrné na konečném intervalu.

                                                              ii.      Exponenciální (posunuté i neposunuté).

                                                            iii.      Jednorozměrné normální, Gaussovo.

                                                            iv.      Dvourozměrné normální – vyjádření pomocí rozptylů a korelačního koeficientu.

Jedná se o tvar jejich hustoty, distribuční funkce, průběhy i analytická vyjádření, parametry a způsob jejich  bodového a intervalového odhadu.

    1. Diskrétní

                                                               i.      Alternativní

                                                              ii.      Binomické

                                                            iii.      Rovnoměrné na konečné diskrétní množině

                                                            iv.      Poissonovo, včetně souvislosti s exponenciálním

                                                             v.      Geometrické

Jedná se o tvar jejich hustoty (pravděpodobnosti), distribuční funkce (pokud má smysl), průběhy i analytická vyjádření, parametry a způsob jejich  bodového a intervalového odhadu.

 

  1. Definice a smysl základních vlastností bodových odhadů = nestrannost a vydatnost.
  2. Rozdělení průměrů pro náhodný výběr z rozdělení a.ii, a.iii, b.i. b.ii, b.iv.
  3. Bodové odhady základních parametrů rozdělení a.ii, a.iii, b.i, b.iv, b.v metodou momentů a metodou maximální věrohodnosti.
  4. Intervalové odhady střední hodnoty a rozptylu z rozdělení  a.iii. při neznámém .

 

Explicitně je požadována dobrá a přehledná znalost studentem zvolené učebnice statistiky, ta bude ověřována v druhém testu. Ověřovány budou jen znalosti uvedené v textech přednášek.