Mediana (stochastics)

W stochastykę The mediana , zwany także centralny wartość jest miarą pozycji z rozkładów prawdopodobieństwa i rozkładów zmiennych losowych . Zatem, podobnie jak wartość oczekiwana i tryb, jest wskaźnikiem, gdzie znajduje się „środek” rozkładu prawdopodobieństwa. Mediana jest wyraźnie liczbą, dla której

  • prawdopodobieństwo otrzymania wartości mniejszej lub równej medianie oraz
  • prawdopodobieństwo otrzymania wartości większej lub równej medianie

jest równe. Istnieje kilka formalizacji tego intuicyjnego pojęcia, które różnią się pod względem istnienia i wyjątkowości mediany.

W statystyki opisowej , która jest mediana dla próbkowania zdefiniowane. Te dwa terminy różnią się tym, że jeden jest kluczową liczbą próby (podobną do średniej arytmetycznej ), a drugim jest rozkład prawdopodobieństwa (podobny do wartości oczekiwanej ). Oba są różne per se, ale można je połączyć poprzez dystrybucję empiryczną .

Pierwsza definicja

Dla rozkładów prawdopodobieństwa

Rozkład prawdopodobieństwa jest podane , to znaczy liczb rzeczywistych , zabezpieczone Borel w Ď-Algebra .

Wtedy liczba rzeczywista nazywana jest medianą (z ), jeśli:

i .

Dla zmiennych losowych

Podana jest rzeczywista zmienna losowa .

Wtedy liczba rzeczywista nazywana jest medianą (z ), jeśli:

i .

Dlatego mediana zmiennej losowej jest dokładnie medianą jej rozkładu .

Definicja poprzez funkcje dystrybucji

Medianę można również zdefiniować za pomocą funkcji rozkładu . Jeśli funkcja rozkładu jest z lub z , wówczas wywoływana jest mediana (z lub z ) if

i .

Oto wartość graniczna w lewo .

Określenie i przykłady

Z ciągłą funkcją dystrybucji

Jeśli funkcja rozkładu jest ciągła , to jest medianą wtedy i tylko wtedy, gdy istnieje rozwiązanie równania

jest.

Opiera się to na fakcie, że wartość graniczna po lewej stronie pokrywa się wtedy z wartością funkcji.

Przykłady
Mediana rozkładu wykładniczego

Jeśli weźmiesz pod uwagę rozkład wykładniczy jako przykład , ma on funkcję rozkładu

dla parametru . Zrównywanie z prowadzi do równania

,

co jest rozwiązaniem

posiada. W tym przypadku mediana jest wyraźna.

Wykres funkcji Cantora (10 iteracji)

Ale mediana może być niejednoznaczna nawet przy stałej funkcji rozkładu. Na przykład, jeśli spojrzymy na rozkład Cantora , którego funkcja rozkładu jest pokazana po prawej stronie, to ze względu na swoją konstrukcję przyjmuje wartość w całym przedziale . Każdy punkt w tym przedziale jest zatem medianą. W przypadku stałej funkcji rozkładu mediana jest jednoznaczna, na przykład gdy funkcja dystrybucji rośnie w ściśle monotonny sposób. Dokładniej mówiąc, wyjątkowość ma już zastosowanie, gdy funkcja dystrybucji w jednym środowisku, w którym przyjmuje wartość , rośnie ściśle monotonicznie.

Z gęstościami prawdopodobieństwa

Jeśli zmienna losowa lub rozkład prawdopodobieństwa ma funkcję gęstości prawdopodobieństwa (jest to więc rozkład absolutnie ciągły ), mediana jest rozwiązaniem równania

.

Wynika to bezpośrednio z faktu, że rozkłady absolutnie ciągłe zawsze mają ciągłą funkcję dystrybucji, którą można wyznaczyć za pomocą całki i instrukcji w powyższej sekcji.

Występuje tutaj kilka median, na przykład, jeśli funkcja gęstości prawdopodobieństwa jest stale zerowa w przedziale czasu.

przykład

Spojrzenie na funkcję prawdopodobieństwa

,

więc jest to stałe zero w przedziale . Z podstawowych reguł całkowania wynika, że ​​każda wartość znajduje się w medianie. Rozwiązanie równania całkowego najczęściej odpowiada wyznaczeniu odpowiedniej funkcji rozkładu i dlatego może być postrzegane jako szczególny przypadek procedury opisanej w powyższej sekcji.

Jasna definicja

Podaje się rozkład prawdopodobieństwa lub rzeczywistą zmienną losową . Niech będzie funkcją dystrybucyjną or . Następnie jest nazywany

mediana lub . Odpowiada następującą definicję: Czy odwrotna dystrybuanta do mediana jest zdefiniowany jako

.

Ze względu na prawną ciągłość funkcji dystrybucji, dolne minimum można również zastąpić minimum w górnej z dwóch definicji .

cechy

Mediana to kwantyl , a dokładniej kwantyl 50%.

Jeśli rozkład jest symetryczny , to znaczy zero jest medianą. Mówiąc bardziej ogólnie, oś symetrii jest medianą dowolnego rozkładu symetrycznego.

Każda mediana minimalizuje odchylenie bezwzględne, tj. Jeśli jest zmienną losową z , zawsze ma to zastosowanie

dla wszystkich

a równość obowiązuje wtedy i tylko wtedy, gdy jest również medianą.

Relacja z medianą statystyki opisowej

Mediana w statystyki opisowej (jako kluczowa postać próbki) może być związana z medianą prawdopodobieństwo dystrybucji poprzez rozkładu empirycznego : Jeżeli próbka jest podana i rozkład empiryczny jest wtedy Mediana (w sensie teorii prawdopodobieństwa) od Mediana (w sensie statystyki opisowej) z . Jednak ze względu na różne definicje mogą wystąpić niewielkie odchylenia.

Dalsze definicje

Mediana jest uważana za najbardziej bezpośrednią wartość, dla której

ma zastosowanie lub jest zdefiniowana. Jednak istnienie mediany nie jest gwarantowane w obu definicjach. Tak jest dla

zawsze , ponieważ funkcja dystrybucji nigdy nie przyjmuje wartości . Podobnie nie ma , więc powyższy łańcuch równań jest spełniony: bo wszystko jest , jak dla wszystkich nadal obowiązuje.

Ponadto należy zauważyć, że funkcje dystrybucyjne w starszej literaturze rosyjskojęzycznej są definiowane jako ciągłe lewostronnie, a nie tak ciągłe prawostronnie, jak w obszarze niemieckojęzycznym. Na przykład w przypadku uczciwego rzutu monetą raz zamiast .

linki internetowe

literatura

Indywidualne dowody

  1. ^ Hans-Otto Georgii: Stochastics . Wprowadzenie do teorii prawdopodobieństwa i statystyki. Wydanie 4. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7 , s. 101 , doi : 10.1515 / 9783110215274 .
  2. a b Hans-Otto Georgii: Stochastics . Wprowadzenie do teorii prawdopodobieństwa i statystyki. Wydanie 4. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7 , s. 233 , doi : 10.1515 / 9783110215274 .
  3. Norbert Kusolitsch: Teoria miary i prawdopodobieństwa . Wstęp. Wydanie drugie poprawione i rozszerzone. Springer-Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-45386-1 , s. 113 , doi : 10.1007 / 978-3-642-45387-8 .