У дома · Инструмент · Определете общата дисперсия. Показатели на вариация: понятие, видове, формули за изчисление. Примери за решаване на проблеми

Определете общата дисперсия. Показатели на вариация: понятие, видове, формули за изчисление. Примери за решаване на проблеми

Очакването и дисперсията са най-често използваните числени характеристики на случайна променлива. Те характеризират най-важните характеристики на разпределението: неговото положение и степен на разсейване. В много практически задачи пълна, изчерпателна характеристика на случайна променлива - законът за разпределение - или изобщо не може да бъде получена, или изобщо не е необходима. В тези случаи човек се ограничава до приблизително описание на случайна променлива, използвайки числови характеристики.

Очакваната стойност често се нарича просто средна стойност на случайна променлива. Дисперсията на случайна променлива е характеристика на дисперсията, разпространението на случайна променлива около нейното математическо очакване.

Очакване на дискретна случайна променлива

Нека се доближим до концепцията за математическото очакване, първо въз основа на механичната интерпретация на разпределението на дискретна случайна променлива. Нека единичната маса е разпределена между точките на оста x х1 , х 2 , ..., хн, а всяка материална точка има съответстваща маса от стр1 , стр 2 , ..., стрн. Необходимо е да се избере една точка по абсцисната ос, характеризираща позицията на цялата система от материални точки, като се вземат предвид техните маси. Естествено е да приемем за такава точка центъра на масата на системата от материални точки. Това е среднопретеглената стойност на случайната променлива х, към която е абсцисата на всяка точка хазвлиза с „тегло“, равно на съответната вероятност. Получената по този начин средна стойност на случайната променлива хсе нарича неговото математическо очакване.

Математическото очакване на дискретна случайна променлива е сумата от продуктите на всичките й възможни стойности и вероятностите на тези стойности:

Пример 1.Организирана е печеливша лотария. Има 1000 печалби, от които 400 са 10 рубли. 300 - 20 рубли всяка. 200-100 рубли всеки. и 100 - 200 рубли всяка. Каква е средната печалба за някой, който закупи един билет?

Решение. Ще намерим средните печалби, ако разделим общата сума на печалбите, която е 10*400 + 20*300 + 100*200 + 200*100 = 50 000 рубли, на 1000 (общата сума на печалбите). Тогава получаваме 50000/1000 = 50 рубли. Но изразът за изчисляване на средните печалби може да бъде представен в следната форма:

От друга страна, при тези условия печелившият размер е случайна променлива, която може да приема стойности от 10, 20, 100 и 200 рубли. с вероятности, равни съответно на 0,4; 0,3; 0,2; 0,1. Следователно очакваната средна печалба е равна на сумата от произведенията на размера на печалбите и вероятността да бъдат получени.

Пример 2.Издателят реши да издаде нова книга. Той планира да продаде книгата за 280 рубли, от които той самият ще получи 200, 50 - книжарницата и 30 - авторът. Таблицата предоставя информация за разходите за издаване на книга и вероятността за продажба на определен брой копия от книгата.

Намерете очакваната печалба на издателя.

Решение. Случайната променлива „печалба” е равна на разликата между приходите от продажби и себестойността на разходите. Например, ако се продадат 500 копия от книга, тогава приходите от продажбата са 200 * 500 = 100 000, а цената на публикацията е 225 000 рубли. Така издателят е изправен пред загуба от 125 000 рубли. Следната таблица обобщава очакваните стойности на случайната променлива - печалба:

Номерпечалба хаз Вероятност страз хаз страз
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
Обща сума: 1,00 25000

Така получаваме математическото очакване на печалбата на издателя:

.

Пример 3.Вероятност за попадение с един изстрел стр= 0,2. Определете консумацията на снаряди, които осигуряват математическо очакване на броя на попаденията, равен на 5.

Решение. От същата формула за математическо очакване, която сме използвали досега, ние изразяваме х- консумация на черупки:

.

Пример 4.Определете математическото очакване на случайна променлива хброй попадения с три изстрела, ако вероятността за попадение с всеки изстрел стр = 0,4 .

Съвет: намерете вероятността от стойности на случайна променлива по Формула на Бернули .

Свойства на математическото очакване

Нека разгледаме свойствата на математическото очакване.

Имот 1.Математическото очакване на постоянна стойност е равно на тази константа:

Имот 2.Постоянният фактор може да бъде изваден от знака за математическо очакване:

Имот 3.Математическото очакване на сумата (разликата) на случайните променливи е равно на сумата (разликата) на техните математически очаквания:

Имот 4.Математическото очакване на произведение от случайни променливи е равно на произведението на техните математически очаквания:

Имот 5.Ако всички стойности на случайна променлива хнамаляване (увеличаване) със същото число СЪС, тогава неговото математическо очакване ще намалее (увеличи) със същото число:

Когато не можете да се ограничите само до математическо очакване

В повечето случаи само математическото очакване не може да характеризира достатъчно случайна променлива.

Нека случайните променливи хИ Yсе дават от следните закони на разпределение:

Значение х Вероятност
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
Значение Y Вероятност
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

Математическите очаквания на тези величини са еднакви – равни на нула:

Моделите им на разпространение обаче са различни. Случайна стойност хможе да приема само стойности, които се различават малко от математическото очакване и случайната променлива Yможе да приема стойности, които се отклоняват значително от математическото очакване. Подобен пример: средната работна заплата не позволява да се прецени делът на високо- и нископлатените работници. С други думи, от математическото очакване не може да се прецени какви отклонения от него, поне средно, са възможни. За да направите това, трябва да намерите дисперсията на случайната променлива.

Дисперсия на дискретна случайна променлива

Дисперсиядискретна случайна променлива хсе нарича математическо очакване на квадрата на неговото отклонение от математическото очакване:

Стандартното отклонение на случайна променлива харитметичната стойност на корен квадратен от неговата дисперсия се нарича:

.

Пример 5.Изчисляване на дисперсии и стандартни отклонения на случайни променливи хИ Y, чиито закони на разпределение са дадени в таблиците по-горе.

Решение. Математически очаквания на случайни променливи хИ Y, както е намерено по-горе, са равни на нула. Според дисперсионната формула при д(х)=д(г)=0 получаваме:

След това стандартните отклонения на случайни променливи хИ Yгрим

.

По този начин, със същите математически очаквания, дисперсията на случайната променлива хмного малка, но случайна променлива Y- значителен. Това е следствие от разликите в разпределението им.

Пример 6.Инвеститорът има 4 алтернативни инвестиционни проекта. Таблицата обобщава очакваната печалба в тези проекти със съответната вероятност.

Проект 1Проект 2Проект 3Проект 4
500, П=1 1000, П=0,5 500, П=0,5 500, П=0,5
0, П=0,5 1000, П=0,25 10500, П=0,25
0, П=0,25 9500, П=0,25

Намерете математическото очакване, дисперсията и стандартното отклонение за всяка алтернатива.

Решение. Нека да покажем как се изчисляват тези стойности за 3-тата алтернатива:

Таблицата обобщава намерените стойности за всички алтернативи.

Всички алтернативи имат еднакви математически очаквания. Това означава, че в дългосрочен план всички имат еднакъв доход. Стандартното отклонение може да се тълкува като мярка за риск – колкото по-високо е то, толкова по-голям е рискът на инвестицията. Инвеститор, който не иска голям риск, ще избере проект 1, тъй като има най-малкото стандартно отклонение (0). Ако инвеститорът предпочита риск и висока доходност за кратък период, тогава той ще избере проекта с най-голямо стандартно отклонение - проект 4.

Дисперсионни свойства

Нека представим свойствата на дисперсията.

Имот 1.Дисперсията на постоянна стойност е нула:

Имот 2.Константният коефициент може да бъде изваден от дисперсионния знак чрез повдигане на квадрат:

.

Имот 3.Дисперсията на случайна променлива е равна на математическото очакване на квадрата на тази стойност, от което се изважда квадратът на математическото очакване на самата стойност:

,

Където .

Имот 4.Дисперсията на сумата (разликата) на случайните променливи е равна на сумата (разликата) на техните дисперсии:

Пример 7.Известно е, че дискретна случайна променлива хприема само две стойности: −3 и 7. Освен това е известно математическото очакване: д(х) = 4 . Намерете дисперсията на дискретна случайна променлива.

Решение. Нека означим с стрвероятността, с която една случайна променлива приема стойност х1 = −3 . Тогава вероятността на стойността х2 = 7 ще бъде 1 − стр. Нека изведем уравнението за математическото очакване:

д(х) = х 1 стр + х 2 (1 − стр) = −3стр + 7(1 − стр) = 4 ,

където получаваме вероятностите: стр= 0,3 и 1 − стр = 0,7 .

Закон за разпределение на случайна променлива:

х −3 7
стр 0,3 0,7

Ние изчисляваме дисперсията на тази случайна променлива, като използваме формулата от свойство 3 на дисперсията:

д(х) = 2,7 + 34,3 − 16 = 21 .

Намерете сами математическото очакване на случайна променлива и след това вижте решението

Пример 8.Дискретна случайна променлива хприема само две стойности. Приема по-голямата от стойностите 3 с вероятност 0,4. Освен това е известна дисперсията на случайната променлива д(х) = 6 . Намерете математическото очакване на случайна променлива.

Пример 9.В урната има 6 бели и 4 черни топки. От урната се изтеглят 3 топки. Броят на белите топки сред изтеглените топки е дискретна случайна променлива х. Намерете математическото очакване и дисперсията на тази случайна променлива.

Решение. Случайна стойност хможе да приема стойности 0, 1, 2, 3. Съответните вероятности могат да бъдат изчислени от правило за умножение на вероятностите. Закон за разпределение на случайна променлива:

х 0 1 2 3
стр 1/30 3/10 1/2 1/6

Оттук и математическото очакване на тази случайна променлива:

М(х) = 3/10 + 1 + 1/2 = 1,8 .

Дисперсията на дадена случайна променлива е:

д(х) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

Очакване и дисперсия на непрекъсната случайна променлива

За непрекъсната случайна променлива механичната интерпретация на математическото очакване ще запази същото значение: центърът на масата за единица маса, разпределена непрекъснато по оста x с плътност f(х). За разлика от дискретна случайна променлива, чийто аргумент на функцията хазпроменя се рязко; за непрекъсната случайна променлива аргументът се променя непрекъснато. Но математическото очакване на непрекъсната случайна променлива също е свързано с нейната средна стойност.

За да намерите математическото очакване и дисперсията на непрекъсната случайна променлива, трябва да намерите определени интеграли . Ако е дадена функцията на плътност на непрекъсната случайна променлива, тогава тя директно влиза в интегранта. Ако е дадена функция на разпределение на вероятностите, тогава като я диференцирате, трябва да намерите функцията на плътност.

Средната аритметична стойност на всички възможни стойности на непрекъсната случайна променлива се нарича негова математическо очакване, означено с или .

дисперсияслучайна величина- мярка за разпространение на дадено случайна величина, тоест нея отклоненияот математическото очакване. В статистиката нотацията (сигма на квадрат) често се използва за обозначаване на дисперсия. Нарича се корен квадратен от дисперсията, равна на стандартно отклонениеили стандартен спред. Стандартното отклонение се измерва в същите единици като самата случайна променлива, а дисперсията се измерва в квадратите на тази единица.

Въпреки че е много удобно да се използва само една стойност (като средна стойност или режим и медиана) за оценка на цялата извадка, този подход може лесно да доведе до неправилни заключения. Причината за тази ситуация не се крие в самата стойност, а във факта, че една стойност по никакъв начин не отразява разпространението на стойностите на данните.

Например в извадката:

средната стойност е 5.

В самата извадка обаче няма нито един елемент със стойност 5. Може да се наложи да знаете степента на близост на всеки елемент в извадката до средната му стойност. Или с други думи, ще трябва да знаете дисперсията на стойностите. Познавайки степента на промяна в данните, можете да интерпретирате по-добре средна стойност, МедианаИ мода. Степента, до която се променят стойностите на извадката, се определя чрез изчисляване на тяхната дисперсия и стандартно отклонение.



Дисперсията и квадратният корен от дисперсията, наречени стандартно отклонение, характеризират средното отклонение от средната стойност на извадката. Сред тези две величини най-важното е стандартно отклонение. Тази стойност може да се разглежда като средното разстояние, на което елементите са от средния елемент на извадката.

Дисперсията е трудна за смислено тълкуване. Въпреки това квадратният корен от тази стойност е стандартното отклонение и може лесно да се тълкува.

Стандартното отклонение се изчислява, като първо се определи дисперсията и след това се вземе квадратен корен от дисперсията.

Например, за масива от данни, показан на фигурата, ще бъдат получени следните стойности:

Снимка 1

Тук средната стойност на квадратните разлики е 717,43. За да получите стандартното отклонение, всичко, което остава, е да вземете корен квадратен от това число.

Резултатът ще бъде приблизително 26,78.

Не забравяйте, че стандартното отклонение се интерпретира като средното разстояние, на което елементите са от средната стойност на извадката.

Стандартното отклонение измерва колко добре средната стойност описва цялата извадка.

Да приемем, че сте ръководител на отдел за производство на компютри. Тримесечният отчет посочва, че производството за последното тримесечие е 2500 компютъра. Това добре ли е или лошо? Вие поискахте (или вече има тази колона в отчета) да се покаже стандартното отклонение за тези данни в отчета. Цифрата на стандартното отклонение, например, е 2000. За вас, като ръководител на отдела, става ясно, че производствената линия изисква по-добро управление (твърде големи отклонения в броя на компютрите).

Спомнете си, че когато стандартното отклонение е голямо, данните са широко разпръснати около средната стойност, а когато стандартното отклонение е малко, те се групират близо до средната стойност.

Четирите статистически функции VAR(), VAR(), STDEV() и STDEV() са предназначени за изчисляване на дисперсията и стандартното отклонение на числа в диапазон от клетки. Преди да можете да изчислите дисперсията и стандартното отклонение на набор от данни, трябва да определите дали данните представляват популация или извадка от популация. В случай на извадка от генерална съвкупност, трябва да използвате функциите VAR() и STDEV(), а в случай на генерална съвкупност, функциите VAR() и STDEV():

Население функция

DISPR()

STANDOTLONP()
проба

DISP()

STDEV()

Дисперсията (както и стандартното отклонение), както отбелязахме, показва степента, в която стойностите, включени в набора от данни, са разпръснати около средното аритметично.

Малка стойност на дисперсия или стандартно отклонение показва, че всички данни са концентрирани около средната аритметична стойност, а голяма стойност на тези стойности показва, че данните са разпръснати в широк диапазон от стойности.

Дисперсията е доста трудна за смислено тълкуване (какво означава малка стойност, голяма стойност?). производителност Задачи 3ще ви позволи визуално, върху графика, да покажете значението на дисперсията за набор от данни.

Задачи

· Упражнение 1.

· 2.1. Дайте понятията: дисперсия и стандартно отклонение; тяхното символно обозначение за статистическа обработка на данни.

· 2.2. Попълнете работния лист в съответствие с фигура 1 и направете необходимите изчисления.

· 2.3. Дайте основните формули, използвани при изчисленията

· 2.4. Обяснете всички обозначения ( , , )

· 2.5. Обяснете практическото значение на понятията дисперсия и стандартно отклонение.

Задача 2.

1.1. Дайте понятията: генерална съвкупност и извадка; математически очаквания и тяхното средноаритметично символно обозначение за статистическа обработка на данни.

1.2. В съответствие с Фигура 2, подгответе работен лист и направете изчисления.

1.3. Посочете основните формули, използвани при изчисленията (за генералната съвкупност и извадката).

Фигура 2

1.4. Обяснете защо е възможно да се получат такива средни аритметични стойности в проби като 46.43 и 48.78 (вижте Приложението на файла). Направете изводи.

Задача 3.

Има две проби с различни набори от данни, но средната стойност за тях ще бъде една и съща:

Фигура 3

3.1. Попълнете работния лист в съответствие с фигура 3 и направете необходимите изчисления.

3.2. Дайте основните формули за изчисление.

3.3. Изградете графики в съответствие с фигури 4, 5.

3.4. Обяснете получените зависимости.

3.5. Извършете подобни изчисления за данните от две проби.

Оригинална проба 11119999

Изберете стойностите на втората проба, така че средноаритметичната стойност за втората проба да е същата, например:

Изберете сами стойностите за втората проба. Подредете изчисления и графики подобно на фигури 3, 4, 5. Покажете основните формули, използвани при изчисленията.

Направете подходящи заключения.

Подгответе всички задачи под формата на доклад с всички необходими картинки, графики, формули и кратки обяснения.

Забележка: изграждането на графиките трябва да бъде обяснено с чертежи и кратки обяснения.

Дисперсия в статистикатасе намира като индивидуалните стойности на характеристиката на квадрат от . В зависимост от първоначалните данни се определя с помощта на формулите за проста и претеглена дисперсия:

1. (за негрупирани данни) се изчислява по формулата:

2. Претеглена дисперсия (за вариационни серии):

където n е честота (повторяемост на фактор X)

Пример за намиране на дисперсия

Тази страница описва стандартен пример за намиране на отклонение, можете също да разгледате други проблеми за намирането му

Пример 1. Следните данни са достъпни за група от 20 задочни студенти. Необходимо е да се изгради интервална серия от разпределението на характеристиката, да се изчисли средната стойност на характеристиката и да се изследва нейната дисперсия

Нека изградим интервално групиране. Нека определим обхвата на интервала с помощта на формулата:

където X max е максималната стойност на груповата характеристика;
X min – минимална стойност на груповия признак;
n – брой интервали:

Приемаме n=5. Стъпката е: h = (192 - 159)/ 5 = 6,6

Нека създадем интервално групиране

За по-нататъшни изчисления ще изградим спомагателна таблица:

X'i е средата на интервала. (например средата на интервала 159 – 165.6 = 162.3)

Определяме средния ръст на учениците, като използваме формулата за средноаритметично претеглено:

Нека определим дисперсията с помощта на формулата:

Формулата на дисперсията може да се трансформира, както следва:

От тази формула следва, че дисперсията е равна на разликата между средната стойност на квадратите на опциите и квадрата и средната стойност.

Дисперсия във вариационни сериис равни интервали, използвайки метода на моментите, може да се изчисли по следния начин, като се използва второто свойство на дисперсията (разделяне на всички опции на стойността на интервала). Определяне на дисперсия, изчислено по метода на моментите, като се използва следната формула е по-малко трудоемко:

където i е стойността на интервала;
A е конвенционална нула, за която е удобно да се използва средата на интервала с най-висока честота;
m1 е квадратът на момента от първи ред;
m2 - момент от втори ред

(ако в статистическа популация дадена характеристика се промени по такъв начин, че има само две взаимно изключващи се опции, тогава такава променливост се нарича алтернативна) може да се изчисли по формулата:

Замествайки q = 1- p в тази дисперсионна формула, получаваме:

Видове дисперсии

Обща дисперсияизмерва вариацията на дадена характеристика в цялата съвкупност като цяло под влиянието на всички фактори, които причиняват тази вариация. Тя е равна на средния квадрат на отклоненията на отделните стойности на характеристика x от общата средна стойност на x и може да се определи като проста дисперсия или претеглена дисперсия.

характеризира случайна вариация, т.е. част от вариацията, която се дължи на влиянието на неотчетени фактори и не зависи от фактора-атрибут, който формира основата на групата. Такава дисперсия е равна на средния квадрат на отклоненията на индивидуалните стойности на атрибута в групата X от средното аритметично на групата и може да се изчисли като проста дисперсия или като претеглена дисперсия.

По този начин, мерки за дисперсия в рамките на групатавариация на признак в група и се определя по формулата:

където xi е средното за групата;
ni е броят на единиците в групата.

Например вътрешногруповите отклонения, които трябва да бъдат определени в задачата за изследване на влиянието на квалификацията на работниците върху нивото на производителността на труда в цеха, показват вариации в производството във всяка група, причинени от всички възможни фактори (техническо състояние на оборудването, наличие на инструменти и материали, възраст на работниците, интензивност на труда и др.), с изключение на разликите в квалификационната категория (в рамките на групата всички работници имат еднаква квалификация).

Средната стойност на дисперсиите в рамките на групата отразява случайно, т.е. онази част от вариацията, която е настъпила под влиянието на всички други фактори, с изключение на фактора за групиране. Изчислява се по формулата:

Характеризира систематичното изменение на получената характеристика, което се дължи на влиянието на фактора-знак, който формира основата на групата. Тя е равна на средния квадрат на отклоненията на груповите средни стойности от общата средна стойност. Междугруповата дисперсия се изчислява по формулата:

Правилото за добавяне на дисперсия в статистиката

Според правило за добавяне на отклоненияобщата дисперсия е равна на сумата от средната стойност на вътрешногруповите и междугруповите дисперсии:

Значението на това правилое, че общата дисперсия, която възниква под влиянието на всички фактори, е равна на сумата от дисперсиите, които възникват под влиянието на всички други фактори, и дисперсията, която възниква поради групиращия фактор.

Използвайки формулата за добавяне на вариации, можете да определите третата неизвестна вариация от две известни вариации и също така да прецените силата на влиянието на груповата характеристика.

Дисперсионни свойства

1. Ако всички стойности на дадена характеристика се намалят (увеличат) със същата постоянна сума, тогава дисперсията няма да се промени.
2. Ако всички стойности на дадена характеристика се намалят (увеличат) с еднакъв брой пъти n, тогава дисперсията съответно ще намалее (увеличи) с n^2 пъти.

Дисперсията на случайна променлива е мярка за разпространението на стойностите на тази променлива. Ниската вариация означава, че стойностите са групирани близо една до друга. Голямата дисперсия показва силно разпространение на стойностите. Концепцията за дисперсия на случайна променлива се използва в статистиката. Например, ако сравните дисперсията на две стойности (например между пациенти мъже и жени), можете да тествате значимостта на променлива. Дисперсията се използва и при изграждането на статистически модели, тъй като ниската дисперсия може да е знак, че пренастройвате стойностите.

стъпки

Изчисляване на дисперсията на извадката

  1. Запишете пробните стойности.В повечето случаи статистиците имат достъп само до извадки от конкретни популации. Например, като правило, статистиците не анализират разходите за поддръжка на съвкупността от всички автомобили в Русия - те анализират произволна извадка от няколко хиляди автомобила. Такава проба ще помогне да се определи средната цена на автомобила, но най-вероятно получената стойност ще бъде далеч от реалната.

    • Например, нека анализираме броя на кифлите, продадени в кафене за 6 дни, взети в произволен ред. Извадката изглежда така: 17, 15, 23, 7, 9, 13. Това е извадка, а не съвкупност, защото нямаме данни за продадени кифли за всеки ден, в който кафенето е отворено.
    • Ако ви е дадена популация, а не извадка от стойности, продължете към следващия раздел.
  2. Запишете формула за изчисляване на дисперсията на извадката.Дисперсията е мярка за разпространението на стойностите на определено количество. Колкото по-близка е стойността на дисперсията до нула, толкова по-близо са групирани стойностите. Когато работите с извадка от стойности, използвайте следната формула за изчисляване на дисперсията:

    • s 2 (\displaystyle s^(2)) = ∑[(x i (\displaystyle x_(i))- х) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2))– това е дисперсия. Дисперсията се измерва в квадратни единици.
    • x i (\displaystyle x_(i))– всяка стойност в извадката.
    • x i (\displaystyle x_(i))трябва да извадите x̅, да го повдигнете на квадрат и след това да добавите резултатите.
    • x̅ – извадкова средна (извадкова средна).
    • n – брой стойности в извадката.
  3. Изчислете средната стойност на извадката.Означава се като x̅. Средната стойност на извадката се изчислява като проста средна аритметична стойност: добавете всички стойности в извадката и след това разделете резултата на броя на стойностите в извадката.

    • В нашия пример добавете стойностите в извадката: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Сега разделете резултата на броя на стойностите в извадката (в нашия пример има 6): 84 ÷ 6 = 14.
      Примерна средна x̅ = 14.
    • Средната стойност на извадката е централната стойност, около която се разпределят стойностите в извадката. Ако стойностите в клъстера на извадката около извадката са средни, тогава дисперсията е малка; иначе разликата е голяма.
  4. Извадете средната стойност на извадката от всяка стойност в извадката.Сега изчислете разликата x i (\displaystyle x_(i))- x̅, където x i (\displaystyle x_(i))– всяка стойност в извадката. Всеки получен резултат показва степента на отклонение на определена стойност от средната стойност на извадката, тоест колко далеч е тази стойност от средната стойност на извадката.

    • В нашия пример:
      x 1 (\displaystyle x_(1))- х = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- x = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x̅ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x̅ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- x̅ = 13 - 14 = -1
    • Правилността на получените резултати е лесна за проверка, тъй като тяхната сума трябва да е равна на нула. Това е свързано с дефиницията на средната стойност, тъй като отрицателните стойности (разстояния от средните до по-малките стойности) са напълно компенсирани от положителните стойности (разстояния от средните до по-големите стойности).
  5. Както беше отбелязано по-горе, сумата от разликите x i (\displaystyle x_(i))- x̅ трябва да е равно на нула. Това означава, че средната дисперсия винаги е нула, което не дава представа за разпространението на стойностите на определено количество. За да разрешите тази задача, повдигнете на квадрат всяка разлика x i (\displaystyle x_(i))- х. Това ще доведе до получаване само на положителни числа, сборът на които никога няма да бъде 0.

    • В нашия пример:
      (x 1 (\displaystyle x_(1))- х) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2))- х) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Намерихте квадрата на разликата - x̅) 2 (\displaystyle ^(2))за всяка стойност в извадката.
  6. Изчислете сумата от квадратите на разликите.Тоест, намерете тази част от формулата, която е написана така: ∑[( x i (\displaystyle x_(i))- х) 2 (\displaystyle ^(2))]. Тук знакът Σ означава сумата от квадратните разлики за всяка стойност x i (\displaystyle x_(i))в пробата. Вече намерихте разликите на квадрат (x i (\displaystyle (x_(i))- х) 2 (\displaystyle ^(2))за всяка стойност x i (\displaystyle x_(i))в пробата; сега просто добавете тези квадратчета.

    • В нашия пример: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Разделете резултата на n - 1, където n е броят на стойностите в извадката.Преди време, за да изчислят дисперсията на извадката, статистиците просто разделиха резултата на n; в този случай ще получите средната стойност на квадратната дисперсия, която е идеална за описание на дисперсията на дадена проба. Но не забравяйте, че всяка извадка е само малка част от съвкупността от стойности. Ако вземете друга проба и извършите същите изчисления, ще получите различен резултат. Както се оказва, разделянето на n - 1 (а не само на n) дава по-точна оценка на дисперсията на съвкупността, което е това, което ви интересува. Делението на n – 1 е станало обичайно, така че е включено във формулата за изчисляване на дисперсията на извадката.

    • В нашия пример извадката включва 6 стойности, тоест n = 6.
      Дисперсия на извадката = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Разликата между дисперсия и стандартно отклонение.Обърнете внимание, че формулата съдържа експонента, така че дисперсията се измерва в квадратни единици на анализираната стойност. Понякога такава величина е доста трудна за работа; в такива случаи използвайте стандартното отклонение, което е равно на корен квадратен от дисперсията. Ето защо дисперсията на извадката се означава като s 2 (\displaystyle s^(2)), а стандартното отклонение на извадката е as s (\displaystyle s).

    • В нашия пример стандартното отклонение на извадката е: s = √33.2 = 5.76.

    Изчисляване на дисперсията на населението

    1. Анализирайте някакъв набор от стойности.Комплектът включва всички стойности на разглежданото количество. Например, ако изучавате възрастта на жителите на Ленинградска област, тогава съвкупността включва възрастта на всички жители на този регион. Когато работите с популация, се препоръчва да създадете таблица и да въведете стойностите на популацията в нея. Разгледайте следния пример:

      • В определена стая има 6 аквариума. Всеки аквариум съдържа следния брой риби:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Запишете формула за изчисляване на дисперсията на популацията.Тъй като популацията включва всички стойности на определено количество, формулата по-долу ви позволява да получите точната стойност на дисперсията на популацията. За да разграничат вариацията на популацията от вариацията на извадката (която е само приблизителна), статистиците използват различни променливи:

      • σ 2 (\displaystyle ^(2)) = (∑(x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)))/н
      • σ 2 (\displaystyle ^(2))– дисперсия на популацията (разчетена като „сигма на квадрат“). Дисперсията се измерва в квадратни единици.
      • x i (\displaystyle x_(i))– всяка стойност в нейната цялост.
      • Σ – знак за сума. Тоест от всяка стойност x i (\displaystyle x_(i))трябва да извадите μ, да го повдигнете на квадрат и след това да добавите резултатите.
      • μ – средна популация.
      • n – брой стойности в популацията.
    3. Изчислете средната стойност на населението.Когато се работи с популация, нейната средна стойност се означава като μ (mu). Средната популация се изчислява като проста средна аритметична: добавете всички стойности в популацията и след това разделете резултата на броя на стойностите в популацията.

      • Имайте предвид, че средните стойности не винаги се изчисляват като средно аритметично.
      • В нашия пример населението означава: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Извадете средната популация от всяка стойност в популацията.Колкото по-близо е стойността на разликата до нула, толкова по-близо е специфичната стойност до средната за съвкупността. Намерете разликата между всяка стойност в популацията и нейната средна стойност и ще получите първа представа за разпределението на стойностите.

      • В нашия пример:
        x 1 (\displaystyle x_(1))- μ = 5 - 10,5 = -5,5
        x 2 (\displaystyle x_(2))- μ = 5 - 10,5 = -5,5
        x 3 (\displaystyle x_(3))- μ = 8 - 10,5 = -2,5
        x 4 (\displaystyle x_(4))- μ = 12 - 10,5 = 1,5
        x 5 (\displaystyle x_(5))- μ = 15 - 10,5 = 4,5
        x 6 (\displaystyle x_(6))- μ = 18 - 10,5 = 7,5
    5. Квадратирайте всеки получен резултат.Стойностите на разликата ще бъдат както положителни, така и отрицателни; Ако тези стойности са нанесени върху числова права, те ще лежат отдясно и отляво на средната стойност на съвкупността. Това не е добре за изчисляване на дисперсията, защото положителните и отрицателните числа взаимно се компенсират. Така че квадратирайте всяка разлика, за да получите изключително положителни числа.

      • В нашия пример:
        (x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))за всяка стойност на популацията (от i = 1 до i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), Където x n (\displaystyle x_(n))– последната стойност в съвкупността.
      • За да изчислите средната стойност на получените резултати, трябва да намерите тяхната сума и да я разделите на n:(( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2)))/н
      • Сега нека запишем горното обяснение с помощта на променливи: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n и получете формула за изчисляване на дисперсията на съвкупността.

Видове дисперсии:

Обща дисперсияхарактеризира изменението на характеристика на цялата съвкупност под влиянието на всички онези фактори, които са причинили това изменение. Тази стойност се определя по формулата

където е общата средна аритметична стойност на цялата изследвана популация.

Средна дисперсия в рамките на групатапоказва случайна вариация, която може да възникне под въздействието на всякакви неотчетени фактори и която не зависи от фактора-атрибут, който формира основата на групирането. Тази дисперсия се изчислява, както следва: първо се изчисляват дисперсиите за отделните групи (), след което се изчислява средната дисперсия в рамките на групата:

където n i е броят на единиците в групата

Междугрупова дисперсия(вариация на груповите средни стойности) характеризира систематичната вариация, т.е. разлики в стойността на изучавания признак, които възникват под влияние на фактора-признак, който е в основата на групирането.

където е средната стойност за отделна група.

И трите вида дисперсия са свързани помежду си: общата дисперсия е равна на сбора от средната дисперсия в рамките на групата и между груповата дисперсия:

Имоти:

25 Относителни мерки на вариация

Коефициент на трептене

Относително линейно отклонение

Коефициентът на вариация

Коеф. Osc. Оотразява относителната флуктуация на екстремните стойности на характеристика около средната. отн. лин. изключено. характеризира пропорцията на средната стойност на знака на абсолютните отклонения от средната стойност. Коеф. Вариацията е най-честата мярка за променливост, използвана за оценка на типичността на средните стойности.

В статистиката популациите с коефициент на вариация над 30–35% се считат за хетерогенни.

    Редовност на сериите на разпределение. Моменти на разпространение. Индикатори за форма на разпределение

Във вариационните серии има връзка между честотите и стойностите на променящата се характеристика: с увеличаване на характеристиката стойността на честотата първо се увеличава до определена граница и след това намалява. Такива промени се наричат модели на разпространение.

Формата на разпределението се изследва с помощта на индикатори за асиметрия и ексцес. При изчисляването на тези показатели се използват моменти на разпределение.

Моментът на k-ти ред е средната стойност на k-тите степени на отклонение на вариантни стойности на характеристика от някаква постоянна стойност. Редът на момента се определя от стойността на k. Когато се анализират вариационни серии, човек се ограничава до изчисляване на моментите на първите четири поръчки. Когато се изчисляват моменти, честотите или честотите могат да се използват като тегла. В зависимост от избора на постоянна стойност се разграничават начални, условни и централни моменти.

Показатели на формата за разпространение:

Асиметрия(As) показател, характеризиращ степента на асиметрия на разпределението .

Следователно, с (лява) отрицателна асиметрия . С (дясна) положителна асиметрия .

Централните моменти могат да се използват за изчисляване на асиметрията. Тогава:

,

където μ 3 – централен момент от трети ред.

- ексцес (Е Да се ) характеризира стръмността на графиката на функцията в сравнение с нормалното разпределение при същата сила на вариация:

,

където μ 4 е централният момент от 4-ти ред.

    Закон за нормалното разпределение

За нормално разпределение (разпределение на Гаус) функцията на разпределение има следната форма:

Очакване - стандартно отклонение

Нормалното разпределение е симетрично и се характеризира със следната зависимост: Xav=Me=Mo

Ексцесът на нормално разпределение е 3, а коефициентът на изкривяване е 0.

Нормалната крива на разпределение е многоъгълник (симетрична права линия с форма на камбана)

    Видове дисперсии. Правилото за добавяне на отклонения. Същността на емпиричния коефициент на детерминация.

Ако първоначалната съвкупност е разделена на групи според някаква значима характеристика, тогава се изчисляват следните видове дисперсии:

    Обща дисперсия на първоначалната популация:

където е общата средна стойност на първоначалната популация; f е честотата на първоначалната популация. Общата дисперсия характеризира отклонението на индивидуалните стойности на дадена характеристика от общата средна стойност на първоначалната популация.

    Разлики в рамките на групата:

където j е номерът на групата; е средната стойност във всяка j-та група; е честотата на j-тата група. Вътрешногруповите дисперсии характеризират отклонението на индивидуалната стойност на признак във всяка група от средната стойност на групата. От всички дисперсии в рамките на групата средната стойност се изчислява по формулата:, където е броят на единиците във всяка j-та група.

    Междугрупова вариация:

Междугруповата дисперсия характеризира отклонението на груповите средни стойности от общата средна стойност на първоначалната популация.

Правило за добавяне на дисперсиие, че общата дисперсия на първоначалната съвкупност трябва да бъде равна на сумата от междугруповите и средните от вътрешногруповите дисперсии:

Емпиричен коефициент на детерминацияпоказва съотношението на вариация в изследваната характеристика, дължаща се на вариация в груповата характеристика и се изчислява по формулата:

    Метод на броене от условна нула (метод на моментите) за изчисляване на средната стойност и дисперсията

Изчисляването на дисперсията по метода на моментите се основава на използването на формулата и 3 и 4 свойства на дисперсията.

(3. Ако всички стойности на атрибута (опции) се увеличат (намалят) с някакво постоянно число A, тогава дисперсията на новата популация няма да се промени.

4. Ако всички стойности на атрибута (опции) се увеличат (умножат) с K пъти, където K е постоянно число, тогава дисперсията на новата популация ще се увеличи (намали) с K 2 пъти.)

Получаваме формула за изчисляване на дисперсията във вариационни серии с равни интервали, използвайки метода на моментите:

A - условна нула, равна на опцията с максимална честота (средата на интервала с максимална честота)

Изчисляването на средната стойност по метода на моментите също се основава на използването на свойствата на средната стойност.

    Концепцията за селективно наблюдение. Етапи на изследване на икономическите явления чрез извадков метод

Извадковото наблюдение е наблюдение, при което не всички единици от първоначалната съвкупност са изследвани и изследвани, а само част от единиците, като резултатът от изследването на част от съвкупността се отнася за цялата първоначална съвкупност. Популацията, от която се избират единици за по-нататъшно изследване и изследване, се нарича общи се наричат ​​всички показатели, характеризиращи тази съвкупност общ.

Наричат ​​се възможни граници на отклонения на извадковата средна стойност от общата средна стойност грешка при вземане на проби.

Множеството от избрани единици се извиква селективени се наричат ​​всички показатели, характеризиращи тази съвкупност селективен.

Примерното изследване включва следните етапи:

Характеристика на обекта на изследване (масови икономически явления). Ако популацията е малка, тогава вземането на проби не се препоръчва; необходимо е цялостно изследване;

Изчисляване на размера на извадката. Важно е да се определи оптималният обем, който ще позволи грешката на извадката да бъде в рамките на приемливия диапазон при най-ниска цена;

Избор на единици за наблюдение, като се вземат предвид изискванията за случайност и пропорционалност.

Доказателство за представителност въз основа на оценка на грешката на извадката. За произволна извадка грешката се изчислява с помощта на формули. За целевата извадка представителността се оценява с помощта на качествени методи (сравнение, експеримент);

Анализ на извадковата популация. Ако генерираната извадка отговаря на изискванията за представителност, тогава тя се анализира с помощта на аналитични показатели (средни, относителни и др.)