У дома · мрежи · Стандартно отклонение. Изчисляване на индексите на вариация

Стандартно отклонение. Изчисляване на индексите на вариация

Трябва да се справим с изчисляването на такива стойности като дисперсия, стандартно отклонение и, разбира се, коефициент на вариация. Именно изчисляването на последното заслужава специално внимание. Много е важно всеки начинаещ, който току-що започва да работи с редактор на електронни таблици, да може бързо да изчисли относителната граница на разпространението на стойностите.

Какъв е коефициентът на вариация и защо е необходим?

И така, струва ми се, че би било полезно да направим кратка теоретична екскурзия и да разберем природата на коефициента на вариация. Този индикатор е необходим за отразяване на обхвата на данните спрямо средната стойност. С други думи, показва отношението на стандартното отклонение към средната стойност. Коефициентът на вариация обикновено се измерва в проценти и се използва за показване на хомогенността на времевата серия.

Коефициентът на вариация ще стане незаменим помощник, когато трябва да направите прогноза въз основа на данни от дадена извадка. Този индикатор ще подчертае основните серии от стойности, които ще бъдат най-полезни за последващо прогнозиране, а също така ще изчисти извадката от маловажни фактори. Така че, ако видите, че стойността на коефициента е 0%, тогава уверено декларирайте, че серията е хомогенна, което означава, че всички стойности в нея са равни една на друга. Ако коефициентът на вариация приеме стойност над 33%, това показва, че имате работа с хетерогенна серия, в която отделните стойности се различават значително от средната извадка.

Как да намерим стандартното отклонение?

Тъй като за изчисляване на индекса на вариация в Excel трябва да използваме стандартното отклонение, би било съвсем подходящо да разберем как можем да изчислим този параметър.

От училищния курс по алгебра знаем, че стандартното отклонение е квадратният корен, извлечен от дисперсията, тоест този показател определя степента на отклонение на определен показател от общата извадка от средната му стойност. С негова помощ можем да измерим абсолютната мярка на флуктуацията на изследваната характеристика и ясно да я интерпретираме.

Изчисляване на коефициента в Excel

За съжаление Excel няма стандартна формула, която да ви позволи автоматично да изчислите индекса на вариация. Но това не означава, че трябва да правите изчисленията наум. Липсата на шаблон в лентата с формули по никакъв начин не намалява възможностите на Excel, така че можете лесно да принудите програмата да извърши необходимото изчисление, като въведете ръчно съответната команда.

За да изчислите индекса на вариация в Excel, трябва да запомните курса си по математика в гимназията и да разделите стандартното отклонение на средната стойност на извадката. Тоест, всъщност формулата изглежда така - STANDARDEVAL(посочен диапазон от данни)/AVERAGE(посочен диапазон от данни). Трябва да въведете тази формула в клетката на Excel, в която искате да получите необходимото изчисление.

Не забравяйте, че тъй като коефициентът е изразен като процент, клетката с формулата ще трябва да бъде съответно форматирана. Можете да направите това по следния начин:

  1. Отворете раздела Начало.
  2. Намерете категорията „Формат на клетка“ в нея и изберете необходимата опция.

Като алтернатива можете да зададете процентния формат за клетката, като щракнете с десния бутон върху активираната клетка на таблицата. В контекстното меню, което се появява, подобно на горния алгоритъм, трябва да изберете категорията „Формат на клетка“ и да зададете необходимата стойност.

Изберете Процент и, ако е необходимо, въведете броя на десетичните знаци

Може би горният алгоритъм може да изглежда сложен за някои. Всъщност изчисляването на коефициента е толкова просто, колкото събирането на две естествени числа. След като изпълните тази задача в Excel, никога няма да се върнете към досадни, сложни решения в бележник.

Все още не можете да направите качествено сравнение на степента на разсейване на данните? Объркани сте от размера на извадката? След това се заемете с бизнеса точно сега и овладейте на практика целия теоретичен материал, който беше представен по-горе! Нека статистическият анализ и развитието на прогнозите вече не ви карат да се чувствате страхливи и негативни. Спестете енергия и време с

ИЗЧИСЛЯВАНЕ НА ВАРИАЦИОННИ ПОКАЗАТЕЛИ

ПРАКТИЧЕСКА РАБОТА 3

Цел на работата: придобиване на практически умения за изчисляване на различни индикатори (мерки) на вариация в зависимост от целите, поставени от изследването.

Работен ред:

1. Определете вида и формата (прости или претеглени) на вариационните индикатори.

3. Формулирайте заключения.

1. Определяне на вида и формата на вариационните показатели.

Вариационните показатели се делят на две групи: абсолютни и относителни. Абсолютните включват: диапазон на вариация, квартилно отклонение, средно линейно отклонение, дисперсия и стандартно отклонение. Относителни показатели са коефициенти на трептене, вариация, относително линейно отклонение, относителна квартилна вариация и др.

Диапазон на вариация (R)е най-простата мярка за вариация на признак и се определя по следната формула:

където е най-високата стойност на вариращата характеристика;

– най-малката стойност на вариращата характеристика.

Квартилно отклонение (Q)– използва се за характеризиране на вариацията на характеристика в съвкупността. Може да се използва вместо диапазон на вариация, за да се избегнат недостатъците, свързани с използването на екстремни стойности.

където и са съответно първият и третият квартил на разпределението.

Квартили– това са стойностите на признака в класираната серия на разпределението, избрани по такъв начин, че 25% от единиците на съвкупността да бъдат с по-ниска стойност; 25% от единиците ще се съдържат между и ; 25% от единиците ще бъдат между и , а останалите 25% надвишават .

Квартили 1 и 3 се определят по формулите:

,

Къде е долната граница на интервала, в който се намира първият квартил;

– сумата от натрупаните честоти на интервали, предхождащи интервала, в който се намира първият квартил;

– честота на интервала, в който се намира първият квартил.

където Me е медианата на серията;

,

Символите са същите като за количествата.

При симетрични или умерено асиметрични разпределения Q»2/3s. Тъй като квартилното отклонение не се влияе от отклоненията на всички стойности на атрибута, използването му трябва да бъде ограничено до случаите, когато определянето на стандартното отклонение е трудно или невъзможно.

Средно линейно отклонение ()представлява средната стойност на абсолютните отклонения на вариантите на признака от средната им стойност. Може да се изчисли с помощта на формулата за средно аритметично, както непретеглено, така и претеглено, в зависимост от липсата или наличието на честоти в серията на разпределение.



Непретеглено средно линейно отклонение,

- средно претеглено линейно отклонение.

отклонение ()– средният квадрат на отклоненията на отделните стойности на характеристика от тяхната средна стойност. Дисперсията се изчислява с помощта на прости непретеглени и претеглени формули.

- непретеглени,

- претеглени.

Стандартно отклонение (s)– най-често срещаният индикатор за вариация е корен квадратен от стойността на вариацията.

Диапазонът на вариация, квартилното отклонение, средните линейни и квадратни отклонения са именувани величини и имат измерението на характеристиката, която се осреднява. Дисперсията няма мерна единица.

За целите на сравняване на вариабилността на различни признаци в една и съща популация или при сравняване на вариабилността на един и същ признак в няколко популации се изчисляват относителни показатели за вариация. Основата за сравнение е средноаритметичното. Най-често относителните показатели се изразяват в проценти и характеризират не само сравнителна оценка на вариацията, но и характеризират хомогенността на популацията.

Коефициент на трептене(относителен диапазон на вариация) се изчислява по формулата:

,

Линеен коефициент на вариация(относително линейно отклонение):

Индекс на относителна квартилна вариация:

или

Коефициентът на вариация:

,

Най-често използваният показател за относителна променливост в статистиката е коефициентът на вариация. Използва се не само за сравнителна оценка на вариацията, но и като характеристика на хомогенността на популацията. Колкото по-голям е коефициентът на вариация, толкова по-голямо е разпространението на стойностите на атрибута около средната стойност, толкова по-голяма е хетерогенността на популацията. Съществува скала за определяне на степента на хомогенност на популацията в зависимост от стойностите на коефициента на вариация (17; P.61).

За да се получи приблизителна представа за формата на разпределението, се изграждат графики на разпределение (многоъгълник и хистограма).

В практиката на статистическите изследвания се среща голямо разнообразие от разпределения. Когато изучаваме хомогенни популации, обикновено имаме работа с разпределения с един връх. Multivertex показва хетерогенността на изследваната популация; появата на два или повече върха показва необходимостта от прегрупиране на данните, за да се идентифицират по-хомогенни групи. Определянето на общия характер на разпределението включва оценка на степента на неговата хомогенност, както и изчисляване на показатели за асиметрия и ексцес. Симетричене разпределение, при което честотите на всеки две опции, еднакво разположени от двете страни на центъра на разпределение, са равни една на друга. За симетричните разпределения средната аритметична стойност, модата и медианата са равни. В това отношение най-простият индикатор асиметриясе основава на съотношението на показателите на центъра на разпределение: колкото по-голяма е разликата между средните, толкова по-голяма е асиметрията на серията.

За да се характеризира асиметрията в централната част на разпределението, т.е. по-голямата част от единиците, или за сравнителен анализ на степента на асиметрия на няколко разпределения, се изчислява относителният индекс на асиметрия на К. Пиърсън:

Стойността на индикатора As може да бъде положителна и отрицателна. Положителната стойност на индикатора показва наличието на дясна асиметрия (десният клон спрямо максималната ордината е по-удължен от левия). При дясностранна асиметрия има връзка между показателите на разпределителния център: . Отрицателният знак на индекса на асиметрия показва наличието на лявостранна асиметрия (фиг. 1). В този случай има връзка между показателите на разпределителния център: .



Ориз. 1. Разпределение:

1 – с лявостранна асиметрия; 2 – с дясностранна асиметрия.

Друг показател, предложен от шведския математик Линдберг, се изчислява по формулата:

където P е процентът на тези характерни стойности, които надвишават средната аритметична стойност.

Най-точният и широко разпространен индикатор се основава на определянето на централен момент от трети ред (при симетрично разпределение стойността му е нула):

където е централният момент от трети ред:

σ – стандартно отклонение.

Използването на този показател позволява не само да се определи степента на асиметрия, но и да се отговори на въпроса за наличието или отсъствието на асиметрия в разпределението на дадена характеристика в общата съвкупност. Оценката на степента на значимост на този показател се дава с помощта на средната квадратична грешка, която зависи от обема на наблюденията ни се изчислява по формулата:

.

Ако съотношението е , асиметрията е значителна и разпределението на признака в популацията не е симетрично. Ако съотношението , асиметрия е незначително, присъствието му може да се обясни с влиянието на различни случайни обстоятелства.

За симетрични разпределения индикаторът се изчислява излишък(острота). Линдберг предложи следния индикатор за оценка на ексцеса:

,

където P е съотношението (%) на броя на опциите, лежащи в интервала, равен на половината от стандартното отклонение в една или друга посока от средното аритметично.

Най-точният индикатор е използването на централен момент от четвърти ред:

къде е централният момент на четвъртия момент;

- за негрупирани данни;

- за групирани данни.

Фигура 2 показва две разпределения: едното е с връх (стойността на ексцеса е положителна), второто е с плосък връх (стойността на ексцеса е отрицателна). Ексцесът е степента на движение на върха на емпиричното разпределение нагоре или надолу от върха на кривата на нормалното разпределение. При нормално разпределение отношението е .



Ориз. 2. Разпределение:

1.4 – нормално; 2 – заострен; 3 – плосък връх

Средната квадратична грешка на ексцеса се изчислява по формулата:

,

където n е броят на наблюденията.

Ако , тогава ексцесът е значителен, ако , тогава не е значителен.

Оценяването на значимостта на показателите за асиметрия и ексцес ни позволява да заключим дали това емпирично изследване може да се класифицира като тип крива на нормално разпределение.

2. Нека разгледаме методологията за изчисляване на индексите на вариация.

Вариацията се измерва с помощта на относителни стойности, наречени коефициенти на вариация, определени като съотношението на средното отклонение към средната стойност. Коефициентът на вариация се използва не само за сравнителна оценка на вариацията на единиците на съвкупността, но и като характеристика на хомогенността на популацията. Стойностите на коефициента на вариация варират от 0 до 100% и колкото по-близо е до нула, толкова по-типична е намерената средна стойност за изследваната статистическа популация и следователно толкова по-добре са избрани статистическите данни. Популацията се счита за количествено хомогенна, ако коефициентът на вариация не надвишава 33% (за разпределения, близки до нормалните). Разграничават се следните относителни показатели на вариация:

Коефициентът на вариация:

където е стандартното отклонение, е средното аритметично.

Линеен коефициент на вариация:

където е средното линейно отклонение.

Коефициент на трептене:

къде е диапазонът на вариация.

Нека изчислим коефициентите на вариация за група организации за товарооборот на автомобилния транспорт (Таблица 5.1), използвайки формули 5.9, 5.10, 5.11

Коефициентът на вариация ще бъде равен на: , което надхвърля 33%, следователно населението е разнородно.

Нека изчислим линейния коефициент на вариация: . Следователно делът на средната стойност на абсолютните отклонения на организациите от средната стойност е 30,7%

Нека намерим коефициента на трептене: . От това следва, че разликата между максималните и минималните стойности на организациите надвишава средната стойност почти 1,078 пъти.

Да определим коефициентите на вариация за групирането на жилищните райони (средно на жител) (Таблица 5.3).

Нека изчислим коефициента на вариация по формула (5.9):

. Това означава, че коефициентът на вариация не надвишава 33%, следователно популацията е хомогенна.

Нека изчислим линейния коефициент на вариация, използвайки формула (5.10):

. Това означава, че делът на средната стойност на абсолютните отклонения на площите на жилищните помещения от средната стойност е 5,56%.

Нека намерим коефициента на трептене, използвайки формула (5.11):

. Разликата между максималните и минималните стойности на жилищните площи не надвишава средната стойност.

ИЗЧИСЛЯВАНЕ И КОНСТРУКЦИЯ НА СТРУКТУРНИ ХАРАКТЕРИСТИКИ НА ВАРИАЦИОННИ СЕРИИ

Още малко по темата

Политическа икономия на Д. Рикардо като идеолог на индустриалната революция
През последната третина на 18в. Индустриалната революция (индустриална революция) започва в Англия. В продължение на няколко десетилетия в леката промишленост едно изобретение следва друго. Целият производствен процес в тази индустрия беше прехвърлен на машинна основа. Постепенно революцията се разпространи и в други сектори на леката, а след това и на тежката промишленост. Широко разпространен ре...

В статистиката промяната в стойностите на определен показател в агрегата се разбира като разлика в нивата му в определени единици от анализирания състав в същия период или момент на изследването. В случай, че се извършва анализ на разликите в стойностите на даден индикатор за един и същ обект, за една и съща единица от съвкупността в различни периоди или моменти от време, тогава това вече няма да се нарича вариация, а колебания или промени през определен период.

Публикувано на www.site

За да изследваме такива колебания, ние използваме нашите собствени методи за анализ, които се различават от методите за вариационен анализ. Обективен фактор за появата на явлението вариация е разликата в условията на дейност на определени обекти, които се изследват в популацията. Например работата на търговско предприятие се влияе от нивото на конкуренция, данъците, използването на съвременни технологии в дейността му, състоянието на оборудването и др. Колебанията са характерни за почти всички природни явления и аспекти на социалния живот. Съществуват обаче и непроменливи показатели, които се формират, когато определени явления се записват в правни актове. Например, броят на генералните директори на едно предприятие не може да варира, според закона трябва да има един. Такива непроменливи обекти по правило не са предмет или обект на статистическо изследване. В нашия живот флуктуацията на знаците е важен фактор, който го влияе. Например, промяната на диапазона от стандартни размери на частите ви позволява да създадете оптимален асортимент, но в същото време високото ниво на вариация в рамките на един стандартен размер показва високо ниво на дефекти и необходимостта от прилагане на подходящи мерки. Значителни нива на вариации в оборота или цените може да показват монополизация на пазара или лошо управление на запасите и да изискват подходящи действия и т.н. Горното ни позволява да твърдим, че в обществения живот, който от гледна точка на статистиката е масова съвкупност, съществува обективна променливост на различни характеристики и елементи, което диктува уместността на изучаването на това явление с помощта на специални показатели за формулиране на оптимални методи за управлявайки го. Коефициентът на вариация е един такъв индикатор. Освен това той принадлежи към групата на относителните показатели за вариация. Разглежданият коефициент е относителен показател, характеризиращ съотношението на стандартното отклонение към средната стойност на изследваната характеристика и обикновено се изразява като процент. Този критерий отразява връзката между нивото на влияние на факторите, които водят до променливост, и общите условия на всички елементи на съвкупността, които пораждат типичната стойност на признака - неговата средна стойност. Коефициентът на вариация се използва за изследване на степента на променливост на различни характеристики на една и съща популация и променливост в различни популации, които имат различни средни стойности.

Много хора се сблъскват с променливостта на изследваната характеристика в отделни единици от съвкупността, нейното колебание спрямо определена стойност, т.е. нейната вариация. Това е нещо, което трябва да се вземе предвид, за да се получи най-достоверната информация за напредъка на дадено научно изследване.

Повечето изследователи, когато определят интервала на промяна в стойността на даден параметър, най-често прибягват до абсолютни, Сред последните най-широко се използва коефициентът на вариация, който, ако изследваната стойност се характеризира с нормално разпределение , е критерий за хомогенност на популацията. Този индикатор ви позволява да определите каква степен на разсейване ще имат стойностите на изследвания параметър, независимо от мащаба и единицата за измерване.

Коефициентът на вариация може да се изчисли чрез разделяне на средноаритметичната стойност на променливата, изразена като процент. Резултатът от това изчисление може да бъде в диапазона от нула до безкрайност, увеличавайки се с увеличаване на вариацията на признака. Ако получената стойност е по-малка от 33,3%, вариацията на признака е слаба. Ако е повече - силно. В последния случай изследваният набор от данни е разнороден, счита се за нетипичен и следователно не може да бъде обобщаващ показател. Следователно за тази популация си струва да се използват други показатели.

Заслужава да се отбележи, че коефициентът на вариация не само характеризира хомогенността на определена популация, но също така се използва като сравнителна оценка за нея. Например, използва се, ако са необходими колебания на определена характеристика в популации, за които изчислената средна стойност е различна. В този случай разпръснатостта на получените данни не позволява обективна оценка на придобития смисъл. Коефициентът на вариация характеризира относителната променливост на променливата и следователно може да бъде относителна мярка за колебанията в стойността на параметъра, който се изследва.

Тук обаче има някои ограничения. По-специално, възможно е да се оцени степента на колебание в стойностите на параметрите само за конкретна характеристика и ако популацията има определен състав. Освен това равенството на тези индикатори може да показва както силна, така и слаба вариация. Такъв е случаят, ако признаците са различни или изследванията се провеждат върху различни популации. Този резултат се формира под влияние на много обективни причини и това трябва да се има предвид при обработката на получените експериментални данни.

Коефициентът на вариация се използва широко в различни области на науката и технологиите. По-специално, той се използва активно при оценка на колебанията в параметрите в икономиката и социологията. В същото време използването на коефициента става невъзможно, ако е необходимо да се оцени променливостта на променливи, които могат да променят знака си на противоположния. В края на краищата, тогава в резултат на изчисленията ще бъдат получени неправилни стойности на този индикатор: или ще бъде много малък, или ще има отрицателен знак. В последния случай си струва да проверите правилността на извършените изчисления.

По този начин можем да кажем, че коефициентът на вариация е параметър, който ще ви позволи да оцените степента на дисперсия и относителната променливост на средната стойност. Използването на този индикатор ни позволява да идентифицираме най-значимите фактори, фокусирането върху които ще ни позволи да постигнем целите си и да решим необходимите проблеми.