heim · Haushaltsgeräte · Wozu dient der Variationskoeffizient? Bestimmung von Variationsindizes

Wozu dient der Variationskoeffizient? Bestimmung von Variationsindizes

Variation- Dies ist die Akzeptanz unterschiedlicher, voneinander abweichender Bedeutungen eines Zeichens durch Einheiten einer Bevölkerung oder Gruppen. Variation ist das Ergebnis des Einflusses einer Kombination vieler Faktoren auf eine Einheit. Synonyme für Beendigung sind die Konzepte der Veränderung (Variabilität, ‚Variabilität‘).

Variation- eine der wichtigsten Kategorien der Statistikwissenschaft. Phänomene, die einer Variation unterliegen, liegen im Bereich der statistischen Wissenschaft, während unveränderliche, statistische, konstante Phänomene in der Statistik nicht berücksichtigt werden.

Fast alle Phänomene, die natürlichen Ursprungs sind, unterliegen Variabilität (z. B. chemische Prozesse, Variabilität erblicher Merkmale bei jedem Menschen usw.). Phänomene sowie eine Reihe von Naturgesetzen können unveränderlich sein (z. B. der Mindestlohn).

Es ist notwendig, die Bedeutung des Studiums der Variation in der Statistikwissenschaft hervorzuheben:

1 . Die Identifizierung der Variabilität in den Dimensionen eines Phänomens ermöglicht es, den Grad der Abhängigkeit des untersuchten Phänomens von anderen Faktoren, die wiederum der Variabilität unterliegen, einzuschätzen, oder mit anderen Worten, den Grad der Stabilität des Phänomens einzuschätzen gegenüber äußeren Einflüssen.

2. Bei der Variation handelt es sich um eine Bewertung der Homogenität des untersuchten Phänomens, d. h. um ein Maß für die Typizität, das für dieses Phänomen von durchschnittlicher Größe berechnet wird.

Variationsreihe ist eine Folge verschiedener Optionen, die in aufsteigender Reihenfolge zusammen mit den entsprechenden Häufigkeiten geschrieben sind.

Abhängig von der Art des Attributs gibt es diskrete und Intervallvariationsreihen. Abhängig von der Menge der Quelldaten und dem Bereich der zulässigen Werte eines eindimensionalen quantitativen Merkmals werden Häufigkeitsverteilungen auch in diskrete und Intervallverteilungen unterteilt. Wenn es viele verschiedene gibt (mehr als 10-15), dann werden diese Optionen gruppiert, indem man eine bestimmte Anzahl von Gruppierungsintervallen und damit die Intervallhäufigkeitsverteilung wählt.

Der erste Schritt bei der Konstruktion einer Intervallvariationsreihe ist die Wahl eines bestimmten Prinzips, das als Grundlage für die Konstruktion einer Intervallreihe gegeben wird. Die Wahl dieses Prinzips hängt vom Grad der Homogenität des betrachteten Aggregats ab. Wenn die Grundgesamtheit homogen ist, wird bei der Erstellung einer Reihe das Prinzip gleicher Intervalle verwendet. In diesem Fall wird die Frage der Homogenität durch eine sinnvolle Analyse der untersuchten Phänomene gelöst.

Die Variabilität eines Phänomens in der statistischen Analyse wird durch eine Reihe von Merkmalen widergespiegelt, die als System bezeichnet werden Variationsindikatoren. Es enthält:

absolute Variationsraten:

1) Variationsbreite;

2) Durchschnittswerte (Gruppe und Allgemein):

- Leistungsdurchschnittswerte;

- strukturelle Durchschnittswerte;


3) durchschnittliche lineare Abweichung;

4) Varianzen (Gruppe, Intergruppe und Gesamt) und Standardabweichung;

relative Variationsindikatoren:

1) Schwingungskoeffizient;

2) Variationskoeffizienten (einschließlich linear);

3) Bestimmtheitsmaßstäbe (empirisch und theoretisch).

Variationsbreite spiegelt die Grenzen der Variabilität eines Merkmals oder mit anderen Worten die Variationsamplitude wider. Der Variationsbereich wird als Differenz zwischen dem Maximalwert des Vorzeichens (x) und dem Minimalwert des Vorzeichens (x) berechnet, d. h. nach der Formel:

x – der größte Wert des Attributs;

X. - der kleinste Wert des Attributs.

Streuung- das durchschnittliche Quadrat der Abweichungen einzelner Werte eines Merkmals von ihrem Durchschnittswert:

Für eine Variationsreihe wird die Varianz anhand der folgenden Formel berechnet: (siehe Tabelle 2.)

Für die Forschung ist es oft praktisch, das Maß der Streuung in denselben Einheiten wie die Varianten darzustellen. Dann verwenden sie statt Varianz Standardabweichung, das ist die Quadratwurzel der Varianz, d.h. Die Standardabweichung wird nach folgender Formel berechnet: (siehe Tabelle 2)

Die oben diskutierten Streuungsmaße (Variationsspanne, Streuung, Standardabweichung) sind absolute Werte, Es ist nicht immer möglich, den Grad der Variabilität eines Zeichens daraus zu beurteilen; bei einigen Aufgaben ist es notwendig, relative Streuungsindikatoren zu verwenden. Dieser Indikator ist der Variationskoeffizient (V), der das Verhältnis der Standardabweichung zum arithmetischen Mittel darstellt, ausgedrückt in Prozent:

Der Variationskoeffizient ermöglicht:

Vergleichen Sie die Variation desselben Merkmals in verschiedenen Objektgruppen.

Identifizieren Sie den Grad des Unterschieds im gleichen Merkmal derselben Gruppe von Objekten zu unterschiedlichen Zeiten.

Vergleichen Sie die Variation verschiedener Merkmale in denselben Objektgruppen.

Wenn der Wert des Variationskoeffizienten 33 nicht überschreitet, gilt die untersuchte Population als homogen .

Schauen wir uns ein Beispiel für die Methode zur Berechnung der Standardabweichung und Varianz eines Merkmals an.

BEISPIEL 5. Als Ergebnis einer stichprobenartigen Kontrolle der Teeverpackungen wurden folgende Daten ermittelt:

Gewicht einer Teepackung, g. Anzahl der Teepackungen, Stk.

52 und älter 3

Berechnen Sie die durchschnittliche Masse einer Packung Tee, die Standardabweichung und die Varianz des Merkmals.

Für die Berechnungen verwenden wir die Formeln aus Tabelle 2.

Es empfiehlt sich, alle Berechnungen in tabellarischer Form aufzubereiten. Um die Mitte des Intervalls zu bestimmen

In jeder Gruppe, d.h. Um den Durchschnittswert zu ermitteln, muss vom Intervall zur diskreten Reihe übergegangen werden. Der Wert des Intervalls ist 1 (z. B. 50 – 49 = 1). Dies bedeutet, dass der Durchschnittswert für die erste Gruppe ((48 +49) /2 = 48,5 beträgt; für die zweite bzw. dritte Gruppe 49,5 und 50,5 usw. d.

Massenzahl Mitte X*f X – X (X – X) (X – X) * f

Dasselbe Dokument enthält Regeln zur Bestimmung des Variationskoeffizienten. Es wurden mehrere Methoden zur Identifizierung von NMCC entwickelt: normativ, tariflich, Entwurf und Schätzung, Kosten. Die Methode der vergleichbaren Marktpreise wird als höchste Priorität angesehen. Es wird empfohlen, es bei der Festlegung des Startpreises zu verwenden. Dabei handelt es sich um den Vergleich kommerzieller Angebote potenzieller Anbieter auf Wunsch des Kunden. Um eine solche Analyse durchzuführen, wird der Variationskoeffizient verwendet. Sie wird in Prozent ausgedrückt. Der Variationskoeffizient ist ein Maß für die relative Streuung der angebotenen Preise. Es zeigt an, welchen Anteil die durchschnittliche Preisspanne am durchschnittlichen Preiswert einnimmt. Dieser Indikator kann folgende Werte annehmen:

  1. Weniger als 10%. In diesem Fall wird der Preisunterschied als unbedeutend angesehen.
  2. Von 10 % bis 20 %. Der Spread gilt als durchschnittlich.
  3. Von 20 % bis 33 %.

Der Variationskoeffizient

Um die Übereinstimmung der untersuchten Werte mit dem Gesetz der Normalverteilung zu überprüfen, werden das Verhältnis des Asymmetrieindikators zu seinem Fehler und das Verhältnis des Kurtosis-Indikators zu seinem Fehler verwendet. Asymmetrieindex Der Asymmetrieindex (A) und sein Fehler (ma) werden mit den folgenden Formeln berechnet: , wobei A der Asymmetrieindex, die Standardabweichung, a das arithmetische Mittel und n die Anzahl der Messungen des Parameters ist. ai ist der gemessene Wert im i-ten Schritt.


Kurtosis-Index Der Kurtosis-Index (E) und sein Fehler (me) werden mit den folgenden Formeln berechnet: , wobei E der Kurtosis-Index, die Standardabweichung, a das arithmetische Mittel und n die Anzahl der Messungen des Parameters ist. ai ist der gemessene Wert im i-ten Schritt. Wenn ein< 0, то больше данных с меньшими значениями, чем среднеарифметическое.
Wenn E< 0, то данные сконцентрированы около среднеарифметического значения.

Die Info

X – Einzelwerte, X̅ – arithmetisches Mittel für die Stichprobe. Notiz. Excel verfügt über eine spezielle Funktion zur Varianzberechnung.


Es ist erwähnenswert, dass diese Varianzberechnung einen Nachteil hat – sie erweist sich als voreingenommen, d. h. sein mathematischer Erwartungswert entspricht nicht dem wahren Wert der Varianz. Lesen Sie hier mehr darüber. Dabei ist nicht alles so schlimm.
Mit zunehmender Stichprobengröße nähert es sich immer noch seinem theoretischen Analogon an, d. h. ist asymptotisch erwartungsfrei. Wenn Sie mit großen Stichprobengrößen arbeiten, können Sie daher die obige Formel verwenden.
Es ist sinnvoll, die Sprache der Zeichen in die Sprache der Wörter zu übersetzen. Es stellt sich heraus, dass die Varianz das durchschnittliche Quadrat der Abweichungen ist. Das heißt, zuerst wird der Durchschnittswert berechnet, dann wird die Differenz zwischen jedem Original- und Durchschnittswert gebildet, quadriert, addiert und dann durch die Anzahl der Werte in der Grundgesamtheit dividiert.

Was kennzeichnet den Variationskoeffizienten?

Um in diesem Fall die Streuung des Normalgesetzes der Fehlerverteilung zu bestimmen, verwenden Sie die Formel: , wobei 2 die Streuung, a das arithmetische Mittel, n die Anzahl der Messungen des Parameters und ai der gemessene Wert am i ist -ter Schritt. Standardabweichung Die Standardabweichung gibt die absolute Abweichung der Messwerte vom arithmetischen Mittel an.
Gemäß der Formel für das Maß der Genauigkeit einer Linearkombination wird der Standardfehler des arithmetischen Mittels durch die Formel bestimmt: , wobei die Standardabweichung, a das arithmetische Mittel und n die Anzahl der Messungen des Parameters ist , ai ist der gemessene Wert im i-ten Schritt. Variationskoeffizient Der Variationskoeffizient charakterisiert das relative Maß der Abweichung der Messwerte vom arithmetischen Mittel: , wobei V der Variationskoeffizient, die Standardabweichung und a das arithmetische Mittel ist.

Variation (Statistik)

Um die Beschreibung zu vervollständigen, müssen Sie verstehen, was der Unterschied zwischen der durchschnittlichen Körpergröße jedes Schülers und dem Durchschnittswert ist. Im ersten Schritt berechnen wir den Dispersionsparameter. Die Streuung in der Statistik (gekennzeichnet durch σ2 (Sigma-Quadrat)) ist das Verhältnis der Summe der Quadrate der Differenz zwischen dem arithmetischen Mittel (μ) und dem Wert eines Reihenmitglieds (X) zur Anzahl aller Mitglieder der Grundgesamtheit ( N).

In Form einer Formel wird dies übersichtlicher berechnet: Wir stellen die Werte, die wir als Ergebnis von Berechnungen mit dieser Formel erhalten, als Quadrat des Wertes (in unserem Fall Quadratzentimeter) dar. Sie werden mir zustimmen, dass es absurd ist, die Körpergröße in Zentimeter mal Quadratzentimeter anzugeben. Daher können wir diesen Ausdruck korrigieren bzw. vereinfachen und die Standardabweichungsformel und -berechnung erhalten, Beispiel: Somit haben wir den Wert der Standardabweichung (oder Standardabweichung) erhalten – die Quadratwurzel der Varianz.

Variationskoeffizient in der Statistik: Berechnungsbeispiele

Die Differenz zwischen einem Einzelwert und dem Durchschnitt gibt das Maß der Abweichung wieder. Es wird quadriert, damit alle Abweichungen ausschließlich positive Zahlen werden und um eine gegenseitige Zerstörung positiver und negativer Abweichungen bei der Summierung zu vermeiden. Dann berechnen wir anhand der quadrierten Abweichungen einfach das arithmetische Mittel. Durchschnitt – Quadrat – Abweichungen. Die Abweichungen werden quadriert und der Durchschnitt berechnet.

Aufmerksamkeit

Die Lösung liegt in nur drei Worten. In reiner Form wie dem arithmetischen Mittel oder dem Index wird die Dispersion jedoch nicht verwendet. Es handelt sich vielmehr um einen Hilfs- und Zwischenindikator, der für andere Arten statistischer Analysen erforderlich ist.


Es gibt nicht einmal eine normale Maßeinheit. Der Formel nach zu urteilen, ist dies das Quadrat der Maßeinheit der Originaldaten. Ohne eine Flasche kommt man, wie man so schön sagt, nicht raus.

Statistische Parameter

Es gingen vier kommerzielle Preisvorschläge ein: 2500 Rubel, 2800 Rubel, 2450 Rubel und 2600 Rubel. Zunächst muss der arithmetische Mittelwert des Preises berechnet werden. Im nächsten Schritt wird die Standardabweichung berechnet. Jetzt muss nur noch der Variationskoeffizient berechnet werden. Der resultierende Koeffizientenwert ist kleiner als 33 %, also Alle gesammelten Daten eignen sich zur Berechnung des Startpreises des Vertrags. Die Berechnung des NMCC und des Variationskoeffizienten erfolgt in Form eines Berichts, der verbindlicher Bestandteil der Beschaffungsdokumentation wird. Der Variationskoeffizient ist ein wichtiges Instrument zur Beurteilung der Richtigkeit von Preisangeboten von Lieferanten. Daher müssen Kunden bei der Erstellung der Dokumentation die Regeln zur Berechnung dieses Indikators und die Besonderheiten seiner Anwendung berücksichtigen.

Wozu dient der Variationskoeffizient?

Wie kann man beweisen, dass ein aus der Untersuchung experimenteller Daten gewonnenes Muster nicht das Ergebnis eines Zufalls oder eines Fehlers eines Experimentators ist, sondern dass es zuverlässig ist? Dies ist eine Frage, mit der neue Forscher konfrontiert sind. Die deskriptive Statistik bietet Werkzeuge zur Lösung dieser Probleme. Es besteht aus zwei großen Abschnitten – einer Beschreibung der Daten und ihrem Vergleich in Gruppen oder hintereinander. Inhaltsverzeichnis:

  • Beschreibende Statistikindikatoren
  • Arithmetische Mittel
  • Standardabweichung
  • Der Variationskoeffizient
  • Berechnungen in Microsoft Excel 2016

Einer der wichtigsten statistischen Indikatoren einer Zahlenfolge ist der Variationskoeffizient. Um es zu finden, werden recht komplexe Berechnungen durchgeführt. Die Tools von Microsoft Excel machen es dem Benutzer deutlich einfacher.

Dieser Indikator ist das Verhältnis der Standardabweichung zum arithmetischen Mittel. Das erhaltene Ergebnis wird in Prozent ausgedrückt.

In Excel gibt es keine separate Funktion zur Berechnung dieses Indikators, aber es gibt Formeln zur Berechnung der Standardabweichung und des arithmetischen Mittels einer Zahlenreihe, nämlich zur Ermittlung des Variationskoeffizienten.

Schritt 1: Berechnen Sie die Standardabweichung

Die Standardabweichung, oder wie sie auch genannt wird, die mittlere quadratische Abweichung, ist die Quadratwurzel von . Um die Standardabweichung zu berechnen, verwenden Sie die Funktion STANDARDABWEICHUNG. Ab Excel 2010 ist es, je nachdem, ob die Berechnung auf der Grundgesamtheit oder der Stichprobe basiert, in zwei separate Optionen unterteilt: STDEV.G Und STDEV.V.

Die Syntax für diese Funktionen sieht folgendermaßen aus:

STANDARDEVAL(Nummer1,Nummer2,…)
= STANDARDABWEICHUNG.G(Zahl1;Zahl2;…)
= STANDARDEV.B(Nummer1;Nummer2;…)


Schritt 2: Berechnen Sie das arithmetische Mittel

Das arithmetische Mittel ist das Verhältnis der Gesamtsumme aller Werte einer Zahlenreihe zu deren Anzahl. Es gibt auch eine separate Funktion zur Berechnung dieses Indikators - DURCHSCHNITT. Berechnen wir seinen Wert anhand eines konkreten Beispiels.


Schritt 3: Ermitteln des Variationskoeffizienten

Jetzt haben wir alle notwendigen Daten, um den Variationskoeffizienten selbst direkt zu berechnen.


Daher haben wir den Variationskoeffizienten berechnet und uns dabei auf Zellen bezogen, in denen die Standardabweichung und das arithmetische Mittel bereits berechnet wurden. Sie können es aber auch etwas anders machen, ohne diese Werte separat zu berechnen.


Es gibt eine bedingte Unterscheidung. Es wird angenommen, dass die Zahlenmenge homogen ist, wenn der Variationskoeffizient weniger als 33 % beträgt. Ansonsten wird es meist als heterogen charakterisiert.

Wie Sie sehen, können Sie mit dem Excel-Programm die Berechnung einer so komplexen statistischen Berechnung wie der Ermittlung des Variationskoeffizienten erheblich vereinfachen. Leider verfügt die Anwendung noch nicht über eine Funktion, die diesen Indikator in einer Aktion berechnen würde, sondern mithilfe der Operatoren STANDARDABWEICHUNG Und DURCHSCHNITT Diese Aufgabe wird erheblich vereinfacht. Somit kann auch eine Person, die nicht über ein hohes Maß an Kenntnissen in Bezug auf statistische Muster verfügt, dies in Excel durchführen.

BERECHNUNG VON VARIATIONSINDIKATOREN

PRAKTISCHE ARBEIT 3

Ziel der Arbeit: Erwerb praktischer Fähigkeiten zur Berechnung verschiedener Variationsindikatoren (Maße) in Abhängigkeit von den in der Studie festgelegten Zielen.

Arbeitsauftrag:

1. Bestimmen Sie Art und Form (einfach oder gewichtet) der Variationsindikatoren.

3. Formulieren Sie Schlussfolgerungen.

1. Bestimmung der Art und Form der Variationsindikatoren.

Variationsindikatoren werden in zwei Gruppen unterteilt: absolute und relative. Zu den absoluten Werten gehören: Variationsbereich, Quartilabweichung, durchschnittliche lineare Abweichung, Streuung und Standardabweichung. Relative Indikatoren sind Oszillationskoeffizienten, Variationskoeffizienten, relative lineare Abweichung, relative Quartilvariation usw.

Variationsbereich (R) ist das einfachste Maß für die Variation eines Merkmals und wird durch die folgende Formel bestimmt:

wo ist der höchste Wert des variierenden Merkmals;

– der kleinste Wert des variierenden Merkmals.

Quartilabweichung (Q)– wird verwendet, um die Variation eines Merkmals im Aggregat zu charakterisieren. Kann anstelle des Variationsbereichs verwendet werden, um die mit der Verwendung von Extremwerten verbundenen Nachteile zu vermeiden.

wobei und das erste bzw. dritte Quartil der Verteilung sind.

Quartile– Dies sind die Werte des Merkmals in der Rangreihe der Verteilung, die so ausgewählt werden, dass 25 % der Bevölkerungseinheiten einen geringeren Wert haben; 25 % der Einheiten werden zwischen und enthalten sein; 25 % der Einheiten liegen zwischen und und die restlichen 25 % liegen über .

Die Quartile 1 und 3 werden durch die Formeln bestimmt:

,

Wo ist die untere Grenze des Intervalls, in dem sich das erste Quartil befindet?

– die Summe der akkumulierten Häufigkeiten von Intervallen, die dem Intervall vorangehen, in dem sich das erste Quartil befindet;

– Häufigkeit des Intervalls, in dem sich das erste Quartil befindet.

wobei Me der Median der Reihe ist;

,

Die Symbole sind die gleichen wie für Mengen.

Bei symmetrischen oder mäßig asymmetrischen Verteilungen Q»2/3s. Da die Quartilabweichung nicht durch die Abweichungen aller Werte des Attributs beeinflusst wird, sollte ihre Verwendung auf Fälle beschränkt werden, in denen die Bestimmung der Standardabweichung schwierig oder unmöglich ist.

Durchschnittliche lineare Abweichung () stellt den Durchschnittswert der absoluten Abweichungen der Attributvarianten von ihrem Durchschnitt dar. Sie kann mit der Formel des arithmetischen Mittels berechnet werden, sowohl ungewichtet als auch gewichtet, abhängig von der Abwesenheit oder Anwesenheit von Häufigkeiten in der Verteilungsreihe.



Ungewichtete durchschnittliche lineare Abweichung,

- gewichtete durchschnittliche lineare Abweichung.

Varianz()– das durchschnittliche Quadrat der Abweichungen einzelner Werte eines Merkmals von ihrem Durchschnittswert. Die Varianz wird mithilfe der einfachen ungewichteten und gewichteten Formeln berechnet.

- ungewichtet,

- gewichtet.

Standardabweichungen)– Der häufigste Variationsindikator ist die Quadratwurzel des Varianzwerts.

Der Variationsbereich, die Quartilabweichung, die durchschnittliche lineare und quadratische Abweichung sind benannte Größen und haben die Dimension des gemittelten Merkmals. Die Dispersion hat keine Maßeinheit.

Zum Vergleich der Variabilität verschiedener Merkmale in derselben Population oder beim Vergleich der Variabilität desselben Merkmals in mehreren Populationen werden relative Variationsindikatoren berechnet. Vergleichsbasis ist das arithmetische Mittel. Am häufigsten werden relative Indikatoren als Prozentsätze ausgedrückt und charakterisieren nicht nur eine vergleichende Bewertung der Variation, sondern auch die Homogenität der Bevölkerung.

Schwingungskoeffizient(relative Variationsbreite) wird nach folgender Formel berechnet:

,

Linearer Variationskoeffizient(relative lineare Abweichung):

Relativer Quartilvariationsindex:

oder

Der Variationskoeffizient:

,

Der in der Statistik am häufigsten verwendete Indikator für die relative Variabilität ist der Variationskoeffizient. Es dient nicht nur zur vergleichenden Variationsbewertung, sondern auch als Merkmal für die Homogenität der Population. Je größer der Variationskoeffizient ist, desto größer ist die Streuung der Attributwerte um den Durchschnitt, desto größer ist die Heterogenität der Grundgesamtheit. Es gibt eine Skala zur Bestimmung des Homogenitätsgrades einer Population in Abhängigkeit von den Werten des Variationskoeffizienten (17; S.61).

Um eine ungefähre Vorstellung von der Form der Verteilung zu erhalten, werden Verteilungsdiagramme (Polygon und Histogramm) erstellt.

In der Praxis der statistischen Forschung stößt man auf eine große Vielfalt an Verteilungen. Bei der Untersuchung homogener Populationen beschäftigen wir uns normalerweise mit Einzelknotenverteilungen. Multivertex zeigt die Heterogenität der untersuchten Population an; das Auftreten von zwei oder mehr Vertices weist auf die Notwendigkeit hin, die Daten neu zu gruppieren, um homogenere Gruppen zu identifizieren. Um die allgemeine Natur der Verteilung zu bestimmen, müssen der Grad ihrer Homogenität beurteilt und Indikatoren für Asymmetrie und Kurtosis berechnet werden. Symmetrisch ist eine Verteilung, bei der die Häufigkeiten zweier beliebiger Optionen, die auf beiden Seiten des Verteilungszentrums gleichmäßig verteilt sind, einander gleich sind. Bei symmetrischen Verteilungen sind das arithmetische Mittel, der Modus und der Median gleich. In dieser Hinsicht der einfachste Indikator Asymmetrie basiert auf dem Verhältnis der Indikatoren des Verteilungszentrums: Je größer die Differenz zwischen den Mittelwerten, desto größer die Asymmetrie der Reihe.

Zur Charakterisierung der Asymmetrie im zentralen Teil der Verteilung, also der Masse der Einheiten, oder für eine vergleichende Analyse des Asymmetriegrades mehrerer Verteilungen wird der relative Asymmetrieindex von K. Pearson berechnet:

Der Wert des As-Indikators kann positiv und negativ sein. Ein positiver Wert des Indikators weist auf das Vorhandensein einer rechtsseitigen Asymmetrie hin (der rechte Zweig ist relativ zur maximalen Ordinate länger als der linke). Bei rechtsseitiger Asymmetrie besteht ein Zusammenhang zwischen den Indikatoren des Verteilungszentrums: . Ein negatives Vorzeichen des Asymmetrieindex weist auf das Vorliegen einer linksseitigen Asymmetrie hin (Abb. 1). In diesem Fall besteht ein Zusammenhang zwischen den Indikatoren des Verteilzentrums: .



Reis. 1. Verteilung:

1 – mit linksseitiger Asymmetrie; 2 – mit rechtsseitiger Asymmetrie.

Ein weiterer vom schwedischen Mathematiker Lindbergh vorgeschlagener Indikator wird nach folgender Formel berechnet:

wobei P der Prozentsatz derjenigen Kennwerte ist, die wertmäßig den arithmetischen Mittelwert überschreiten.

Der genaueste und am weitesten verbreitete Indikator basiert auf der Bestimmung des Zentralmoments dritter Ordnung (in einer symmetrischen Verteilung ist sein Wert Null):

Wo ist das Zentralmoment dritter Ordnung:

σ – Standardabweichung.

Die Verwendung dieses Indikators ermöglicht es, nicht nur das Ausmaß der Asymmetrie zu bestimmen, sondern auch die Frage nach dem Vorhandensein oder Nichtvorhandensein einer Asymmetrie in der Verteilung eines Merkmals in der Gesamtbevölkerung zu beantworten. Eine Einschätzung der Signifikanz dieses Indikators erfolgt anhand des mittleren quadratischen Fehlers, der vom Beobachtungsumfang abhängt N und wird nach der Formel berechnet:

.

Wenn das Verhältnis beträgt, ist die Asymmetrie signifikant und die Verteilung des Merkmals in der Population ist nicht symmetrisch. Wenn das Verhältnis , Asymmetrie unbedeutend ist, kann ihr Vorhandensein durch den Einfluss verschiedener zufälliger Umstände erklärt werden.

Für symmetrische Verteilungen wird der Indikator berechnet Überschuss(Schärfe). Lindbergh schlug den folgenden Indikator zur Beurteilung der Kurtosis vor:

,

wobei P der Anteil (%) der Anzahl der Optionen ist, die in dem Intervall liegen, das der Hälfte der Standardabweichung in die eine oder andere Richtung vom arithmetischen Mittel entspricht.

Der genaueste Indikator ist die Verwendung des Zentralmoments vierter Ordnung:

wo ist das zentrale Moment des vierten Moments;

- für nicht gruppierte Daten;

- für gruppierte Daten.

Abbildung 2 zeigt zwei Verteilungen: Eine weist einen Höhepunkt auf (der Kurtosis-Wert ist positiv), die zweite ist flach (der Kurtosis-Wert ist negativ). Kurtosis ist das Ausmaß, in dem sich die Spitze der empirischen Verteilung von der Spitze der Normalverteilungskurve nach oben oder unten bewegt. Bei einer Normalverteilung beträgt das Verhältnis .



Reis. 2. Verteilung:

1,4 – normal; 2 – spitz; 3 – flache Oberseite

Der mittlere quadratische Fehler der Kurtosis wird nach folgender Formel berechnet:

,

wobei n die Anzahl der Beobachtungen ist.

Wenn , dann ist die Kurtosis signifikant, wenn , dann ist sie nicht signifikant.

Die Beurteilung der Bedeutung der Asymmetrie- und Kurtosis-Indikatoren ermöglicht die Schlussfolgerung, ob diese empirische Studie als eine Art Normalverteilungskurve klassifiziert werden kann.

2. Betrachten wir die Methodik zur Berechnung von Variationsindizes.

In der Statistik wird unter der Variation der Werte eines bestimmten Indikators im Aggregat der Unterschied seiner Werte in bestimmten Einheiten der analysierten Zusammensetzung im selben Zeitraum oder Zeitpunkt der Studie verstanden. Wenn eine Analyse der Unterschiede in den Werten eines Indikators für dasselbe Objekt, für dieselbe Bevölkerungseinheit zu unterschiedlichen Zeiträumen oder Zeitpunkten durchgeführt wird, spricht man nicht mehr von Variation, sondern von Schwankungen oder Änderungen während eines bestimmten Zeitraums.

Gepostet auf www.site

Um solche Schwankungen zu untersuchen, verwenden wir eigene Analysemethoden, die sich von den Methoden der Variationsanalyse unterscheiden. Ein objektiver Faktor für das Auftreten des Variationsphänomens ist der Unterschied in den Aktivitätsbedingungen bestimmter untersuchter Objekte in der Bevölkerung. Beispielsweise wird die Arbeit eines Handelsunternehmens durch das Wettbewerbsniveau, Steuern, den Einsatz fortschrittlicher Technologien in seinen Aktivitäten, den Zustand der Ausrüstung usw. beeinflusst. Fluktuation ist charakteristisch für fast alle Naturphänomene und Facetten des gesellschaftlichen Lebens. Es gibt jedoch auch nichtvariable Indikatoren, die bei der Erfassung bestimmter Phänomene in Rechtsakten gebildet werden. Beispielsweise darf die Anzahl der Generaldirektoren eines Unternehmens nicht variieren; laut Gesetz muss es einen geben. Solche nicht variablen Objekte sind in der Regel nicht Gegenstand oder Gegenstand statistischer Forschung. In unserem Leben ist die Schwankung der Zeichen ein wichtiger Einflussfaktor. Wenn Sie beispielsweise das Sortiment an Standardgrößen von Teilen ändern, können Sie ein optimales Sortiment erstellen. Gleichzeitig weist ein hoher Variationsgrad innerhalb einer Standardgröße auf ein hohes Maß an Mängeln und die Notwendigkeit hin, entsprechende Maßnahmen zu ergreifen. Erhebliche Schwankungen bei Umsatz oder Preisen können auf eine Marktmonopolisierung oder eine schlechte Bestandsverwaltung hinweisen und erfordern entsprechende Maßnahmen usw. Das oben Gesagte lässt darauf schließen, dass es im öffentlichen Leben, das aus statistischer Sicht ein Massenaggregat ist, eine objektive Variabilität verschiedener Merkmale und Elemente gibt, die die Relevanz der Untersuchung dieses Phänomens anhand spezieller Indikatoren zur Formulierung optimaler Methoden dafür bestimmt es verwalten. Der Variationskoeffizient ist ein solcher Indikator. Darüber hinaus gehört es zur Gruppe der relativen Variationsindikatoren. Der betrachtete Koeffizient ist ein relativer Indikator, der das Verhältnis der Standardabweichung zum Durchschnittswert des untersuchten Merkmals charakterisiert und üblicherweise in Prozent ausgedrückt wird. Dieses Kriterium spiegelt die Beziehung zwischen dem Grad des Einflusses von Faktoren, die zu Variabilität führen, und den allgemeinen Bedingungen aller Elemente der Bevölkerung wider, die den typischen Wert des Attributs – seinen Durchschnittswert – ergeben. Der Variationskoeffizient wird verwendet, um den Grad der Variabilität verschiedener Merkmale derselben Population und die Variabilität in verschiedenen Populationen mit unterschiedlichen Durchschnittswerten zu untersuchen.