heim · Andere · Regeln für die Konstruktion diskreter und Intervallverteilungsreihen. Aufbau einer Vertriebsreihe

Regeln für die Konstruktion diskreter und Intervallverteilungsreihen. Aufbau einer Vertriebsreihe

In vielen Fällen, wenn eine statistische Grundgesamtheit eine große oder noch mehr unendlich viele Varianten umfasst, was am häufigsten bei kontinuierlicher Variation der Fall ist, ist es praktisch unmöglich und unpraktisch, für jede Variante eine Gruppe von Einheiten zu bilden. In solchen Fällen ist die Zusammenfassung statistischer Einheiten zu Gruppen nur auf der Grundlage eines Intervalls möglich, d.h. eine solche Gruppe, die bestimmte Grenzen für die Werte eines variierenden Merkmals hat. Diese Grenzwerte werden durch zwei Zahlen angezeigt, die die Ober- und Untergrenzen jeder Gruppe angeben. Die Verwendung von Intervallen führt zur Bildung einer Intervallverteilungsreihe.

Intervall rad ist eine Variationsreihe, deren Varianten in Form von Intervallen dargestellt werden.

Eine Intervallreihe kann mit gleichen und ungleichen Intervallen gebildet werden, wobei die Wahl des Prinzips zur Konstruktion dieser Reihe hauptsächlich vom Grad der Repräsentativität und Zweckmäßigkeit der statistischen Grundgesamtheit abhängt. Wenn die Grundgesamtheit hinsichtlich der Anzahl der Einheiten groß genug (repräsentativ) und in ihrer Zusammensetzung völlig homogen ist, empfiehlt es sich, der Bildung einer Intervallreihe die Intervallgleichheit zugrunde zu legen. Normalerweise wird nach diesem Prinzip eine Intervallreihe für diejenigen Populationen gebildet, bei denen die Variationsbreite relativ klein ist, d. h. die maximalen und minimalen Optionen weichen in der Regel mehrfach voneinander ab. In diesem Fall wird der Wert gleicher Intervalle durch das Verhältnis der Variationsbreite eines Merkmals zu einer bestimmten Anzahl gebildeter Intervalle berechnet. Gleich bestimmen Und Intervall kann die Sturgess-Formel verwendet werden (normalerweise mit einer kleinen Variation der Intervalleigenschaften und einer großen Anzahl von Einheiten in der statistischen Grundgesamtheit):

wo x ich - gleicher Intervallwert; X max, X min – maximale und minimale Optionen in einem statistischen Aggregat; N . - die Anzahl der Einheiten im Aggregat.

Beispiel. Es ist ratsam, die Größe eines gleichen Intervalls für die Dichte der radioaktiven Kontamination mit Cäsium zu berechnen - 137 in 100 Siedlungen des Bezirks Krasnopolsky der Region Mogilev, wenn bekannt ist, dass die anfängliche (minimale) Option 1 km / beträgt km 2, das Finale ( maximal) - 65 ki/km 2. Mit Formel 5.1. wir bekommen:

Um eine Intervallreihe mit gleichen Intervallen hinsichtlich der Dichte der Cäsiumkontamination zu bilden – 137 Siedlungen in der Region Krasnopolski – kann die Größe des gleichen Intervalls folglich 8 ki/km 2 betragen.

Unter Bedingungen ungleichmäßiger Verteilung, d.h. Wenn die maximalen und minimalen Optionen hundertfach sind, können Sie beim Bilden einer Intervallreihe das Prinzip anwenden ungleich Intervalle. Ungleiche Intervalle nehmen normalerweise zu, wenn wir uns zu größeren Werten des Merkmals bewegen.

Die Form der Intervalle kann geschlossen oder offen sein. Geschlossen Es ist üblich, Intervalle zu nennen, die sowohl eine untere als auch eine obere Grenze haben. Offen Intervalle haben nur eine Grenze: Im ersten Intervall gibt es eine obere Grenze, im letzten gibt es eine untere Grenze.

Es empfiehlt sich, Intervallreihen insbesondere mit ungleichen Intervallen unter Berücksichtigung auszuwerten Verteilungsdichte, Der einfachste Weg, dies zu berechnen, ist das Verhältnis der lokalen Frequenz (oder Frequenz) zur Größe des Intervalls.

Um praktisch eine Intervallreihe zu bilden, können Sie das Tabellenlayout verwenden. 5.3.

Tabelle 5.3. Das Verfahren zur Bildung einer Intervallreihe von Siedlungen in der Region Krasnopolski entsprechend der Dichte der radioaktiven Kontamination mit Cäsium –137

Der Hauptvorteil der Intervallreihe ist ihr Maximum Kompaktheit. gleichzeitig werden in der Intervallverteilungsreihe einzelne Varianten des Merkmals in den entsprechenden Intervallen ausgeblendet

Bei der grafischen Darstellung einer Intervallreihe in einem rechtwinkligen Koordinatensystem werden auf der Abszissenachse die oberen Grenzen der Intervalle und auf der Ordinatenachse die lokalen Häufigkeiten der Reihe aufgetragen. Der grafische Aufbau einer Intervallreihe unterscheidet sich vom Aufbau eines Verteilungspolygons dadurch, dass jedes Intervall eine untere und eine obere Grenze hat und zwei Abszissen einem Ordinatenwert entsprechen. Daher wird im Diagramm einer Intervallreihe nicht wie in einem Polygon ein Punkt markiert, sondern eine Linie, die zwei Punkte verbindet. Diese horizontalen Linien werden durch vertikale Linien miteinander verbunden und es entsteht die Figur eines Stufenpolygons, die allgemein als „Stufenpolygon“ bezeichnet wird Histogramm Verteilung (Abb. 5.3).

Bei der grafischen Konstruktion einer Intervallreihe für eine ausreichend große statistische Grundgesamtheit nähert sich das Histogramm an symmetrisch Form der Verteilung. In den Fällen, in denen die statistische Grundgesamtheit klein ist, gilt in der Regel: asymmetrisch Balkendiagramm.

In manchen Fällen empfiehlt es sich, eine Reihe akkumulierter Frequenzen zu bilden, d. h. kumulativ Reihe. Eine kumulative Reihe kann auf der Grundlage einer diskreten oder einer Intervallverteilungsreihe gebildet werden. Bei der grafischen Darstellung einer kumulativen Reihe in einem rechtwinkligen Koordinatensystem werden Varianten auf der Abszissenachse und akkumulierte Häufigkeiten (Frequenzen) auf der Ordinatenachse aufgetragen. Die resultierende gekrümmte Linie wird üblicherweise als bezeichnet kumulativ Verteilung (Abb. 5.4).

Die Bildung und grafische Darstellung verschiedener Arten von Variationsreihen trägt zu einer vereinfachten Berechnung der wichtigsten statistischen Merkmale bei, die in Thema 6 ausführlich besprochen werden, und hilft, das Wesen der Verteilungsgesetze der statistischen Grundgesamtheit besser zu verstehen. Besondere Bedeutung kommt der Analyse einer Variationsreihe dann zu, wenn es darum geht, den Zusammenhang zwischen Optionen und Häufigkeiten (Frequenzen) zu identifizieren und nachzuvollziehen. Diese Abhängigkeit zeigt sich darin, dass die Anzahl der Fälle pro Option in gewisser Weise mit der Größe dieser Option zusammenhängt, d. h. Mit zunehmenden Werten der variierenden Charakteristik erfahren die Häufigkeiten (Häufigkeiten) dieser Werte bestimmte, systematische Veränderungen. Das bedeutet, dass die Zahlen in der Spalte Häufigkeit (Häufigkeit) nicht chaotisch schwanken, sondern sich in einer bestimmten Richtung, in einer bestimmten Reihenfolge und Reihenfolge ändern.

Wenn die Häufigkeiten eine gewisse Systematik in ihren Veränderungen aufweisen, dann bedeutet das, dass wir auf dem Weg sind, ein Muster zu erkennen. Das System, die Reihenfolge und die Reihenfolge der Häufigkeitsänderungen spiegeln allgemeine Ursachen und allgemeine Bedingungen wider, die für die gesamte Bevölkerung charakteristisch sind.

Es sollte nicht davon ausgegangen werden, dass das Verteilungsmuster immer in vorgefertigter Form vorliegt. Es gibt ziemlich viele Variationsreihen, in denen die Frequenzen bizarr springen, mal ansteigend, mal abnehmend. In solchen Fällen ist es ratsam, herauszufinden, mit welcher Art von Verteilung der Forscher es zu tun hat: Entweder weist diese Verteilung überhaupt keine inhärenten Muster auf, oder ihre Natur ist noch nicht geklärt: Der erste Fall ist selten, der zweite jedoch Der Fall ist ein ziemlich häufiges und weit verbreitetes Phänomen.

Daher kann bei der Bildung einer Intervallreihe die Gesamtzahl der statistischen Einheiten klein sein und jedes Intervall enthält eine kleine Anzahl von Varianten (z. B. 1–3 Einheiten). In solchen Fällen kann man nicht mit der Manifestation irgendeines Musters rechnen. Damit auf der Grundlage zufälliger Beobachtungen ein natürliches Ergebnis erzielt werden kann, muss das Gesetz der großen Zahlen in Kraft treten, d. h. so dass es für jedes Intervall nicht mehrere, sondern Dutzende und Hunderte statistischer Einheiten gäbe. Zu diesem Zweck müssen wir versuchen, die Anzahl der Beobachtungen so weit wie möglich zu erhöhen. Dies ist der sicherste Weg, Muster in Massenprozessen zu erkennen. Wenn es keine wirkliche Möglichkeit gibt, die Anzahl der Beobachtungen zu erhöhen, kann die Identifizierung eines Musters dadurch erreicht werden, dass die Anzahl der Intervalle in der Verteilungsreihe verringert wird. Durch die Verringerung der Anzahl der Intervalle in einer Variationsreihe erhöht sich dadurch die Anzahl der Häufigkeiten in jedem Intervall. Dies bedeutet, dass die zufälligen Schwankungen jeder statistischen Einheit einander überlagert, „geglättet“ werden und zu einem Muster werden.

Die Bildung und Konstruktion von Variationsreihen ermöglicht es uns, nur ein allgemeines, ungefähres Bild der Verteilung der statistischen Grundgesamtheit zu erhalten. Beispielsweise drückt ein Histogramm nur in grober Form den Zusammenhang zwischen den Werten eines Merkmals und seinen Häufigkeiten (Häufigkeiten) aus. Daher sind Variationsreihen im Wesentlichen nur die Grundlage für eine weitere, vertiefte Untersuchung der inneren Gesetzmäßigkeit der Statik Verteilung.

TESTFRAGEN ZU THEMA 5

1. Was ist Variation? Was verursacht die Variation eines Merkmals in einer statistischen Population?

2. Welche Arten unterschiedlicher Merkmale können in der Statistik auftreten?

3. Was ist eine Variationsreihe? Welche Arten von Variationsreihen kann es geben?

4. Was ist eine Ranglistenserie? Was sind seine Vor- und Nachteile?

5. Was ist eine diskrete Reihe und welche Vor- und Nachteile hat sie?

6. Wie wird eine Intervallreihe gebildet, welche Vor- und Nachteile hat sie?

7. Was ist eine grafische Darstellung von geordneten, diskreten Intervallverteilungsreihen?

8. Was ist das Verteilungskumulat und was zeichnet es aus?

Der einfachste Weg, statistisches Material zusammenzufassen, ist die Erstellung von Reihen. Das zusammenfassende Ergebnis einer statistischen Studie können Verteilungsreihen sein. Eine Verteilungsreihe in der Statistik ist eine geordnete Verteilung von Bevölkerungseinheiten in Gruppen nach einem beliebigen Merkmal: qualitativ oder quantitativ. Wenn eine Reihe auf qualitativer Basis aufgebaut ist, wird sie als attributiv bezeichnet, und wenn sie quantitativ ist, wird sie als Variation bezeichnet.

Eine Variationsreihe ist durch zwei Elemente gekennzeichnet: Variante (X) und Häufigkeit (f). Eine Variante ist ein separater Wert eines Merkmals einer einzelnen Einheit oder Gruppe einer Population. Eine Zahl, die angibt, wie oft ein bestimmter Attributwert vorkommt, wird als Häufigkeit bezeichnet. Wenn die Häufigkeit als relative Zahl ausgedrückt wird, wird sie als Häufigkeit bezeichnet. Eine Variationsreihe kann intervallartig sein, wenn die Grenzen „von“ und „bis“ definiert sind, oder sie kann diskret sein, wenn das untersuchte Merkmal durch eine bestimmte Zahl gekennzeichnet ist.

Schauen wir uns die Konstruktion von Variationsreihen anhand von Beispielen an.

Beispiel. und es gibt Daten über die Tarifkategorien von 60 Arbeitern in einer der Werkstätten des Werks.

Verteilen Sie die Arbeitnehmer nach Tarifkategorien und erstellen Sie eine Variationsreihe.

Dazu notieren wir alle Werte des Merkmals in aufsteigender Reihenfolge und zählen die Anzahl der Arbeiter in jeder Gruppe.

Tabelle 1.4

Verteilung der Arbeitnehmer nach Kategorie

Arbeiterrang (X)

Anzahl der Arbeiter

Person (w)

in % der Gesamtsumme (insbesondere)

Wir haben eine diskrete Variationsreihe erhalten, in der das untersuchte Merkmal (der Rang des Arbeiters) durch eine bestimmte Zahl dargestellt wird. Aus Gründen der Übersichtlichkeit werden Variationsreihen grafisch dargestellt. Basierend auf dieser Verteilerreihe wurde eine Verteilerfläche konstruiert.

Reis. 1.1. Polygon zur Verteilung der Arbeitnehmer nach Tarifkategorien

Wir betrachten die Konstruktion einer Intervallreihe mit gleichen Intervallen anhand des folgenden Beispiels.

Beispiel. Es sind Daten über den Wert des Anlagekapitals von 50 Unternehmen in Millionen Rubel bekannt. Es ist erforderlich, die Verteilung der Unternehmen nach Anlagekosten darzustellen.

Um die Verteilung der Unternehmen nach Anlagekosten aufzuzeigen, lösen wir zunächst die Frage nach der Anzahl der Gruppen, die wir hervorheben möchten. Angenommen, wir haben beschlossen, fünf Unternehmensgruppen zu identifizieren. Dann bestimmen wir die Größe des Intervalls in der Gruppe. Dazu verwenden wir die Formel

Nach unserem Beispiel.

Indem wir den Wert des Intervalls zum Mindestwert des Attributs addieren, erhalten wir Gruppen von Unternehmen nach Anlagekosten.

Eine Einheit mit einem doppelten Wert gehört zu der Gruppe, in der sie als Obergrenze fungiert (d. h. der Wert des Attributs 17 geht an die erste Gruppe, 24 an die zweite usw.).

Zählen wir die Anzahl der Fabriken in jeder Gruppe.

Tabelle 1.5

Verteilung der Unternehmen nach Wert des Anlagekapitals (Millionen Rubel)

Kosten des Anlagekapitals
in Millionen Rubel (X)

Anzahl der Firmen
(Frequenz) (f)

Akkumulierte Frequenzen
(kumulativ)

Gemäß dieser Verteilung wurde eine Variationsintervallreihe erhalten, aus der hervorgeht, dass 36 Unternehmen über ein Anlagekapital im Wert von 10 bis 24 Millionen Rubel verfügen. usw.

Intervallverteilungsreihen können grafisch in Form eines Histogramms dargestellt werden.

Die Ergebnisse der Datenverarbeitung werden in dargestellt statistische Tabellen. Statistische Tabellen enthalten ein eigenes Subjekt und Prädikat.

Das Subjekt ist die Gesamtheit oder ein Teil der Gesamtheit, die charakterisiert wird.

Prädikate sind Indikatoren, die das Subjekt charakterisieren.

Es werden Tabellen unterschieden: einfache und Gruppentabellen, kombinatorische Tabellen mit einfacher und komplexer Entwicklung des Prädikats.

Eine einfache Tabelle im Betreff enthält eine Liste der einzelnen Einheiten.

Wenn das Subjekt eine Gruppierung von Einheiten enthält, wird eine solche Tabelle als Gruppentabelle bezeichnet. Beispielsweise eine Gruppe von Unternehmen nach Anzahl der Arbeitnehmer, Bevölkerungsgruppen nach Geschlecht.

Der Betreff der Kombinationstabelle enthält eine Gruppierung nach zwei oder mehr Merkmalen. Beispielsweise wird die Bevölkerung nach Geschlecht in Gruppen nach Bildung, Alter usw. eingeteilt.

Kombinationstabellen enthalten Informationen, die es ermöglichen, die Beziehung einer Reihe von Indikatoren und das Muster ihrer räumlichen und zeitlichen Veränderungen zu identifizieren und zu charakterisieren. Um die Tabelle bei der Entwicklung ihres Themas übersichtlicher zu gestalten, beschränken Sie sich auf zwei oder drei Merkmale und bilden für jedes davon eine begrenzte Anzahl von Gruppen.

Das Prädikat in Tabellen kann auf unterschiedliche Weise entwickelt werden. Bei einer einfachen Entwicklung des Prädikats sind alle seine Indikatoren unabhängig voneinander lokalisiert.

Bei komplexer Entwicklung des Prädikats werden die Indikatoren miteinander kombiniert.

Bei der Erstellung einer Tabelle muss man von den Zielen der Studie und dem Inhalt des verarbeiteten Materials ausgehen.

In der Statistik kommen neben Tabellen auch Grafiken und Diagramme zum Einsatz. Diagramm – statistische Daten werden anhand geometrischer Formen dargestellt. Diagramme sind in lineare Diagramme und Balkendiagramme unterteilt, es können jedoch auch Figurendiagramme (Zeichnungen und Symbole) und Kreisdiagramme (ein Kreis wird als Größe der Gesamtbevölkerung angenommen und die Flächen einzelner Sektoren zeigen deren spezifisches Gewicht oder Verhältnis) angezeigt werden Komponenten), Radialdiagramme (auf der Grundlage von Polarkoordinaten erstellt). Ein Kartogramm ist eine Kombination aus einer Übersichtskarte oder einem Lageplan mit einem Diagramm.

Der wichtigste Schritt bei der Untersuchung sozioökonomischer Phänomene und Prozesse ist die Systematisierung von Primärdaten und auf dieser Grundlage die Gewinnung einer zusammenfassenden Charakteristik des gesamten Objekts anhand allgemeiner Indikatoren, die durch die Zusammenfassung und Gruppierung primärstatistischen Materials erreicht wird.

Statistische Zusammenfassung - Hierbei handelt es sich um einen Komplex aufeinanderfolgender Operationen zur Verallgemeinerung spezifischer Einzelfakten, die eine Menge bilden, um typische Merkmale und Muster zu identifizieren, die dem untersuchten Phänomen als Ganzes innewohnen. Die Durchführung einer statistischen Zusammenfassung umfasst die folgenden Schritte :

  • Auswahl von Gruppierungsmerkmalen;
  • Festlegung der Reihenfolge der Gruppenbildung;
  • Entwicklung eines Systems statistischer Indikatoren zur Charakterisierung von Gruppen und dem Objekt als Ganzes;
  • Entwicklung statistischer Tabellenlayouts zur Darstellung zusammenfassender Ergebnisse.

Statistische Gruppierung nennt man die Aufteilung von Einheiten der untersuchten Bevölkerung in homogene Gruppen nach bestimmten für sie wesentlichen Merkmalen. Gruppierungen sind die wichtigste statistische Methode zur Zusammenfassung statistischer Daten, die Grundlage für die korrekte Berechnung statistischer Indikatoren.

Folgende Gruppierungsarten werden unterschieden: typologisch, strukturell, analytisch. Alle diese Gruppierungen sind dadurch vereint, dass die Einheiten des Objekts nach einem bestimmten Merkmal in Gruppen eingeteilt werden.

Gruppierungsfunktion ist ein Merkmal, durch das die Einheiten einer Population in separate Gruppen eingeteilt werden. Die Schlussfolgerungen einer statistischen Studie hängen von der richtigen Wahl eines Gruppierungsmerkmals ab. Als Grundlage für die Gruppierung müssen aussagekräftige, theoretisch fundierte Merkmale (quantitativ oder qualitativ) herangezogen werden.

Quantitative Merkmale der Gruppierung einen numerischen Ausdruck haben (Handelsvolumen, Alter der Person, Familieneinkommen usw.) und qualitative Anzeichen einer Gruppierung spiegeln den Zustand der Bevölkerungseinheit wider (Geschlecht, Familienstand, Branche des Unternehmens, Eigentumsform usw.).

Nachdem die Grundlage der Gruppierung festgelegt wurde, muss über die Anzahl der Gruppen entschieden werden, in die die untersuchte Bevölkerung eingeteilt werden soll. Die Anzahl der Gruppen hängt von den Zielen der Studie und der Art des der Gruppierung zugrunde liegenden Indikators, der Populationsgröße und dem Variationsgrad des Merkmals ab.

Beispielsweise berücksichtigt die Gruppierung der Unternehmen nach Eigentumsarten kommunales, bundesstaatliches und bundessubjektives Eigentum. Erfolgt die Gruppierung nach einem quantitativen Kriterium, ist besonderes Augenmerk auf die Anzahl der Einheiten des Untersuchungsgegenstandes und den Grad der Schwankung des Gruppierungsmerkmals zu legen.

Nachdem die Anzahl der Gruppen ermittelt wurde, müssen die Gruppierungsintervalle festgelegt werden. Intervall – das sind die Werte eines variierenden Merkmals, die innerhalb bestimmter Grenzen liegen. Jedes Intervall hat seinen eigenen Wert, Ober- und Untergrenzen oder mindestens eine davon.

Untere Grenze des Intervalls heißt der kleinste Wert des Merkmals im Intervall und Höchstgrenze - der höchste Wert des Merkmals im Intervall. Der Wert des Intervalls ist die Differenz zwischen der oberen und unteren Grenze.

Gruppierungsintervalle sind je nach Größe: gleich und ungleich. Wenn sich die Variation eines Merkmals in relativ engen Grenzen manifestiert und die Verteilung gleichmäßig ist, wird eine Gruppe in gleichen Abständen gebildet. Der Wert des gleichen Intervalls wird durch die folgende Formel bestimmt :

wobei Xmax, Xmin die Maximal- und Minimalwerte des Merkmals im Aggregat sind; n – Anzahl der Gruppen.

Die einfachste Gruppierung, bei der jede ausgewählte Gruppe durch einen Indikator charakterisiert wird, stellt eine Verteilungsreihe dar.

Statistische Verteilungsreihe - Dies ist eine geordnete Verteilung von Bevölkerungseinheiten in Gruppen nach einem bestimmten Merkmal. Abhängig von dem Merkmal, das der Bildung der Verteilungsreihe zugrunde liegt, werden attributive und Variationsverteilungsreihen unterschieden.

Attributiv werden als Verteilungsreihen bezeichnet, die nach qualitativen Merkmalen aufgebaut sind, also Merkmale, die keinen numerischen Ausdruck haben (Verteilung nach Art der Arbeit, nach Geschlecht, nach Beruf usw.). Attributive Verteilungsreihen charakterisieren die Zusammensetzung der Bevölkerung nach bestimmten wesentlichen Merkmalen. Über mehrere Zeiträume hinweg erfasst, ermöglichen diese Daten die Untersuchung von Strukturveränderungen.

Variationsreihe werden als quantitativ konstruierte Verteilungsreihen bezeichnet. Jede Variationsreihe besteht aus zwei Elementen: Optionen und Frequenzen. Optionen Man nennt die Einzelwerte des Merkmals, die es in der Variationsreihe annimmt, also den spezifischen Wert des variierenden Merkmals.

Frequenzen Man bezeichnet die Anzahl einzelner Varianten oder jeder Gruppe einer Variationsreihe, das heißt, es handelt sich um Zahlen, die angeben, wie häufig bestimmte Varianten in der Verteilungsreihe vorkommen. Die Summe aller Häufigkeiten bestimmt die Größe der Gesamtpopulation, ihr Volumen. Frequenzen werden als Häufigkeiten bezeichnet, die in Bruchteilen einer Einheit oder als Prozentsatz der Gesamtsumme ausgedrückt werden. Dementsprechend beträgt die Summe der Häufigkeiten 1 oder 100 %.

Abhängig von der Art der Variation eines Merkmals werden drei Formen von Variationsreihen unterschieden: Rangreihen, diskrete Reihen und Intervallreihen.

Rangierte Variationsserie - Dies ist die Verteilung einzelner Bevölkerungseinheiten in aufsteigender oder absteigender Reihenfolge des untersuchten Merkmals. Mit der Rangfolge können Sie quantitative Daten einfach in Gruppen einteilen, die kleinsten und größten Werte eines Merkmals sofort erkennen und die am häufigsten wiederholten Werte hervorheben.

Diskrete Variationsreihe charakterisiert die Verteilung von Bevölkerungseinheiten gemäß einem diskreten Merkmal, das nur ganzzahlige Werte annimmt. Zum Beispiel Tarifkategorie, Anzahl der Kinder in der Familie, Anzahl der Mitarbeiter im Unternehmen usw.

Weist ein Merkmal eine kontinuierliche Änderung auf, die innerhalb gewisser Grenzen beliebige Werte („von – bis“) annehmen kann, dann ist für dieses Merkmal ein Aufbau erforderlich Intervallvariationsreihe . Zum Beispiel die Höhe des Einkommens, die Betriebszugehörigkeit, die Kosten des Anlagevermögens des Unternehmens usw.

Beispiele zur Lösung von Problemen zum Thema „Statistische Zusammenfassung und Gruppierung“

Problem 1 . Es gibt Informationen über die Anzahl der Bücher, die Studierende im vergangenen Studienjahr durch Abonnements erhalten haben.

Konstruieren Sie geordnete und diskrete Variationsverteilungsreihen und bezeichnen Sie die Elemente der Reihe.

Lösung

Dieses Set bietet viele Optionen für die Anzahl der Bücher, die die Schüler erhalten. Zählen wir die Anzahl solcher Optionen und ordnen sie in Form von Variationsreihen mit Rangfolge und Variationsreihen mit diskreter Verteilung an.

Problem 2 . Es liegen Daten zu den Kosten des Anlagevermögens für 50 Unternehmen in Tausend Rubel vor.

Erstellen Sie eine Verteilungsreihe und markieren Sie dabei 5 Unternehmensgruppen (in gleichen Abständen).

Lösung

Zur Lösung wählen wir den größten und kleinsten Wert des Anlagevermögens von Unternehmen aus. Dies sind 30,0 und 10,2 Tausend Rubel.

Ermitteln wir die Größe des Intervalls: h = (30,0-10,2):5= 3,96 Tausend Rubel.

Zur ersten Gruppe gehören dann Unternehmen, deren Anlagevermögen 10,2 Tausend Rubel beträgt. bis zu 10,2+3,96=14,16 Tausend Rubel. Es wird 9 solcher Unternehmen geben. Die zweite Gruppe umfasst Unternehmen, deren Anlagevermögen 14,16 Tausend Rubel beträgt. bis zu 14,16+3,96=18,12 Tausend Rubel. Es wird 16 solcher Unternehmen geben. Ebenso ermitteln wir die Anzahl der Unternehmen in der dritten, vierten und fünften Gruppe.

Die resultierende Verteilungsreihe tragen wir in die Tabelle ein.

Problem 3 . Für eine Reihe von Unternehmen der Leichtindustrie wurden folgende Daten erhoben:

Gruppieren Sie die Unternehmen nach der Anzahl der Arbeitnehmer und bilden Sie in gleichen Abständen 6 Gruppen. Berechnen Sie für jede Gruppe:

1. Anzahl der Unternehmen
2. Anzahl der Arbeitnehmer
3. Menge der pro Jahr produzierten Produkte
4. durchschnittliche tatsächliche Leistung pro Arbeitnehmer
5. Volumen des Anlagevermögens
6. durchschnittliche Größe des Anlagevermögens eines Unternehmens
7. Durchschnittswert der von einem Unternehmen hergestellten Produkte

Stellen Sie die Berechnungsergebnisse in Tabellen dar. Schlussfolgerungen.

Lösung

Zur Lösung wählen wir den größten und kleinsten Wert der durchschnittlichen Zahl der Arbeitnehmer im Unternehmen aus. Dies sind 43 und 256.

Ermitteln wir die Größe des Intervalls: h = (256-43):6 = 35,5

Zur ersten Gruppe gehören dann Unternehmen, deren durchschnittliche Beschäftigtenzahl zwischen 43 und 43 + 35,5 = 78,5 Personen liegt. Es wird 5 solcher Unternehmen geben. Zur zweiten Gruppe gehören Unternehmen, deren durchschnittliche Beschäftigtenzahl zwischen 78,5 und 78,5 + 35,5 = 114 Personen liegt. Es wird 12 solcher Unternehmen geben. Ebenso ermitteln wir die Anzahl der Unternehmen in der dritten, vierten, fünften und sechsten Gruppe.

Die resultierenden Verteilungsreihen stellen wir in eine Tabelle ein und berechnen die notwendigen Indikatoren für jede Gruppe:

Abschluss : Wie aus der Tabelle hervorgeht, ist die zweite Unternehmensgruppe am zahlreichsten. Es umfasst 12 Unternehmen. Die kleinsten Gruppen sind die fünfte und sechste Gruppe (jeweils zwei Unternehmen). Dies sind die größten Unternehmen (gemessen an der Zahl der Arbeitnehmer).

Da die zweite Gruppe die größte ist, sind das Volumen der pro Jahr von Unternehmen dieser Gruppe produzierten Produkte und das Volumen des Anlagevermögens deutlich höher als bei anderen. Gleichzeitig ist die durchschnittliche tatsächliche Leistung pro Arbeitnehmer in den Unternehmen dieser Gruppe nicht die höchste. Hier sind Unternehmen der vierten Gruppe führend. Auf diese Gruppe entfällt auch ein relativ großes Volumen des Anlagevermögens.

Zusammenfassend stellen wir fest, dass die durchschnittliche Größe des Anlagevermögens und die durchschnittliche Produktionsmenge eines Unternehmens direkt proportional zur Größe des Unternehmens (in Bezug auf die Anzahl der Arbeitnehmer) sind.

Gruppierung- Dies ist die Aufteilung einer Bevölkerung in Gruppen, die nach einem bestimmten Merkmal homogen sind.

Zweck des Dienstes. Mit dem Online-Rechner können Sie:

  • Erstellen Sie eine Variationsreihe, ein Histogramm und ein Polygon erstellen;
  • Finden Sie Variationsindikatoren (Durchschnitt, Modus (auch grafisch), Median, Variationsbereich, Quartile, Dezile, Quartildifferenzierungskoeffizient, Variationskoeffizient und andere Indikatoren);

Anweisungen. Um eine Reihe zu gruppieren, müssen Sie den Typ der erhaltenen Variationsreihe (diskret oder Intervall) auswählen und die Datenmenge (Anzahl der Zeilen) angeben. Die resultierende Lösung wird in einer Word-Datei gespeichert (siehe Beispiel für die Gruppierung statistischer Daten).

Anzahl der Eingabedaten
",0);">

Wenn die Gruppierung bereits durchgeführt wurde und die diskrete Variationsreihe oder Intervallreihe, dann müssen Sie den Online-Rechner Variationsindizes verwenden. Testen der Hypothese über die Art der Verteilung erfolgt über den Dienst Studium des Verteilungsformulars.

Arten statistischer Gruppierungen

Variationsreihe. Bei Beobachtungen einer diskreten Zufallsvariablen kann derselbe Wert mehrmals vorkommen. Solche Werte x i einer Zufallsvariablen werden aufgezeichnet und geben an, wie oft sie in n Beobachtungen vorkommt. Dies ist die Häufigkeit dieses Werts.
Im Falle einer kontinuierlichen Zufallsvariablen wird in der Praxis die Gruppierung verwendet.
  1. Typologische Gruppierung- Dies ist die Einteilung der untersuchten qualitativ heterogenen Bevölkerung in Klassen, sozioökonomische Typen und homogene Einheitengruppen. Um diese Gruppierung zu erstellen, verwenden Sie den Parameter „Diskrete Variationsreihe“.
  2. Eine Gruppierung wird als strukturell bezeichnet, bei dem eine homogene Bevölkerung in Gruppen eingeteilt wird, die ihre Struktur anhand unterschiedlicher Merkmale charakterisieren. Um diese Gruppierung zu erstellen, verwenden Sie den Parameter „Intervallreihe“.
  3. Eine Gruppierung, die die Beziehungen zwischen den untersuchten Phänomenen und ihren Eigenschaften aufzeigt, wird aufgerufen analytische Gruppe(siehe analytische Gruppierung von Reihen).

Grundsätze zur Erstellung statistischer Gruppierungen

Eine Reihe von Beobachtungen, die in aufsteigender Reihenfolge geordnet sind, wird Variationsreihe genannt. Gruppierungsfunktion ist ein Merkmal, anhand dessen eine Bevölkerung in verschiedene Gruppen unterteilt wird. Es wird als Basis der Gruppe bezeichnet. Die Gruppierung kann sowohl auf quantitativen als auch auf qualitativen Merkmalen basieren.
Nachdem die Grundlage der Gruppierung festgelegt wurde, sollte über die Anzahl der Gruppen entschieden werden, in die die untersuchte Bevölkerung eingeteilt werden soll.

Beim Einsatz von Personalcomputern zur Verarbeitung statistischer Daten erfolgt die Gruppierung von Objekteinheiten nach Standardverfahren.
Ein solches Verfahren basiert auf der Verwendung der Sturgess-Formel zur Bestimmung der optimalen Gruppenanzahl:

k = 1+3,322*log(N)

Dabei ist k die Anzahl der Gruppen und N die Anzahl der Bevölkerungseinheiten.

Die Länge der Teilintervalle wird berechnet als h=(x max -x min)/k

Dann wird die Anzahl der Beobachtungen, die in diese Intervalle fallen, gezählt und als Häufigkeiten ni angenommen. Wenige Frequenzen, deren Werte kleiner als 5 sind (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Als neue Werte werden die Mittelwerte der Intervalle x i =(c i-1 +c i)/2 übernommen.

Das Senden Ihrer guten Arbeit an die Wissensdatenbank ist ganz einfach. Nutzen Sie das untenstehende Formular

Studierende, Doktoranden und junge Wissenschaftler, die die Wissensbasis in ihrem Studium und ihrer Arbeit nutzen, werden Ihnen sehr dankbar sein.

Veröffentlicht am http://www.allbest.ru/

AUFGABE1

Über die Löhne der Arbeitnehmer im Unternehmen liegen folgende Daten vor:

Tabelle 1.1

Die Höhe des Lohns in konventioneller Hinsicht. Höhle. Einheiten

Es ist erforderlich, eine Intervallverteilungsreihe zu erstellen, anhand derer ermittelt werden soll;

1) Durchschnittsgehalt;

2) durchschnittliche lineare Abweichung;

4) Standardabweichung;

5) Variationsbereich;

6) Schwingungskoeffizient;

7) linearer Variationskoeffizient;

8) einfacher Variationskoeffizient;

10) Mittelwert;

11) Asymmetriekoeffizient;

12) Pearson-Asymmetrieindex;

13) Kurtosis-Koeffizient.

Lösung

Wie Sie wissen, sind die Optionen (erkannte Werte) in aufsteigender Reihenfolge angeordnet diskrete Variationsreihe. Mit einer großen Anzahl Option (mehr als 10) werden auch bei diskreter Variation Intervallreihen konstruiert.

Wenn eine Intervallreihe mit geraden Intervallen erstellt wird, wird der Variationsbereich durch die angegebene Anzahl von Intervallen geteilt. Wenn der resultierende Wert darüber hinaus ganzzahlig und eindeutig ist (was selten vorkommt), wird davon ausgegangen, dass die Länge des Intervalls dieser Zahl entspricht. In anderen Fällen produziert Rundung Notwendig V Seite Zunahme, Also Zu die letzte verbleibende Ziffer war gerade. Offensichtlich nimmt die Länge des Intervalls zu Variationsbereich um einen Betrag, der dem Produkt aus der Anzahl der Intervalle und der Differenz zwischen der berechneten und der ursprünglichen Länge des Intervalls entspricht

A) Wenn die Größe der Erweiterung des Variationsbereichs unbedeutend ist, wird sie entweder zum größten Wert des Merkmals addiert oder vom kleinsten Wert abgezogen;

b) Wenn das Ausmaß der Erweiterung des Variationsbereichs erkennbar ist, wird dieser, um eine Verwechslung der Mitte des Bereichs zu vermeiden, grob halbiert, indem gleichzeitig zu den größten Werten addiert und von den kleinsten Werten subtrahiert wird das Merkmal.

Wenn eine Intervallreihe mit ungleichen Intervallen erstellt wird, vereinfacht sich der Vorgang, allerdings muss die Länge der Intervalle immer noch als Zahl mit der letzten geraden Ziffer ausgedrückt werden, was nachfolgende Berechnungen numerischer Merkmale erheblich vereinfacht.

30 ist die Stichprobengröße.

Erstellen wir eine Intervallverteilungsreihe mithilfe der Sturges-Formel:

K = 1 + 3,32*log n,

K – Anzahl der Gruppen;

K = 1 + 3,32*lg 30 = 5,91=6

Wir ermitteln den Bereich des Attributs – Löhne der Arbeitnehmer im Unternehmen – (x) mithilfe der Formel

R= xmax - xmin und durch 6 dividieren; R= 195-112=83

Dann beträgt die Länge des Intervalls l Spur=83:6=13,83

Der Anfang des ersten Intervalls ist 112. Addition zu 112 l ras = 13,83, wir erhalten seinen Endwert 125,83, der auch der Beginn des zweiten Intervalls ist usw. Ende des fünften Intervalls - 195.

Bei der Suche nach Häufigkeiten sollte man sich an der Regel orientieren: „Wenn der Wert eines Merkmals mit der Grenze des internen Intervalls übereinstimmt, sollte es dem vorherigen Intervall zugeordnet werden.“

Wir erhalten eine Intervallreihe von Häufigkeiten und Summenhäufigkeiten.

Tabelle 1.2

Daher haben 3 Mitarbeiter ein Gehalt. Gebühr von 112 auf 125,83 konventionelle Währungseinheiten. Höchstes Gehalt Gebühr von 181,15 auf 195 konventionelle Währungseinheiten. nur 6 Mitarbeiter.

Um numerische Eigenschaften zu berechnen, transformieren wir die Intervallreihe in eine diskrete Reihe, wobei wir optional die Mitte der Intervalle nehmen:

Tabelle 1.3

14131,83

Verwendung der gewichteten arithmetischen Mittelformel

herkömmliche Währungseinheiten

Durchschnittliche lineare Abweichung:

wobei xi der Wert des untersuchten Merkmals für die i-te Einheit der Bevölkerung ist,

Durchschnittswert des untersuchten Merkmals.

Veröffentlicht am http://www.allbest.ru/

LGepostet am http://www.allbest.ru/

Konventionelle Währungseinheiten

Standardabweichung:

Streuung:

Relativer Variationsbereich (Oszillationskoeffizient): c= R:,

Relative lineare Abweichung: q = L:

Der Variationskoeffizient: V = y:

Der Oszillationskoeffizient zeigt die relative Schwankung der Extremwerte eines Merkmals um das arithmetische Mittel und der Variationskoeffizient charakterisiert den Grad und die Homogenität der Grundgesamtheit.

c= R: = 83 / 159,485*100 % = 52,043 %

Somit beträgt die Differenz zwischen den Extremwerten 5,16 % (=94,84 %-100 %) weniger als das durchschnittliche Gehalt der Arbeitnehmer im Unternehmen.

q = L: = 17,765/ 159,485*100 % = 11,139 %

V = y: = 21,704/ 159,485*100 % = 13,609 %

Der Variationskoeffizient beträgt weniger als 33 %, was auf eine schwache Variation der Löhne der Arbeitnehmer im Unternehmen hinweist, d. h. dass der Durchschnittswert ein typisches Merkmal des Arbeiterlohns ist (die Bevölkerung ist homogen).

In Intervallverteilungsreihen Mode bestimmt durch die Formel -

Häufigkeit des Modalintervalls, d. h. des Intervalls mit der größten Anzahl an Optionen;

Häufigkeit des Intervalls vor dem Modal;

Häufigkeit des dem Modal folgenden Intervalls;

Modale Intervalllänge;

Die untere Grenze des Modalintervalls.

Zur Bestimmung Mediane In der Intervallreihe verwenden wir die Formel

wo ist die kumulative (akkumulierte) Häufigkeit des Intervalls vor dem Median;

Untere Grenze des Medianintervalls;

Mittlere Intervallhäufigkeit;

Länge des Medianintervalls.

Medianintervall- ein Intervall, dessen kumulierte Häufigkeit (=3+3+5+7) die Hälfte der Summe der Häufigkeiten übersteigt - (153,49; 167,32).

Berechnen wir Asymmetrie und Kurtosis, wofür wir ein neues Arbeitsblatt erstellen:

Tabelle 1.4

Sachliche Daten

Berechnungsdaten

Berechnen wir das Moment dritter Ordnung

Daher ist die Asymmetrie gleich

Ab 0,3553 0,25 gilt die Asymmetrie als signifikant.

Berechnen wir das Moment vierter Ordnung

Daher ist die Kurtosis gleich

Als< 0, то эксцесс является плосковершинным.

Der Grad der Asymmetrie kann mithilfe des Pearson-Asymmetriekoeffizienten (As) bestimmt werden: Schwingungsprobenwertumsatz

wo ist das arithmetische Mittel der Verteilungsreihe; -- Mode; -- Standardabweichung.

Bei einer symmetrischen (Normal-)Verteilung = Mo ist der Asymmetriekoeffizient daher Null. Wenn As > 0, dann gibt es mehr Mode, also liegt eine rechtshändige Asymmetrie vor.

Als ob< 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

Die Verteilung ist nicht symmetrisch, sondern weist eine linksseitige Asymmetrie auf.

AUFGABE 2

Wie groß sollte die Stichprobengröße sein, damit bei einer Wahrscheinlichkeit von 0,954 der Stichprobenfehler 0,04 nicht überschreitet, wenn aufgrund früherer Erhebungen bekannt ist, dass die Varianz 0,24 beträgt?

Lösung

Der Stichprobenumfang für nicht-repetitive Stichproben wird nach folgender Formel berechnet:

t – Konfidenzkoeffizient (bei einer Wahrscheinlichkeit von 0,954 entspricht er 2,0; ermittelt aus Tabellen der Wahrscheinlichkeitsintegrale),

y2=0,24 – Standardabweichung;

10.000 Menschen - Stichprobengröße;

Dx =0,04 – maximaler Fehler des Stichprobenmittelwerts.

Mit einer Wahrscheinlichkeit von 95,4 % kann angegeben werden, dass die Stichprobengröße bei einem relativen Fehler von nicht mehr als 0,04 mindestens 566 Familien betragen sollte.

AUFGABE3

Zu den Einnahmen aus der Haupttätigkeit des Unternehmens liegen folgende Daten in Millionen Rubel vor.

Um eine Reihe von Dynamiken zu analysieren, bestimmen Sie die folgenden Indikatoren:

1) Kette und Basis:

Absolute Steigerungen;

Wachstumsraten;

Wachstumsrate;

2) durchschnittlich

Dynamikzeilenebene;

Absoluter Anstieg;

Wachstumsrate;

Zunahme;

3) absoluter Wert einer Steigerung von 1 %.

Lösung

1. Absoluter Anstieg (Dy)- Dies ist der Unterschied zwischen der nächsten Stufe der Serie und der vorherigen (oder Basisstufe):

Kette: DN = yi - yi-1,

Grundlegend: DN = yi - y0,

уi – Zeilenebene,

i – Zeilenebenennummer,

y0 – Basisjahrniveau.

2. Wachstumsrate (Tu) ist das Verhältnis des nachfolgenden Niveaus der Reihe zum vorherigen (oder Basisjahr 2001):

Kette: Tu = ;

Grundlegend: Di =

3. Wachstumsrate (TD) ist das Verhältnis des absoluten Wachstums zum vorherigen Niveau, ausgedrückt in %.

Kette: Tu = ;

Grundlegend: Di =

4. Absoluter Wert einer Steigerung um 1 % (A)- Dies ist das Verhältnis des absoluten Kettenwachstums zur Wachstumsrate, ausgedrückt in %.

A =

Durchschnittliche Zeilenebene berechnet nach der arithmetischen Mittelformel.

Durchschnittliches Einkommensniveau aus Kernaktivitäten für 4 Jahre:

Durchschnittlicher absoluter Anstieg berechnet nach der Formel:

wobei n die Anzahl der Ebenen der Reihe ist.

Im Jahresdurchschnitt stiegen die Einnahmen aus Kernaktivitäten um 3,333 Millionen Rubel.

Durchschnittliche jährliche Wachstumsrate berechnet nach der geometrischen Mittelformel:

уn ist die letzte Ebene der Zeile,

y0 ist das Anfangsniveau der Reihe.

Tu = 100 % = 102,174 %

Durchschnittliche jährliche Wachstumsrate berechnet nach der Formel:

T? = Di - 100 % = 102,74 % - 100 % = 2,74 %.

Somit stiegen die Einnahmen aus der Haupttätigkeit des Unternehmens im Jahresdurchschnitt um 2,74 %.

AUFGABENA4

Berechnung:

1. Individuelle Preisindizes;

2. Allgemeiner Handelsumsatzindex;

3. Gesamtpreisindex;

4. Gesamtindex des physischen Warenverkaufsvolumens;

5. Teilen Sie die absolute Wertsteigerung des Handelsumsatzes nach Faktoren auf (aufgrund von Preisänderungen und der Anzahl der verkauften Waren);

6. Ziehen Sie kurze Schlussfolgerungen zu allen erhaltenen Indikatoren.

Lösung

1. Gemäß der Bedingung beliefen sich die einzelnen Preisindizes für die Produkte A, B, C auf -

ipA=1,20; iðÑ=1,15; iðВ=1,00.

2. Wir berechnen den allgemeinen Handelsumsatzindex nach der Formel:

I w = = 1470/1045*100 % = 140,67 %

Der Handelsumsatz stieg um 40,67 % (140,67 %-100 %).

Im Durchschnitt stiegen die Rohstoffpreise um 10,24 %.

Die Höhe der Mehrkosten der Käufer durch Preiserhöhungen:

w(p) = ? p1q1 - ? p0q1 = 1470 - 1333,478 = 136,522 Millionen Rubel.

Aufgrund steigender Preise mussten Käufer zusätzlich 136,522 Millionen Rubel ausgeben.

4. Allgemeiner Index des physischen Handelsvolumens:

Das physische Handelsvolumen stieg um 27,61 %.

5. Bestimmen wir die Gesamtveränderung des Handelsumsatzes im zweiten Zeitraum im Vergleich zum ersten Zeitraum:

w = 1470-1045 = 425 Millionen Rubel.

aufgrund von Preisänderungen:

W(p) = 1470 - 1333,478 = 136,522 Millionen Rubel.

aufgrund von Änderungen des physikalischen Volumens:

w(q) = 1333,478 - 1045 = 288,478 Millionen Rubel.

Der Warenumschlag stieg um 40,67 %. Die Preise für drei Waren stiegen im Durchschnitt um 10,24 %. Das physische Handelsvolumen stieg um 27,61 %.

Im Allgemeinen stieg das Verkaufsvolumen um 425 Millionen Rubel, unter anderem aufgrund steigender Preise um 136,522 Millionen Rubel und aufgrund eines Anstiegs des Verkaufsvolumens um 288,478 Millionen Rubel.

AUFGABE5

Die folgenden Daten sind für 10 Fabriken in einer Branche verfügbar.

Anlagennummer

Produktleistung, tausend Stück. (X)

Basierend auf den angegebenen Daten:

I) Um die Bestimmungen der logischen Analyse über das Vorhandensein einer linearen Korrelation zwischen der Faktoreigenschaft (Produktvolumen) und der resultierenden Eigenschaft (Stromverbrauch) zu bestätigen, zeichnen Sie die Ausgangsdaten in das Diagramm des Korrelationsfelds ein und ziehen Sie Schlussfolgerungen über die Form der Beziehung, geben Sie ihre Formel an;

2) Bestimmen Sie die Parameter der Verbindungsgleichung und zeichnen Sie die resultierende theoretische Linie auf dem Diagramm des Korrelationsfelds auf;

3) Berechnen Sie den linearen Korrelationskoeffizienten.

4) die Bedeutung der in den Absätzen 2) und 3) ermittelten Indikatoren erläutern;

5) Erstellen Sie anhand des resultierenden Modells eine Prognose über den möglichen Energieverbrauch in einem Werk mit einem Produktionsvolumen von 4,5 Tausend Einheiten.

Lösung

Die Daten des Attributs – das Produktionsvolumen (Faktor) – werden mit xi bezeichnet; Vorzeichen - Stromverbrauch (Ergebnis) durch yi; Auf dem Korrelationsfeld OXY werden Punkte mit den Koordinaten (x, y) aufgetragen.

Die Punkte des Korrelationsfeldes liegen entlang einer bestimmten Geraden. Daher ist die Beziehung linear; wir suchen nach einer Regressionsgleichung in Form einer Geraden Уx=ax+b. Um es zu finden, verwenden wir das System normaler Gleichungen:

Lassen Sie uns eine Berechnungstabelle erstellen.

Aus den gefundenen Mittelwerten stellen wir ein System zusammen und lösen es nach den Parametern a und b:

Wir erhalten also die Regressionsgleichung für y auf x: = 3,57692 x + 3,19231

Wir erstellen eine Regressionsgerade auf dem Korrelationsfeld.

Durch Einsetzen der x-Werte aus Spalte 2 in die Regressionsgleichung erhalten wir die berechneten (Spalte 7) und vergleichen sie mit den y-Daten, die sich in Spalte 8 widerspiegeln. Die Richtigkeit der Berechnungen wird übrigens durch bestätigt das Zusammentreffen der Durchschnittswerte von y und.

Koeffizientlineare Korrelation bewertet die Nähe der Beziehung zwischen den Merkmalen x und y und wird anhand der Formel berechnet

Der Winkelkoeffizient der direkten Regression a (bei x) charakterisiert die Richtung des IdentifiziertenAbhängigkeitenVorzeichen: für a>0 sind sie gleich, für a<0- противоположны. Es ist absolut Wert – ein Maß für die Änderung des resultierenden Merkmals, wenn sich das Faktormerkmal um eine Maßeinheit ändert.

Der freie Term der direkten Regression gibt die Richtung an und sein absoluter Wert ist ein quantitatives Maß für den Einfluss aller anderen Faktoren auf das resultierende Merkmal.

Wenn< 0, dann wird die Ressource des Faktors, der für ein einzelnes Objekt charakteristisch ist, mit weniger und wann verwendet>0 Mithöhere Effizienz als der Durchschnitt für die gesamte Objektmenge.

Lassen Sie uns eine Post-Regressionsanalyse durchführen.

Der Koeffizient bei x der direkten Regression ist gleich 3,57692 >0, daher steigt (sinkt) mit einer Zunahme (Abnahme) der Produktionsleistung der Stromverbrauch. Steigerung der Produktionsleistung um 1.000 Einheiten. ergibt einen durchschnittlichen Anstieg des Stromverbrauchs um 3,57692 Tausend kWh.

2. Der freie Term der direkten Regression beträgt 3,19231, daher erhöht der Einfluss anderer Faktoren den Einfluss der Produktproduktion auf den Stromverbrauch in absoluten Zahlen um 3,19231 Tausend kWh.

3. Der Korrelationskoeffizient von 0,8235 zeigt eine sehr enge Abhängigkeit des Stromverbrauchs vom Produktoutput.

Mithilfe der Regressionsmodellgleichung lassen sich leicht Vorhersagen treffen. Dazu werden die Werte von x – dem Produktionsvolumen – in die Regressionsgleichung eingesetzt und der Stromverbrauch vorhergesagt. In diesem Fall können die Werte von x nicht nur innerhalb eines bestimmten Bereichs, sondern auch außerhalb dieses Bereichs angenommen werden.

Lassen Sie uns eine Prognose über den möglichen Energieverbrauch in einem Werk mit einem Produktionsvolumen von 4,5 Tausend Einheiten erstellen.

3,57692*4,5 + 3,19231= 19,288 45 Tausend kWh.

LISTE DER VERWENDETEN QUELLEN

1. Sacharenkow S.N. Sozioökonomische Statistik: Lehrbuch und praktischer Leitfaden. -Mn.: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. Allgemeine Theorie der Statistik. - M.: INFRA - M., 2000.

3. Eliseeva I.I. Statistiken. - M.: Prospekt, 2002.

4. Allgemeine Theorie der Statistik / Allgemein. Hrsg. O.E. Bashina, A.A. Spirina. - M.: Finanzen und Statistik, 2000.

5. Sozioökonomische Statistik: Pädagogisch und praktisch. Zulage / Zakharenkov S.N. und andere – Mn.: Yerevan State University, 2004.

6. Sozioökonomische Statistik: Lehrbuch. Zuschuss. / Ed. Nesterovich S.R. - Mn.: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Statistik. - Minsk, 2000.

8. Kharchenko L.P. Statistiken. - M.: INFRA - M, 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Statistiken. - M.: INFRA - M, 1999.

10. Wirtschaftsstatistik / Ed. Yu.N. Ivanova - M., 2000.

Gepostet auf Allbest.ru

...

Ähnliche Dokumente

    Berechnung des arithmetischen Mittels für eine Intervallverteilungsreihe. Bestimmung des allgemeinen Index des physischen Handelsvolumens. Analyse der absoluten Änderung der Gesamtproduktionskosten aufgrund von Änderungen des physischen Volumens. Berechnung des Variationskoeffizienten.

    Test, hinzugefügt am 19.07.2010

    Die Essenz von Groß-, Einzelhandel und öffentlichem Handel. Formeln zur Berechnung individueller und aggregierter Umsatzindizes. Berechnung der Merkmale einer Intervallverteilungsreihe – arithmetisches Mittel, Modus und Median, Variationskoeffizient.

    Kursarbeit, hinzugefügt am 10.05.2013

    Berechnung des geplanten und tatsächlichen Umsatzvolumens, Prozentsatz der Planerfüllung, absolute Umsatzänderung. Ermittlung des absoluten Wachstums, der durchschnittlichen Wachstumsraten und der Steigerung der Bareinnahmen. Berechnung struktureller Durchschnittswerte: Moden, Mediane, Quartile.

    Test, hinzugefügt am 24.02.2012

    Intervallreihe der Verteilung der Banken nach Gewinnvolumen. Ermitteln des Modus und des Medians der resultierenden Intervallverteilungsreihe mithilfe einer grafischen Methode und durch Berechnungen. Berechnung der Merkmale von Intervallverteilungsreihen. Berechnung des arithmetischen Mittels.

    Test, hinzugefügt am 15.12.2010

    Formeln zur Bestimmung der Durchschnittswerte einer Intervallreihe – Moden, Mediane, Streuung. Berechnung analytischer Indikatoren von Dynamikreihen anhand von Ketten- und Grundschemata, Wachstumsraten und Inkrementen. Das Konzept eines konsolidierten Kosten-, Preis-, Ausgaben- und Umsatzindex.

    Kursarbeit, hinzugefügt am 27.02.2011

    Konzept und Zweck, Reihenfolge und Regeln für den Aufbau einer Variationsreihe. Analyse der Datenhomogenität in Gruppen. Indikatoren für die Variation (Fluktuation) eines Merkmals. Bestimmung der durchschnittlichen linearen und quadratischen Abweichung, des Schwingungs- und Variationskoeffizienten.

    Test, hinzugefügt am 26.04.2010

    Das Konzept von Modus und Median als typische Merkmale, die Reihenfolge und Kriterien für ihre Bestimmung. Ermitteln des Modus und des Medians in diskreten und Intervallvariationsreihen. Quartile und Dezile als zusätzliche Merkmale einer Variationsstatistikreihe.

    Test, hinzugefügt am 11.09.2010

    Konstruktion einer Intervallverteilungsreihe basierend auf Gruppierungsmerkmalen. Merkmale der Abweichung der Häufigkeitsverteilung von einer symmetrischen Form, Berechnung von Kurtosis- und Asymmetrieindikatoren. Analyse von Bilanz- oder Gewinn- und Verlustrechnungskennzahlen.

    Test, hinzugefügt am 19.10.2014

    Konvertieren empirischer Reihen in diskrete Reihen und Intervallreihen. Bestimmung des Mittelwerts für eine diskrete Reihe anhand ihrer Eigenschaften. Berechnung unter Verwendung einer diskreten Reihe von Modus-, Median- und Variationsindikatoren (Streuung, Abweichung, Oszillationskoeffizient).

    Test, hinzugefügt am 17.04.2011

    Erstellung einer statistischen Reihe zur Verteilung von Organisationen. Grafische Ermittlung der Mode- und Medianwerte. Die Nähe der Korrelation anhand des Bestimmtheitsmaßes. Ermittlung des Stichprobenfehlers der durchschnittlichen Mitarbeiterzahl.