घर · एक नोट पर · रैखिक सहसंबंध गुणांक की गणना कैसे करें. एक्सेल में एकाधिक सहसंबंध गुणांक (एक्सेल)

रैखिक सहसंबंध गुणांक की गणना कैसे करें. एक्सेल में एकाधिक सहसंबंध गुणांक (एक्सेल)

आज का लेख इस बारे में बात करेगा कि चर एक दूसरे से कैसे संबंधित हो सकते हैं। सहसंबंध का उपयोग करके, हम यह निर्धारित कर सकते हैं कि पहले और दूसरे चर के बीच कोई संबंध है या नहीं। मुझे आशा है कि आपको यह गतिविधि पिछली गतिविधियों की तरह ही मज़ेदार लगेगी!

सहसंबंध x और y के बीच संबंध की मजबूती और दिशा को मापता है। यह चित्र क्रमित जोड़े (x, y) के स्कैटर प्लॉट के रूप में विभिन्न प्रकार के सहसंबंध दिखाता है। परंपरागत रूप से, x चर को क्षैतिज अक्ष पर रखा जाता है और y चर को ऊर्ध्वाधर अक्ष पर रखा जाता है।

ग्राफ़ A एक सकारात्मक रैखिक सहसंबंध का एक उदाहरण है: जैसे-जैसे x बढ़ता है, y भी बढ़ता है, और रैखिक रूप से। ग्राफ़ बी हमें नकारात्मक रैखिक सहसंबंध का एक उदाहरण दिखाता है, जहां x बढ़ने पर, y रैखिक रूप से घटता है। ग्राफ C में हम देखते हैं कि x और y के बीच कोई संबंध नहीं है। ये चर एक-दूसरे को किसी भी तरह से प्रभावित नहीं करते हैं।

अंत में, ग्राफ़ डी चरों के बीच गैर-रैखिक संबंधों का एक उदाहरण है। जैसे-जैसे x बढ़ता है, y पहले घटता है, फिर दिशा बदलता है और बढ़ता है।

लेख का शेष भाग आश्रित और स्वतंत्र चर के बीच रैखिक संबंधों पर केंद्रित है।

सहसंबंध गुणांक

सहसंबंध गुणांक, आर, हमें स्वतंत्र और आश्रित चर के बीच संबंध की ताकत और दिशा दोनों प्रदान करता है। r का मान - 1.0 और + 1.0 के बीच होता है। जब r सकारात्मक होता है, तो x और y के बीच संबंध सकारात्मक होता है (आकृति में ग्राफ A), और जब r नकारात्मक होता है, तो संबंध भी नकारात्मक होता है (ग्राफ B)। शून्य के करीब सहसंबंध गुणांक इंगित करता है कि x और y (ग्राफ C) के बीच कोई संबंध नहीं है।

x और y के बीच संबंध की मजबूती इस बात से निर्धारित होती है कि सहसंबंध गुणांक - 1.0 या +- 1.0 के करीब है या नहीं। निम्नलिखित चित्र का अध्ययन करें.

ग्राफ़ A, r = + 1.0 पर x और y के बीच एक पूर्ण सकारात्मक सहसंबंध दिखाता है। ग्राफ़ बी - आर = - 1.0 पर एक्स और वाई के बीच आदर्श नकारात्मक सहसंबंध। ग्राफ़ सी और डी आश्रित और स्वतंत्र चर के बीच कमजोर संबंधों के उदाहरण हैं।

सहसंबंध गुणांक, आर, आश्रित और स्वतंत्र चर के बीच संबंध की ताकत और दिशा दोनों निर्धारित करता है। आर मान - 1.0 (मजबूत नकारात्मक संबंध) से + 1.0 (मजबूत सकारात्मक संबंध) तक होता है। जब r = 0 होता है तो चर x और y के बीच कोई संबंध नहीं होता है।

हम निम्नलिखित समीकरण का उपयोग करके वास्तविक सहसंबंध गुणांक की गणना कर सकते हैं:

अच्छा अच्छा! मैं जानता हूं कि यह समीकरण अजीब प्रतीकों की एक डरावनी गड़बड़ी जैसा दिखता है, लेकिन इससे पहले कि हम घबराएं, आइए इस पर एक परीक्षा ग्रेड का उदाहरण लागू करें। मान लीजिए कि मैं यह निर्धारित करना चाहता हूं कि क्या एक छात्र द्वारा सांख्यिकी का अध्ययन करने में बिताए गए घंटों की संख्या और अंतिम परीक्षा ग्रेड के बीच कोई संबंध है। नीचे दी गई तालिका हमें इस समीकरण को कई सरल गणनाओं में तोड़ने और उन्हें अधिक प्रबंधनीय बनाने में मदद करेगी।

जैसा कि आप देख सकते हैं, किसी विषय का अध्ययन करने के लिए समर्पित घंटों की संख्या और परीक्षा ग्रेड के बीच एक बहुत मजबूत सकारात्मक संबंध है। इसके बारे में जानकर शिक्षक बहुत प्रसन्न होंगे।

समान चरों के बीच संबंध स्थापित करने से क्या लाभ है? बढ़िया सवाल. यदि कोई संबंध अस्तित्व में पाया जाता है, तो हम विषय का अध्ययन करने में बिताए गए घंटों की एक निश्चित संख्या के आधार पर परीक्षा परिणामों की भविष्यवाणी कर सकते हैं। सीधे शब्दों में कहें तो कनेक्शन जितना मजबूत होगा, हमारी भविष्यवाणी उतनी ही सटीक होगी।

सहसंबंध गुणांक की गणना करने के लिए एक्सेल का उपयोग करना

मुझे यकीन है कि इन भयानक सहसंबंध गुणांक गणनाओं को देखने के बाद, आपको यह जानकर सचमुच खुशी होगी कि एक्सेल निम्नलिखित विशेषताओं के साथ CORREL फ़ंक्शन का उपयोग करके आपके लिए यह सब काम कर सकता है:

कोरेल (सरणी 1; सारणी 2),

सरणी 1 = पहले चर के लिए डेटा रेंज,

सरणी 2 = दूसरे चर के लिए डेटा श्रेणी।

उदाहरण के लिए, यह आंकड़ा परीक्षा ग्रेड उदाहरण के लिए सहसंबंध गुणांक की गणना करने के लिए उपयोग किए जाने वाले CORREL फ़ंक्शन को दिखाता है।

सहसंबंध गुणांक की गणना करके रिश्ते की मात्रात्मक विशेषता प्राप्त की जा सकती है।

एक्सेल में सहसंबंध विश्लेषण

फ़ंक्शन का सामान्य रूप CORREL(array1, array2) है। "Array1" फ़ील्ड में, किसी एक मान की कोशिकाओं की श्रेणी के निर्देशांक दर्ज करें, जिसकी निर्भरता निर्धारित की जानी चाहिए। जैसा कि आप देख सकते हैं, सहसंबंध गुणांक एक संख्या के रूप में हमारे द्वारा पहले चयनित सेल में दिखाई देता है। सहसंबंध विश्लेषण मापदंडों वाली एक विंडो खुलती है। पिछली विधि के विपरीत, "इनपुट अंतराल" फ़ील्ड में हम प्रत्येक कॉलम के अंतराल को अलग से नहीं, बल्कि विश्लेषण में भाग लेने वाले सभी कॉलमों में दर्ज करते हैं। जैसा कि आप देख सकते हैं, एक्सेल एप्लिकेशन एक साथ सहसंबंध विश्लेषण के दो तरीके प्रदान करता है।

एक्सेल में सहसंबंध ग्राफ

6) अंतिम तालिका का पहला तत्व चयनित क्षेत्र के ऊपरी बाएँ कक्ष में दिखाई देगा। इसलिए, H0 परिकल्पना को अस्वीकार कर दिया गया है, अर्थात, प्रतिगमन पैरामीटर और सहसंबंध गुणांक शून्य से यादृच्छिक रूप से भिन्न नहीं हैं, लेकिन सांख्यिकीय रूप से महत्वपूर्ण हैं। 7. प्रतिगमन समीकरण के प्राप्त अनुमान इसे पूर्वानुमान के लिए उपयोग करने की अनुमति देते हैं।

एक्सेल में सहसंबंध गुणांक की गणना कैसे करें

यदि गुणांक 0 है, तो यह इंगित करता है कि मानों के बीच कोई संबंध नहीं है। चर और y के बीच संबंध खोजने के लिए, अंतर्निहित Microsoft Excel "CORREL" फ़ंक्शन का उपयोग करें। उदाहरण के लिए, "Array1" के लिए y मान चुनें, और "Array2" के लिए x मान चुनें। परिणामस्वरूप, आपको प्रोग्राम द्वारा परिकलित सहसंबंध गुणांक प्राप्त होगा। इसके बाद, आपको प्रत्येक x और xav, और yav के बीच अंतर की गणना करने की आवश्यकता है। चयनित कक्षों में, सूत्र x-x, y- लिखें। औसत के साथ कोशिकाओं को पिन करना न भूलें। प्राप्त परिणाम वांछित सहसंबंध गुणांक होगा।

पियर्सन गुणांक की गणना के लिए उपरोक्त सूत्र दर्शाता है कि यदि मैन्युअल रूप से किया जाए तो यह प्रक्रिया कितनी श्रम-गहन है। दूसरा, कृपया सुझाव दें कि डेटा के बड़े प्रसार के साथ विभिन्न नमूनों के लिए किस प्रकार के सहसंबंध विश्लेषण का उपयोग किया जा सकता है? मैं सांख्यिकीय रूप से कैसे साबित कर सकता हूं कि 60 से अधिक उम्र वाले समूह और बाकी सभी लोगों के बीच एक महत्वपूर्ण अंतर है?

DIY: एक्सेल का उपयोग करके मुद्रा सहसंबंधों की गणना करना

उदाहरण के लिए, हम माइक्रोसॉफ्ट एक्सेल का उपयोग करते हैं, लेकिन कोई अन्य प्रोग्राम जिसमें आप सहसंबंध सूत्र का उपयोग कर सकते हैं वह करेगा। 7.इसके बाद EUR/USD डेटा वाले सेल चुनें। 9.EUR/USD और USD/JPY के लिए सहसंबंध गुणांक की गणना करने के लिए Enter दबाएँ। यह हर दिन संख्याओं को अपडेट करने के लायक नहीं है (ठीक है, जब तक कि आप मुद्रा सहसंबंधों से ग्रस्त न हों)।

क्या आपको पहले से ही दो सांख्यिकीय मात्राओं के बीच संबंध की डिग्री की गणना करने और उस सूत्र को निर्धारित करने की आवश्यकता का सामना करना पड़ा है जिसके द्वारा वे सहसंबंधित होते हैं? ऐसा करने के लिए, मैंने CORREL फ़ंक्शन का उपयोग किया - इसके बारे में यहां कुछ जानकारी है। यह दो डेटा श्रेणियों के बीच सहसंबंध की डिग्री लौटाता है। सैद्धांतिक रूप से, सहसंबंध फ़ंक्शन को रैखिक से घातीय या लघुगणक में परिवर्तित करके परिष्कृत किया जा सकता है। डेटा और सहसंबंध ग्राफ़ के विश्लेषण से इसकी विश्वसनीयता में काफी सुधार हो सकता है।

आइए मान लें कि सेल B2 में स्वयं सहसंबंध गुणांक होता है, और सेल B3 में पूर्ण अवलोकनों की संख्या होती है। क्या आपके पास रूसी भाषी कार्यालय है? वैसे, मुझे एक गलती भी मिली - नकारात्मक सहसंबंधों के लिए महत्व की गणना नहीं की जाती है। यदि दोनों चर मीट्रिक हैं और उनका वितरण सामान्य है, तो विकल्प सही है। और क्या केवल एक सीसी का उपयोग करके वक्रों की समानता की कसौटी को चिह्नित करना संभव है? आपके पास "वक्र" की समानता नहीं है, बल्कि दो श्रृंखलाओं की समानता है, जिसे सिद्धांत रूप में एक वक्र द्वारा वर्णित किया जा सकता है।

1. एक्सेल खोलें

2. डेटा कॉलम बनाएं. हमारे उदाहरण में, हम प्रथम-ग्रेडर में आक्रामकता और आत्म-संदेह के बीच संबंध, या सहसंबंध पर विचार करेंगे। प्रयोग में 30 बच्चों ने भाग लिया, डेटा एक्सेल तालिका में प्रस्तुत किया गया है:

1 कॉलम - विषय संख्या

2 कॉलम - आक्रामकताअंकों में

3 कॉलम - संशयअंकों में

3. फिर आपको टेबल के बगल में एक खाली सेल का चयन करना होगा और आइकन पर क्लिक करना होगा एफ(एक्स)एक्सेल पैनल में

4.फ़ंक्शन मेनू खुल जाएगा, आपको श्रेणियों में से चयन करना होगा सांख्यिकीय , और फिर फ़ंक्शंस की सूची में वर्णानुक्रम से खोजें कोरलऔर ओके पर क्लिक करें

5. फिर फ़ंक्शन तर्कों का एक मेनू खुल जाएगा, जो आपको हमारे लिए आवश्यक डेटा कॉलम का चयन करने की अनुमति देगा। पहला कॉलम चुनने के लिए आक्रामकताआपको लाइन के आगे नीले बटन पर क्लिक करना होगा सारणी1

6.के लिए डेटा का चयन करें सारणी1कॉलम से आक्रामकताऔर डायलॉग बॉक्स में नीले बटन पर क्लिक करें

7. फिर, ऐरे 1 की तरह, लाइन के आगे नीले बटन पर क्लिक करें सारणी2

8.के लिए डेटा का चयन करें सारणी2- स्तंभ संशयऔर नीला बटन फिर से दबाएँ, फिर ठीक है

9. यहां, आर-पियर्सन सहसंबंध गुणांक की गणना की गई है और चयनित सेल में लिखा गया है। हमारे मामले में, यह सकारात्मक है और लगभग बराबर है 0,225 . इसके बारे में बोलता है मध्यम सकारात्मकप्रथम-ग्रेडर में आक्रामकता और आत्म-संदेह के बीच संबंध

इस प्रकार, सांख्यिकीय निष्कर्षप्रयोग होगा: r = 0.225, चरों के बीच एक मध्यम सकारात्मक संबंध सामने आया आक्रामकताऔर संशय.

कुछ अध्ययनों में सहसंबंध गुणांक के महत्व के पी-स्तर को निर्दिष्ट करने की आवश्यकता होती है, लेकिन एक्सेल, एसपीएसएस के विपरीत, यह विकल्प प्रदान नहीं करता है। यह ठीक है, वहाँ (ए.डी. नास्लेडोव) है।

आप इसे शोध परिणामों के साथ भी संलग्न कर सकते हैं।

क्या आपको पहले से ही दो सांख्यिकीय मात्राओं के बीच संबंध की डिग्री की गणना करने और उस सूत्र को निर्धारित करने की आवश्यकता का सामना करना पड़ा है जिसके द्वारा वे सहसंबंधित होते हैं? एक सामान्य व्यक्ति पूछ सकता है कि आखिर इसकी आवश्यकता क्यों होगी। अजीब बात है, यह वास्तव में आवश्यक है। यदि आप, मान लीजिए, एक स्टॉक व्यापारी हैं, तो विश्वसनीय सहसंबंधों को जानने से आपको बेतहाशा पैसा कमाने में मदद मिल सकती है। समस्या यह है कि किसी कारण से कोई भी इन सहसंबंधों का खुलासा नहीं करता है (आश्चर्य की बात है, है ना?)।

आइए उन्हें स्वयं गिनें! उदाहरण के लिए, मैंने यूरो के माध्यम से डॉलर के साथ रूबल के सहसंबंध की गणना करने का प्रयास करने का निर्णय लिया। आइए विस्तार से देखें कि यह कैसे किया जाता है।

यह आलेख Microsoft Excel दक्षता के उन्नत स्तरों के लिए डिज़ाइन किया गया है। यदि आपके पास पूरा लेख पढ़ने का समय नहीं है, तो आप फ़ाइल डाउनलोड कर सकते हैं और स्वयं इसका पता लगा सकते हैं।

अगर आपको अक्सर खुद को ऐसा कुछ करने की जरूरत महसूस होती हैमैं अत्यधिक अनुशंसा करता हूं कि आप पुस्तक खरीदने पर विचार करें। एक्सेल में सांख्यिकीय गणना.

सहसंबंधों के बारे में क्या जानना महत्वपूर्ण है?

एक विश्वसनीय सहसंबंध की गणना करने के लिए, आपके पास एक विश्वसनीय नमूना होना चाहिए; यह जितना बड़ा होगा, परिणाम उतना ही अधिक विश्वसनीय होगा। इस उदाहरण के प्रयोजनों के लिए, मैंने 10 वर्षों में विनिमय दरों का दैनिक नमूना लिया। डेटा निःशुल्क उपलब्ध है, मैंने इसे http://oanda.com साइट से लिया है।

मैंने वास्तव में क्या किया?

(1) एक बार जब मेरे पास कच्चा डेटा आ गया, तो मैंने दो डेटा सेटों के बीच सहसंबंध की डिग्री की जांच शुरू कर दी। ऐसा करने के लिए, मैंने CORREL फ़ंक्शन का उपयोग किया - इसके बारे में थोड़ी जानकारी है। यह दो डेटा श्रेणियों के बीच सहसंबंध की डिग्री लौटाता है। परिणाम, स्पष्ट रूप से कहें तो, विशेष रूप से प्रभावशाली नहीं था (केवल लगभग 70%)। सामान्यतया, दो मात्राओं के बीच सहसंबंध की डिग्री को आमतौर पर इस मात्रा का वर्ग माना जाता है, यानी सहसंबंध लगभग 49% तक विश्वसनीय निकला। ये तो बहुत कम है!

(2) ये मुझे बहुत अजीब लगा. मेरी गणना में कौन-सी त्रुटियाँ आ सकती थीं? इसलिए मैंने एक ग्राफ़ बनाने और यह देखने का निर्णय लिया कि क्या हो सकता है। ग्राफ़ को विशेष रूप से वर्ष के अनुसार तोड़ा गया था ताकि आप स्पष्ट रूप से देख सकें कि सहसंबंध कहाँ टूटता है। शेड्यूल इस प्रकार बना

(3) ग्राफ़ से यह स्पष्ट है कि लगभग 35 रूबल प्रति यूरो की सीमा में सहसंबंध दो भागों में टूटने लगता है। इस वजह से यह अविश्वसनीय साबित हुआ. यह पता लगाना जरूरी था कि ऐसा क्यों हो रहा है.

(4) रंग से पता चलता है कि ये डेटा 2007, 2008, 2009 को संदर्भित करते हैं। निश्चित रूप से! आर्थिक शिखर और मंदी की अवधि आमतौर पर सांख्यिकीय रूप से अविश्वसनीय होती है, जो इस मामले में हुआ। इसलिए, मैंने इन अवधियों को डेटा से बाहर करने का प्रयास किया (और जांचने के लिए, मैंने इस अवधि में डेटा के सहसंबंध की डिग्री की जांच की)। अकेले इन आंकड़ों के सहसंबंध की डिग्री 0.01% है, यानी यह पूरी तरह से अनुपस्थित है। लेकिन उनके बिना, डेटा लगभग 81% सहसंबद्ध है। यह पहले से ही काफी विश्वसनीय सहसंबंध है। यहां फ़ंक्शन के साथ एक ग्राफ़ है।

अगले कदम

सैद्धांतिक रूप से, सहसंबंध फ़ंक्शन को रैखिक से घातीय या लघुगणक में परिवर्तित करके परिष्कृत किया जा सकता है। इस मामले में, सहसंबंध की सांख्यिकीय विश्वसनीयता लगभग एक प्रतिशत बढ़ जाती है, लेकिन सूत्र को लागू करने की जटिलता अविश्वसनीय रूप से बढ़ जाती है। इसलिए, मैं खुद से सवाल पूछता हूं: क्या यह वाकई जरूरी है? प्रत्येक विशिष्ट मामले के लिए निर्णय लेना आपके ऊपर है।

क्षेत्र के क्षेत्रों के लिए, 200X का डेटा प्रदान किया गया है।

क्षेत्र क्रमांक एक सक्षम व्यक्ति का प्रति दिन औसत प्रति व्यक्ति निर्वाह वेतन, रगड़, x औसत दैनिक वेतन, रगड़, वाई
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

व्यायाम:

1. एक सहसंबंध क्षेत्र का निर्माण करें और कनेक्शन के रूप के बारे में एक परिकल्पना तैयार करें।

2. रैखिक प्रतिगमन समीकरण के मापदंडों की गणना करें

4. औसत (सामान्य) लोच गुणांक का उपयोग करते हुए, कारक और परिणाम के बीच संबंध की ताकत का तुलनात्मक मूल्यांकन दें।

7. यदि कारक का अनुमानित मूल्य उसके औसत स्तर से 10% बढ़ जाता है, तो परिणाम के अनुमानित मूल्य की गणना करें। महत्व स्तर के लिए पूर्वानुमान विश्वास अंतराल निर्धारित करें।

समाधान:

आइए एक्सेल का उपयोग करके इस समस्या को हल करें।

1. उपलब्ध डेटा x और y की तुलना करके, उदाहरण के लिए, उन्हें कारक x के बढ़ते क्रम में रैंकिंग करके, कोई विशेषताओं के बीच सीधे संबंध की उपस्थिति का निरीक्षण कर सकता है, जब औसत प्रति व्यक्ति निर्वाह स्तर में वृद्धि औसत दैनिक बढ़ जाती है वेतन। इसके आधार पर, हम यह धारणा बना सकते हैं कि विशेषताओं के बीच संबंध प्रत्यक्ष है और इसे एक सीधी रेखा समीकरण द्वारा वर्णित किया जा सकता है। चित्रात्मक विश्लेषण के आधार पर भी इसी निष्कर्ष की पुष्टि की जाती है।

सहसंबंध फ़ील्ड बनाने के लिए, आप एक्सेल पीपीपी का उपयोग कर सकते हैं। प्रारंभिक डेटा को क्रम में दर्ज करें: पहले x, फिर y।

उन कक्षों के क्षेत्र का चयन करें जिनमें डेटा है।

उसके बाद चुनो: प्लॉट डालें/स्कैटर करें/मार्कर्स के साथ स्कैटर करेंजैसा कि चित्र एक में दिखाया गया है।

चित्र 1 सहसंबंध क्षेत्र का निर्माण

सहसंबंध क्षेत्र का विश्लेषण निकट-सरलता निर्भरता की उपस्थिति को दर्शाता है, क्योंकि बिंदु लगभग एक सीधी रेखा में स्थित हैं।

2. रेखीय प्रतिगमन समीकरण के मापदंडों की गणना करने के लिए
आइए अंतर्निहित सांख्यिकीय फ़ंक्शन का उपयोग करें लाइनेस्ट.

इसके लिए:

1) विश्लेषित डेटा वाली मौजूदा फ़ाइल खोलें;
2) प्रतिगमन आंकड़ों के परिणाम प्रदर्शित करने के लिए खाली कोशिकाओं (5 पंक्तियाँ, 2 कॉलम) का 5x2 क्षेत्र चुनें।
3) सक्रिय करें फ़ंक्शन विज़ार्ड: मुख्य मेनू में चयन करें सूत्र/सम्मिलित फ़ंक्शन.
4)खिड़की में वर्गतुम ले रहे हो सांख्यिकीय, फ़ंक्शन विंडो में - लाइनेस्ट. बटन को क्लिक करे ठीक हैजैसा कि चित्र 2 में दिखाया गया है;

चित्र 2 फ़ंक्शन विज़ार्ड डायलॉग बॉक्स

5) फ़ंक्शन तर्क भरें:

के लिए ज्ञात मान

x के ज्ञात मान

स्थिर- एक तार्किक मान जो समीकरण में एक मुक्त पद की उपस्थिति या अनुपस्थिति को इंगित करता है; यदि स्थिरांक = 1, तो मुक्त पद की गणना सामान्य तरीके से की जाती है, यदि स्थिरांक = 0, तो मुक्त पद 0 है;

आंकड़े- एक तार्किक मान जो इंगित करता है कि प्रतिगमन विश्लेषण पर अतिरिक्त जानकारी प्रदर्शित की जानी चाहिए या नहीं। यदि सांख्यिकी = 1, तो अतिरिक्त जानकारी प्रदर्शित की जाती है, यदि सांख्यिकी = 0, तो केवल समीकरण मापदंडों के अनुमान प्रदर्शित किए जाते हैं।

बटन को क्लिक करे ठीक है;

चित्र 3 LINEST फ़ंक्शन तर्क संवाद बॉक्स

6) अंतिम तालिका का पहला तत्व चयनित क्षेत्र के ऊपरी बाएँ कक्ष में दिखाई देगा। संपूर्ण तालिका खोलने के लिए, कुंजी दबाएँ , और फिर कुंजी संयोजन के लिए ++ .

अतिरिक्त प्रतिगमन आँकड़े निम्नलिखित चित्र में दिखाए गए क्रम में आउटपुट होंगे:

गुणांक मान बी गुणांक एक मान
मानक त्रुटि बी मानक त्रुटि ए
मानक त्रुटि y
एफ आंकड़ा
वर्गों का प्रतिगमन योग

चित्र 4 LINEST फ़ंक्शन की गणना का परिणाम

हमें प्रतिगमन स्तर मिला:

हम निष्कर्ष निकालते हैं: औसत प्रति व्यक्ति निर्वाह स्तर में 1 रूबल की वृद्धि के साथ। औसत दैनिक वेतन औसतन 0.92 रूबल बढ़ जाता है।

इसका मतलब यह है कि मजदूरी (y) में 52% भिन्नता को कारक x की भिन्नता - औसत प्रति व्यक्ति जीवित मजदूरी, और 48% - मॉडल में शामिल नहीं किए गए अन्य कारकों की कार्रवाई द्वारा समझाया गया है।

निर्धारण के परिकलित गुणांक का उपयोग करके, सहसंबंध गुणांक की गणना की जा सकती है: .

कनेक्शन का मूल्यांकन करीबी के रूप में किया गया है।

4. औसत (सामान्य) लोच गुणांक का उपयोग करके, हम परिणाम पर कारक के प्रभाव की ताकत निर्धारित करते हैं।

एक सीधी रेखा समीकरण के लिए, हम सूत्र का उपयोग करके औसत (कुल) लोच गुणांक निर्धारित करते हैं:

हम x मान वाले कक्षों के क्षेत्र का चयन करके और चयन करके औसत मान ज्ञात करेंगे सूत्र/ऑटोसम/औसत, और हम y के मानों के साथ भी ऐसा ही करेंगे।

चित्र 5 औसत फ़ंक्शन मान और तर्क की गणना

इस प्रकार, यदि औसत प्रति व्यक्ति जीवन यापन की लागत उसके औसत मूल्य से 1% बदलती है, तो औसत दैनिक वेतन औसतन 0.51% बदल जाएगा।

डेटा विश्लेषण उपकरण का उपयोग करना वापसीउपलब्ध:
- प्रतिगमन सांख्यिकी के परिणाम,
- विचरण के विश्लेषण के परिणाम,
- आत्मविश्वास अंतराल के परिणाम,
- अवशिष्ट और प्रतिगमन रेखा फिटिंग ग्राफ़,
- अवशेष और सामान्य संभावना.

प्रक्रिया निम्नलिखित है:

1) तक पहुंच की जाँच करें विश्लेषण पैकेज. मुख्य मेनू में, चुनें: फ़ाइल/विकल्प/ऐड-ऑन.

2) ड्रॉपडाउन सूची में नियंत्रणवस्तु चुनें एक्सेल ऐड-इन्सऔर बटन दबाएँ जाना।

3)खिड़की में ऐड-ऑनबॉक्स को चेक करें विश्लेषण पैकेजऔर फिर बटन पर क्लिक करें ठीक है.

अगर विश्लेषण पैकेजफ़ील्ड सूची में नहीं उपलब्ध ऐड-ऑन, बटन दबाएँ समीक्षाएक खोज करने के लिए.

यदि आपको एक संदेश प्राप्त होता है जो दर्शाता है कि विश्लेषण पैकेज आपके कंप्यूटर पर स्थापित नहीं है, तो क्लिक करें हाँइसे स्थापित करने के लिए.

4) मुख्य मेनू में, चुनें: डेटा/डेटा विश्लेषण/विश्लेषण उपकरण/प्रतिगमनऔर फिर बटन पर क्लिक करें ठीक है.

5) डेटा इनपुट और आउटपुट पैरामीटर संवाद बॉक्स भरें:

इनपुट अंतराल Y- परिणामी विशेषता का डेटा युक्त श्रेणी;

इनपुट अंतराल एक्स- कारक विशेषता का डेटा युक्त श्रेणी;

टैग- एक ध्वज जो इंगित करता है कि पहली पंक्ति में कॉलम नाम हैं या नहीं;

स्थिरांक - शून्य- समीकरण में एक मुक्त पद की उपस्थिति या अनुपस्थिति को दर्शाने वाला ध्वज;

आउटपुट अंतराल- यह भविष्य की सीमा के ऊपरी बाएँ कक्ष को इंगित करने के लिए पर्याप्त है;

6) नई वर्कशीट - आप नई शीट के लिए एक मनमाना नाम निर्दिष्ट कर सकते हैं।

फिर बटन पर क्लिक करें ठीक है.

चित्र 6 रिग्रेशन टूल के लिए पैरामीटर दर्ज करने के लिए डायलॉग बॉक्स

समस्या डेटा के प्रतिगमन विश्लेषण के परिणाम चित्र 7 में प्रस्तुत किए गए हैं।

चित्र 7 प्रतिगमन उपकरण का उपयोग करने का परिणाम

5. आइए औसत सन्निकटन त्रुटि का उपयोग करके समीकरणों की गुणवत्ता का मूल्यांकन करें। आइए चित्र 8 में प्रस्तुत प्रतिगमन विश्लेषण के परिणामों का उपयोग करें।

चित्र 8 प्रतिगमन उपकरण "शेष की निकासी" का उपयोग करने का परिणाम

आइए एक नई तालिका बनाएं जैसा कि चित्र 9 में दिखाया गया है। कॉलम सी में, हम सूत्र का उपयोग करके सापेक्ष सन्निकटन त्रुटि की गणना करते हैं:

चित्र 9 औसत सन्निकटन त्रुटि की गणना

औसत सन्निकटन त्रुटि की गणना सूत्र का उपयोग करके की जाती है:

निर्मित मॉडल की गुणवत्ता अच्छी आंकी गई है, क्योंकि यह 8-10% से अधिक नहीं है।

6. प्रतिगमन आंकड़ों वाली तालिका (चित्र 4) से हम फिशर के एफ-परीक्षण का वास्तविक मूल्य लिखते हैं:

क्योंकि 5% महत्व स्तर पर, तो हम यह निष्कर्ष निकाल सकते हैं कि प्रतिगमन समीकरण महत्वपूर्ण है (संबंध सिद्ध हो चुका है)।

8. हम छात्र के टी-सांख्यिकी का उपयोग करके और प्रत्येक संकेतक के आत्मविश्वास अंतराल की गणना करके प्रतिगमन मापदंडों के सांख्यिकीय महत्व का आकलन करेंगे।

हमने संकेतकों और शून्य के बीच सांख्यिकीय रूप से महत्वहीन अंतर के बारे में परिकल्पना एच 0 को सामने रखा है:

.

स्वतंत्रता की डिग्री की संख्या के लिए

चित्र 7 में वास्तविक t-सांख्यिकी मान हैं:

सहसंबंध गुणांक के लिए टी-परीक्षण की गणना दो तरीकों से की जा सकती है:

विधि I:

कहाँ - सहसंबंध गुणांक की यादृच्छिक त्रुटि.

हम गणना के लिए चित्र 7 में दी गई तालिका से डेटा लेंगे।

विधि II:

वास्तविक टी-सांख्यिकी मान तालिका मानों से अधिक हैं:

इसलिए, परिकल्पना H 0 को अस्वीकार कर दिया गया है, अर्थात, प्रतिगमन पैरामीटर और सहसंबंध गुणांक संयोग से शून्य से भिन्न नहीं हैं, लेकिन सांख्यिकीय रूप से महत्वपूर्ण हैं।

पैरामीटर a के लिए विश्वास अंतराल को इस प्रकार परिभाषित किया गया है

पैरामीटर ए के लिए, चित्र 7 में दर्शाई गई 95% सीमाएँ थीं:

प्रतिगमन गुणांक के लिए विश्वास अंतराल को इस प्रकार परिभाषित किया गया है

प्रतिगमन गुणांक बी के लिए, चित्र 7 में दर्शाई गई 95% सीमाएँ थीं:

आत्मविश्वास अंतराल की ऊपरी और निचली सीमाओं के विश्लेषण से यह निष्कर्ष निकलता है कि संभाव्यता के साथ पैरामीटर ए और बी, निर्दिष्ट सीमा के भीतर होने के कारण, शून्य मान नहीं लेते हैं, अर्थात। सांख्यिकीय रूप से महत्वहीन नहीं हैं और शून्य से काफी भिन्न हैं।

7. प्रतिगमन समीकरण के प्राप्त अनुमान इसे पूर्वानुमान के लिए उपयोग करने की अनुमति देते हैं। यदि जीवन यापन की अनुमानित लागत है:

तब जीवन यापन की लागत का अनुमानित मूल्य होगा:

हम सूत्र का उपयोग करके पूर्वानुमान त्रुटि की गणना करते हैं:

कहाँ

हम एक्सेल पीपीपी का उपयोग करके विचरण की गणना भी करेंगे। इसके लिए:

1) सक्रिय करें फ़ंक्शन विज़ार्ड: मुख्य मेनू में चयन करें सूत्र/सम्मिलित फ़ंक्शन.

3) कारक विशेषता के संख्यात्मक डेटा वाली श्रेणी भरें। क्लिक ठीक है.

चित्र 10 विचरण की गणना

हमें विचरण मान मिल गया

स्वतंत्रता की प्रति डिग्री अवशिष्ट विचरण की गणना करने के लिए, हम विचरण के विश्लेषण के परिणामों का उपयोग करेंगे जैसा कि चित्र 7 में दिखाया गया है।

0.95 की संभावना के साथ y के व्यक्तिगत मूल्यों की भविष्यवाणी के लिए आत्मविश्वास अंतराल अभिव्यक्ति द्वारा निर्धारित किया जाता है:

अंतराल काफी व्यापक है, मुख्यतः अवलोकनों की छोटी मात्रा के कारण। सामान्य तौर पर, औसत मासिक वेतन का पूर्वानुमान विश्वसनीय निकला।

समस्या की स्थिति यहां से ली गई है: अर्थमिति पर कार्यशाला: प्रोक। भत्ता / आई.आई. एलिसेवा, एस.वी. कुरीशेवा, एन.एम. गोर्डीन्को और अन्य; ईडी। आई.आई. एलिसेवा। - एम.: वित्त और सांख्यिकी, 2003. - 192 पी.: बीमार।