डेटा स्मूथिंग परिभाषा और उदाहरण |
ये कà¥?या है जानकार आपके à¤à¥€ पसीने छà¥?ट ज
विषयसूची:
यह क्या है:
डेटा चिकनाई एक सांख्यिकीय तकनीक है जिसमें डेटा सेट से आउटलेटर्स को निकालने के लिए निकालना शामिल है एक पैटर्न अधिक दिखाई देता है।
यह कैसे काम करता है (उदाहरण):
उदाहरण के लिए, मान लें कि एक विश्वविद्यालय पिछले 10 वर्षों में अपने अपराध डेटा का विश्लेषण कर रहा है। हिंसक अपराधों की संख्या इस तरह कुछ दिखती है:
जैसा कि आप देख सकते हैं, ज्यादातर समय विश्वविद्यालय को सालाना 15 से कम अपराधों का अनुभव होता है। हालांकि, 2006 और 2007 में, विश्वविद्यालय की सार्वजनिक सुरक्षा टीम द्वारा प्रयोगात्मक रिपोर्टिंग आवश्यकता के कारण 44 का अनुभव हुआ। रिपोर्टिंग प्रयोग ने उन वर्षों के दौरान किसी भी प्रकार की चोरी को शामिल करने के लिए हिंसक अपराध की परिभाषा को बदल दिया, जिसने परिसर में "हिंसक" अपराधों की संख्या में एक बड़ी छलांग लगाई। यदि हम इन वर्षों को औसत में शामिल करते हैं - यानी, अगर हम कुछ डेटा चिकनाई करते हैं - विश्वविद्यालय ने सालाना औसतन 1 9 हिंसक अपराधों का अनुभव किया। लेकिन अगर हम उन वर्षों को छोड़ देते हैं, तो हम देख सकते हैं कि एक और यथार्थवादी औसत सालाना 13 हिंसक अपराध है - 32% अंतर।
यह क्यों मायने रखता है:
चलने के उपयोग सहित डेटा को सुचारू करने के कई तरीके हैं औसत और एल्गोरिदम। विचार यह है कि डेटा चिकनाई पैटर्न को और अधिक दृश्यमान बनाता है और इस प्रकार स्टॉक की कीमतों, ग्राहक प्रवृत्तियों या व्यावसायिक जानकारी के किसी भी अन्य हिस्से में बदलाव की भविष्यवाणी करने में सहायता करता है। हालांकि, डेटा चिकनाई महत्वपूर्ण जानकारी को अनदेखा कर सकती है या महत्वपूर्ण तथ्यों को कम दिखाई दे सकती है; दूसरे शब्दों में, "डेटा के किनारों को गोल करने" कुछ डेटा को अधिक महत्व दे सकता है और अन्य डेटा को अनदेखा कर सकता है।