Data mining एक ऐसी प्रक्रिया है जिसमें की एक बड़ी मात्रा की data को analyze किया जाता है, जिससे की कुछ pattern को ढूंडा जा सके और कुछ उपयोगी जानकारी. इन्हें typically perform किया जाता है databases में जो की data को store करता है एक structured format में.
इसमें बड़ी मात्रा की data को “mining” करने से उसमें से कुछ छिपी हुई information भी प्राप्त होती है जिन्हें की किसी दुसरे कार्यों में उपयोग किया जा सकता है.
Data Mining के उदाहरण
एक credit card company data mining का इस्तमाल कर उनके members की buying habits को समझती है. वहीँ cardholders के purchases को analyze कर company उनके shopping habits को study कर सकती है, वहीँ ये भी जान सकती है की वो कैसे अलग अलग जगहों के लोग किस प्रकार की खरीदारी ज्यादा करते हैं.
वहीँ ये information काफी महत्वपूर्ण हो सकती है उस individuals को कुछ specific promotions offer करने में. वहीँ ये समान data से उनकी खरीदारी के pattern को भी समझा जा सकता है, फिर चाहे वो किसे भी देश के हो या किसी भी प्रान्त से क्यूँ न हो.
ये information काफी valuable होती है उन companies के लिए जो की advertise करना चाहते हैं या कोई नया businesses आरम्भ करना चाहते हैं.
वहीँ Online services, जैसे की Google और Facebook, बहुत मात्रा की data को mine करते हैं जिससे की वो targeted content और advertisements offer कर पायें users को.
वहीँ Google भी, ऐसे ही search queries को analyze करता है वहीँ ऐसे popular searches को ढूंडता कुछ specific areas में और उन्हें अपने autocomplete list में डाल देता है (ये वो suggestions होती है जो की दिखाई पड़ती है जैसे ही आप कुछ type करें तब).
User Activity data को mine कर Facebook भी बहुत से अलग अलग topics की जानकारी हासिल कर लेता है, वहीँ उसी हिसाब से वो ads target करता है जो की उसी information के ऊपर आधारित होता है.
जहाँ data mining को मुख्य रूप से marketing purposes के लिए इस्तमाल किया जाता है, वहीँ इसके बहुत से दुसरे uses भी होते हैं. उदाहरण के लिए, healthcare companies इस data mining का इस्तमाल कर उन links को खोज सकती है जो की कुछ विशेष genes और diseases के विषय में होती है.
मौसम विभाग भी इन data को mine कर मौसम के pattern को खोज सकता है और साथ में इसकी मदद से आगे की meteorologic events के विषय में पूर्व अनुमान लगा सकता है.
वहीँ Traffic management भी इन automotive data को mine कर इस चीज़ का पूर्व अनुमान लगा सकती है की भविष्य में किस प्रकार की traffic levels होने वाली है और उस हिसाब से सही plans बना सकते हैं highways और streets के लिए.
Data Mining की आवश्यकताएँ
Data mining की मुख्य दो चीज़ों की requirements होती है — बहुत सारा data और बहुत सारा computing power.
जितना organized data होगा, ये इतना ही आसान बनाएगा उसे सही रूप से mine करनें में और साथ में useful information को प्राप्त करने में.
इसलिए ये बहुत ही जरुरी होता है किसी भी organization के लिए जो की engage होना चाहते हैं data mining में, उन्हें proactive बनना होगा ये select करने के लिए की किस प्रकार के data को log करना है और कैसे उसे store करना है.
जब बात आती है data की mining करने की तब supercomputers और computing clusters की जरुरत होती है petabyte मात्रा की data को process करने के लिए.
« Back to Wiki Index