Friday, August 3, 2007

अब एक एलेक्‍सा नजर कितने आदमी थे पर

चिट्ठा संसार में उथल पुथल मची है जो ऊपर से इतना दिखाई नहीं देती। हमने तीन एग्रीगेटरों के आंकड़ों पर विचार किया था और नतीजा दिया था कि अभी तो सब ठीक दिख रहा है- टेक्‍नॉराटी के हवाले से यह भी बताया कि नए एग्रीगेटरों पर गया ट्रेफिक सब नारद का नहीं है भई। बाद में चिट्ठाजगत के आंकड़े विपुल ने सामने रखे, अच्‍छा लगा। इस प्रकार की पारदर्शिता एक स्‍वस्‍थ परिघटना है, हांलॉंकि इस मामले में नारद बाजी मारता है क्‍योंकि उसके आंकड़े सर्वसुलभ हैं, बिल्‍कुल पारदर्शी, पर लगता है इसकी वजह है कि सबने उसे बिसरा दिया है :( - वरना क्‍या वजह है कि नारद के लॉग का आकार अभी तक 100 है जबकि स्‍टेटकांउटर ने अरसा हुआ, मुफ्त ग्राहकों के लिए लॉग का आकार 500 कर दिया था, इससे पूरी तस्‍वीर सामने आती है, 100 से तो केवल कुछ घंटों के ट्रेफिक का लॉग देता है बाकी के विषय में केवल समन्वित आंकड़े मिलते हैं। इस छोटे से काम में यानि 100 से 500 करने में 2-4 मिनट लगेंगे, कृपया ध्‍यान दें। खैर इसके बावजूद नारद की पारदर्शिता बाकी से बेहतर है क्‍योंकि आंकड़े रीयल टाईम में उपलब्‍ध हैं।


किंतु ट्रेफिक के आंकड़े केवल प्रदाता ही उपलब्‍ध नहीं कराता वरन एलेक्‍सा जैसे सेवा प्रदाता भी उपलब्‍ध कराते हैं। तो हमने पिछले तीन महीने के एलेक्‍सा आंकड़े चारों प्रमुख एग्रीगेटरों के लिए तुलना करते हुए लिए और देखें हमें क्‍या मिलता है-



ये ग्राफ पिछली मान्‍यता को कुछ कुछ बदलता है और यह दर्शाता है कि ब्‍लॉगवाणी प्रमुख एग्रीगेटर की तरह उभर रहा है जबकि नारद दक्षिणायन है। दरअसल एलेक्‍सा के अनुसार ट्रेफिक वाल्‍युम की दृष्टि से रैंक इस प्रकार हैं-

 

नारद                   1,60,514

ब्‍लॉगवाणी             3,75,551

हिंदी ब्‍लॉग्स          6,37,868

चिट्ठाजगत           9,08,770


नारद का रैंक अब भी सबसे अधिक है पर ये इनके डाटा के महीनों पुराने उपलब्‍ध होने के कारण है जो अन्‍य एग्रीगेटरों के पास नहीं है। यदि ऊपर वाले ग्राफ पर नजर डालें तो वह स्थान जहॉं ऊपर की ओर जाते ग्राफ नारद के नीचे जाते ग्राफ को काटते हैं- शोध प्रविधि की दृष्टि से यह ही क्रिटिकल प्‍वाईंट है।


किंतु इन आंकड़ों की एक सीमा है ये पेजलोड को एक संख्‍या मानकर विश्‍लेषित करते हैं जबकि वे मानवीय हस्‍तक्षेप हैं, अत: किसी भी मानविकी के शोध की तरह यहॉं भी मानना होगा कि वस्‍तुनिष्‍ठता से परे, व्‍यक्तिनिष्‍ठ शोध की अभी भी बहुत सी गुंजाइश है- इस मामले में निर्णायक पंक्ति लिखने का अभी समय नहीं आया है।


26 comments:

दिनेश श्रीनेत said...

कृपया इंडियन बाइस्कोप को भी देखें, अपने कमेंट्स दें, अपनी साइट पर लिंक दें, उचित लगे तो लिखें भी
लिंक यह है

http://indianbioscope.blogspot.com

sanjay tiwari said...

अच्छा विश्लेषण.

विपुल जैन said...

पहली बात, मेरा लेख जो आपने refer किया है वह traffic के आंकड़े नहीं हैं,यह संग्रहित प्रविष्टियों की संख्या है।
दूसरी बात, alexa, page view का graph दिखा कर, यह कहना गलत है, ब्लॉगवाणी का graph इतना उप्पर है,
चिट्ठाजगत को छोड़ कर सब redirect करते हैं, तो page view के नज़रया गलत है।
देखना है तो reach per million से या unique visitor से compare करना चाहिए।

one more thing alexa counts narad within akshargram, so comparison is not good.

विपुल जैन said...

reach per million for all blogvani, hindiblogs.com and chitthjagat.in is 0.00015%

for akshargram is 0.00025%

आलोक said...

मुझे ऍलॅक्सा के बारे में अधिक मालूम नहीं है। यह है क्या? और यह स्थलों का क्रमांकन कर पाने के लिए जानकारी लाता कहाँ से है?

मान लीजिए कि मेरा स्थल है example.com - तो एलेक्सा को कैसे पता चलेगा कि मेरे स्थल के किस किस पन्ने को कितनी बार देखा गया?

यह मालूम होने की प्रतीक्षा है।

विपुल जैन said...

आलोक जी,
alexa का data काफी भरोसे वाला है, यह , root-servers.net और ultradns.org जैसी जगह से pooled data लेता है। यहाँ से पता चलता है किसने किस डोमेन को कितनी बार पुकारा। वोह ऐसे, आप तो डोमेन type करते है, वोह ip को redirect होता है। यह सब ultradns जैसे servers पर होता है।
यह server data बेचते हैं, जो alexa खरीदता है।

आलोक said...

यह server data बेचते हैं, जो alexa खरीदता है।

समझा। तो जब भी मैं अपने ही स्थल example.com में एक पन्ने से दूसरे पन्ने जाऊँगा, तो वह गिनती कर लेगा।
इसका मतलब कि अपने स्थल example.com पर किसी भी आन्तरिक कड़ी पर चटका लगाने पर यदि मैं एक के बजाय चार पुनर्निर्देशन करवा दूँ - छोटे छोटे 10-20 बाइट के पन्नों की ओर - और फिर असली कड़ी पर ले जाऊँ, तो एलेक्सा में क्रमांकन चार गुना हो जाएगा, जबकि प्रयोक्ता एकमात्र ही है?

यदि इस सवाल का जवाब हाँ है, तो क्या एलेक्सा यह भी बताता है कि कितने अनोखे प्रयोक्ता example.com पर आए? लेकिन यह कैसे पता चलेगा उसे?

विपुल जैन said...

बिलकुल सही समझे आप, एलेक्सा यह भी बताता है कि कितने अनोखे प्रयोक्ता थे। वोह है reach per million।

आलोक said...

एलेक्सा यह भी बताता है कि कितने अनोखे प्रयोक्ता थे

पर सावल तो यही है न कि एलेक्सा को पता कैसे चलेगा कि मेरा प्रयोक्ता अनोखा है?

विपुल जैन said...

reach per million is by unique ip

आलोक said...

ठीक है। इसका मतलब यह हुआ कि -

- जब लोगबाग साइबर कैफ़े में एक ही स्थल को देखेंगे, तो एक के बाद एक उसी कुर्सी पर बैठने वाले को एक ही माना जाएगा

- किसी कम्पनी में अन्तर्जाल प्रॉक्सी के जरिए बीस हज़ार लोगों तक पहुँचता है, वह सब एक ही माने जाएँगे

- वही आईपी अलग अलग लोगों को समय समय पर बँटते रहते हैं

यानी कि जो अनोखे आगन्तुकों की संख्या एलेक्सा देगा, वास्तविक संख्या उससे अधिक भी हो सकती है।

मुझे लगता है कि इस प्रकार के विश्लेषणों के पहले पाठकों को आँकड़ों का मतलब समझाना ज़रूरी है।

Neelima said...

आलोक/विपुलजी
ऊपर की बातचीत से यह लग रहा है कि ऐलेक्‍सा को मापदंड माने जाने के विषय में संदेह है- यह बिल्‍कुल संभव है, क्‍योंकि ऐलेक्‍सा को लेने की वजह बस इतनी थी कि टैक्‍नारॉटी से केवल लिंकों का ही संदर्भ मिल रहा था और वहॉं ब्‍लॉगवाणी था ही नहीं। मेरा तकनीकी ज्ञान इस विषय में बस इतना है कि मुझे सुझाया गया कि ऐलेक्‍सा आवाजाही पर नजर रखता है इसलिए उसके डाटा से संकेत मिल सकते हैं, बस इतना ही।

अफ़लातून said...

मेरे तीन चिट्ठे वर्डप्रेस पर हैं । वर्डप्रेस बिना किसी अतिरिक्त सेवा से जुड़े यह सूचित करता है कि किन स्थलों से ,कितने लोग आपके चिट्ठों तक पहुँचे।इन आँकड़ों के हिसाब से मेरे ज्यादातर पाठक ब्लॉगवाणी से पहुँच रहे हैं।नोटेपैड के आँकड़ों की पुष्टि इस बात से भी हो रही है कि ब्लॉगवाणी जुलाई मध्य से बीस हुई है ।

Neelima said...

अफलातूनजी मैं..मैं ..मैं हूँ मतलब नीलिमा।

सुजाता (नोटपैड) तो भागी हुई लड़कियों पर काव्‍यपरक नजर रखें हैं- इन आंकड़ों से हम जुझ रहे हैं सर। :)

विपुल जैन said...

@ अफ़लातूनजी
बिलकुल ब्लॉगवाणी सबसे उत्तम एग्रीगेटर है, सबसे जयादा traffic लेता है, मुझे खुशी है।

मेरा कहना यह है विश्लेषण गलत है, देखना है तो reach per million देखो।

Aflatoon said...

नीलिमाजी और सुजाताजी दोनों से माफ़ी । लाल को गुलाबी कहने का मतलब दोनों को नहीं पहचाना।माफ़ी स्वीकारें।

प्रियंकर said...

मेरे दोनों ब्लॉग भी वर्डप्रेस पर हैं और उन पर भी आजकल ज्यादा पाठक ब्लॉगवाणी से पहुंच रहे हैं जबकि पहले नारद से पहुंचते थे .

इस हिसाब से ज्यादा तकनीकी पचड़े में पड़े बिना मोटे तौर पर नीलिमा के निष्कर्ष सही प्रतीत होते हैं .

Udan Tashtari said...

अच्छा विश्लेषण.बढ़िया ज्ञानवर्धक टिप्पणियाँ. अच्छा लगा.

Jitendra Chaudhary said...

मेरे विचार से तो सभी एग्रीगेटर अपने आंकड़े पूर्ण रुप से सार्वजनिक करे, पूरी तरह से, जैसे नारद पर है, और लोगो को स्वयं निर्णय लेने दें। दूध का दूध और पानी का पानी हो जाने थे।

उन सर्व-उपलब्ध आंकड़ो पर किया गया कोई भी विश्लेषण, सत्यता और निष्पक्षता के अधिक करीब होगा।

अभय तिवारी said...

भई मेरे भी ब्लॉग अपर ब्लॉगवाणी पर पहुँचने वालों की सँख्या नारद से आने वालों की संख्या से ज़्यादा हो चुकी है..

जगदीश भाटिया said...

इसे पढ़ें
Because the Alexa toolbar is such a pile, no one ever keeps it installed. So just by updating and surfing your own site daily, (assuming NO ONE else does), you can get your Alexa ranking from 5,500,000 or “no data” to around 300,000 in under a month and to 100,000 in 3 months.

इसे यहां से लिया गया

http://seoblackhat.com/2005/07/23/the-alexa-toolbar-why-you-want-this-peice-of-crap/

Sanjeet Tripathi said...

विश्लेषण बढ़िया है, आभार, पर टिप्पणियों ने इन सब के बारे में जानकारी बढ़ा दी है, भई नीलिमा जी टिप्पणी देने वालो का आभार प्रदर्शन बाद में करें पर अपन तो पहले ही कर देते है कि इन सबकी टिप्पणी से हमारी तकनीकी जानकारी बढ़ी है अत: आभार!

अनूप शुक्ल said...

विश्लेषण व टिप्पणिया अच्छी हैं।

Pramod Singh said...

मैं भी! मैं भी! हां, हां, सही है. दूध का दूध और पानी का पानी.. या पानी में दूध भी सही है.

Amit said...

मैं वही कहना चाहता था जो जगदीश जी ने पहले ही कह दिया। अलेक्सा का डाटा बिलकुल reliable नहीं है क्योंकि वह किसी साइट के हिट आदि के आंकड़े अपनी टूलबार में लगे spyware के द्वारा एकत्र करता है, तो जिस लोगों ने उसकी टूलबार अपने-२ ब्राउज़र में लगा रखी है उनके द्वारा खोली गई साइटों के ही आंकड़े अलेक्सा को मिलेंगे। बाकी जहाँ तक विपुल जी द्वारा बताई गई डाटा खरीदने की बात है, वह मेरे लिए नई जानकरी है। विपुल जी कैसे इस बात को कह सकते हैं इसके लिए यदि कुछ बताएँ तो अपना भी ज्ञानवर्धन होगा। :)

masijeevi said...

इन गोरखधंधों की काफी जानकारी इन टिप्‍पणियों से हो रही है, पर एक बात तय है कि म्‍यूचुअल एरर नेगेशन मेथड के कारण इतना तय है कि भले ही डाटा स्‍वयं में कैसे एकत्र किया गया हो पर यदि उसे सेलेक्टिवली किसी के पक्ष में डाक्‍टर न किया गया हो, उसके एरर एक दूसरे को नेगेट करते हैं। जैसे कि एक्जिट पोल आदि । यानि अगर एलेक्‍सा कहीं A फायदे में होगा तो कहीं B इसलिए, वास्‍तव जो थोड़ा बहुत एरर होगा वह एक दूसरे को खत्‍म कर वास्‍तव जैसी ही तस्‍वीर सामने आएगी। खासतौर पर जब लोगों के अपने काउंटरों से यह क्रासचैक भी हो रहा है। इसलिए डाटा की कंपेरेटिव सैंक्टिटी बनी रहती है।