Semalt: गुगल क्रोम एक्स्टेन्सन प्रयोग गरी कसरी वेब पृष्ठ स्क्र्याप गर्ने

स्क्रिन स्क्र्यापर एक स्क्रिप्ट हो जुन साइटहरू पढ्दछ र वेबबाट उपयोगी जानकारी निकाल्छ। स्क्रिन स्क्र्यापि वेबसाइट र वेब पृष्ठहरूबाट माइक्रोसफ्ट एक्सेलमा वास्तविक डाटा पाउने अन्तिम समाधान हो। गुगल क्रोम एक्स्टेन्सन स्क्रेपर एक शक्तिशाली स्क्रिन स्क्र्यापिंग उपकरण हो जुन दुबै विन्डोज र म्याक ओएसमा काम गर्दछ।

गुगल क्रोम एक्स्टेन्सन स्क्रैपर किन?

गुगल क्रोम एक्स्टेन्सन स्क्र्यापर एक शक्तिशाली स्क्रीन स्क्र्यापिंग उपकरण हो जुन क्रोम वेब स्टोरमा नि: शुल्क जाँदैछ। यो स्क्र्यापिंग उपकरण प्लगइनको रूपमा क्रोम ब्राउजरमा स्थापना गरिएको छ। प्लगइनले ब्लगर र मार्केटरहरूलाई वेब पृष्ठबाट एलिमेन्टमा दायाँ क्लिक गरेर डाटा पुनःबहाली गर्न अनुमति दिन्छ। '' स्क्र्याप समान '' तपाईंको स्क्रिनमा पप अप हुन्छ यदि तपाईं एक एलिमेन्टमा दायाँ क्लिक गर्नुहुन्छ भने।

XPaths को परिचय

XPath एक प्रोग्रामिंग भाषा हो जुन XML संरचनाहरूमा महत्वपूर्ण जानकारी फेला पार्न प्रयोग गर्दछ। HTML फाइल XML संरचनाको उत्कृष्ट उदाहरण हो। XPath सामान्यतया लक्षित नोडहरू चयन गर्न प्रयोग गरिन्छ। यस सन्दर्भमा, XPaths वेब पृष्ठमा झिक्नु पर्ने पाठ निर्धारण गर्न प्रयोग गरिनेछ। XPaths ले स्वीडेनका सांसदहरूको पार्टी नाम र फोन नम्बरहरू पहिचान गर्न मद्दत गर्दछ।

Chrome 34 ra स्वीडिश सांसदहरूको ठेगाना विवरण पहुँच गर्न गुगल क्रोमको खुरचुर प्रयोग गर्दै

क्रोमको स्क्रेपरको साथ, वेब पृष्ठबाट जानकारी निकाल्ने सरल मात्र छैन तर शानदार पनि छ। तपाईं प्रक्रिया र टेकनिकको आनन्द लिनुहुनेछ।

वेबसाइटले सबै स्वीडेन सदस्यहरू र तिनीहरूको ठेगानाहरू सूचीबद्ध गर्दछ। सुरू गर्नका लागि कुनै पनि MP मा दायाँ क्लिक गर्नुहोस् र "समान स्क्र्याप गर्नुहोस्" चयन गर्नुहोस्। तपाईंले आफ्नो स्क्रिनमा निम्न प्रदर्शन हेर्न सक्नुहुन्छ।

स्क्र्याप वेब पृष्ठ कसरी गर्ने भन्ने बारे चरण-चरण गाइड

यदि तपाइँ एक MP मा दायाँ क्लिक गर्नुभयो र "तत्व निरीक्षण गर्नुहोस्" चयन गर्नुभयो भने, "" grid_6 अल्फा ओमेगा खोज परिणाम कन्टेनर क्लिस्ट "वर्ग अन्तर्गत एक वर्णमाला सूची सिर्जना हुनेछ। दुई वेब चरणहरू यस वेब पृष्ठलाई स्क्र्याप गर्न प्रयोग गरिनेछ। चरण १ को चयन समावेश छ। एक XPath साथ MP डेटाको ट्यागहरूसहितको ट्यागहरू। चरण २ ले डेटाको खास अंशहरू जस्तै पार्टी नाम, नाम, र फोन नम्बरहरू लिने समावेश गर्दछ र स्तम्भहरूमा डाटा व्यवस्थित गर्दछ।

चरण 1

HTML संरचनामा गहिरो खन्नुहोस् र तत्त्वहरूलाई अक्षुण्ण राख्नुहोस्। तपाईंको संरचनामा तत्त्वहरूसँग सम्बन्धित ट्यागहरूको संख्या पहिचान गर्न ट्यागहरू देखाउनुहोस्। लक्षित डेटाको समावेश गरेर अन्तिम ट्याग पहिचान गर्नुहोस्। "Scrape" क्लिक गरेर संरचनामा XPath परीक्षण चलाउनुहोस्।

तपाईंको स्क्रीनमा 9 34 r प of्क्तिहरू समावेश भएको सूची प्रदर्शित हुनेछ। 349 ले स्वीडेनका सांसदहरूको कुल संख्या प्रतिनिधित्व गर्दछ।

चरण २

प्रस्तुत डाटालाई स्तम्भमा विभाजन गर्नुहोस्। तपाईंले प्रयोग गरिरहनु भएको वेबपृष्ठमा HTML कोडको निरीक्षण गर्नुहोस्। यस अवस्थामा, निकालिनु पर्ने टुक्राहरू यस समयमा पहेँलोमा हाइलाइट हुन्छन्। सिर्जना गरिएको स्तम्भमा XPaths सम्मिलित गर्नुहोस् प्लगइन चलाउनका लागि "Scrape" क्लिक गर्नुहोस्।

यदि तपाईंसँग XPaths को आधारभूत ज्ञान छ भने, प्रोग्रामिंग बुझ्ने कार्य तपाईंको लागि कठिन कार्य हुनेछैन। माथिका हाइलाइट चरणहरू स्क्र्याप वेब पृष्ठ कसरी गर्ने भन्ने बारे मा तपाईंलाई मार्गदर्शन गर्दछ। यदि तपाईं बहु वेब पृष्ठहरू स्क्र्याप गर्न काम गर्दै हुनुहुन्छ भने, तपाईंसँग प्रोग्रामिंग सीप हुन आवश्यक छ।

mass gmail