यह webStraktor नाम का विंडोज़ ऐप है जिसकी नवीनतम रिलीज़ को webStraktor-20140420-R01.zip के रूप में डाउनलोड किया जा सकता है। इसे वर्कस्टेशन के लिए मुफ्त होस्टिंग प्रदाता ऑनवर्क्स में ऑनलाइन चलाया जा सकता है।
वेबस्ट्रेक्टर नाम के इस ऐप को ऑनवर्क्स के साथ मुफ्त में ऑनलाइन डाउनलोड करें और चलाएं।
इस ऐप को चलाने के लिए इन निर्देशों का पालन करें:
- 1. इस एप्लिकेशन को अपने पीसी में डाउनलोड करें।
- 2. हमारे फ़ाइल प्रबंधक में https://www.onworks.net/myfiles.php?username=XXXXX उस उपयोगकर्ता नाम के साथ दर्ज करें जो आप चाहते हैं।
- 3. इस एप्लिकेशन को ऐसे फाइल मैनेजर में अपलोड करें।
- 4. इस वेबसाइट से कोई भी ओएस ऑनवर्क्स ऑनलाइन एमुलेटर शुरू करें, लेकिन बेहतर विंडोज ऑनलाइन एमुलेटर।
- 5. ऑनवर्क्स विंडोज ओएस से आपने अभी शुरुआत की है, हमारे फाइल मैनेजर को https://www.onworks.net/myfiles.php?username=XXXXX उस यूजरनेम के साथ जाएं जो आप चाहते हैं।
- 6. एप्लिकेशन डाउनलोड करें और इसे इंस्टॉल करें।
- 7. अपने Linux वितरण सॉफ़्टवेयर रिपॉजिटरी से वाइन डाउनलोड करें। एक बार इंस्टॉल हो जाने पर, आप ऐप को वाइन के साथ चलाने के लिए डबल-क्लिक कर सकते हैं। आप PlayOnLinux को भी आज़मा सकते हैं, जो वाइन पर एक फैंसी इंटरफ़ेस है जो आपको लोकप्रिय विंडोज़ प्रोग्राम और गेम इंस्टॉल करने में मदद करेगा।
वाइन लिनक्स पर विंडोज सॉफ्टवेयर चलाने का एक तरीका है, लेकिन विंडोज की आवश्यकता नहीं है। वाइन एक ओपन-सोर्स विंडोज संगतता परत है जो किसी भी लिनक्स डेस्कटॉप पर सीधे विंडोज प्रोग्राम चला सकती है। अनिवार्य रूप से, वाइन खरोंच से पर्याप्त विंडोज़ को फिर से लागू करने की कोशिश कर रहा है ताकि वह उन सभी विंडोज़ अनुप्रयोगों को वास्तव में विंडोज़ की आवश्यकता के बिना चला सके।
स्क्रीनशॉट
Ad
वेबस्ट्रेक्टर
वर्णन
वेबस्ट्रेक्टर एक प्रोग्रामयोग्य वर्ल्ड वाइड वेब डेटा निष्कर्षण क्लाइंट है। इसका उद्देश्य HTTP प्रोटोकॉल के माध्यम से HTML आधारित सामग्री को परिमार्जन करना और प्रासंगिक जानकारी निकालना है। वेबस्ट्रेक्टर छवियों सहित वेब पर उपलब्ध जानकारी के संग्रह, निष्कर्षण और भंडारण की सुविधा के लिए एक स्क्रिप्टिंग भाषा की सुविधा देता है। स्क्रिप्टिंग भाषा रेगुलर एक्सप्रेशन और xPath सिंटैक्स के तत्वों का उपयोग करती है। वेबस्ट्रेक्टर स्क्रिप्टिंग भाषा में एक छोटा निर्देश सेट होता है और इसके सिंटैक्स में महारत हासिल करना आसान होता है।
मानक वेबस्ट्रेक्टर आउटपुट प्रारूप XML आधारित है, या तो ASCII, UTF-8 या ISO-8859-1 (लैटिन1) कोड पृष्ठों में।
वेबस्ट्रैक्टर HTTP प्रोटोकॉल के माध्यम से सामग्री पुनर्प्राप्त करने के लिए Apache HttpClient पर निर्भर करता है। यह रोबोट बहिष्करण प्रोटोकॉल का पालन करता है और इसे प्रमुख प्रकार के वेब प्रॉक्सी सर्वर से कनेक्ट करके गुमनाम तरीके से संचालित करने के लिए कॉन्फ़िगर किया जा सकता है।
वेबस्ट्रैक्टर स्क्रैपिंग और क्रॉलिंग क्षमताओं को एकीकृत करके वेब क्रॉलर, स्पाइडर या बॉट्स की कार्यक्षमता का विस्तार करता है।
विशेषताएं
- प्रोग्रामयोग्य वेब क्रॉलर (वेब स्पाइडर या वेब बॉट)
- स्क्रिप्टिंग भाषा में महारत हासिल करना आसान
- जावा स्विंग आधारित ग्राफिकल विकास वातावरण
- UTF8 या ISO-8859-1 XML आउटपुट
- आसानी से उपलब्ध शेड्यूलिंग अनुप्रयोगों के साथ एकीकृत होता है
- संपूर्ण विन्यास
- वेब प्रॉक्सी सर्वर समर्थन
- रोबोट बहिष्करण प्रोटोकॉल समर्थन
- कॉन्फ़िगर करने योग्य उपयोगकर्ता एजेंट हस्ताक्षर
- चरण दर चरण ट्यूटोरियल और उदाहरण स्क्रिप्ट
- अपाचे Httpक्लाइंट आधारित
दर्शक
डेवलपर्स, आर्किटेक्ट्स
यूजर इंटरफेस
जावा स्विंग
प्रोग्रामिंग भाषा
जावा
डेटाबेस पर्यावरण
एक्सएमएल आधारित
यह एक एप्लिकेशन है जिसे https://sourceforge.net/projects/webstractor/ से भी प्राप्त किया जा सकता है। हमारे निःशुल्क ऑपरेटिव सिस्टमों में से एक से सबसे आसान तरीके से ऑनलाइन चलाने के लिए इसे ऑनवर्क्स में होस्ट किया गया है।





