এটি ওয়েবস্ট্র্যাক্টর নামে একটি উইন্ডোজ অ্যাপ যার সর্বশেষ রিলিজটি webStraktor-20140420-R01.zip হিসাবে ডাউনলোড করা যেতে পারে। এটি ওয়ার্কস্টেশনের জন্য বিনামূল্যের হোস্টিং প্রদানকারী OnWorks-এ অনলাইনে চালানো যেতে পারে।
অনলাইনে ডাউনলোড করুন এবং চালান ওয়েবস্ট্র্যাক্টর নামের এই অ্যাপটি OnWorks সহ বিনামূল্যে।
এই অ্যাপটি চালানোর জন্য এই নির্দেশাবলী অনুসরণ করুন:
- 1. আপনার পিসিতে এই অ্যাপ্লিকেশনটি ডাউনলোড করুন৷
- 2. আমাদের ফাইল ম্যানেজারে প্রবেশ করুন https://www.onworks.net/myfiles.php?username=XXXXX আপনি যে ইউজারনেম চান।
- 3. এই ধরনের ফাইল ম্যানেজারে এই অ্যাপ্লিকেশনটি আপলোড করুন।
- 4. এই ওয়েবসাইট থেকে যেকোনো OS OnWorks অনলাইন এমুলেটর শুরু করুন, তবে আরও ভালো উইন্ডোজ অনলাইন এমুলেটর।
- 5. OnWorks Windows OS থেকে আপনি এইমাত্র শুরু করেছেন, আমাদের ফাইল ম্যানেজারে যান https://www.onworks.net/myfiles.php?username=XXXXX আপনার পছন্দের ব্যবহারকারীর নাম সহ।
- 6. অ্যাপ্লিকেশনটি ডাউনলোড করুন এবং এটি ইনস্টল করুন।
- 7. আপনার লিনাক্স ডিস্ট্রিবিউশন সফ্টওয়্যার সংগ্রহস্থল থেকে ওয়াইন ডাউনলোড করুন। একবার ইনস্টল হয়ে গেলে, আপনি ওয়াইন দিয়ে চালানোর জন্য অ্যাপটিতে ডাবল-ক্লিক করতে পারেন। এছাড়াও আপনি PlayOnLinux ব্যবহার করে দেখতে পারেন, ওয়াইনের উপর একটি অভিনব ইন্টারফেস যা আপনাকে জনপ্রিয় উইন্ডোজ প্রোগ্রাম এবং গেম ইনস্টল করতে সাহায্য করবে।
ওয়াইন লিনাক্সে উইন্ডোজ সফ্টওয়্যার চালানোর একটি উপায়, কিন্তু কোন উইন্ডোজ প্রয়োজন নেই। ওয়াইন হল একটি ওপেন সোর্স উইন্ডোজ সামঞ্জস্যপূর্ণ স্তর যা সরাসরি যেকোনো লিনাক্স ডেস্কটপে উইন্ডোজ প্রোগ্রাম চালাতে পারে। মূলত, ওয়াইন স্ক্র্যাচ থেকে পর্যাপ্ত উইন্ডোজ পুনরায় প্রয়োগ করার চেষ্টা করছে যাতে এটি আসলে উইন্ডোজের প্রয়োজন ছাড়াই সেই সমস্ত উইন্ডোজ অ্যাপ্লিকেশন চালাতে পারে।
স্ক্রীনশটগুলি
Ad
ওয়েবস্ট্র্যাক্টর
বর্ণনাঃ
webStraktor হল একটি প্রোগ্রামেবল ওয়ার্ল্ড ওয়াইড ওয়েব ডেটা এক্সট্রাকশন ক্লায়েন্ট। এর উদ্দেশ্য হল HTTP প্রোটোকলের মাধ্যমে HTML ভিত্তিক বিষয়বস্তু স্ক্র্যাপ করা এবং প্রাসঙ্গিক তথ্য বের করা। ওয়েবস্ট্র্যাক্টর ছবি সহ ওয়েবে উপলব্ধ তথ্য সংগ্রহ, নিষ্কাশন এবং সঞ্চয় করার সুবিধার্থে একটি স্ক্রিপ্টিং ভাষা বৈশিষ্ট্যযুক্ত। স্ক্রিপ্টিং ভাষা রেগুলার এক্সপ্রেশন এবং xPath সিনট্যাক্সের উপাদান ব্যবহার করে। ওয়েবস্ট্র্যাক্টর স্ক্রিপ্টিং ল্যাঙ্গুয়েজে একটি ছোট নির্দেশনা সেট রয়েছে এবং এর সিনট্যাক্স আয়ত্ত করা সহজ।
স্ট্যান্ডার্ড ওয়েবস্ট্র্যাক্টর আউটপুট ফর্ম্যাট হল XML ভিত্তিক, হয় ASCII, UTF-8 বা ISO-8859-1 (ল্যাটিন1) কোড পৃষ্ঠাগুলিতে।
webStraktor HTTP প্রোটোকলের মাধ্যমে সামগ্রী পুনরুদ্ধার করার জন্য Apache HttpClient-এর উপর নির্ভর করে। এটি রোবট এক্সক্লুশন প্রোটোকল মেনে চলে এবং এটি প্রধান ধরনের ওয়েব প্রক্সি সার্ভারের সাথে সংযোগ করে একটি বেনামী উপায়ে কাজ করার জন্য কনফিগার করা যেতে পারে।
webStraktor স্ক্র্যাপিং এবং ক্রল করার ক্ষমতা একত্রিত করে ওয়েব ক্রলার, স্পাইডার বা বটগুলির কার্যকারিতা প্রসারিত করে।
বৈশিষ্ট্য
- প্রোগ্রামেবল ওয়েব ক্রলার (ওয়েব স্পাইডার বা ওয়েব বট)
- স্ক্রিপ্টিং ভাষা আয়ত্ত করা সহজ
- জাভা সুইং ভিত্তিক গ্রাফিকাল উন্নয়ন পরিবেশ
- UTF8 বা ISO-8859-1 XML আউটপুট
- সহজলভ্য সময়সূচী অ্যাপ্লিকেশনের সাথে সংহত করে
- সম্পূর্ণ কনফিগারেশন
- ওয়েব প্রক্সি সার্ভার সমর্থন
- রোবট বর্জন প্রোটোকল সমর্থন
- কনফিগারযোগ্য ব্যবহারকারী এজেন্ট স্বাক্ষর
- ধাপে ধাপে টিউটোরিয়াল এবং উদাহরণ স্ক্রিপ্ট
- Apache HttpClient ভিত্তিক
পাঠকবর্গ
বিকাশকারী, স্থপতি
ব্যবহারকারী ইন্টারফেস
জাভা সুইং
প্রোগ্রামিং ভাষা
জাভা
ডাটাবেস পরিবেশ
XML-ভিত্তিক
এটি একটি অ্যাপ্লিকেশন যা https://sourceforge.net/projects/webstraktor/ থেকেও আনা যেতে পারে। আমাদের বিনামূল্যের অপারেটিভ সিস্টেমগুলির মধ্যে একটি থেকে সবচেয়ে সহজ উপায়ে অনলাইনে চালানোর জন্য এটি OnWorks-এ হোস্ট করা হয়েছে।





