این برنامه لینوکس به نام webStraktor است که آخرین نسخه آن را می توان با نام webStraktor-20140420-R01.zip دانلود کرد. می توان آن را به صورت آنلاین در ارائه دهنده میزبانی رایگان OnWorks برای ایستگاه های کاری اجرا کرد.
این برنامه با نام webStraktor را با OnWorks به صورت آنلاین دانلود و اجرا کنید.
برای اجرای این برنامه این دستورالعمل ها را دنبال کنید:
- 1. این برنامه را در رایانه شخصی خود دانلود کنید.
- 2. در فایل منیجر ما https://www.onworks.net/myfiles.php?username=XXXXX نام کاربری مورد نظر خود را وارد کنید.
- 3. این برنامه را در چنین فایل منیجر آپلود کنید.
- 4. OnWorks Linux آنلاین یا شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MACOS را از این وب سایت راه اندازی کنید.
- 5. از سیستم عامل لینوکس OnWorks که به تازگی راه اندازی کرده اید، به مدیر فایل ما https://www.onworks.net/myfiles.php?username=XXXXX با نام کاربری که می خواهید بروید.
- 6. اپلیکیشن را دانلود کرده، نصب و اجرا کنید.
عکس ها
Ad
webStraktor
شرح
webStraktor یک سرویس گیرنده استخراج داده در وب جهانی قابل برنامه ریزی است. هدف آن حذف محتوای مبتنی بر HTML از طریق پروتکل HTTP و استخراج اطلاعات مربوطه است. webStraktor دارای یک زبان برنامه نویسی برای تسهیل جمع آوری، استخراج و ذخیره سازی اطلاعات موجود در وب، از جمله تصاویر است. زبان برنامه نویسی از عناصر Regular Expression و نحو xPath استفاده می کند. زبان برنامه نویسی webStraktor دارای یک مجموعه دستورالعمل کوچک است و دستور زبان آن آسان است.
فرمت استاندارد خروجی webStraktor مبتنی بر XML است، یا در صفحات کد ASCII، UTF-8 یا ISO-8859-1 (لاتین1).
webStraktor برای بازیابی محتوا از طریق پروتکل HTTP به Apache HttpClient متکی است. به پروتکل حذف روبات ها پایبند است و می توان آن را پیکربندی کرد تا با اتصال به انواع غالب سرورهای پروکسی وب، به روشی ناشناس عمل کند.
webStraktor عملکرد خزنده های وب، عنکبوت ها یا ربات ها را با ادغام قابلیت های خراشیدن و خزیدن گسترش می دهد.
امکانات
- خزنده وب قابل برنامه ریزی (وب عنکبوت یا ربات وب)
- تسلط آسان به زبان برنامه نویسی
- محیط توسعه گرافیکی مبتنی بر جاوا swing
- خروجی UTF8 یا ISO-8859-1 XML
- با برنامه های زمان بندی به راحتی در دسترس ادغام می شود
- پیکربندی جامع
- پشتیبانی از سرور پروکسی وب
- پشتیبانی از پروتکل حذف ربات
- امضای نماینده کاربر قابل تنظیم
- آموزش گام به گام و نمونه اسکریپت
- مبتنی بر HttpClient آپاچی
مخاطبان
توسعه دهندگان، معماران
رابط کاربری
جاوا Swing
زبان برنامه نویسی
جاوه
محیط پایگاه داده
مبتنی بر XML
این برنامه ای است که می تواند از https://sourceforge.net/projects/webstraktor/ نیز دریافت شود. در OnWorks میزبانی شده است تا به آسانی از یکی از سیستم عامل های رایگان ما به صورت آنلاین اجرا شود.