זוהי אפליקציית Windows בשם webStraktor, שאת הגרסה האחרונה שלה ניתן להוריד כ- webStraktor-20140420-R01.zip. ניתן להריץ אותה באופן מקוון בספק האירוח החינמי OnWorks לתחנות עבודה.
הורד והפעל אונליין את האפליקציה הזו בשם webStraktor עם OnWorks בחינם.
בצע את ההוראות הבאות כדי להפעיל את האפליקציה הזו:
- 1. הורד את היישום הזה למחשב שלך.
- 2. הזן במנהל הקבצים שלנו https://www.onworks.net/myfiles.php?username=XXXXX עם שם המשתמש שאתה רוצה.
- 3. העלה את היישום הזה במנהל קבצים כזה.
- 4. הפעל כל אמולטור מקוון של OS OnWorks מאתר זה, אך עדיף אמולטור מקוון של Windows.
- 5. ממערכת ההפעלה OnWorks Windows שזה עתה התחלת, עבור אל מנהל הקבצים שלנו https://www.onworks.net/myfiles.php?username=XXXXX עם שם המשתמש הרצוי.
- 6. הורד את האפליקציה והתקן אותה.
- 7. הורד את Wine ממאגרי התוכנה שלך להפצות לינוקס. לאחר ההתקנה, תוכל ללחוץ פעמיים על האפליקציה כדי להפעיל אותם עם Wine. אתה יכול גם לנסות את PlayOnLinux, ממשק מפואר מעל Wine שיעזור לך להתקין תוכניות ומשחקים פופולריים של Windows.
Wine היא דרך להפעיל תוכנת Windows על לינוקס, אך ללא צורך ב-Windows. Wine היא שכבת תאימות של Windows בקוד פתוח שיכולה להריץ תוכניות Windows ישירות על כל שולחן עבודה של לינוקס. בעיקרו של דבר, Wine מנסה להטמיע מחדש מספיק של Windows מאפס כדי שהוא יוכל להריץ את כל יישומי Windows מבלי להזדקק ל-Windows.
בצילומי מסך
Ad
וובסטרקטור
תיאור
webStraktor הוא תוכנת חילוץ נתונים מהאינטרנט העולמי הניתנת לתכנות. מטרתה היא לגרד תוכן מבוסס HTML באמצעות פרוטוקול HTTP ולחלץ מידע רלוונטי. webStraktor כוללת שפת סקריפטים כדי להקל על איסוף, חילוץ ואחסון של מידע הזמין באינטרנט, כולל תמונות. שפת הסקריפטים משתמשת באלמנטים של ביטוי רגולרי ותחביר xPath. לשפת הסקריפטים של webStraktor יש סט הוראות קטן והתחביר שלה קל לשליטה.
פורמט הפלט הסטנדרטי של webStraktor מבוסס XML, בין אם בדפי קוד ASCII, UTF-8 או ISO-8859-1 (Latin1).
webStraktor מסתמך על Apache HttpClient לאחזור תוכן דרך פרוטוקול HTTP. הוא פועל לפי פרוטוקול Robots Exclusion Protocol וניתן להגדירו לפעול באופן אנונימי על ידי התחברות לסוגים הנפוצים של שרתי פרוקסי אינטרנט.
webStraktor מרחיב את הפונקציונליות של סורקי אתרים, עכבישים או בוטים על ידי שילוב יכולות גירוד וסריקה.
תכונות
- זחלן אינטרנט שניתן לתכנות (עכביש אינטרנט או בוט אינטרנט)
- שפת סקריפטים קלה לשליטה
- סביבת פיתוח גרפית מבוססת ג'אווה סווינג
- פלט XML של UTF8 או ISO-8859-1
- משתלב עם אפליקציות תזמון זמינות בקלות
- תצורה ממצה
- תמיכה בשרת פרוקסי אינטרנט
- תמיכה בפרוטוקול אי הכללת רובוטים
- חתימת סוכן משתמש הניתנת להגדרה
- הדרכה שלב אחר שלב ודוגמאות לסקריפטים
- מבוסס Apache HttpClient
קהל
מפתחים, אדריכלים
ממשק משתמש
Java Swing
שפת תכנות
Java
סביבת מסד נתונים
מבוסס XML
זוהי אפליקציה שניתן להוריד גם מ-https://sourceforge.net/projects/webstraktor/. היא אוחסנה ב-OnWorks על מנת שניתן יהיה להפעיל אותה באופן מקוון בצורה הקלה ביותר מאחת ממערכות ההפעלה החינמיות שלנו.





