אנגליתצרפתיתספרדי

Ad


סמל OnWorks

הורדה של osDQ apache spark data pipeline עבור לינוקס

הורדה חינם של אפליקציית apache spark data pipeline osDQ Linux להפעלה מקוונת באובונטו מקוונת, פדורה מקוונת או דביאן מקוונת

זוהי אפליקציית לינוקס בשם apache spark data pipeline osDQ שניתן להוריד את המהדורה האחרונה שלה בתור osdq-spark_0.0.1.zip. ניתן להפעיל אותו באופן מקוון בספק האירוח החינמי OnWorks עבור תחנות עבודה.

הורד והפעל באינטרנט את האפליקציה הזו בשם apache spark data pipeline osDQ עם OnWorks בחינם.

בצע את ההוראות הבאות כדי להפעיל את האפליקציה הזו:

- 1. הורד את היישום הזה למחשב שלך.

- 2. הזן במנהל הקבצים שלנו https://www.onworks.net/myfiles.php?username=XXXXX עם שם המשתמש שאתה רוצה.

- 3. העלה את היישום הזה במנהל קבצים כזה.

- 4. הפעל את האמולטור המקוון של OnWorks Linux או Windows מקוון או אמולטור מקוון של MACOS מאתר זה.

- 5. ממערכת ההפעלה OnWorks Linux שזה עתה התחלת, עבור אל מנהל הקבצים שלנו https://www.onworks.net/myfiles.php?username=XXXXX עם שם המשתמש הרצוי.

- 6. הורד את האפליקציה, התקן אותה והפעל אותה.

בצילומי מסך

Ad


צינור נתונים של apache spark osDQ


תיאור

זהו פרויקט נצר של פרויקט איכות נתונים בקוד פתוח (osDQ). https://sourceforge.net/projects/dataquality/

תת פרויקט זה ייצור צינור נתונים מבוסס אפאצ'י שבו מטא נתונים (קובץ) מבוססי JSON ישמשו להפעלת עיבוד נתונים, צנרת נתונים, איכות נתונים והכנת נתונים ותכונות מודל נתונים עבור ביג דאטה. זה משתמש ב-Java API של apache spark. זה יכול לפעול גם במצב מקומי.

קבל דוגמה של json ב https://github.com/arrahtech/osdq-spark

איך לרוץ

פתח את קובץ ה-zip

Windows : java -cp .\lib\*;osdq-spark-0.0.1.jar org.arrah.framework.spark.run.TransformRunner -c .\example\samplerun.json

מק UNIX
java -cp ./lib/*:./osdq-spark-0.0.1.jar org.arrah.framework.spark.run.TransformRunner -c ./example/samplerun.json

עבור אלה שמשתמשים ב-Windows, עליך לפתוח את הפצת hadoop בכונן המקומי ולהגדיר את HADOOP_HOME. העתק גם את winutils.exe מכאן אל HADOOP_HOME\bin



תכונות

  • צור צנרת נתונים כמו שימוש ב-Join, Filter, Aggregate, הצהרת מקרה
  • השתמש באיכות נתונים - החלף, שחרר, הצטרף,
  • פרופיל נתונים, פרופיל בסיס עמודות
  • Fuzzy Join - מרחק קוסינוס ואחרים
  • סיווג ודגימה - יער אקראי, רשת עצבית רב-מעמדית
  • נורמליזציה של נתונים - zscore, סטיית תקן, ציון יחס,
  • דגימה אקראית, מרובדת, מבוססת מפתח


קהל

טכנולוגיית מידע, קהל אחר, אדריכלים


ממשק משתמש

קונסולה/טרמינל


שפת תכנות

ג'אווה, סקאלה


כל הקטגוריות

אחסון נתונים, בינה עסקית, ETL

זוהי אפליקציה שניתן להביא גם מ-https://sourceforge.net/projects/apache-spark-osdq/. הוא התארח ב-OnWorks על מנת להפעיל אותו באינטרנט בצורה הקלה ביותר מאחת ממערכות ההפעלה החינמיות שלנו.


שרתים ותחנות עבודה בחינם

הורד אפליקציות Windows & Linux

  • 1
    Phaser
    Phaser
    Phaser היא פתיחה מהירה, חינמית ומהנה
    מסגרת משחק מקור HTML5 שמציעה
    עיבוד WebGL ו-Canvas לרוחב
    דפדפני אינטרנט שולחניים וניידים. משחקים
    יכול להיות שותף...
    הורד את Phaser
  • 2
    מנוע VASSAL
    מנוע VASSAL
    VASSAL הוא מנוע משחק ליצירה
    גרסאות אלקטרוניות של לוח מסורתי
    ומשחקי קלפים. זה מספק תמיכה עבור
    עיבוד ואינטראקציה של חלקי משחק,
    ו...
    הורד את VASSAL Engine
  • 3
    OpenPDF - Fork of iText
    OpenPDF - Fork of iText
    OpenPDF היא ספריית Java ליצירה
    ועריכת קבצי PDF עם LGPL ו
    רישיון קוד פתוח MPL. OpenPDF הוא ה
    יורש הקוד הפתוח LGPL/MPL של iText,
    ...
    הורד את OpenPDF - Fork of iText
  • 4
    SAGA GIS
    SAGA GIS
    SAGA - מערכת לאוטומטיות
    ניתוחים גיאוגרפיים - הוא גיאוגרפי
    תוכנת מערכת מידע (GIS) עם
    יכולות עצומות לגיאודטה
    עיבוד ואנה...
    הורד את SAGA GIS
  • 5
    ארגז כלים עבור Java/JTOpen
    ארגז כלים עבור Java/JTOpen
    ארגז הכלים של IBM עבור Java / JTOpen הוא א
    ספריית מחלקות Java התומכות ב
    תכנות לקוח/שרת ואינטרנט
    דגמים למערכת עם OS/400,
    i5/OS, o...
    הורד את ארגז הכלים עבור Java/JTOpen
  • 6
    D3.js
    D3.js
    D3.js (או D3 עבור מסמכים מבוססי נתונים)
    היא ספריית JavaScript המאפשרת לך
    לייצר נתונים דינמיים ואינטראקטיביים
    הדמיות בדפדפני אינטרנט. עם D3
    אתה...
    הורד את D3.js
  • עוד »

פקודות לינוקס

Ad