عربيالفرنسيةالإسبانية

Ad


OnWorks فافيكون

اباتشي سبارك خط أنابيب البيانات تحميل osDQ لينكس

تنزيل تطبيق Apache Spark Data Peline OSDQ Linux مجانًا للتشغيل عبر الإنترنت في Ubuntu عبر الإنترنت أو Fedora عبر الإنترنت أو Debian عبر الإنترنت

هذا هو تطبيق Linux المسمى apache spark data pipeline osDQ والذي يمكن تنزيل أحدث إصدار له كـ osdq-spark_0.0.1.zip. يمكن تشغيله عبر الإنترنت في مزود الاستضافة المجاني OnWorks لمحطات العمل.

قم بتنزيل وتشغيل هذا التطبيق المسمى osDQ بخط أنابيب بيانات apache spark مع OnWorks مجانًا.

اتبع هذه التعليمات لتشغيل هذا التطبيق:

- 1. قم بتنزيل هذا التطبيق على جهاز الكمبيوتر الخاص بك.

- 2. أدخل في مدير الملفات الخاص بنا https://www.onworks.net/myfiles.php؟username=XXXXX باسم المستخدم الذي تريده.

- 3. تحميل هذا التطبيق في هذا الملف.

- 4. ابدأ تشغيل OnWorks Linux عبر الإنترنت أو محاكي Windows عبر الإنترنت أو محاكي MACOS عبر الإنترنت من هذا الموقع.

- 5. من نظام تشغيل OnWorks Linux الذي بدأته للتو ، انتقل إلى مدير الملفات الخاص بنا https://www.onworks.net/myfiles.php؟username=XXXXX مع اسم المستخدم الذي تريده.

- 6. قم بتنزيل التطبيق وتثبيته وتشغيله.

SCREENSHOTS

Ad


اباتشي شرارة خط أنابيب البيانات osDQ


الوصف

هذا مشروع فرعي لمشروع جودة البيانات مفتوحة المصدر (OSDQ) https://sourceforge.net/projects/dataquality/

سيؤدي هذا المشروع الفرعي إلى إنشاء خط أنابيب بيانات قائم على Apache Spark حيث سيتم استخدام البيانات الوصفية المستندة إلى JSON (ملف) لتشغيل معالجة البيانات وخط أنابيب البيانات وجودة البيانات وإعداد البيانات وميزات نمذجة البيانات للبيانات الضخمة. هذا يستخدم جافا API من اباتشي سبارك. يمكن تشغيله في الوضع المحلي أيضًا.

احصل على مثال json في https://github.com/arrahtech/osdq-spark

كيفية الجري

قم بفك ضغط الملف المضغوط

نظام التشغيل Windows: java -cp. \ lib \ *؛ osdq-spark-0.0.1.jar org.arrah.framework.spark.run.TransformRunner -c. \ example \ samplerun.json

نظام التشغيل Mac UNIX
java -cp ./lib/*:./osdq-spark-0.0.1.jar org.arrah.framework.spark.run.TransformRunner -c ./example/samplerun.json

بالنسبة لأولئك الذين يستخدمون windows ، يجب أن يكون لديك توزيع hadoop غير مضغوط على محرك الأقراص المحلي ومجموعة HADOOP_HOME. انسخ أيضًا winutils.exe من هنا إلى HADOOP_HOME \ bin



المميزات

  • قم بإنشاء مسار بيانات مثل استخدام Join و Filter و Aggregate و Case statement
  • استخدام جودة البيانات - استبدال ، إسقاط ، انضمام ،
  • التنميط البيانات ، العمود قاعدة التنميط
  • انضمام غامض - مسافة جيب التمام وغيرها
  • التصنيف وأخذ العينات - غابة عشوائية ، شبكة عصبية متعددة الفئات
  • تطبيع البيانات - zscore ، الانحراف القياسي ، درجة النسبة ،
  • أخذ عينات عشوائي ، طبقي ، قائم على المفتاح


الجمهور

تكنولوجيا المعلومات ، جمهور آخر ، مهندسون معماريون


واجهة المستخدم

وحدة التحكم / المحطة


لغة البرمجة

جافا ، سكالا


الفئات

تخزين البيانات ، ذكاء الأعمال ، ETL

هذا تطبيق يمكن جلبه أيضًا من https://sourceforge.net/projects/apache-spark-osdq/. تمت استضافته في OnWorks ليتم تشغيله عبر الإنترنت بأسهل طريقة من أحد أنظمتنا التشغيلية المجانية.


خوادم ومحطات عمل مجانية

قم بتنزيل تطبيقات Windows و Linux

  • 1
    فيزر
    فيزر
    Phaser هو مفتوح سريع ومجاني وممتع
    مصدر إطار عمل لعبة HTML5 الذي يوفر
    عرض WebGL و Canvas عبر
    متصفحات الويب لسطح المكتب والجوال. ألعاب
    يمكن المشاركة ...
    تحميل Phaser
  • 2
    محرك VASSAL
    محرك VASSAL
    VASSAL هو محرك لعبة للإبداع
    النسخ الإلكترونية للسبورة التقليدية
    وألعاب الورق. يوفر الدعم ل
    عرض قطعة اللعبة والتفاعل ،
    و...
    قم بتنزيل محرك VASSAL
  • 3
    OpenPDF - شوكة iText
    OpenPDF - شوكة iText
    OpenPDF هي مكتبة جافا للإنشاء
    وتحرير ملفات PDF باستخدام LGPL و
    ترخيص MPL مفتوح المصدر. OpenPDF هو ملف
    LGPL / MPL وريث مفتوح المصدر لـ iText ،
    ا...
    قم بتنزيل OpenPDF - Fork of iText
  • 4
    ساجا جيس
    ساجا جيس
    SAGA - النظام الآلي
    التحليلات الجيولوجية - هو جغرافي
    برنامج نظام المعلومات (GIS) مع
    قدرات هائلة للبيانات الجغرافية
    المعالجة وآنا ...
    تنزيل SAGA GIS
  • 5
    Toolbox for Java / JTOpen
    Toolbox for Java / JTOpen
    يعد IBM Toolbox for Java / JTOpen ملف
    مكتبة من فئات Java التي تدعم
    العميل / الخادم وبرمجة الإنترنت
    نماذج لنظام يعمل بنظام التشغيل OS / 400 ،
    i5 / OS ، س ...
    تنزيل Toolbox for Java / JTOpen
  • 6
    D3.js
    D3.js
    D3.js (أو D3 للمستندات المستندة إلى البيانات)
    هي مكتبة جافا سكريبت تسمح لك
    لإنتاج بيانات ديناميكية وتفاعلية
    تصورات في متصفحات الويب. مع D3
    أنت...
    تنزيل D3.js
  • أكثر "

أوامر لينكس

Ad