Dies ist die Linux-App namens Open Source Data Quality and Profiling, deren neueste Version als ProfileV6.3.3.zip heruntergeladen werden kann. Es kann online beim kostenlosen Hosting-Anbieter OnWorks für Workstations ausgeführt werden.
Laden Sie diese App namens „Open Source Data Quality and Profiling with OnWorks“ kostenlos herunter und führen Sie sie online aus.
Befolgen Sie diese Anweisungen, um diese App auszuführen:
- 1. Diese Anwendung auf Ihren PC heruntergeladen.
- 2. Geben Sie in unserem Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX den gewünschten Benutzernamen ein.
- 3. Laden Sie diese Anwendung in einem solchen Dateimanager hoch.
- 4. Starten Sie den OnWorks Linux-Online- oder Windows-Online-Emulator oder den MACOS-Online-Emulator von dieser Website.
- 5. Rufen Sie vom gerade gestarteten OnWorks Linux-Betriebssystem aus unseren Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX mit dem gewünschten Benutzernamen auf.
- 6. Laden Sie die Anwendung herunter, installieren Sie sie und führen Sie sie aus.
SCREENSHOTS
Ad
Open-Source-Datenqualität und -Profilierung
BESCHREIBUNG
Dieses Projekt widmet sich Open-Source-Lösungen für Datenqualität und Datenaufbereitung. Die Datenqualität umfasst Profilerstellung, Filterung, Governance, Ähnlichkeitsprüfung, Änderung der Datenanreicherung, Echtzeitwarnung, Warenkorbanalyse, Blasendiagramm, Lagervalidierung, Einzelkundenansicht usw., definiert durch die Strategie.
Dieses Tool entwickelt eine leistungsstarke integrierte Datenverwaltungsplattform, die nahtlos Datenintegration, Datenprofilierung, Datenqualität, Datenaufbereitung, Dummy-Datenerstellung, Metadatenerkennung, Anomalieerkennung, Datenbereinigung, Berichterstellung und Analyse ermöglicht.
Es verfügte auch über Hadoop-Unterstützung (Big Data), um Dateien in/aus dem Hadoop-Grid zu verschieben sowie Hive-Tabellen zu erstellen, zu laden und zu profilieren. Dieses Projekt ist auch als „Aggregate Profiler“ bekannt.
Resful API für dieses Projekt wird erstellt als (Beta-Version) https://sourceforge.net/projects/restful-api-for-osdq/
Auf Apache Spark basierende Datenqualität wird entwickelt https://sourceforge.net/projects/apache-spark-osdq/
Eigenschaften
- Teiid-, MySQL-, Oracle-, Postgres-, Access-, Db2- und SQL Server-zertifizierter Big-Data-Support – HIVE
- Hive-Tabelle erstellen, Hive-Tabelle profilieren, Datei in/vom Profiler-System und Hadoop-Grid verschieben
- Fuzzy-Logic-basierte Ähnlichkeitsprüfung, Kardinalitätsprüfung zwischen Tabellen und Dateien
- Export und Import aus dem XML-, XLS- oder CSV-Format, PDF-Export
- Dateianalyse, Regex-Suche, Standardisierung, DB-Suche
- Vollständiger DB-Scan, SQL-Schnittstelle, Datenwörterbuch, Schemavergleich
- Statistische Analyse, Berichterstattung (dimensions- und kennzahlbasiert), Ad-hoc-Berichte und Analysen
- Mustervergleich, DeDuplizierung, Fallvergleich, Korbanalyse, Verteilungsdiagramm
- Funktionen zur Datengenerierung, Datenvorbereitung und Datenmaskierung
- Metadateninformationen, Reverse Engineering des Datenmodells
- Aktualitätsanalyse, Stringlängenanalyse, KMean, Vorhersage, Regression
- Adresskorrektur, Einzelansicht von Kunden, Produkten, Golden Merge für Datensätze
- Record Match, Linkage und Merge basierend auf Fuzzy-Logik hinzugefügt
- Formaterstellung, Formatanpassung (Telefon, Datum, Zeichenfolge und Zahl), Formatstandardisierung
- Datenvorbereitung: Ordinal, Normalisierung, Bucketting, Regression
- Datenmaskierung, Verschlüsselung, Randomisierung von Daten
Publikum
Fortgeschrittene Endbenutzer, Entwickler, Qualitätsingenieure, Management
Benutzeroberfläche
Java-Schaukel
Programmiersprache
Javac
Datenbankumgebung
JDBC, ODBC
Kategorien
Dies ist eine Anwendung, die auch von https://sourceforge.net/projects/dataquality/ abgerufen werden kann. Es wurde in OnWorks gehostet, um es auf einfachste Weise online über eines unserer kostenlosen Betriebssysteme ausführen zu können.