Jest to aplikacja dla systemu Linux o nazwie Open Source Data Quality and Profiling, której najnowszą wersję można pobrać jako ProfileV6.3.3.zip. Można go uruchomić online w bezpłatnym dostawcy hostingu OnWorks dla stacji roboczych.
Pobierz i uruchom online tę aplikację o nazwie Open Source Data Quality and Profiling with OnWorks za darmo.
Postępuj zgodnie z tymi instrukcjami, aby uruchomić tę aplikację:
- 1. Pobrałem tę aplikację na swój komputer.
- 2. Wpisz w naszym menedżerze plików https://www.onworks.net/myfiles.php?username=XXXXX z wybraną nazwą użytkownika.
- 3. Prześlij tę aplikację w takim menedżerze plików.
- 4. Uruchom emulator online OnWorks Linux lub Windows online lub emulator online MACOS z tej witryny.
- 5. W systemie operacyjnym OnWorks Linux, który właśnie uruchomiłeś, przejdź do naszego menedżera plików https://www.onworks.net/myfiles.php?username=XXXXX z wybraną nazwą użytkownika.
- 6. Pobierz aplikację, zainstaluj ją i uruchom.
ZRZUTY EKRANU
Ad
Jakość i profilowanie danych typu open source
OPIS
Projekt ten poświęcony jest rozwiązaniom w zakresie jakości i przygotowania danych typu open source. Jakość danych obejmuje profilowanie, filtrowanie, zarządzanie, sprawdzanie podobieństwa, wzbogacanie danych, alerty w czasie rzeczywistym, analizę koszyka, wykres bąbelkowy. Walidacja magazynu, widok pojedynczego klienta itp. zdefiniowane przez strategię.
To narzędzie opracowuje zintegrowaną platformę zarządzania danymi o wysokiej wydajności, która bezproblemowo umożliwi integrację danych, profilowanie danych, jakość danych, przygotowywanie danych, tworzenie fikcyjnych danych, odkrywanie metadanych, wykrywanie anomalii, oczyszczanie danych, raportowanie i analizę.
Posiadał również obsługę Hadoop (Big Data) do przenoszenia plików do/z Hadoop Grid, tworzenia, ładowania i profilowania tabel Hive. Ten projekt jest również znany jako „Aggregate Profiler”
Resful API dla tego projektu jest budowane jako (wersja Beta) https://sourceforge.net/projects/restful-api-for-osdq/
Jakość danych oparta na Apache Spark jest budowana https://sourceforge.net/projects/apache-spark-osdq/
Korzyści
- Teiid, Mysql, Oracle, Postgres, Access, Db2, SQL Server Certyfikat wsparcia Big Data - HIVE
- Utwórz tabelę Hive, tabelę Profile Hive, przenieś plik do/z systemu Profiler i siatki Hadoop
- Kontrola podobieństwa oparta na logice Fuzzy Logic, kontrola Cardinailty pomiędzy tabelami i plikami
- Eksport i import z formatu XML, XLS lub CSV, eksport do formatu PDF
- Analiza plików, wyszukiwanie wyrażeń regularnych, standaryzacja, wyszukiwanie DB
- Pełne skanowanie bazy danych, interfejs SQL, słownik danych, porównanie schematów
- Analiza statystyczna, raportowanie (oparte na wymiarach i środkach), raporty ad hoc i analityka
- Dopasowywanie wzorców, Deduplikacja, Dopasowywanie przypadków, Analiza koszykowa, Wykres dystrybucji
- Funkcje generowania danych, przygotowywania danych i maskowania danych
- Informacje o metadanych, inżynieria wsteczna modelu danych
- Analiza aktualności, Analiza długości łańcucha, KMean, Predykcja, Regresja
- Korekta adresu, pojedynczy widok klienta, produktu, złote połączenie rekordów
- Dodano dopasowanie rekordu, powiązanie i połączenie w oparciu o logikę rozmytą
- Tworzenie formatu, dopasowywanie formatu (telefon, data, ciąg znaków i liczba), standaryzacja formatu
- Przygotowanie danych: porządkowe, normalizacja, grupowanie, regresja
- maskowanie danych, szyfrowanie, randomizacja danych
Publiczność
Zaawansowani użytkownicy końcowi, programiści, inżynierowie jakości, zarząd
Interfejs użytkownika
Huśtawka Java
Język programowania
Java
Środowisko bazy danych
JDBC, ODBC
Kategorie
Jest to aplikacja, którą można również pobrać ze strony https://sourceforge.net/projects/dataquality/. Został on hostowany w OnWorks, aby można go było uruchomić online w najprostszy sposób z jednego z naszych bezpłatnych systemów operacyjnych.