Il s'agit de l'application Windows nommée Open Source Data Quality and Profiling dont la dernière version peut être téléchargée en tant que ProfileV6.3.3.zip. Il peut être exécuté en ligne sur le fournisseur d'hébergement gratuit OnWorks pour les postes de travail.
Téléchargez et exécutez en ligne cette application nommée Open Source Data Quality and Profiling with OnWorks gratuitement.
Suivez ces instructions pour exécuter cette application :
- 1. Téléchargé cette application sur votre PC.
- 2. Entrez dans notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous voulez.
- 3. Téléchargez cette application dans ce gestionnaire de fichiers.
- 4. Démarrez n'importe quel émulateur en ligne OS OnWorks à partir de ce site Web, mais un meilleur émulateur en ligne Windows.
- 5. Depuis le système d'exploitation OnWorks Windows que vous venez de démarrer, accédez à notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous souhaitez.
- 6. Téléchargez l'application et installez-la.
- 7. Téléchargez Wine depuis les dépôts de logiciels de vos distributions Linux. Une fois installé, vous pouvez ensuite double-cliquer sur l'application pour les exécuter avec Wine. Vous pouvez également essayer PlayOnLinux, une interface sophistiquée sur Wine qui vous aidera à installer des programmes et des jeux Windows populaires.
Wine est un moyen d'exécuter un logiciel Windows sur Linux, mais sans Windows requis. Wine est une couche de compatibilité Windows open source qui peut exécuter des programmes Windows directement sur n'importe quel bureau Linux. Essentiellement, Wine essaie de ré-implémenter suffisamment de Windows à partir de zéro pour qu'il puisse exécuter toutes ces applications Windows sans avoir réellement besoin de Windows.
CAPTURES D'ÉCRAN
Ad
Qualité et profilage des données Open Source
DESCRIPTION
Ce projet est dédié aux solutions open source de qualité et de préparation des données. La qualité des données comprend le profilage, le filtrage, la gouvernance, la vérification de similitude, la modification de l'enrichissement des données, les alertes en temps réel, l'analyse du panier, la validation du graphique à bulles, la vue client unique, etc. définie par Strategy.
Cet outil développe une plate-forme de gestion de données intégrée hautes performances qui effectuera de manière transparente l'intégration des données, le profilage des données, la qualité des données, la préparation des données, la création de données factices, la découverte de métadonnées, la découverte d'anomalies, le nettoyage des données, la création de rapports et l'analyse.
Il prenait également en charge Hadoop (Big data) pour déplacer des fichiers vers/depuis Hadoop Grid, créer, charger et profiler des tables Hive. Ce projet est également connu sous le nom de "Aggregate Profiler"
L'API Resful pour ce projet est en train d'être construite en tant que (version bêta) https://sourceforge.net/projects/restful-api-for-osdq/
La qualité des données basée sur Apache Spark se construit à https://sourceforge.net/projects/apache-spark-osdq/
Fonctionnement
- Teiid, Mysql, Oracle, Postgres, Access, Db2, SQL Server certifié Support Big Data - HIVE
 - Créer une table Hive, une table Profile Hive, déplacer un fichier vers/depuis le système Profiler et la grille Hadoop
 - Vérification de similarité basée sur la logique floue, vérification de Cardinailty entre les tables et les fichiers
 - Exportation et importation au format XML, XLS ou CSV, exportation PDF
 - Analyse de fichiers, recherche Regex, normalisation, recherche DB
 - Analyse complète de la base de données, interface SQL, dictionnaire de données, comparaison de schémas
 - Analyse statistique, rapports (basés sur les dimensions et les mesures), rapports ad hoc et analyses
 - Correspondance de modèle, déduplication, correspondance de cas, analyse de panier, graphique de distribution
 - Fonctionnalités de génération de données, de préparation de données et de masquage de données
 - Informations sur les métadonnées, ingénierie inverse du modèle de données
 - Analyse de l'actualité, analyse de la longueur des chaînes, KMean, prédiction, régression
 - Correction d'adresse, vue unique du client, du produit, fusion dorée pour les enregistrements
 - Correspondance d'enregistrements, liaison et fusion ajoutées en fonction de la logique floue
 - Création de format, correspondance de format (téléphone, date, chaîne et numéro), normalisation de format
 - Préparation des données : ordinal, normalisation, regroupement, régression
 - masquage des données, cryptage, randomisation des données
 
Audience
Utilisateurs finaux avancés, développeurs, ingénieurs qualité, gestion
Interface utilisateur
Balançoire Java
Langage de programmation
Java
Environnement de base de données
JDBC, ODBC
Il s'agit d'une application qui peut également être récupérée à partir de https://sourceforge.net/projects/dataquality/. Il a été hébergé dans OnWorks afin d'être exécuté en ligne de la manière la plus simple à partir de l'un de nos systèmes d'exploitation gratuits.





