Este é o aplicativo Linux denominado Open Source Data Quality and Profiling, cuja versão mais recente pode ser baixada como ProfileV6.3.3.zip. Ele pode ser executado online no provedor de hospedagem gratuita OnWorks para estações de trabalho.
Baixe e execute online este aplicativo chamado Open Source Data Quality and Profiling with OnWorks gratuitamente.
Siga estas instruções para executar este aplicativo:
- 1. Baixe este aplicativo em seu PC.
- 2. Entre em nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que você deseja.
- 3. Carregue este aplicativo em tal gerenciador de arquivos.
- 4. Inicie o emulador OnWorks Linux online ou Windows online ou emulador MACOS online a partir deste site.
- 5. No sistema operacional OnWorks Linux que você acabou de iniciar, acesse nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que deseja.
- 6. Baixe o aplicativo, instale-o e execute-o.
SCREENSHOTS
Ad
Perfil e qualidade de dados de código aberto
DESCRIÇÃO
Este projeto é dedicado a soluções de qualidade e preparação de dados de código aberto. A Qualidade de Dados inclui criação de perfil, filtragem, governança, verificação de similaridade, alteração de enriquecimento de dados, alerta em tempo real, análise de cesta, validação de armazém de gráfico de bolhas, visão única do cliente, etc. definida pela Estratégia.
Esta ferramenta está desenvolvendo uma plataforma de gerenciamento de dados integrado de alto desempenho que fará integração de dados, criação de perfis de dados, qualidade de dados, preparação de dados, criação de dados fictícios, descoberta de metadados, descoberta de anomalias, limpeza de dados, relatórios e análises de forma contínua.
Ele também tinha suporte a Hadoop (Big data) para mover arquivos de / para Hadoop Grid, criar, carregar e criar perfis de tabelas. Este projeto também é conhecido como "Aggregate Profiler"
A API Resful para este projeto está sendo construída (versão beta) https://sourceforge.net/projects/restful-api-for-osdq/
a qualidade de dados com base no Apache Spark está sendo construída em https://sourceforge.net/projects/apache-spark-osdq/
Recursos
- Suporte de Big Data certificado por Teiid, Mysql, Oracle, Postgres, Access, Db2, SQL Server - HIVE
- Criar tabela Hive, tabela Hive de perfil, mover arquivo de / para o Profiler System e Hadoop Grid
- Verificação de similaridade baseada em lógica difusa, verificação cardinailty entre tabelas e arquivos
- Exportar e importar do formato XML, XLS ou CSV, exportação de PDF
- Análise de arquivo, pesquisa Regex, padronização, pesquisa de banco de dados
- Varredura completa de banco de dados, interface SQL, dicionário de dados, comparação de esquemas
- Análise estatística, relatórios (com base em dimensões e medidas), relatórios ad hoc e análises
- Correspondência de padrões, desduplicação, correspondência de caso, análise de cesta, gráfico de distribuição
- Recursos de geração de dados, preparação de dados e mascaramento de dados
- Informações de metadados, engenharia reversa do modelo de dados
- Análise de oportunidade, análise de comprimento de coluna, KMean, previsão, regressão
- Correção de endereço, visão única do cliente, produto, fusão de ouro para registros
- Record Match, Linkage e Merge adicionados com base na lógica difusa
- Criação de formato, correspondência de formato (telefone, data, string e número), padronização de formato
- Preparação de dados: Ordinal, Normalização, Bucketing, Regressão
- mascaramento de dados, criptografia, randomização de dados
Público
Usuários finais avançados, desenvolvedores, engenheiros de qualidade, gerenciamento
Interface com o usuário
Java swing
Linguagem de Programação
Java
Ambiente de Banco de Dados
JDBC, ODBC
Categorias
Este é um aplicativo que também pode ser obtido em https://sourceforge.net/projects/dataquality/. Ele foi hospedado no OnWorks para ser executado online da maneira mais fácil a partir de um de nossos Sistemas Operativos gratuitos.