Amazon Best VPN GoSearch

OnWorks 网站图标

开源数据质量和分析仅在 Linux 上运行

免费下载开源数据质量和分析以在 Linux 在线中运行 Linux 应用程序可在 Ubuntu 在线、Fedora 在线或 Debian 在线中在线运行

这是名为 Open Source Data Quality and Profiling 的 Linux 应用程序,可在 Linux 中在线运行,其最新版本可作为 ProfilerV6.3.1.zip 下载。 它可以在免费的工作站托管提供商 OnWorks 中在线运行。

下载并在线运行这个名为“开源数据质量和分析”的应用程序,以便在 Linux 中通过 OnWorks 免费运行。

请按照以下说明运行此应用程序:

- 1. 在您的 PC 中下载此应用程序。

- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。

- 3. 在这样的文件管理器中上传这个应用程序。

- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。

- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。

- 6. 下载应用程序,安装并运行。

SCREENSHOTS

Ad


开源数据质量和分析可在 Linux 中在线运行


商品描述

该项目致力于开源数据质量和数据准备解决方案。 数据质量包括由 Strategy 定义的分析、过滤、治理、相似性检查、数据丰富更改、实时警报、篮子分析、气泡图仓库验证、单一客户视图等。

该工具正在开发高性能的集成数据管理平台,它将无缝地进行数据集成、数据分析、数据质量、数据准备、虚拟数据创建、元数据发现、异常发现、数据清理、报告和分析。

它还具有 Hadoop(大数据)支持,可将文件移入/移出 Hadoop 网格、创建、加载和配置 Hive 表。 这个项目也被称为“聚合分析器”

此项目的 Resful API 正在构建为(Beta 版) https://sourceforge.net/projects/restful-api-for-osdq/

基于 apache spark 的数据质量正在构建 https://sourceforge.net/projects/apache-spark-osdq/

特性

  • Teiid、Mysql、Oracle、Postgres、Access、Db2、SQL Server 认证大数据支持 - HIVE
  • 创建 Hive 表、Profile Hive 表、将文件移入/移出 Profiler System 和 Hadoop Grid
  • 基于模糊逻辑的相似性检查,表和文件之间的基数检查
  • 从 XML、XLS 或 CSV 格式导出和导入,PDF 导出
  • 文件分析、正则表达式搜索、标准化、数据库搜索
  • 完整的数据库扫描、SQL 接口、数据字典、模式比较
  • 统计分析、报告(基于维度和度量)、即席报告和分析
  • 模式匹配、重复数据删除、案例匹配、篮子分析、分布图
  • 数据生成、数据准备和数据屏蔽功能
  • 元数据信息,数据模型逆向工程
  • 时效分析、字符串长度分析、KMean、预测、回归
  • 地址更正、客户单一视图、产品、记录的黄金合并
  • 基于模糊逻辑添加记录匹配、联动和合并
  • 格式创建、格式匹配(电话、日期、字符串和数字)、格式标准化
  • 数据准备:序数、归一化、分桶、回归
  • 数据屏蔽、加密、数据随机化


目的

高级最终用户、开发人员、质量工程师、管理人员


用户界面

Java秋千


程式语言

爪哇岛


数据库环境

JDBC、ODBC


这是一个也可以从 https://sourceforge.net/projects/dataquality/ 获取的应用程序。 它已托管在 OnWorks 中,以便从我们的免费操作系统之一以最简单的方式在线运行。


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad




×
广告
❤️在这里购物、预订或购买——免费,有助于保持服务免费。