これは Open Source Data Quality and Profiling という名前の Windows アプリで、その最新リリースは ProfileV6.3.3.zip としてダウンロードできます。 これは、ワークステーション用の無料のホスティング プロバイダーである OnWorks でオンラインで実行できます。
Open Source Data Quality and Profiling with OnWorks という名前のこのアプリをオンラインで無料でダウンロードして実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOSOnWorksオンラインエミュレーターを起動しますが、Windowsオンラインエミュレーターの方が優れています。
-5。起動したばかりのOnWorksWindows OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードしてインストールします。
-7.LinuxディストリビューションソフトウェアリポジトリからWineをダウンロードします。 インストールしたら、アプリをダブルクリックして、Wineで実行できます。 また、人気のあるWindowsプログラムやゲームのインストールに役立つWine上の豪華なインターフェイスであるPlayOnLinuxを試すこともできます。
WineはLinux上でWindowsソフトウェアを実行する方法ですが、Windowsは必要ありません。 Wineは、任意のLinuxデスクトップでWindowsプログラムを直接実行できるオープンソースのWindows互換性レイヤーです。 基本的に、Wineは、実際にWindowsを必要とせずに、これらすべてのWindowsアプリケーションを実行できるように、十分な数のWindowsを最初から再実装しようとしています。
スクリーンショットは
Ad
オープンソースのデータ品質とプロファイリング
DESCRIPTION
このプロジェクトは、オープンソースのデータ品質およびデータ準備ソリューションに取り組んでいます。 データ品質には、プロファイリング、フィルタリング、ガバナンス、類似性チェック、データエンリッチメントの変更、リアルタイムアラート、バスケット分析、バブルチャートウェアハウス検証、ストラテジーによって定義された単一の顧客ビューなどが含まれます。
このツールは、データ統合、データプロファイリング、データ品質、データ準備、ダミーデータ作成、メタデータ検出、異常検出、データクレンジング、レポート作成、分析をシームレスに実行する高性能統合データ管理プラットフォームを開発しています。
また、Hadoopグリッドとの間でファイルを移動したり、Hiveテーブルを作成、ロード、プロファイルしたりするためのHadoop(ビッグデータ)のサポートもありました。 このプロジェクトは「AggregateProfiler」とも呼ばれます
このプロジェクトのResfulAPIは(ベータ版)として構築されています https://sourceforge.net/projects/restful-api-for-osdq/
apacheSparkベースのデータ品質はで構築されています https://sourceforge.net/projects/apache-spark-osdq/
特徴
- Teiid、Mysql、Oracle、Postgres、Access、Db2、SQLServer認定のビッグデータサポート-HIVE
- Hiveテーブル、Profile Hiveテーブルを作成し、ProfilerSystemおよびHadoopグリッドとの間でファイルを移動します
- ファジー論理ベースの類似性チェック、テーブルとファイル間のカーディナイルティチェック
- XML、XLSまたはCSV形式からのエクスポートとインポート、PDFエクスポート
- ファイル分析、正規表現検索、標準化、DB検索
- 完全なDBスキャン、SQLインターフェイス、データディクショナリ、スキーマ比較
- 統計分析、レポート(ディメンションおよびメジャーベース)、アドホックレポートおよび分析
- パターンマッチング、重複排除、ケースマッチング、バスケット分析、分布図
- データ生成、データ準備、およびデータマスキング機能
- メタデータ情報、データモデルのリバースエンジニアリング
- 適時性分析、文字列長分析、KMean、予測、回帰
- 住所修正、顧客の単一ビュー、製品、レコードのゴールデンマージ
- ファジー論理に基づいて追加されたレコード一致、リンケージ、およびマージ
- フォーマットの作成、フォーマットのマッチング(電話、日付、文字列、数字)、フォーマットの標準化
- データの準備:順序、正規化、バケット化、回帰
- データのマスキング、暗号化、データのランダム化
Audience
高度なエンドユーザー、開発者、品質エンジニア、管理
ユーザーインターフェース
Java Swing
プログラミング言語
Java
データベース環境
JDBC、ODBC
これは、https://sourceforge.net/projects/dataquality/からも取得できるアプリケーションです。 無料のオペレーティングシステムのXNUMXつから最も簡単な方法でオンラインで実行するために、OnWorksでホストされています。