Dit is de Linux-app genaamd data-diff waarvan de nieuwste release kan worden gedownload als v0.9.7sourcecode.zip. Het kan online worden uitgevoerd in de gratis hostingprovider OnWorks voor werkstations.
Download en voer deze app met de naam data-diff gratis online uit met OnWorks.
Volg deze instructies om deze app uit te voeren:
- 1. Download deze applicatie op uw pc.
- 2. Voer in onze bestandsbeheerder https://www.onworks.net/myfiles.php?username=XXXXX in met de gebruikersnaam die u wilt.
- 3. Upload deze applicatie in zo'n bestandsbeheerder.
- 4. Start de OnWorks Linux online of Windows online emulator of MACOS online emulator vanaf deze website.
- 5. Ga vanuit het OnWorks Linux-besturingssysteem dat u zojuist hebt gestart naar onze bestandsbeheerder https://www.onworks.net/myfiles.php?username=XXXXX met de gewenste gebruikersnaam.
- 6. Download de applicatie, installeer hem en voer hem uit.
SCREENSHOTS
Ad
gegevens-verschil
PRODUCTBESCHRIJVING
We zijn verheugd om de lancering aan te kondigen van een nieuw open-sourceproduct, data-diff, dat het vergelijken van datasets tussen databases op elke schaal snel maakt. data-diff automatiseert datakwaliteitscontroles voor datareplicatie en -migratie. In moderne dataplatforms bewegen gegevens voortdurend tussen systemen, en bij het moderne datavolume en de complexiteit lopen systemen voortdurend niet synchroon. Tot nu toe was er geen tooling om ervoor te zorgen dat wanneer de gegevens correct worden gekopieerd. Het op grote schaal repliceren van gegevens over honderden tabellen, met lage latentie en tegen redelijke infrastructuurkosten is een moeilijk probleem, en de meeste datateams waarmee we hebben gesproken, hebben te maken gehad met problemen met de datakwaliteit in hun replicatieprocessen. De harde waarheid is dat de kwaliteit van de replicatie de kwaliteit van de data is. Aangezien het kopiëren van volledige datasets in batch vaak onhaalbaar is op de moderne dataschaal, vertrouwen bedrijven op de Change Data Capture (CDC)-benadering van het repliceren van data met behulp van een continue stroom van updates.
Voordelen
- Vind mismatches in databases
- Voert diff van rijen in detail uit
- Eenvoudige CLI/API om monitoring en waarschuwingen te creëren
- Verifieer meer dan 25 miljoen rijen in <10 seconden en meer dan 1 miljard rijen in ~5 minuten
- Verifieert in veel verschillende databases
- Werkt voor tabellen met tientallen miljarden rijen
Programmeertaal
Python
Categorieën
Dit is een applicatie die ook kan worden opgehaald van https://sourceforge.net/projects/data-diff.mirror/. Het is gehost in OnWorks, zodat het op de gemakkelijkste manier online kan worden uitgevoerd vanaf een van onze gratis besturingssystemen.