EngelsFransSpaans

Ad


OnWorks-favicon

marc2ris - Online in de cloud

Voer marc2ris uit in OnWorks gratis hostingprovider via Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

Dit is de opdracht marc2ris die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

PROGRAMMA:

NAAM


marc2ris - converteert bibliografische MARC-gegevens naar het RIS-formaat

KORTE INHOUD


marc2ris [-e log-bestemming] [-h] [-l Log niveau] [-L log-bestand] [-m] [-o uitbestand]
[-O uitbestand] [-T invoer_type] [-u t|f] filet

PRODUCTBESCHRIJVING


marc2ris probeert de informatie die nuttig is voor RefDB uit MARC-datasets te extraheren. MARC
(Machine Readable Catalog Format) is een standaard die stamt uit de jaren 1960 en die op grote schaal wordt gebruikt
gebruikt door bibliotheken en bibliografische bureaus. De meeste bibliotheken die Z39.50-toegang bieden, kunnen:
lever de records in ten minste één MARC-formaat (zoals bij de meeste andere "standaarden" is er
een paar om uit te kiezen). Momenteel worden de volgende MARC-dialecten ondersteund:

MARC21
Dit is een poging om bestaande MARC-varianten (voornamelijk USMARC en CANMARC) te consolideren
en zal in de nabije toekomst waarschijnlijk het formaat zijn dat door alle bibliotheken wordt ondersteund. De
formaat wordt beschreven op de Bibliotheek of Congres MARC paginas[1].

UNIMARC
Dit is het Europese equivalent van een standaardisatiepoging. De specificatie kan zijn:
gevonden hier[2].

UKMARC
Dit formaat ligt redelijk dicht bij de USMARC-variant en wordt voornamelijk gebruikt door bibliotheken in
het Verenigd Koninkrijk en in Ierland. Bibliotheken die dit formaat ondersteunen, kunnen overschakelen naar:
MARC21 in de toekomst. Helaas is er geen online beschrijving van dit formaat, maar
dit PDF document[3] beschrijft de belangrijkste verschillen tussen USMARC en UKMARC.

OPTIES


Standaard leest het script USMARC-gegevens van stdin en stuurt het RIS-gegevens naar stdout.

-e log-bestemming
log-bestemming kan de waarden 0, 1 of 2 hebben, of de equivalente tekenreeksen stderr,
syslogof filet, respectievelijk. Deze waarde geeft aan waar de logboekinformatie naartoe gaat.
0 (nul) betekent dat de berichten naar stderr worden verzonden. Ze zijn direct beschikbaar op de
scherm, maar ze kunnen de uitvoer van opdrachten verstoren. 1 zal de output naar de . sturen
syslog-faciliteit. Houd er rekening mee dat syslog moet worden geconfigureerd om logberichten te accepteren
van gebruikersprogramma's, zie de syslog(8) man-pagina voor meer informatie. Unix-achtig
systemen slaan deze berichten meestal op in /var/log/user.log. 2 stuurt de berichten naar
een aangepast logbestand dat kan worden opgegeven met de -L optie.

-h
Geeft het help- en gebruiksscherm weer en sluit vervolgens af.

-l Log niveau
Specificeer de prioriteit tot welke gebeurtenissen worden gelogd. Dit is ofwel een getal tussen 0
en 7 of een van de snaren emerg, te waarschuwen, crit, dwalen, waarschuwing, kennisgeving, info, debug,
respectievelijk (zie ook Definities op logniveau). -1 schakelt logboekregistratie volledig uit. Een lage
log-niveau zoals 0 betekent dat alleen de meest kritieke berichten worden gelogd. Een hoger logboek
niveau betekent dat ook minder kritieke gebeurtenissen worden gelogd. 7 bevat foutopsporing
berichten. Dit laatste kan uitgebreid en overvloedig zijn, dus u wilt dit logniveau vermijden
tenzij u problemen moet opsporen.

-L log-bestand
Geef het volledige pad op naar een logbestand dat de logberichten zal ontvangen. Meestal dit
zou zijn /var/log/refdba.

-m
Extra MARC-uitgang inschakelen. De uitvoergegevens zijn de RIS-uitvoer afgewisseld
met de MARC-brongegevens die zijn gebruikt om de uitvoer te genereren. Dit is handig om op te lossen
conversiefouten handmatig.

-o filet
Stuur output naar filet. Indien filet bestaat, wordt de inhoud ervan overschreven.

-O filet
Stuur output naar filet. Indien filet bestaat, wordt de uitvoer toegevoegd.

-t invoer_type
Geef het MARC-invoertype op. De standaard is MARC21. Andere beschikbare typen zijn: UNIMARC
en UKMARC.

-u t|f
Vraag Unicode-uitvoer aan indien ingesteld op "t" (dit is de standaardinstelling). marc2ris probeert
converteer de invoergegevens naar Unicode (tenzij de gegevensset expliciet vermeldt dat het
maakt al gebruik van Unicode). Als de conversie niet lijkt te werken, stel dit dan in op "f" als
sommige MARC-varianten vermelden de tekencodering niet expliciet.

CONFIGURATIE


marc2ris evalueert het bestand marc2risrc om zichzelf te initialiseren.

tafel 1. marc2risrc
┌──────────┬──────────────────────┬─────────────── ───────────┐
VeranderlijkStandaardOpmerking
├──────────┼──────────────────────┼─────────────── ───────────┤
│outfile │ (geen) │ Het standaard uitvoerbestand │
│ │ naam. │
├──────────┼──────────────────────┼─────────────── ───────────┤
│outappend │ t │ Bepaalt of │
│ │ │ uitvoer wordt toegevoegd (t)
│ │ │ naar een bestaand bestand of │
│ │ │ overschrijft (f) een
│ │ │ bestaand bestand. │
├──────────┼──────────────────────┼─────────────── ───────────┤
│unmapped │ t │ Indien ingesteld op t, onbekend
│ │ │ tags in de invoergegevens │
│ │ │ wordt uitgevoerd na │
│ │ een label; de
│ │ │ resulterende gegevens kunnen │ . zijn
│ │ │ gekeurd en vervolgens │
│ │ doorgestuurd dorst naar
│ │ │ verwijder deze │
│ │ │ extra regels. Indien ingesteld
│ │ naar f, onbekende tags zullen │
│ │ │ gracieus genegeerd worden. │
├──────────┼──────────────────────┼─────────────── ───────────┤
│logfile │ /var/log/med2ris.log │ Het volledige pad van een │
│ │ │ aangepast logbestand. Dit is
│ │ │ alleen gebruikt als logdest │ . is
│ │ │ correct ingesteld. │
├──────────┼──────────────────────┼─────────────── ───────────┤
│logdest │ 1 │ De bestemming van de │
│ │ │ logboekinformatie. 0 =
│ │ │ afdrukken naar stderr; 1 = gebruik │
│ │ │ de syslog-faciliteit; 2 =
│ │ │ gebruik een aangepast logbestand. │
│ │ │ De laatste heeft een │ . nodig
│ │ │ juiste instelling van │
│ │ │ logbestand. │
├──────────┼──────────────────────┼─────────────── ───────────┤
│logniveau │ 6 │ Het logniveau tot │
│ │ │ welke berichten zullen worden │
│ │ verzonden. Een lage instelling (0) │
│ │ │ staat alleen de meeste │ toe
│ │ │ belangrijke berichten, een │
│ │ │ hoge instelling (7) maakt │ . mogelijk
│ │ │ alle berichten inclusief │
│ │ │ debug berichten. -1 betekent
│ │ │ er wordt niets gelogd. │
└──────────┴──────────────────────┴─────────────── ───────────┘

GEGEVENS VERWERKEN


Het doel van het MARC-formaat is heel anders dan het doel van het RIS-formaat,
dus je moet niet al te verbaasd zijn dat het importeren van MARC-gegevens enigszins ruw is aan de
randen. Het filter kan blijkbaar prima met heel veel datasets omgaan, maar het volgende:
tekortkomingen zijn bekend (en meer zullen waarschijnlijk worden ontdekt door de geïnteresseerde lezer):

· Sommige velden, zoals 846, worden momenteel volledig genegeerd. Dit is natuurlijk gebonden aan
veranderen.

· Auteursnamen gespecificeerd in de natuurlijke volgorde, dat wil zeggen zoiets als First Middle Last,
zijn niet genormaliseerd vanwege de problemen met meerdere middelste of laatste namen. Auteur
namen in omgekeerde volgorde, dat wil zeggen zoiets als Last, First Middle, zijn genormaliseerd
in de meeste gevallen correct. Het hanteren van niet-Europese namen is een kwestie van beproeving en
fout.

· De verwerking van karaktersets is enigszins beperkt. Alleen het ongewijzigde invoerteken
codering of UTF-8 zijn beschikbaar voor de uitvoergegevens.

Dat gezegd hebbende, er is nog enige hoop. De -m opdrachtregeloptie schakelt extra in
MARC-uitgang. Dat wil zeggen, de gegenereerde uitvoer zal afgewisselde regels bevatten die de
inhoud van de originele MARC-velden die zijn gebruikt om de volgende RIS-regel of -regels te genereren. Voor
voorbeeld, het volgende uitvoerfragment laat zien hoe: marc2ris de auteursregels gegenereerd van
de MARC-ingang:

leeg auteursveld (100)
:Auteur(Ind1): 1
:Auteur($a): Ershov, AP
:Auteur($b):
:Auteur($c):
:Auteur(Ind1): 1
:Auteur($a): Knuth, Donald Ervin,
:Auteur($b):
:Auteur($c):
AU - Ershov,AP
AU - Knuth, Donald Ervin

Als u vindt dat marc2ris uw gegevens niet op de juiste manier vertaalt, is de gemakkelijkste manier misschien:
Om het gebruik -m schakelen en de uitvoer omleiden naar een bestand. Dan kun je de
situatie en repareer de RIS-lijnen zoals u wilt. Eindelijk kun je de MARC-lijnen eraf halen
met een commando als:

~$ grep -v " " < withmarc.ris > womarc.ris

Gebruik marc2ris online met onworks.net-services


Gratis servers en werkstations

Windows- en Linux-apps downloaden

Linux-commando's

Ad