Il s'agit de la commande marc2ris qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos nombreux postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
marc2ris - convertit les données bibliographiques MARC au format RIS
SYNOPSIS
marc2ris [-e destination du journal] [-h] [-l niveau de journalisation] [-L fichier journal] [-m] [-o fichier de sortie]
[-O fichier de sortie] [-t type d'entrée] [-u t|f] filet
DESCRIPTION
marc2ris tente d'extraire les informations utiles à RefDB à partir des ensembles de données MARC.
(Machine Readable Catalogue Format) est une norme originaire des années 1960 et largement utilisée
Utilisé par les bibliothèques et les agences bibliographiques. La plupart des bibliothèques proposant un accès Z39.50 peuvent
fournir les enregistrements dans au moins un format MARC (comme avec la plupart des autres « normes », il y a
(plusieurs choix possibles). Les dialectes MARC suivants sont actuellement pris en charge :
MARC21
Il s'agit d'une tentative de consolidation des variantes MARC existantes (principalement USMARC et CANMARC)
et sera très probablement le format pris en charge par toutes les bibliothèques dans un avenir proche.
le format est décrit sur le Bibliothèque of Congrès MARC pages[1].
UNIMARC
Il s'agit de l'équivalent européen d'une tentative de normalisation. La spécification peut être
trouvé ici[2].
UKMARC
Ce format est assez proche de la variante USMARC et est principalement utilisé par les bibliothèques
au Royaume-Uni et en Irlande. Les bibliothèques prenant en charge ce format peuvent passer à
MARC21 à venir. Malheureusement, il n'existe pas de description en ligne de ce format, mais
ceci. PDF document[3] décrit les principales différences entre USMARC et UKMARC.
OPTIONS
Par défaut, le script lit les données USMARC depuis stdin et envoie les données RIS vers stdout.
-e destination du journal
log-destination peut avoir les valeurs 0, 1 ou 2, ou les chaînes équivalentes stderr,
syslog, ou filet, respectivement. Cette valeur spécifie où vont les informations du journal.
0 (zéro) signifie que les messages sont envoyés à stderr. Ils sont immédiatement disponibles sur le
mais ils peuvent interférer avec la sortie de la commande. 1 enverra la sortie au
installation syslog. Gardez à l'esprit que syslog doit être configuré pour accepter les messages de journal
à partir des programmes utilisateur, voir le syslog(8) page de manuel pour plus d'informations. Unix-like
les systèmes enregistrent généralement ces messages dans /var/log/user.log. 2 enverra les messages à
un fichier journal personnalisé qui peut être spécifié avec le -L option.
-h
Affiche l'aide et l'écran d'utilisation, puis quitte.
-l niveau de journalisation
Spécifiez la priorité jusqu'à laquelle les événements sont enregistrés. C'est soit un nombre entre 0
et 7 ou l'une des cordes émergents, alerter, Critique, se tromper, avertissement, avis, info, déboguer,
respectivement (voir aussi les définitions de niveau de journal). -1 désactive complètement la journalisation. Un faible
un niveau de journal comme 0 signifie que seuls les messages les plus critiques sont enregistrés. Un journal plus élevé
level signifie que les événements moins critiques sont également enregistrés. 7 comprendra le débogage
messages. Ce dernier peut être verbeux et abondant, vous voulez donc éviter ce niveau de journalisation
sauf si vous avez besoin de traquer les problèmes.
-L fichier journal
Spécifiez le chemin d'accès complet à un fichier journal qui recevra les messages de journal. Typiquement ce
serait /var/log/refdba.
-m
Activer la sortie MARC supplémentaire. Les données de sortie seront celles du RIS intercalées.
avec les données MARC source utilisées pour générer la sortie. Ceci est utile pour corriger
erreurs de conversion manuellement.
-o filet
Envoyer la sortie à filet. Si filet existe, son contenu sera écrasé.
-O filet
Envoyer la sortie à filet. Si filet existe, la sortie sera ajoutée.
-t type d'entrée
Spécifiez le type d'entrée MARC. La valeur par défaut est MARC21. D'autres types disponibles sont UNIMARC
et UKMARC.
-u t|f
Demander la sortie Unicode si défini sur « t » (c'est la valeur par défaut). marc2ris tente de
convertir les données d'entrée en Unicode (sauf si l'ensemble de données indique explicitement qu'il
utilise déjà Unicode). Si la conversion ne fonctionne pas, définissez ce paramètre sur « f » comme
certaines variantes MARC n'indiquent pas explicitement l'encodage des caractères.
CONFIGURATION
marc2ris évalue le fichier marc2risrc pour s'initialiser.
lampe de table 1. marc2risrc
?? ??
│Variable │ Réglage par défaut │ Commentaires │
?? ??
│outfile │ (aucun) │ Le fichier de sortie par défaut │
│ │ │ nom. ??
?? ??
outappend │ t │ Détermine si │
│ │ │ la sortie est ajoutée (t) │
│ │ │ vers un fichier existant ou │
│ │ │ écrase (f) un
│ │ │ fichier existant. ??
?? ??
non mappé │ t │ Si défini sur t, inconnu
│ │ │ balises dans les données d'entrée │
│ │ │ sera affiché après │
│ │ un étiqueter; le
│ │ │ les données résultantes peuvent être │
│ │ │ inspecté puis être │
│ │ │ envoyé par sed à
│ │ enlevez-les
│ │ │ lignes supplémentaires. Si défini │
│ │ à f, les balises inconnues seront
│ │ │ être gracieusement ignoré. ??
?? ??
│logfile │ /var/log/med2ris.log │ Le chemin complet d'un │
│ │ │ fichier journal personnalisé. C'est
│ │ │ utilisé uniquement si logdest est │
│ │ │ réglé de manière appropriée. ??
?? ??
│logdest │ 1 │ La destination du │
│ │ informations de journal. 0 =
│ │ │ imprimer sur stderr; 1 = utiliser │
│ │ │ la fonction syslog ; 2 =
│ │ utilise un fichier journal personnalisé. ??
│ │ │ Ce dernier a besoin d'un │
│ │ │ réglage correct de │
│ │ fichier journal. ??
?? ??
│loglevel │ 6 │ Le niveau de journalisation jusqu'à │
│ │ │ quels messages seront │
│ │ envoyé. Un réglage bas (0) │
│ │ │ n'autorise que le plus │
│ │ │ messages importants, un │
│ │ │ le réglage haut (7) permet │
│ │ │ tous les messages y compris │
│ │ messages de débogage. -1 signifie
│ │ │ rien ne sera enregistré. ??
?? ??
DONNEES TRAITEMENT DES SEMENCES
L’objectif du format MARC est entièrement différent de celui du format RIS,
vous ne devriez donc pas être trop surpris que l'importation de données MARC soit quelque peu approximative au départ
bords. Le filtre semble fonctionner correctement avec un grand nombre d'ensembles de données, mais les éléments suivants
des lacunes sont connues (et le lecteur intéressé est susceptible d'en découvrir d'autres) :
· Certains champs, comme le 846, sont actuellement complètement ignorés. Ceci est bien sûr inévitable.
changer.
· Les noms d'auteurs sont spécifiés dans l'ordre naturel, c'est-à-dire quelque chose comme Prénom Deuxième prénom Nom,
ne sont pas normalisés en raison de problèmes liés à la multiplicité des deuxièmes prénoms ou des noms de famille.
les noms dans l'ordre inverse, c'est-à-dire quelque chose comme Nom, Prénom, Deuxième prénom, sont normalisés
correctement dans la plupart des cas. Le traitement des noms non européens est une question d'essais et
Erreur.
· La gestion des jeux de caractères est quelque peu limitée. Seul le caractère d'entrée non modifié est pris en compte.
l'encodage ou UTF-8 sont disponibles pour les données de sortie.
Cela dit, il y a encore un peu d’espoir. -m l'option de ligne de commande active des options supplémentaires
Sortie MARC. Autrement dit, la sortie générée contiendra des lignes intercalées indiquant
contenu des champs MARC d'origine utilisés pour générer la ou les lignes RIS suivantes. Pour
exemple, l'extrait de sortie suivant montre comment marc2ris généré les lignes de l'auteur à partir de
l'entrée MARC :
champ auteur vide (100)
:Auteur(Ind1): 1
:Auteur($a): Ershov, AP
:Auteur($b):
:Auteur($c):
:Auteur(Ind1): 1
:Auteur($a): Knuth, Donald Ervin,
:Auteur($b):
:Auteur($c):
AU - Ershov, AP
AU - Knuth, Donald Ervin
Si vous pensez que marc2ris ne traduit pas vos données de manière appropriée, le moyen le plus simple pourrait être
d'utiliser le -m et rediriger la sortie vers un fichier. Vous pouvez ensuite analyser le
et corrigez les lignes RIS comme bon vous semble. Enfin, vous pouvez supprimer les lignes MARC.
avec une commande comme :
~$ grep -v " " < withmarc.ris > womarc.ris
Utilisez marc2ris en ligne avec les services onworks.net