英語フランス語スペイン語

Ad


OnWorksファビコン

marc2ris-クラウドでのオンライン

Ubuntu Online、Fedora Online、Windowsオンラインエミュレーター、またはMACOSオンラインエミュレーターを介してOnWorks無料ホスティングプロバイダーでmarc2risを実行します

これは、Ubuntu Online、Fedora Online、Windowsオンラインエミュレーター、MACOSオンラインエミュレーターなどの複数の無料オンラインワークステーションの2つを使用してOnWorks無料ホスティングプロバイダーで実行できるコマンドmarcXNUMXrisです。

プログラム:

NAME


marc2ris-MARC書誌データをRIS形式に変換します

SYNOPSIS


マーク2リス [-e ログ宛先] [-h] [-l ログレベル] [-L ログファイル] [-m] [-o アウトファイル]
[-O アウトファイル] [-NS 入力方式] [-u t | f] file

DESCRIPTION


marc2risは、MARCデータセットからRefDBに役立つ情報を抽出しようとします。 MARC
(機械可読目録形式)は1960年代からの標準であり、広く普及しています。
図書館や書誌機関で使用されます。 Z39.50アクセスを提供するほとんどのライブラリは
少なくともXNUMXつのMARC形式でレコードを提供します(他のほとんどの「標準」と同様に)
から選択するカップル)。 現在、次のMARC方言がサポートされています。

マーク21
これは、既存のMARCバリアント(主にUSMARCとCANMARC)を統合する試みです。
近い将来、すべてのライブラリでサポートされる形式になる可能性があります。 The
フォーマットは 図書館 of 議会 MARC ページ[1]。

ユニマルク
これは、ヨーロッパでの標準化の試みに相当します。 仕様は
発見 こちら[2]。

UKMARC
この形式はUSMARCバリアントにかなり近く、主に次のライブラリで使用されます。
イギリスとアイルランド。 この形式をサポートするライブラリは、
将来的にはMARC21。 残念ながら、この形式のオンライン説明はありませんが、
この PDF ドキュメント[3]は、USMARCとUKMARCの主な違いについて説明しています。

OPTIONS


デフォルトでは、スクリプトはstdinからUSMARCデータを読み取り、RISデータをstdoutに送信します。

-e ログ宛先
log-destinationは、値0、1、または2、または同等の文字列を持つことができます stderr,
syslogまたは file、 それぞれ。 この値は、ログ情報の送信先を指定します。
0(ゼロ)は、メッセージがstderrに送信されることを意味します。 それらはすぐに利用可能です
画面に表示されますが、コマンド出力に干渉する場合があります。 1は出力をに送信します
syslog機能。 ログメッセージを受け入れるようにsyslogを設定する必要があることに注意してください
ユーザープログラムから、を参照してください syslog(8)詳細についてはmanページ。 Unixライク
システムは通常、これらのメッセージを/var/log/user.logに保存します。 2はにメッセージを送信します
で指定できるカスタムログファイル -L オプションを選択します。

-h
ヘルプと使用法の画面を表示して終了します。

-l ログレベル
イベントがログに記録されるまでの優先度を指定します。 これは0からXNUMXまでの数字のいずれかです
および7または文字列のXNUMXつ EMERG, アラート, 批判する, 誤る, 警告, 通知, info, debug,
それぞれ(ログレベルの定義も参照)。 -1 ロギングを完全に無効にします。 低
0のようなログレベルは、最も重要なメッセージのみがログに記録されることを意味します。 より高いログ
レベルは、重要度の低いイベントもログに記録されることを意味します。 7にはデバッグが含まれます
メッセージ。 後者は冗長で豊富な場合があるため、このログレベルは避けたいと思います
問題を追跡する必要がない限り。

-L ログファイル
ログメッセージを受信するログファイルへのフルパスを指定します。 通常これ
/ var / log / refdbaになります。

-m
追加のMARC出力をオンにします。 出力データは、散在するRIS出力になります
出力の生成に使用されるソースMARCデータを使用します。 これは修正するのに便利です
手動で変換エラー。

-o file
に出力を送信します file。 場合 file 存在する場合、その内容は上書きされます。

-O file
に出力を送信します file。 場合 file 存在する場合、出力が追加されます。

-t 入力方式
MARC入力タイプを指定します。 デフォルトは マーク21。 他の利用可能なタイプは ユニマルク
& UKMARC.

-u t | f
「t」に設定されている場合はUnicode出力を要求します(これがデフォルトです)。 marc2risは
入力データをUnicodeに変換します(データセットに明示的に記載されている場合を除く)
すでにUnicodeを使用しています)。 変換が機能しないように見える場合は、これを「f」に設定します。
一部のMARCバリアントは、文字エンコードを明示的に記述していません。

CONFIGURATION


マーク2リス ファイルmarc2risrcを評価して、それ自体を初期化します。

1. マーク2リスク
┌──────────┬──────────────────────┬──────────────── ───────────┐
変数デフォルトコメント
├──────────┼──────────────────────┼──────────────── ───────────┤
│outfile│(なし)│デフォルトの出力ファイル│
│││名前。 │
├──────────┼──────────────────────┼──────────────── ───────────┤
│outappend│t│かどうかを決定します│
│││出力が追加されます(t)│
│││既存のファイルまたは│
│││上書き(f)│
│││既存のファイル。 │
├──────────┼──────────────────────┼──────────────── ───────────┤
│マップされていない│t│に設定されている場合 t、不明│
│││入力データのタグ│
│││は次のように出力されます│
│││a 鬼ごっこ; │
│││結果のデータは│である可能性があります
│││検査されてから│
│││送信 sed から│
│││これらを取り除く│
│││追加の行。 設定されている場合│
│││to f、不明なタグは│
│││優雅に無視されます。 │
├──────────┼──────────────────────┼──────────────── ───────────┤
│logfile│/ var / log /med2ris.log│のフルパス│
│││カスタムログファイル。 これは│です
│││logdestが│の場合にのみ使用
│││適切に設定してください。 │
├──────────┼──────────────────────┼──────────────── ───────────┤
│logdest│1│宛先│
│││ログ情報。 0 =│
│││stderrに印刷します。 1 =使用│
│││syslogファシリティ。 2 =│
│││カスタムログファイルを使用します。 │
│││後者には│が必要です
││││の適切な設定
│││ログファイル。 │
├──────────┼──────────────────────┼──────────────── ───────────┤
│loglevel│6│最大│のログレベル
│││どのメッセージが
│││送信されました。 低い設定(0)│
│││許可するのはほとんどの│
│││重要なメッセージ、│
│││高い設定(7)は│を許可します
││││を含むすべてのメッセージ
│││デバッグメッセージ。 -1は│を意味します
│││何も記録されません。 │
└──────────┴──────────────────────┴──────────────── ───────────┘

DATA 加工


MARC形式の目的は、RIS形式の目的とはまったく異なります。
したがって、MARCデータのインポートが
エッジ。 フィルタは明らかに非常に多くのデータセットをうまく処理しますが、次の
欠点は知られています(そして、興味のある読者によってもっと発見される可能性があります):

・846などの一部のフィールドは、現在完全に無視されています。 もちろん、これは
変更します。

・自然な順序で指定された著者名、つまりFirst MiddleLastのようなもの
複数のミドルネームまたはラストネームの問題のため、正規化されていません。 著者
逆の順序の名前、つまりLast、FirstMiddleなどの名前は正規化されます
ほとんどの場合正しく。 ヨーロッパ以外の名前の取り扱いは裁判の問題であり、
エラー。

・文字セットの処理には多少の制限があります。 変更されていない入力文字のみ
出力データには、エンコーディングまたはUTF-8を使用できます。

とはいえ、まだいくつかの希望があります。 The -m コマンドラインオプションは追加のスイッチをオンにします
MARC出力。 つまり、生成された出力には、
次のRIS行を生成するために使用された元のMARCフィールドの内容。 にとって
たとえば、次の出力スニペットはその方​​法を示しています マーク2リス から著者行を生成しました
MARC入力:

空の著者フィールド(100)
:作成者(Ind1):1
:著者($ a):エルショフ、AP
:作成者($ b):
:作成者($ c):
:作成者(Ind1):1
:著者($ a):クヌース、ドナルド・アーヴィン、
:作成者($ b):
:作成者($ c):
AU-エルショフ、AP
AU-クヌース、ドナルド・アーヴィン

marc2risがデータを適切に変換していないと思われる場合、最も簡単な方法は次のとおりです。
使用します -m 出力を切り替えてファイルにリダイレクトします。 次に、分析することができます
状況に応じて、適切と思われるRISラインを修正します。 最後に、MARCラインを取り除くことができます
次のようなコマンドで:

〜$ grep -v " "<withmarc.ris> womarc.ris

onworks.netサービスを使用してオンラインでmarc2risを使用する


無料のサーバーとワークステーション

Windows と Linux のアプリをダウンロード

Linuxコマンド

Ad