英语法语西班牙语

运行服务器 | Ubuntu > | Fedora > |


OnWorks 网站图标

marc2ris - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 marc2ris

这是命令 marc2ris,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

名称


marc2ris - 将 MARC 书目数据转换为 RIS 格式

概要


马克2里斯 [-e 日志目的地] [-h] [-l 日志级别] [-L 日志文件] [-m] [-o 输出文件]
[-O 输出文件] [-t 输入类型] [-u t|f] 文件

商品描述


marc2ris 试图从 MARC 数据集中提取对 RefDB 有用的信息。 马克
(Machine Readable Catalog Format) 是一种源自 1960 年代的标准,被广泛使用
图书馆和书目机构使用。 大多数提供 Z39.50 访问的图书馆都可以
以至少一种 MARC 格式提供记录(与大多数其他“标准”一样,
一对夫妇可供选择)。 目前支持以下 MARC 方言:

马克21
这是对现有 MARC 变体(主要是 USMARC 和 CANMARC)进行整合的尝试
并且很可能在不久的将来成为所有图书馆支持的格式。 这
格式在 鑫安图书馆 of 代表大会 MARC 网页[1]。

统一管理中心
这相当于欧洲的标准化尝试。 规格可以是
发现 此处[2]。

UKMARC
这种格式与 USMARC 变体相当接近,主要由以下图书馆使用
英国和爱尔兰。 支持这种格式的库可能会切换到
未来的MARC21。 不幸的是没有这种格式的在线描述,但是
Free Introduction PDF 文件[3] 描述了 USMARC 和 UKMARC 之间的主要区别。

配置


默认情况下,脚本从标准输入读取 USMARC 数据并将 RIS 数据发送到标准输出。

-e 日志目的地
log-destination 的值可以是 0、1 或 2,或等效的字符串 斯特德,
系统日志文件, 分别。 此值指定日志信息的去向。
0(零)表示将消息发送到 stderr。 它们可立即在
屏幕,但它们可能会干扰命令输出。 1 将输出发送到
系统日志设施。 请记住,必须将 syslog 配置为接受日志消息
从用户程序,请参阅 系统日志(8) 手册页以获取更多信息。 类Unix
系统通常将这些消息保存在 /var/log/user.log 中。 2 将消息发送到
可以使用指定的自定义日志文件 -L 选项。

-h
显示帮助和使用屏幕,然后退出。

-l 日志级别
指定记录事件的优先级。 这是一个介于 0 之间的数字
和 7 个或其中一个字符串 EMERG, 警报, 暴击, 犯错, 警告, 注意, info, 调试,
分别(另见日志级别定义)。 -1 完全禁用日志记录。 一个低
像 0 这样的日志级别意味着只记录最关键的消息。 更高的日志
级别意味着也记录较少的关键事件。 7 将包括调试
消息。 后者可能冗长而丰富,因此您希望避免此日志级别
除非你需要追踪问题。

-L 日志文件
指定将接收日志消息的日志文件的完整路径。 通常这个
将是 /var/log/refdba。

-m
打开额外的 MARC 输出。 输出数据将被RIS输出穿插
使用用于生成输出的源 MARC 数据。 这有助于修复
手动转换错误。

-o 文件
将输出发送到 文件。 如果 文件 存在,其内容将被覆盖。

-O 文件
将输出发送到 文件。 如果 文件 存在,输出将被附加。

-t 输入类型
指定 MARC 输入类型。 默认是 马克21. 其他可用的类型是 统一管理中心
UKMARC.

-u t|f
如果设置为“t”(这是默认值),则请求 Unicode 输出。 marc2ris 试图
将输入数据转换为 Unicode(除非数据集明确声明它
已经使用 Unicode)。 如果转换似乎不起作用,请将其设置为“f”作为
一些 MARC 变体没有明确说明字符编码。

配置


马克2里斯 评估文件 marc2risrc 以初始化自身。

1. marc2risrc
┌──────────┬────────────────────────┬──────────────── ──────────────┐
变量默认指南
├──────────┼────────────────────────┼──────────────── ──────────────┤
│outfile │ (none) │ 默认输出文件 │
│ │ │ 姓名。 │
├──────────┼────────────────────────┼──────────────── ──────────────┤
│outappend │ t │ 判断是否 │
│ │ │ 输出被追加(t) │
│ │ │ 到现有文件或 │
│ │ │ 覆盖 (f) │
│ │ │ 现有文件。 │
├──────────┼────────────────────────┼──────────────── ──────────────┤
│未映射 │ t │ 如果设置为 t, 未知 │
│ │ │ 输入数据中的标签│
│ │ │ 输出如下│
│ │ │ 一标签; │
│ │ │ 结果数据可以是 │
│ │ │ 验货后再被│
│ │ │ 已发送 口渴 至│
│ │ │ 脱掉这些│
│ │ │ 附加行。 若设│
│ │ │ 到 f, 未知标签会│
│ │ │ 被优雅地忽略。 │
├──────────┼────────────────────────┼──────────────── ──────────────┤
│logfile │ /var/log/med2ris.log │ 一个完整路径 │
│ │ │ 自定义日志文件。 这是│
│ │ │ 仅在 logdest 为 │ 时使用
│ │ │ 适当设置。 │
├──────────┼────────────────────────┼──────────────── ──────────────┤
│logdest │ 1 │ 目的地 │
│ │ │日志信息。 0 = │
│ │ │ 打印到标准错误; 1 = 使用│
│ │ │ 系统日志工具; 2 = │
│ │ │ 使用自定义日志文件。 │
│ │ │ 后者需要一个 │
│ │ │ │ 的正确设置
│ │ │ 日志文件。 │
├──────────┼────────────────────────┼──────────────── ──────────────┤
│loglevel │ 6 │ 日志级别最高 │
│ │ │ 哪些信息是 │
│ │ │ 发送。 低设置 (0) │
│ │ │ 只允许最多│
│ │ │ 重要讯息, 一 │
│ │ │ 高设置 (7) 允许 │
│ │ │ 所有消息包括 │
│ │ │ 调试信息。 -1 表示│
│ │ │ 不会记录任何内容。 │
└──────────┴────────────────────────┴──────────────── ──────────────┘

数据 处理


MARC 格式的目的与 RIS 格式的目的完全不同,
所以你不应该太惊讶 MARC 数据的导入有点粗糙
边缘。 过滤器显然可以很好地处理相当多的数据集,但以下内容
缺点是已知的(感兴趣的读者可能会发现更多):

· 某些字段,如 846,目前被完全忽略。 这当然是必然的
改变。

· 以自然顺序指定的作者姓名,例如 First Middle Last 之类的东西,
由于多个中间名或姓氏的问题而未规范化。 作者
倒序的名字,即像 Last, First Middle 这样的名字,被规范化
大多数情况下是正确的。 非欧洲名称的处理是一个试验和
错误。

· 字符集处理有些受限。 只有未更改的输入字符
编码或 UTF-8 可用于输出数据。

话虽如此,但仍有一些希望。 这 -m 命令行选项打开额外的
MARC 输出。 也就是说,生成的输出将包含穿插的行,显示
用于生成以下 RIS 行的原始 MARC 字段的内容。 为了
例如,以下输出片段显示了如何 马克2里斯 从生成作者行
MARC 输入:

空作者字段 (100)
:作者(Ind1):1
:作者($a): Ershov, AP
:作者($b):
:作者($c):
:作者(Ind1):1
:Author($a): Knuth, Donald Ervin,
:作者($b):
:作者($c):
AU - Ershov, AP
AU - Knuth,唐纳德·欧文

如果您觉得 marc2ris 没有正确翻译您的数据,最简单的方法可能是
使用 -m switch 并将输出重定向到一个文件中。 然后你可以分析
情况并按照您认为合适的方式修复 RIS 线。 最后你可以剥离 MARC 线
使用如下命令:

~$ grep -v " " <withmarc.ris > womarc.ris

使用 onworks.net 服务在线使用 marc2ris


Ad


Ad