이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 공급자에서 실행할 수 있는 명령 marc2ris입니다.
프로그램:
이름
marc2ris - MARC 서지 데이터를 RIS 형식으로 변환합니다.
개요
마크투리스 [-이자형 로그 대상] [-h] [-l 로그 수준] [-엘 로그 파일] [-m] [-오 아웃파일]
[-영형 아웃파일] [-NS 입력 유형] [-유 헿] 파일
기술
marc2ris는 MARC 데이터셋에서 RefDB에 유용한 정보를 추출하려고 시도합니다. 마크
(Machine Readable Catalog Format)은 1960년대에 시작된 표준으로 널리 사용됩니다.
도서관 및 서지 기관에서 사용합니다. Z39.50 액세스를 제공하는 대부분의 라이브러리는
최소한 하나의 MARC 형식으로 레코드를 제공하십시오(대부분의 다른 "표준"과 마찬가지로
커플)을 선택할 수 있습니다. 현재 다음 MARC 방언이 지원됩니다.
마크21
이는 기존 MARC 변형(주로 USMARC 및 CANMARC)을 통합하려는 시도입니다.
가까운 장래에 모든 라이브러리에서 지원하는 형식일 가능성이 큽니다. NS
형식은 에 설명되어 있습니다. 도서관 of 국회 MARC 페이지[1].
유니마크
이것은 표준화 시도에 해당하는 유럽식입니다. 사양은
발견 여기에서 지금 확인해 보세요.[2].
UKMARC
이 형식은 USMARC 변종에 상당히 가깝고 주로 다음의 라이브러리에서 사용됩니다.
영국과 아일랜드. 이 형식을 지원하는 라이브러리는 다음으로 전환될 수 있습니다.
미래의 MARC21. 불행히도 이 형식에 대한 온라인 설명은 없지만
이 PDF 문서[3]은 USMARC와 UKMARC의 주요 차이점을 설명합니다.
옵션
기본적으로 스크립트는 stdin에서 USMARC 데이터를 읽고 RIS 데이터를 stdout으로 보냅니다.
-e 로그 대상
log-destination은 0, 1 또는 2 값 또는 이에 상응하는 문자열을 가질 수 있습니다. 표준 오류,
syslog및 파일, 각각. 이 값은 로그 정보가 어디로 가는지 지정합니다.
0(영)은 메시지가 stderr로 전송됨을 의미합니다. 그들은 즉시 사용할 수 있습니다
그러나 명령 출력을 방해할 수 있습니다. 1은 출력을 다음으로 보냅니다.
시스템 로그 기능. 로그 메시지를 수락하도록 syslog를 구성해야 합니다.
사용자 프로그램에서 syslog(8) 자세한 내용은 매뉴얼 페이지를 참조하십시오. 유닉스 계열
시스템은 일반적으로 이러한 메시지를 /var/log/user.log에 저장합니다. 2는 다음으로 메시지를 보냅니다.
로 지정할 수 있는 사용자 정의 로그 파일 -L 옵션을 선택합니다.
-h
도움말 및 사용 화면을 표시한 후 종료합니다.
-l 로그 수준
이벤트가 기록되는 우선 순위를 지정합니다. 이것은 0 사이의 숫자이거나
및 7 또는 문자열 중 하나 EMERG, 경보, 치명타, 잘못을, 경고, 주의, 정보, 디버그,
각각(로그 수준 정의 참조). -1 로깅을 완전히 비활성화합니다. 낮은
0과 같은 로그 수준은 가장 중요한 메시지만 기록됨을 의미합니다. 더 높은 로그
수준은 덜 중요한 이벤트도 기록됨을 의미합니다. 7에는 디버그가 포함됩니다.
메시지. 후자는 장황하고 풍부할 수 있으므로 이 로그 수준을 피하고 싶습니다.
문제를 추적해야 하는 경우가 아니면.
-L 로그 파일
로그 메시지를 수신할 로그 파일의 전체 경로를 지정하십시오. 일반적으로 이
/var/log/refdba가 됩니다.
-m
추가 MARC 출력을 켭니다. 출력 데이터는 RIS 출력이 산재되어 있습니다.
출력을 생성하는 데 사용되는 소스 MARC 데이터와 함께. 이것은 수정하는 데 유용합니다.
수동으로 변환 오류.
-o 파일
출력 보내기 파일. 면 파일 존재하는 경우 해당 내용을 덮어씁니다.
-O 파일
출력 보내기 파일. 면 파일 존재하는 경우 출력이 추가됩니다.
-t 입력 유형
MARC 입력 유형을 지정합니다. 기본값은 마크21. 다른 사용 가능한 유형은 유니마크
과 UKMARC.
-u 헿
"t"(기본값)로 설정된 경우 유니코드 출력을 요청합니다. marc2ris 시도
입력 데이터를 유니코드로 변환합니다(데이터 세트에 명시적으로 명시되어 있지 않는 한
이미 유니코드를 사용하고 있습니다.) 변환이 작동하지 않는 것 같으면 다음과 같이 "f"로 설정하십시오.
일부 MARC 변형은 문자 인코딩을 명시적으로 명시하지 않습니다.
구성
마크투리스 자신을 초기화하기 위해 파일 marc2risrc를 평가합니다.
작업대 1. 마크투리스rc
┌───────────┬───────────────────────┬──────────────── ────────────┐
│변하기 쉬운 │ 태만 │ Comment │
├──────────┼───────────────────────┼──────────────── ────────────┤
│outfile │ (없음) │ 기본 출력 파일 │
│ │ │ 이름. │
├──────────┼───────────────────────┼──────────────── ────────────┤
│outappend │ t │ 다음 여부를 결정합니다.
│ │ │ 출력이 추가됨(t) │
│ │ │ 기존 파일 또는 │
│ │ │ 덮어쓰기(f) │
│ │ │ 기존 파일. │
├──────────┼───────────────────────┼──────────────── ────────────┤
│매핑되지 않음 │ t │ 로 설정된 경우 t, 알 수 없음 │
│ │ │ 입력 데이터의 태그 │
│ │ │ 다음에 출력됩니다 │
│ │ │ 꼬리표; │
│ │ │ 결과 데이터는 │
│ │ │ 검사 후 │
│ │ │ 을 통해 보낸 SED │에
│ │ │ 벗기다 │
│ │ │ 추가 라인. 설정된 경우 │
│ │ ~ f, 알 수 없는 태그는 │
│ │ │ 정상적으로 무시됩니다. │
├──────────┼───────────────────────┼──────────────── ────────────┤
│logfile │ /var/log/med2ris.log │ 전체 경로 │
│ │ │ 사용자 정의 로그 파일. │입니다
│ │ │ logdest가 │인 경우에만 사용
│ │ │ 적절하게 설정합니다. │
├──────────┼───────────────────────┼──────────────── ────────────┤
│logdest │ 1 │ │의 목적지
│ │ │ 로그 정보. 0 = │
│ │ │ stderr로 인쇄; 1 = 사용 │
│ │ │ syslog 기능; 2 = │
│ │ │ 사용자 지정 로그 파일을 사용합니다. │
│ │ │ 후자는 │ 필요
│ │ │ 적절한 설정 │
│ │ │ 로그 파일. │
├──────────┼───────────────────────┼──────────────── ────────────┤
│loglevel │ 6 │ 최대 │까지의 로그 수준
│ │ │ 어떤 메시지가 │
│ │ │ 보냈습니다. 낮은 설정 (0) │
│ │ │는 가장 많이 │만 허용합니다.
│ │ │ 중요한 메시지, a │
│ │ │ 높은 설정(7) 허용 │
│ │ │을 포함한 모든 메시지
│ │ │ 디버그 메시지. -1은 │를 의미합니다.
│ │ │ 아무것도 기록되지 않습니다. │
└───────────┴───────────────────────┴───────────────── ────────────┘
데이터 가공
MARC 형식의 목적은 RIS 형식의 목적과 완전히 다릅니다.
따라서 MARC 데이터 가져오기가
가장자리. 필터는 분명히 많은 데이터 세트를 잘 처리하지만 다음은
단점이 알려져 있습니다(관심 있는 독자가 더 많이 발견할 수 있음).
· 846과 같은 일부 필드는 현재 완전히 무시됩니다. 이것은 물론
변경합니다.
· 자연 순서로 지정된 저자 이름(예: First Middle Last,
여러 중간 이름 또는 성의 문제로 인해 정규화되지 않습니다. 작가
역순의 이름, 즉 성, 중간 이름과 같은 이름은 정규화됩니다.
대부분의 경우 올바르게. 유럽 이외의 이름을 처리하는 것은 시험 문제이며
오류.
· 문자 집합 처리가 다소 제한됩니다. 변경되지 않은 입력 문자만
인코딩 또는 UTF-8은 출력 데이터에 사용할 수 있습니다.
아직 희망이 조금 있다는 얘기다. NS -m 명령줄 옵션이 추가로 켜집니다.
MARC 출력. 즉, 생성된 출력에는 다음을 표시하는 산재된 선이 포함됩니다.
다음 RIS 라인을 생성하는 데 사용되는 원래 MARC 필드의 내용입니다. 을위한
예를 들어 다음 출력 스니펫은 마크투리스 에서 작성자 라인을 생성했습니다.
MARC 입력:
빈 작성자 필드(100)
:저자(Ind1): 1
:저자($a): Ershov, AP
:저자($b):
:저자($c):
:저자(Ind1): 1
:저자($a): 크누스, 도널드 어빈,
:저자($b):
:저자($c):
AU - 에르쇼프, AP
AU - 크누스,도널드 어빈
marc2ris가 데이터를 적절하게 변환하지 않는다고 생각되면 가장 쉬운 방법은
를 사용하는 -m 전환하고 출력을 파일로 리디렉션합니다. 그러면 분석할 수 있습니다.
상황에 맞게 RIS 라인을 수정하십시오. 마지막으로 MARC 라인을 제거할 수 있습니다.
다음과 같은 명령으로
~$ grep -v " " < withmarc.ris > womarc.ris
onworks.net 서비스를 사용하여 온라인으로 marc2ris 사용