영어FrenchGermanItalianPortugueseRussianSpanish

온웍스 파비콘

marc2ris - 클라우드의 온라인

Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터를 통해 OnWorks 무료 호스팅 제공업체에서 marc2ris 실행

이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 공급자에서 실행할 수 있는 명령 marc2ris입니다.

프로그램:

이름


marc2ris - MARC 서지 데이터를 RIS 형식으로 변환합니다.

개요


마크투리스 [-이자형 로그 대상] [-h] [-l 로그 수준] [-엘 로그 파일] [-m] [-오 아웃파일]
[-영형 아웃파일] [-NS 입력 유형] [-유 ] 파일

기술


marc2ris는 MARC 데이터셋에서 RefDB에 유용한 정보를 추출하려고 시도합니다. 마크
(Machine Readable Catalog Format)은 1960년대에 시작된 표준으로 널리 사용됩니다.
도서관 및 서지 기관에서 사용합니다. Z39.50 액세스를 제공하는 대부분의 라이브러리는
최소한 하나의 MARC 형식으로 레코드를 제공하십시오(대부분의 다른 "표준"과 마찬가지로
커플)을 선택할 수 있습니다. 현재 다음 MARC 방언이 지원됩니다.

마크21
이는 기존 MARC 변형(주로 USMARC 및 CANMARC)을 통합하려는 시도입니다.
가까운 장래에 모든 라이브러리에서 지원하는 형식일 가능성이 큽니다. NS
형식은 에 설명되어 있습니다. 도서관 of 국회 MARC 페이지[1].

유니마크
이것은 표준화 시도에 해당하는 유럽식입니다. 사양은
발견 바로가기[2].

UKMARC
이 형식은 USMARC 변종에 상당히 가깝고 주로 다음의 라이브러리에서 사용됩니다.
영국과 아일랜드. 이 형식을 지원하는 라이브러리는 다음으로 전환될 수 있습니다.
미래의 MARC21. 불행히도 이 형식에 대한 온라인 설명은 없지만
PDF 문서[3]은 USMARC와 UKMARC의 주요 차이점을 설명합니다.

옵션


기본적으로 스크립트는 stdin에서 USMARC 데이터를 읽고 RIS 데이터를 stdout으로 보냅니다.

-e 로그 대상
log-destination은 0, 1 또는 2 값 또는 이에 상응하는 문자열을 가질 수 있습니다. 표준 오류,
syslog파일, 각각. 이 값은 로그 정보가 어디로 가는지 지정합니다.
0(영)은 메시지가 stderr로 전송됨을 의미합니다. 그들은 즉시 사용할 수 있습니다
그러나 명령 출력을 방해할 수 있습니다. 1은 출력을 다음으로 보냅니다.
시스템 로그 기능. 로그 메시지를 수락하도록 syslog를 구성해야 합니다.
사용자 프로그램에서 syslog(8) 자세한 내용은 매뉴얼 페이지를 참조하십시오. 유닉스 계열
시스템은 일반적으로 이러한 메시지를 /var/log/user.log에 저장합니다. 2는 다음으로 메시지를 보냅니다.
로 지정할 수 있는 사용자 정의 로그 파일 -L 옵션을 선택합니다.

-h
도움말 및 사용 화면을 표시한 후 종료합니다.

-l 로그 수준
이벤트가 기록되는 우선 순위를 지정합니다. 이것은 0 사이의 숫자이거나
및 7 또는 문자열 중 하나 EMERG, 경보, 치명타, 잘못을, 경고, 주의, 정보, 디버그,
각각(로그 수준 정의 참조). -1 로깅을 완전히 비활성화합니다. 낮은
0과 같은 로그 수준은 가장 중요한 메시지만 기록됨을 의미합니다. 더 높은 로그
수준은 덜 중요한 이벤트도 기록됨을 의미합니다. 7에는 디버그가 포함됩니다.
메시지. 후자는 장황하고 풍부할 수 있으므로 이 로그 수준을 피하고 싶습니다.
문제를 추적해야 하는 경우가 아니면.

-L 로그 파일
로그 메시지를 수신할 로그 파일의 전체 경로를 지정하십시오. 일반적으로 이
/var/log/refdba가 됩니다.

-m
추가 MARC 출력을 켭니다. 출력 데이터는 RIS 출력이 산재되어 있습니다.
출력을 생성하는 데 사용되는 소스 MARC 데이터와 함께. 이것은 수정하는 데 유용합니다.
수동으로 변환 오류.

-o 파일
출력 보내기 파일. 면 파일 존재하는 경우 해당 내용을 덮어씁니다.

-O 파일
출력 보내기 파일. 면 파일 존재하는 경우 출력이 추가됩니다.

-t 입력 유형
MARC 입력 유형을 지정합니다. 기본값은 마크21. 다른 사용 가능한 유형은 유니마크
UKMARC.

-u
"t"(기본값)로 설정된 경우 유니코드 출력을 요청합니다. marc2ris 시도
입력 데이터를 유니코드로 변환합니다(데이터 세트에 명시적으로 명시되어 있지 않는 한
이미 유니코드를 사용하고 있습니다.) 변환이 작동하지 않는 것 같으면 다음과 같이 "f"로 설정하십시오.
일부 MARC 변형은 문자 인코딩을 명시적으로 명시하지 않습니다.

구성


마크투리스 자신을 초기화하기 위해 파일 marc2risrc를 평가합니다.

작업대 1. 마크투리스rc
┌───────────┬───────────────────────┬──────────────── ────────────┐
변하기 쉬운태만댓글
├──────────┼───────────────────────┼──────────────── ────────────┤
│outfile │ (없음) │ 기본 출력 파일 │
│ │ │ 이름. │
├──────────┼───────────────────────┼──────────────── ────────────┤
│outappend │ t │ 다음 여부를 결정합니다.
│ │ │ 출력이 추가됨(t) │
│ │ │ 기존 파일 또는 │
│ │ │ 덮어쓰기(f) │
│ │ │ 기존 파일. │
├──────────┼───────────────────────┼──────────────── ────────────┤
│매핑되지 않음 │ t │ 로 설정된 경우 t, 알 수 없음 │
│ │ │ 입력 데이터의 태그 │
│ │ │ 다음에 출력됩니다 │
│ │ │ 꼬리표; │
│ │ │ 결과 데이터는 │
│ │ │ 검사 후 │
│ │ │ 을 통해 보낸 SED │에
│ │ │ 벗기다 │
│ │ │ 추가 라인. 설정된 경우 │
│ │ ~ f, 알 수 없는 태그는 │
│ │ │ 정상적으로 무시됩니다. │
├──────────┼───────────────────────┼──────────────── ────────────┤
│logfile │ /var/log/med2ris.log │ 전체 경로 │
│ │ │ 사용자 정의 로그 파일. │입니다
│ │ │ logdest가 │인 경우에만 사용
│ │ │ 적절하게 설정합니다. │
├──────────┼───────────────────────┼──────────────── ────────────┤
│logdest │ 1 │ │의 목적지
│ │ │ 로그 정보. 0 = │
│ │ │ stderr로 인쇄; 1 = 사용 │
│ │ │ syslog 기능; 2 = │
│ │ │ 사용자 지정 로그 파일을 사용합니다. │
│ │ │ 후자는 │ 필요
│ │ │ 적절한 설정 │
│ │ │ 로그 파일. │
├──────────┼───────────────────────┼──────────────── ────────────┤
│loglevel │ 6 │ 최대 │까지의 로그 수준
│ │ │ 어떤 메시지가 │
│ │ │ 보냈습니다. 낮은 설정 (0) │
│ │ │는 가장 많이 │만 허용합니다.
│ │ │ 중요한 메시지, a │
│ │ │ 높은 설정(7) 허용 │
│ │ │을 포함한 모든 메시지
│ │ │ 디버그 메시지. -1은 │를 의미합니다.
│ │ │ 아무것도 기록되지 않습니다. │
└───────────┴───────────────────────┴───────────────── ────────────┘

데이터 가공


MARC 형식의 목적은 RIS 형식의 목적과 완전히 다릅니다.
따라서 MARC 데이터 가져오기가
가장자리. 필터는 분명히 많은 데이터 세트를 잘 처리하지만 다음은
단점이 알려져 있습니다(관심 있는 독자가 더 많이 발견할 수 있음).

· 846과 같은 일부 필드는 현재 완전히 무시됩니다. 이것은 물론
변경합니다.

· 자연 순서로 지정된 저자 이름(예: First Middle Last,
여러 중간 이름 또는 성의 문제로 인해 정규화되지 않습니다. 작가
역순의 이름, 즉 성, 중간 이름과 같은 이름은 정규화됩니다.
대부분의 경우 올바르게. 유럽 ​​이외의 이름을 처리하는 것은 시험 문제이며
오류.

· 문자 집합 처리가 다소 제한됩니다. 변경되지 않은 입력 문자만
인코딩 또는 UTF-8은 출력 데이터에 사용할 수 있습니다.

아직 희망이 조금 있다는 얘기다. NS -m 명령줄 옵션이 추가로 켜집니다.
MARC 출력. 즉, 생성된 출력에는 다음을 표시하는 산재된 선이 포함됩니다.
다음 RIS 라인을 생성하는 데 사용되는 원래 MARC 필드의 내용입니다. 을위한
예를 들어 다음 출력 스니펫은 마크투리스 에서 작성자 라인을 생성했습니다.
MARC 입력:

빈 작성자 필드(100)
:저자(Ind1): 1
:저자($a): Ershov, AP
:저자($b):
:저자($c):
:저자(Ind1): 1
:저자($a): 크누스, 도널드 어빈,
:저자($b):
:저자($c):
AU - 에르쇼프, AP
AU - 크누스,도널드 어빈

marc2ris가 데이터를 적절하게 변환하지 않는다고 생각되면 가장 쉬운 방법은
를 사용하는 -m 전환하고 출력을 파일로 리디렉션합니다. 그러면 분석할 수 있습니다.
상황에 맞게 RIS 라인을 수정하십시오. 마지막으로 MARC 라인을 제거할 수 있습니다.
다음과 같은 명령으로

~$ grep -v " " < withmarc.ris > womarc.ris

onworks.net 서비스를 사용하여 온라인으로 marc2ris 사용


Ad


Ad

최신 Linux 및 Windows 온라인 프로그램