최신 릴리스를 Corpus.zip으로 다운로드할 수 있는 Linux 온라인에서 실행되는 KSUCCA Corpus라는 Linux 앱입니다. 워크스테이션용 무료 호스팅 제공업체인 OnWorks에서 온라인으로 실행할 수 있습니다.
KSUCCA Corpus라는 이 앱을 온라인으로 다운로드하여 실행하면 OnWorks와 함께 Linux 온라인에서 무료로 실행할 수 있습니다.
이 앱을 실행하려면 다음 지침을 따르세요.
- 1. 이 애플리케이션을 PC에 다운로드했습니다.
- 2. 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX에 원하는 사용자 이름을 입력합니다.
- 3. 이러한 파일 관리자에서 이 응용 프로그램을 업로드합니다.
- 4. 이 웹사이트에서 OnWorks Linux 온라인 또는 Windows 온라인 에뮬레이터 또는 MACOS 온라인 에뮬레이터를 시작합니다.
- 5. 방금 시작한 OnWorks Linux OS에서 원하는 사용자 이름으로 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX로 이동합니다.
- 6. 응용 프로그램을 다운로드하여 설치하고 실행합니다.
스크린 샷
Ad
KSUCCA Corpus는 Linux 온라인에서 실행됩니다.
기술
KSUCCA(King Saud University Corpus of Classical Arabic)는 이슬람 이전 시대부터 회교식 50세기(CE XNUMX세기부터 XNUMX세기 초까지의 기간에 해당)까지 고전 아랍어 텍스트의 주석이 달린 선구적인 XNUMX개 토큰 코퍼스입니다. 순수한 고전 아랍어의 시대입니다. 이 말뭉치의 주요 목적은 꾸란 단어의 분포 어휘 의미론을 연구하는 데 사용하는 것입니다. 그러나 다음과 같은 다른 연구 목적으로 사용될 수 있습니다.• 아랍어 언어학: 어휘, 형태론, 통사론, 의미론 및 실용론 연구.
• 아랍어 전산 언어학: 어휘, 형태론, 통사론, 의미론 및 실용론 연구(다양한 응용 포함).
• 아랍인과 비아랍인 모두를 위한 아랍어 교육.
• 인공 지능.
• 자연어 처리.
• 정보 검색.
• 질문 답변.
• 기계 번역.
특징
- 전자 코퍼스: 서면 아랍어를 보다 빠르고 정확하게 조사할 수 있습니다.
- 동시성 말뭉치: 이슬람 이전 시대부터 회교 XNUMX세기(CE XNUMX세기에서 XNUMX세기 초까지의 기간에 해당)까지의 아랍어 텍스트를 포함하며, 이는 순수한 고전 아랍어의 시대입니다.
- 일반 말뭉치: 광범위한 장르를 포괄하여 다양한 연구 주제에 적합합니다.
- 대표 코퍼스: 고전 아랍어에 관한 일반화의 기초로 사용할 수 있습니다.
- 균형 잡힌 말뭉치: 각 장르에서 가져온 텍스트 샘플의 수는 해당 장르에 비례합니다.
- 단일 언어 말뭉치: 고전 아랍어의 서면 텍스트를 포함합니다.
- 무모음 말뭉치: 거룩한 꾸란의 단어만 모음으로 되어 있습니다.
- 미가공 말뭉치: 태깅, 원형 복원 또는 추가 유형의 주석이 포함되지 않은 일반 텍스트입니다.
- 기본형, 줄기, POS 태그, 성별 및 숫자 주석이 포함된 자동으로 주석이 달린 말뭉치 버전도 사용할 수 있습니다.
이것은 https://sourceforge.net/projects/ksucca-corpus/에서도 가져올 수 있는 애플리케이션입니다. 무료 운영 체제 중 하나에서 가장 쉬운 방법으로 온라인으로 실행하기 위해 OnWorks에서 호스팅되었습니다.