이는 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 공급자에서 실행할 수 있는 formatdb 명령입니다.
프로그램:
이름
formatdb - BLAST용 단백질 또는 뉴클레오티드 데이터베이스 형식 지정
개요
포맷DB [-] [-B 파일 이름] [-F 파일 이름] [-L 파일 이름] [-T 파일 이름] [-V] [-a] [-b] [-e]
[-i 파일 이름] [-l 파일 이름] [-n 하위 버전] [-o] [-p F] [-s] [-t 하위 버전] [-v N]
기술
포맷DB 전에 단백질 또는 뉴클레오티드 소스 데이터베이스를 포맷하기 위해 사용해야 합니다.
이러한 데이터베이스는 blastall, blastpgp 또는 MegaBLAST로 검색할 수 있습니다. 소스 데이터베이스
FASTA 또는 ASN.1 형식일 수 있습니다. FASTA 형식은 다음과 같이 가장 자주 사용되지만
에 입력 포맷DB, ASN.1의 사용은 ASN.1을 사용하는 사람들에게 유리합니다.
GenBank 보고서와 같은 다른 형식의 공통 소스입니다. 일단 소스 데이터베이스 파일
에 의해 포맷되었습니다. 포맷DB BLAST에서는 필요하지 않습니다. 하시는 분들은 참고하세요
다음을 사용하여 BLAST 데이터베이스에 주기적인 업데이트를 적용합니다. 병합(1), 다음을 수행해야 합니다.
원본 데이터베이스 파일을 유지합니다.
옵션
아래에 옵션 요약이 포함되어 있습니다.
- 사용 메시지 인쇄
-B 파일 이름
지정된 Gifile에서 생성된 이진 Gifile -F. 이 옵션은 다음을 지정합니다.
바이너리 GI 목록 파일의 이름. 이 옵션은 -F 옵션. NS
텍스트 GI 목록은 -F 옵션과 -B 선택권은 생성할 것입니다
이진 형식의 해당 GI 목록입니다. 바이너리 파일은 더 작고 BLAST는 필요하지 않습니다.
더 빨리 읽을 수 있도록 변환합니다.
-F 파일 이름
함께 사용할 Gifile(GI 목록이 포함된 파일) -B or -L
-L 파일 이름
이름이 지정된 별칭 파일을 만듭니다. 파일 이름, 검색된 시퀀스를
에 의해 지정된 -F.
-T 파일 이름
의 표에 따라 ASN.1 정의에서 분류법 ID를 설정합니다. 파일 이름.
-V Verbose: 데이터베이스에서 고유하지 않은 문자열 ID를 확인합니다.
-a 입력 파일은 ASN.1 형식의 데이터베이스입니다(그렇지 않으면 FASTA가 예상됨).
-b ASN.1 데이터베이스는 바이너리입니다(ASCII 텍스트가 아님).
-e 입력은 시퀀스 항목입니다. 소스 ASN.1 데이터베이스(텍스트 ASCII 또는 바이너리)는
Bioseq 세트 또는 단 하나의 Bioseq만 포함합니다. 후자의 경우 -e 제공되어야 합니다.
-i 파일 이름
포맷을 위한 입력 파일
-l 파일 이름
로그 파일 이름(기본값 = formatdb.log)
-n 하위 버전 BLAST 파일의 기본 이름(기본값은 원본 FASTA 파일의 이름)
-o SeqID를 구문 분석하고 인덱스를 만듭니다. 원본 데이터베이스가 FASTA 형식인 경우
FASTA 정의 행의 데이터베이스 식별자는 다음 규칙을 따라야 합니다.
FASTA 정의 형식.
-p F 입력은 단백질이 아니라 뉴클레오티드입니다.
-s 로커스가 아닌 가입으로만 인덱싱합니다. 시퀀스 세트에 특히 유용합니다.
가입 및 위치 이름이 동일한 EST와 같습니다. Formatdb 실행
이 옵션을 사용하면 더 빠르고 더 작은 임시 파일을 생성합니다. 그것은 강하게
EST, STS, GSS 및 HTGS에 권장됩니다.
-t 하위 버전 데이터베이스 파일 제목 [문자열]
-v N 대용량 FASTA 파일을 크기의 '볼륨'으로 나눕니다. N 백만 글자(4000
기본). 볼륨 생성의 일부로, 포맷DB 새로운 유형의 BLAST를 씁니다.
'nal' 또는 'pal' 확장자를 가진 별칭 파일이라고 하는 데이터베이스 파일.
onworks.net 서비스를 사용하여 온라인에서 formatdb 사용