이것은 Ubuntu Online, Fedora Online, Windows online emulator 또는 MAC OS online emulator와 같은 다양한 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공자에서 실행할 수 있는 명령 mhap입니다.
프로그램:
이름
mhap - 확률적 시퀀스 겹침
기술
설정해주세요 -s 또는 -p 옵션. 아래 옵션을 참조하세요: MHAP: MinHash 정렬 프로토콜.
PacBio 또는 Nanopore와 같은 장문 읽기 시퀀스의 중복을 찾기 위한 도구
생물정보학.
버전: 1.6, 빌드 시간: 09/12/2015 11:46 PM 사용법 1(직접 실행): java
-섬기는 사람 -Xmx -항아리 -s[-큐
파일>] [-f ] 사용법 2 (미리 계산된 것을 생성
바이너리): java -섬기는 사람 -Xmx -항아리 -p
-q [-에프 ]
--조정, 기본값 = 거짓
실험적 옵션.
--정렬-오프셋, 기본값 = -0. 535
정렬 일치 점수의 분산을 설명하기 위한 오프셋입니다.
--정렬-점수, 기본값 = 1.0E-6
정렬 일치에 대한 차단 점수입니다.
--필터-임계값, 기본값 = 1.0E-5
[double], k-mer 필터 파일의 k-mer가 고려되는 차단점
반복적입니다. 특정 k-mer에 대한 이 값은 두 번째 열에 지정됩니다.
필터 파일. 필터 파일이 제공되지 않으면 이 옵션은 무시됩니다.
--도움, 기본값 = 거짓
도움말 메뉴를 표시합니다.
--최대-이동, 기본값 = 0.2
[double], 추정된 오버랩의 왼쪽 및 오른쪽 영역 크기(유도됨)
중간 이동 및 시퀀스 길이에서 k-mer 일치가 여전히 있는 경우
유효한 것으로 간주됨. 2단계 필터만 해당.
--최소-저장-길이, 기본값 = 0
[int], 상자에 저장된 읽기의 최소 길이입니다. 필터링하는 데 사용됩니다.
FASTA 파일에서 짧은 내용을 읽습니다.
--나노포어-패스트, 기본값 = 거짓
Nanopore 빠른 설정에 대한 모든 매개변수를 설정합니다. 이것은 현재 가장 좋은 것입니다.
지침이며, 사전 경고 없이 언제든지 변경될 수 있습니다.
--자기없음, 기본값 = 거짓
상자 내부의 시퀀스 간의 중복을 계산하지 마십시오.
to 및 from 시퀀스가 다른 파일에서 나옵니다.
--숫자 해시, 기본값 = 512
[int], MinHashing에 사용할 min-mer의 수입니다.
--최소-일치-수, 기본값 = 3
[int], 2단계 필터를 계산하기 전에 공유해야 하는 최소 # min-mer입니다.
해당 값보다 낮은 모든 시퀀스는 겹치지 않는 것으로 간주됩니다.
--숫자 스레드, 기본값 = 12
[int], 계산에 사용할 스레드 수입니다. 일반적으로 2 x #cores로 설정됩니다.
--팩바이오-패스트, 기본값 = 거짓
PacBio 빠른 설정에 대한 모든 매개변수를 설정합니다. 이것은 현재 가장 좋은 설정입니다.
지침이며, 사전 경고 없이 언제든지 변경될 수 있습니다.
--pacbio-감응형, 기본값 = 거짓
PacBio 민감 설정에 대한 모든 매개변수를 설정합니다. 이것은 현재 가장 좋은 것입니다.
지침이며, 사전 경고 없이 언제든지 변경될 수 있습니다.
--store-full-id, 기본값 = 거짓
시퀀스만을 저장하는 것이 아니라 FASTA 파일에 표시된 대로 전체 ID를 저장합니다.
파일 내 위치. 일부 FASTA 파일에는 긴 IDS가 있어 결과 출력이 느려집니다.
압축 파일 형식을 사용하는 경우 이 옵션은 무시됩니다.
--한계점, 기본값 = 0.04
[double], 두 번째 단계 정렬 병합을 위한 임계값 유사도 점수 차단
필터입니다. 이는 겹치는 부분에서 일치하는 k-mer의 평균 수를 기반으로 합니다.
부위.
--번역, 기본값 = 거짓
버전과 빌드 시간을 표시합니다.
--가중, 기본값 = 거짓
가중 MinHashing을 수행합니다.
-f, 기본값 = ""
매우 반복적인 k-mer를 필터링하는 데 사용되는 k-mer 필터 파일입니다. 정렬해야 합니다.
빈도 순으로 내림차순으로 (두 번째 열)
-h, 기본값 = 거짓
도움말 메뉴를 표시합니다.
-k, 기본값 = 16
[int], MinHashing에 사용되는 k-mer 크기입니다. 두 번째 단계 필터의 k-mer 크기는 다음과 같습니다.
분리되어 있으며, 수정할 수 없습니다.
-p, 기본값 = ""
사용법 2만. 변환해야 하는 FASTA 파일이 들어 있는 디렉토리
저장을 위한 이진 형식.
-q, 기본값 = ""
사용법 1: 비교할 파일의 디렉토리 또는 읽기의 FASTA 파일
상자의 읽기 세트(참조 -s). 사용법 2: 바이너리의 출력 디렉토리
포맷된 데이터 파일.
-s, 기본값 = ""
사용법 1만 해당. 읽을 내용의 FASTA 또는 바이너리 데이터 파일(사용법 2 참조)
상자에 저장해 두면 이후에 읽는 모든 내용과 비교하게 됩니다.
onworks.net 서비스를 사용하여 mhap을 온라인으로 사용하세요