영어프랑스어스페인어

Ad


온웍스 파비콘

cmcalibrate - 클라우드에서의 온라인

Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터를 통해 OnWorks 무료 호스팅 제공업체에서 cmcalibrate를 실행합니다.

Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 공급자에서 실행할 수 있는 cmcalibrate 명령입니다.

프로그램:

이름


cmcalibrate - 공분산 모델 E-값 결정을 위한 지수 꼬리 맞춤

개요


cm보정 [옵션] cm파일

기술


cm보정 다음을 생성하여 E-값 결정을 위한 지수 꼬리 매개변수를 결정합니다.
무작위 시퀀스를 CM으로 검색하고 결과 점수를 수집합니다.
안타. 적중의 비트 점수 히스토그램은 지수 꼬리에 적합하며,
장착된 꼬리의 매개변수는 CM 파일에 저장됩니다. 지수 꼬리 매개변수
그런 다음 발견된 적중의 통계적 유의성을 추정하는 데 사용됩니다. cmsearch
cmscan.

CM 파일은 다음을 사용하여 보정해야 합니다. cm보정 에서 사용되기 전에 cmsearch or cm스캔,
한 가지 예외가 있습니다. 다음만 포함하는 CM 파일을 보정할 필요는 없습니다.
실행 전 염기쌍이 XNUMX인 모델 cmsearch.

cm보정 매우 느립니다. 단일 평균 크기를 보정하는 데 몇 시간이 걸립니다.
단일 CPU의 CM. cm보정 Infernal의 경우 사용 가능한 모든 코어에서 병렬로 실행됩니다.
POSIX 스레딩을 지원하는 시스템에 구축되었습니다(설치 섹션 참조).
자세한 내용은 사용자 가이드 참조). 사용 코어는 대략적으로 발생합니다
단일 CPU 대비 가속. MPI(메시지 전달 인터페이스)는 다음 용도로도 사용할 수 있습니다.
와의 병렬화 --mpi Infernal이 MPI를 활성화하여 구축되었지만 다음을 사용하는 경우 옵션
161개 이상의 프로세서는 권장되지 않습니다. 161개 이상으로 늘리면 속도가 빨라지지 않기 때문입니다.
교정. 자세한 내용은 사용자 가이드의 설치 섹션을 참조하세요.

XNUMXD덴탈의 --예측 옵션을 사용하여 프로그램을 실행하는 데 걸리는 시간을 추정할 수 있습니다.
주어진 cm파일 현재 컴퓨터에서. 운행시간을 예측하려면 프로세서
MPI, 추가로 사용 --n예측 옵션을 선택합니다.

검색된 무작위 시퀀스 cm보정 훈련된 HMM에 의해 생성됩니다.
다양한 GC 콘텐츠를 포함하는 실제 게놈 서열. 목표는 GC 분포를 갖는 것입니다.
무작위 서열의 서열은 실제 게놈 서열의 서열과 유사하다.

XNUMX회 검색과 그에 따른 지수 꼬리 맞춤이 각각 하나씩 수행됩니다.
사용할 수 있는 네 가지 CM 알고리즘 cmsearchcm스캔: 글로컬 CYK,
글로컬 내부, 로컬 CYK 및 로컬 내부.

E-값 매개변수는 다음에 의해 결정됩니다. cm보정 에 의해서만 사용됩니다 cmsearchcmscan
프로그램들. 이러한 프로그램을 사용하지 않을 경우 교정하는 데 시간을 낭비하지 마십시오.
당신의 모델.

옵션


-h 돕다; 명령줄 사용법과 사용 가능한 옵션에 대한 간략한 알림을 인쇄합니다.

-L 검색할 무작위 시퀀스의 전체 길이를 설정합니다. 메가베이스(Mb). 에 의해
기본 is 1.6MB 증가 지수 꼬리를 더 적합하게 만들 것입니다
정확하고 E-값이 더 정확하지만 시간이 더 오래 걸립니다(두 배로 증가). 대략적으로
실행 시간이 두 배로 늘어납니다.) 감소 그렇게 하면 권장되지 않습니다.
덜 정확하고 E-값도 덜 정확합니다.

옵션 위한 예측 필요한 TIME 메모리


--예측
교정의 실행 시간을 예측합니다. cm파일 (제공된 옵션 포함) 켜기
현재 머신을 종료하고 종료합니다. 교정이 수행되지 않습니다. 예측
대략적인 추정으로 간주해야합니다. 멀티스레딩이 활성화된 경우(참조:
사용자 가이드의 설치 섹션), 시기는 개수를 고려합니다.
사용 가능한 코어 수

--n예측
--예측, 지정 교정에는 프로세서가 사용됩니다.
이는 MPI 실행의 실행 시간을 예측하는 데 유용할 수 있습니다.
프로세서.

--memreq
교정에 필요한 메모리 양 예측 cm파일 (제공됨
옵션)을 현재 시스템에서 종료하고 종료합니다. 교정이 수행되지 않습니다.

옵션 제어 기하급수적 꼬리 맞다


--gtailn
glocal Inside와 glocal CYK에 대한 지수 꼬리를 최고 점수
히스토그램 꼬리에서 is 검색된 Mb의 수를 곱합니다. 그만큼
기본값 250입니다. 값 250이 잘 작동하므로 선택되었습니다.
경험적으로 다른 값에 비해 상대적입니다.

--ltailn
로컬 내부 및 로컬 CYK에 대한 지수 꼬리를 최고 점수
히스토그램 꼬리에서 is 검색된 Mb의 수를 곱합니다. 그만큼
기본값 750입니다. 값 750이 잘 작동하므로 선택되었습니다.
경험적으로 다른 값에 비해 상대적입니다.

--tailp
무시 --gtailn--ltailn 접두사가 붙은 옵션과 맞는 분수 꼬리
모든 검색 모드에 대해 히스토그램을 지수 꼬리로 표시합니다.

선택 사항 출력 파일


--h파일
히스토그램을 파일에 맞게 저장 . 이 파일의 형식은 공백 두 개입니다.
한 줄에 열을 구분합니다. 첫 번째 열은 비트 점수의 x축 값입니다.
각 쓰레기통. 두 번째 열은 bin당 적중 횟수의 y축 값입니다. 각
시리즈는 단일 문자 "&"가 있는 줄로 구분됩니다. 파일에는 다음이 포함됩니다.
XNUMX개의 지수 꼬리 각각에 대해 하나의 계열이 다음 순서로 적합합니다.
글로컬 CYK, 글로컬 Inside, 로컬 CYK 및 로컬 Inside.

--sfile
생존 플롯 정보를 파일에 저장 . 이 파일의 형식은 공백 두 개입니다.
한 줄에 열을 구분합니다. 첫 번째 열은 비트 점수의 x축 값입니다.
각 쓰레기통. 두 번째 열은 충족되거나 일치하는 적중 비율의 y축 값입니다.
각 bin의 점수를 초과합니다. 각 시리즈는 단일 라인으로 구분됩니다.
성격 "&". 파일에는 XNUMX개의 CM 각각에 대한 세 가지 데이터 시리즈가 포함됩니다.
검색 모드는 glocal CYK, glocal Inside, local CYK,
현지 내부. 첫 번째 시리즈는 히스토그램의 경험적 생존 플롯입니다.
무작위 시퀀스에 대한 히트 수입니다. 두 번째 계열은 지수 꼬리 맞춤입니다.
경험적 분포. 세 번째 계열은 람다인 경우 지수 꼬리 맞춤입니다.
2의 자연로그(0.691314718)로 고정되어 설정되었습니다.

--qq파일
분위수-분위수 플롯 정보를 파일에 저장 . 이 파일의 형식은 다음과 같습니다.
한 줄에 두 개의 공백으로 구분된 열. 첫 번째 열은 x축 값이고,
두 번째 열은 y축 값입니다. 점으로부터의 거리
동일선(y=x)은 지수 꼬리 맞춤이 얼마나 좋은지를 나타내는 척도입니다.
점이 동일선에 가까울수록 적합도가 더 좋습니다. 각 시리즈는
단일 문자 "&"가 있는 줄로 구분됩니다. 파일에는 하나의 시리즈가 포함됩니다.
XNUMX개의 지수 꼬리 피팅 각각에 대한 경험적 데이터는 다음과 같습니다.
순서: glocal CYK, glocal Inside, 로컬 CYK 및 로컬 Inside.

--파일
다양한 지수 꼬리 피팅의 공간 구분 통계를 파일에 저장합니다. .
파일에는 다음과 같은 지수 꼬리에 대한 람다 및 뮤 값이 포함됩니다.
다양한 크기의 히스토그램 꼬리. 파일의 필드에는 라벨이 지정되어 있습니다.
유익하게.

--xfile
각 맞춤 히스토그램 꼬리의 점수 목록을 파일에 저장 . 각 라인의
이 파일은 꼬리에 하나의 적중이 존재했음을 나타내는 다른 점수를 갖습니다.
그 점수. 각 계열은 단일 문자 "&"가 있는 줄로 구분됩니다. 그만큼
파일에는 XNUMX개의 지수 꼬리 피팅 각각에 대해 하나의 계열이 포함됩니다.
다음 순서: glocal CYK, glocal Inside, 로컬 CYK 및 로컬 Inside.

기타 옵션


--씨앗
난수 생성기 시드 , 정수 >= 0. 만약 XNUMX이 아니고,
확률적 시뮬레이션을 재현할 수 있습니다. 같은 명령은 같은 것을 줄 것입니다
결과. 만약에 0이면 난수 생성기가 임의로 시드되고
확률적 시뮬레이션은 동일한 명령을 실행할 때마다 다릅니다. 기본값
씨앗은 181입니다.

--베타
기본적으로 쿼리 종속 밴딩(QDB)은 CM 검색을 가속화하는 데 사용됩니다.
베타 테일 손실 확률이 1E-15인 알고리즘. 이 베타 값은 다음과 같습니다.
로 변경 --베타 . 베타 매개변수는 확률의 양입니다.
밴드 계산 중에 질량이 제외되고 베타 값이 높을수록 속도가 향상됩니다.
하지만 낮은 값보다 정확도가 더 높아집니다. 사용되는 기본값은 1E-15입니다.
(QDB에 대한 자세한 내용은 Nawrocki 및 Eddy, PLoS 전산 생물학 참조)
3(3): e56.)

--노밴드
E-값 교정 중에는 QDB를 끄십시오. 이렇게 하면 교정 속도가 느려집니다.

--nonnull3
null3 사후 추가 null 모델을 끕니다. 그렇지 않은 경우에는 권장되지 않습니다.
동일한 옵션을 사용하여 cmsearch 및 / 또는 cmscan.

--무작위의
대신 CM의 배경 널 모델을 사용하여 무작위 시퀀스를 생성하십시오.
좀 더 현실적인 HMM. CM이 다음을 사용하여 구축되지 않은 경우 --없는 ~에 대한 옵션
cm빌드, 배경 널 모델은 A, C, G 및 U 각각 25%입니다.

--gc
시퀀스의 뉴클레오티드 분포를 사용하여 무작위 시퀀스를 생성합니다.
파일 .

--cpu
지정 병렬 CPU 작업자가 사용됩니다. 만약에 "0"으로 설정하면
프로그램은 스레드를 사용하지 않고 직렬 모드로 실행됩니다. 당신은 또한 제어할 수 있습니다
환경 변수를 설정하여 이 숫자를 INFERNAL_NCPU. 이 옵션은
Infernal이 제작된 기계가 다음을 사용할 수 있는 경우에만 사용할 수 있습니다.
POSIX 스레딩(자세한 내용은 사용자 가이드의 설치 섹션 참조)
정보).

--mpi MPI 병렬 프로그램으로 실행합니다. 이 옵션은 지옥불이 있는 경우에만 사용할 수 있습니다.
"--enable-mpi" 플래그로 구성 및 빌드되었습니다(설치 참조).
자세한 내용은 사용자 가이드 섹션을 참조하세요).

onworks.net 서비스를 사용하여 온라인으로 cmcalibrate를 사용하세요.


무료 서버 및 워크스테이션

Windows 및 Linux 앱 다운로드

Linux 명령

Ad