영어프랑스어스페인어

Ad


온웍스 파비콘

cmemit - 클라우드의 온라인

Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터를 통해 OnWorks 무료 호스팅 제공업체에서 cmemit를 실행하세요.

이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 cmemit 명령입니다.

프로그램:

이름


cmemit - 공분산 모델의 샘플 시퀀스

개요


cmemit [옵션]

기술


XNUMXD덴탈의 cmemit 프로그램 샘플은 공분산 모델의 시퀀스를 방출합니다. ,
출력에 씁니다. 샘플링 시퀀스는 다양한 목적에 유용할 수 있습니다.
벤치마크 또는 테스트를 위한 합성 참양성 생성을 포함합니다.

기본값은 각 CM에서 정렬되지 않은 시퀀스 XNUMX개를 샘플링하는 것입니다. 또는 -c
옵션에서는 단일 다수결 합의 시퀀스를 내보낼 수 있습니다. 또는 -a 옵션, 당신
정렬을 방출할 수 있습니다.

XNUMXD덴탈의 CM 라이브러리가 포함될 수 있으며, 이 경우 각 CM이 차례로 사용됩니다.

'-'(대시)일 수 있으며, 이는 다음에서 이 입력을 읽는 것을 의미합니다. 표준 파일보다는.

염기쌍이 XNUMX인 모델의 경우 시퀀스는 대신 프로필 HMM 필터에서 샘플링됩니다.
CM의. 그러나 이러한 모델은 거의 동일하므로(특별 옵션이 아닌 한)
사용되었다 cmbuild 이를 방지하기 위해) CM 대신 HMM을 사용해도
중요한 방식으로 출력하지 않는 한 -l 옵션이 사용됩니다. 와 함께 -엘, HMM은
동일 확률 모델 시작 및 끝 위치에 대해 구성되지만 CM은 그렇지 않습니다. 당신은 할 수 있습니다
정력에도 유리합니다. cmemit 항상 CM으로부터 샘플링을 하도록 --놈몬리 옵션을 선택합니다.

옵션


-h 돕다; 명령줄 사용법과 사용 가능한 옵션에 대한 간략한 알림을 인쇄합니다.

-o 합성 시퀀스를 파일에 저장 stdout에 쓰는 대신.

-N 생성 시퀀스. 기본값은 10입니다.

-u 생성된 시퀀스를 정렬되지 않은 형식(FASTA)으로 작성합니다. 이것이 기본값입니다
행동.

-a 생성된 시퀀스를 합의된 정렬 형식(STOCKHOLM)으로 작성합니다.
FASTA가 아닌 구조 주석. 다른 출력 형식은 다음을 사용하여 가능합니다.
--아웃포맷 옵션을 선택합니다.

-c 샘플링 시퀀스 대신 단일 다수결 합의 시퀀스 예측
CM의 확률 분포에서. 고도로 보존된 잔기(염기쌍
점수가 3.0비트보다 높은 잔기 또는 점수가 XNUMX비트인 단일 가닥 잔기
1.0비트 이상)은 대문자로 표시됩니다. 다른 것들은 소문자로 표시됩니다.

-e 무작위로 생성된 더 큰 길이의 시퀀스에 CM 방출 시퀀스를 삽입합니다.
다양한 실제 게놈 서열에 대해 훈련된 HMM에서 생성됨
GC 내용(에서 사용하는 것과 동일한 HMM cm보정). 당신은을 사용할 수 있습니다 --iid ~에 대한 옵션
대신 25% A, C, G 및 U 시퀀스를 생성합니다. CM 방출 시퀀스가 ​​시작됩니다.
더 큰 시퀀스 내에서 임의의 위치에 있으며 해당 시퀀스에 포함됩니다.
않는 한 전체 --u5p or --u3p 옵션이 사용됩니다. 언제 -e 에서 사용되는
조합과 --u5p, CM 방출 시퀀스는 항상 위치 1에서 시작됩니다.
더 큰 시퀀스이며 5'가 잘립니다. 조합해서 사용하는 경우 --u3p CM
방출된 시퀀스는 항상 다음 위치에서 끝납니다. 더 큰 순서의 것입니다
3'이 잘렸습니다.

-l 시퀀스를 내보내기 전에 CM을 로컬 모드로 구성하십시오. 기본적으로 모델
글로벌 모드가 됩니다. 로컬 모드에서는 대규모 삽입 및 삭제가 더 많습니다.
글로벌 모드보다 일반적입니다.

옵션 위한 잘림 방출됨 시퀀스


--u5p 무작위로 선택된 시작 위치에서 방출된 모든 시퀀스를 자릅니다. , 만으로
다음에서 시작하는 잔여물 출력 중 . 다른 시작점이 무작위로 선택됩니다.
각 시퀀스마다.

--u3p 무작위로 선택된 끝 위치에서 방출된 모든 시퀀스를 자릅니다. , 만으로
잔여물을 해당 위치까지 출력 . 다른 끝점이 무작위로 선택됩니다.
각 시퀀스마다.

--a5p
와 함께 -a 옵션으로 방출된 정렬을 무작위로 자릅니다.
선택한 시작 경기 위치 , 위치에 대한 정렬 열만 출력하여
경기 후 상태 - 1. 0과 합의 사이의 정수여야 합니다.
모델의 길이(이는 다음을 사용하여 결정될 수 있음) cmstat 프로그램. 특별함으로
경우에는 0을 사용하여 무작위로 선택된 시작 위치가 발생합니다.

--a3p
와 함께 -a 옵션으로 방출된 정렬을 무작위로 자릅니다.
선택한 최종 경기 위치 , 위치에 대한 정렬 열만 출력하여
경기 전 상태 + 1. 1과 합의 사이의 정수여야 합니다.
모델의 길이(이는 다음을 사용하여 결정될 수 있음) cmstat 프로그램). 로서
특별한 경우, 0을 사용 무작위로 선택된 끝 위치가 발생합니다.

기타 옵션


--씨앗
난수 생성기 시드 , 정수 >= 0. 만약 XNUMX이 아니고,
시퀀스의 확률론적 샘플링이 재현 가능합니다. 동일한 명령이 제공됩니다
같은 결과. 만약에 0이면 난수 생성기가 임의로 시드됩니다.
확률론적 샘플링은 동일한 명령을 실행할 때마다 달라집니다. 그만큼
기본 시드는 0입니다.

--iid-이자형, A, C, G 및 U 각각 25%로 더 큰 시퀀스를 생성합니다.

--rna 방출된 시퀀스가 ​​RNA 시퀀스로 출력되도록 지정합니다. 이는 사실입니다.
태만.

--DNA 방출된 시퀀스가 ​​DNA 시퀀스로 출력되도록 지정합니다. 기본적으로
출력 알파벳은 RNA입니다.

--idx
방출된 시퀀스의 이름이 다음으로 시작하도록 지정합니다. . . By
디폴트 값 1입니다.

--아웃포맷
-ㅏ 출력 정렬 형식을 다음과 같이 지정하십시오. . 허용되는 형식은 다음과 같습니다: Pfam,
AFA, A2M, Clustal 및 필립. AFA는 빠르게 정렬됩니다. Pfam과 스톡홀름만 해당
정렬 형식에는 합의 구조 주석이 포함됩니다.

--t파일
내보낸 각 시퀀스에 대한 표 형식 시퀀스 구문 분석 트리(추적)를 파일로 덤프합니다.
. 주로 디버깅에 유용합니다.

--exp
CM의 방출 및 전환 확률을 다음과 같이 지수화합니다. 그리고
시퀀스를 방출하기 전에 해당 분포를 다시 정규화합니다. 이 옵션은
기본값과 관련된 구문 분석 트리의 CM 확률 분포입니다. 와 함께 이하
1.0에서 방출된 시퀀스는 정렬 시 비트 점수가 낮아지는 경향이 있습니다.
센티미터. 와 함께 1.0보다 크면 방출된 시퀀스는 더 높은 비트를 갖는 경향이 있습니다.
CM에 대한 정렬 시 점수를 얻습니다. 이 비트 점수 차이는 다음과 같이 증가합니다.
어느 방향으로든 1.0에서 더 멀어집니다. 만약에 1.0과 같습니다. 이 옵션은
기본값에 비해 아무런 영향을 미치지 않습니다. 이 옵션은 시퀀스를 생성하는 데 유용합니다.
그게 더 어렵거나( < 1.0) 또는 더 쉬움( > 1.0) CM의 경우
배경, 무작위 순서와 상동성을 구별합니다.

--흠만
CM 대신 필터 프로필 HMM에서 내보냅니다.

--놈몬리
필터 프로파일 HMM에서 방출하지 마십시오. 다음이 있는 모델의 경우에도 항상 CM을 사용하십시오.
염기쌍이 XNUMX개입니다.

onworks.net 서비스를 사용하여 온라인으로 cmemit 사용


무료 서버 및 워크스테이션

Windows 및 Linux 앱 다운로드

Linux 명령

Ad