영어프랑스어스페인어

Ad


온웍스 파비콘

cmbuild - 클라우드에서의 온라인

Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터를 통해 OnWorks 무료 호스팅 제공업체에서 cmbuild를 실행합니다.

Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 cmbuild 명령입니다.

프로그램:

이름


cmbuild - 구조적으로 주석이 달린 RNA 다중 서열로부터 공분산 모델 구축
정렬

개요


cmbuild [옵션]

기술


각 다중 서열 정렬에 대해 공분산 모델을 구축하고 저장합니다.
새 파일 .

정렬 파일은 Stockholm 또는 SELEX 형식이어야 하며 합의 내용을 포함해야 합니다.
XNUMX차 구조 주석. cmbuild 합의 구조를 사용하여 결정합니다.
CM의 아키텍처

'-'(대시)일 수 있으며, 이는 다음에서 이 입력을 읽는 것을 의미합니다. 표준 파일보다는.
'-'를 사용하려면 다음과 같이 정렬 파일 형식도 지정해야 합니다. --정보 , ~ 같이
--정보 스톡홀름 (구현의 현재 제한으로 인해 MSA 파일
되감기 불가능한 입력 스트림에서는 형식을 자동 감지할 수 없습니다.)

'-'가 아닐 수 있습니다. (표준 출력), CM 파일을 다음으로 보내기 때문에 표준 출력 충돌할 것이다
프로그램의 다른 텍스트 출력과 함께.

CM을 작성하는 것 외에도 , cmbuild 또한 각각에 대해 한 줄을 출력합니다.
stdout으로 생성된 모델입니다. 각 줄에는 다음 필드가 있습니다. "aln": 인덱스
CM을 구축하는 데 사용되는 정렬; "idx": CM의 인덱스 ; "이름":
CM의 이름 "nseq": CM을 구축하는 데 사용되는 정렬의 시퀀스 수입니다.
"eff_nseq": 모델을 구축하는 데 사용되는 시퀀스의 유효 개수입니다. "alen": 길이
CM 구축에 사용된 정렬 "clen": 정렬의 열 수
합의(일치) 열로 정의됩니다. "bps": CM의 염기쌍 수; "비프":
CM의 분기 수; "rel entropy: CM": 총 상대 엔트로피
모델을 합의 열 수로 나눈 값입니다. "상대 엔트로피: HMM": 전체 상대
XNUMX차 구조를 무시한 모델의 엔트로피를 합의 수로 나눈 값
열. "설명": 모델/정렬에 대한 설명입니다.

옵션


-h 돕다; 명령줄 사용법과 사용 가능한 옵션에 대한 간략한 알림을 인쇄합니다.

-n 새 CM의 이름을 지정하세요. . 기본값은 선형 이름을 사용하는 것입니다(있는 경우).
현재의 ), 또는 그렇지 않은 경우 해당 이름 . If
둘 이상의 선형을 포함하고 -n 작동하지 않으며 모든 정렬
이름이 주석으로 표시되어 있어야 합니다. (스톡홀름 #=GF ID 주석에서와 같이).

-F 허용 덮어쓰게 됩니다. 이 옵션이 없으면 이미
존재, cmbuild 오류와 함께 종료됩니다.

-o 요약 출력을 파일로 보내기 , 오히려 표준 출력.

-O 각 모델이 구성된 후 주석이 달린 소스 정렬을 파일에 다시 저장합니다.
스톡홀름 형식으로. 시퀀스에는 상대적인 시퀀스 가중치가 표시됩니다.
배정되었습니다. 선형에는 참조 주석선이 주석으로 추가됩니다.
합의로 할당된 열을 나타냅니다. 소스 정렬이
참조 주석("#=GC RF")은 다음의 합의 잔여물로 대체됩니다.
합의 열에 대한 모델과 '.' 삽입 열의 경우 --손
옵션은 합의 위치를 ​​지정하는 데 사용되었으며, 이 경우
변하지 않은.

--devhelp 다음과 같이 인쇄 도움말 -h , 하지만 그렇지 않은 전문가 옵션도 포함됩니다.
와 함께 표시 -h . 이러한 전문가 옵션은 다음과 관련이 없을 것으로 예상됩니다.
대다수의 사용자이므로 매뉴얼 페이지에 설명되어 있지 않습니다. 유일한
실제로 수행하는 작업을 이해하기 위한 리소스는 간략한 한 줄입니다.
설명은 다음과 같은 경우에 출력됩니다. --devhelp 활성화되어 있고 소스 코드가 있습니다.

옵션 제어 모델 건설


이러한 옵션은 정렬에서 합의 열이 정의되는 방식을 제어합니다.

--빠른 분수가 >=인 합의 열을 자동으로 정의합니다. 대칭 of
공백과 반대되는 잔여물. (자세한 내용은 아래를 참조하세요. --symfrac 옵션.) 이것은
태만.

--손 기준 좌표 주석(스톡홀름의 #=GC RF 라인)을 사용하여
열은 합의이며 삽입입니다. 공백이 아닌 문자는 다음을 나타냅니다.
합의칼럼. (예를 들어 합의 열을 "x"로 표시하고 열을 삽입합니다.
"."로.) 이 옵션은 --rf 이전 버전의 Infernal(0.1
1.0.2)까지.

--symfrac
컨센서스 열을 정의하는 데 필요한 잔류 분율 임계값을 정의합니다.
사용하지 않는 --손. 기본값은 0.5입니다. 각 열의 기호 분수는 다음과 같습니다.
상대 시퀀스 가중치를 고려한 후 계산됩니다. 이를 다음으로 설정
0.0은 모든 정렬 열이 합의로 할당됨을 의미합니다.
어떤 경우에는 유용합니다. 1.0으로 설정하면 간격이 0인 열만 포함됩니다.
컨센서스로 할당됩니다. 이 옵션은 --gapthresh 선택권
이전 버전의 Infernal(0.1~1.0.2)에서 (1.0 -
). 예를 들어 다음 명령에 대한 동작을 재현하려면 cmbuild --gapthresh 0.8
이전 버전에서는 다음을 사용하십시오. cmbuild --symfrac 0.2 이 버전으로.

--noss XNUMX차 구조 주석이 있는 경우 무시합니다. 다음을 사용하여 CM을 구축합니다.
염기쌍이 XNUMX개입니다. 이 모델은 HMM 프로필과 유사하며 cmsearch
cmscan 프로그램은 이를 위해 CM 알고리즘보다 빠른 HMM 알고리즘을 사용합니다.
모델. 또한 제로 염기쌍 모델은 다음과 같이 보정할 필요가 없습니다. cm보정
실행하기 전에 cmsearch 그것으로. 그만큼 --noss 옵션이 없으면 사용해야 합니다.
XNUMX차 구조 주석 .

--rsearch
파일의 RIBOSUM 행렬을 사용하여 RSEARCH로 방출 점수를 매개변수화합니다. .
--rsearch 활성화, 모든 정렬 정확히 하나만 포함해야 합니다.
순서 또는 --전화 옵션도 활성화해야 합니다. 각 시퀀스의 모든 위치
합의 "열"로 간주됩니다. 실제로 이들에 대한 배출 점수는
모델은 모델링의 차이로 인해 RIBOSUM 점수와 동일하지 않습니다.
Infernal과 RSEARCH 간의 전략은 비슷하지만 최대한 유사할 것입니다.
RIBOSUM 매트릭스 파일은 Infernal의 "matrices/" 하위 디렉터리에 포함되어 있습니다.
최상위 "infernal-xxx" 디렉터리. RIBOSUM 행렬은 대체 점수입니다.
별도의 단일 가닥을 가진 구조적 RNA에 대해 특별히 훈련된 매트릭스
잔기 및 염기쌍 대체 점수. 자세한 내용은 RSEARCH를 참조하세요.
간행물(Klein and Eddy, BMC Bioinformatics 4:44, 2003).

기타 모델 건설 옵션


--없는
null 모델 읽기 . 널 모델은 각 RNA의 확률을 정의합니다.
배경 서열의 뉴클레오티드, 기본값은 각 뉴클레오티드에 대해 0.25를 사용하는 것입니다.
null 파일의 형식은 사용자 가이드에 지정되어 있습니다.

--이전의
이전에 Dirichlet을 읽으십시오. , 기본 혼합물 Dirichlet 대체. NS
이전 파일의 형식은 사용 설명서에 지정되어 있습니다.

--devhelp 추가로 문서화되지 않은 모델 구성 옵션을 확인하세요.

옵션 제어 상대적인 무게


cmbuild 밀접하게 관련된 가중치를 낮추기 위해 임시 시퀀스 가중치 알고리즘을 사용합니다.
시퀀스 및 먼 관련 항목의 가중치를 높입니다. 이는 모델을 덜 만드는 효과가 있습니다.
고르지 않은 계통발생적 표현으로 인해 편향됩니다. 예를 들어 두 개의 동일한 시퀀스는
일반적으로 각 시퀀스는 하나의 시퀀스에 비해 절반의 가중치를 받습니다. 이 옵션은 제어합니다.
어떤 알고리즘이 사용되는지.

--wpb Henikoff 위치 기반 시퀀스 가중치 체계 사용[Henikoff 및 Henikoff,
J. 몰. 바이올. 243:574, 1994]. 이것이 기본값입니다.

--wgsc Gerstein/Sonnhammer/Chothia 가중치 알고리즘을 사용합니다[Gerstein et al, J. Mol.
바이올. 235:1067, 1994].

--없음
시퀀스 가중치를 끄십시오. 예를 들어 명시적으로 모든 시퀀스 가중치를 1.0으로 설정합니다.

--w주어진
입력 정렬 파일의 주석에 지정된 대로 시퀀스 가중치를 사용합니다. 그렇지 않은 경우
가중치가 주어졌으므로 모두 1.0이라고 가정합니다. 기본값은 새 항목을 결정하는 것입니다.
Gerstein/Sonnhammer/Chothia 알고리즘을 사용하여 시퀀스 가중치를 무시합니다.
주석이 달린 가중치.

--wblosum
기본값 대신 BLOSUM 필터링 알고리즘을 사용하여 시퀀스에 가중치를 부여합니다.
GSC 가중치. 주어진 백분율 동일성으로 시퀀스를 클러스터링합니다(참조: --wid);
각 클러스터에 총 가중치 1.0을 할당하고 구성원 간에 균등하게 분배합니다.
그 클러스터의.

--와이드
의 동작을 제어합니다. --wblosum 백분율을 설정하여 가중치 옵션
정렬을 클러스터링하기 위한 ID .

옵션 제어 유효한 순차 NUMBER


상대 가중치가 결정된 후 총 유효 가중치로 합산되도록 정규화됩니다.
시퀀스 번호, eff_nseq. 이 숫자는 실제 시퀀스 수일 수 있습니다.
정렬하지만 거의 항상 그보다 작습니다. 기본 엔트로피 가중치
방법 (--엔트) 정보 내용을 줄이기 위해 유효 시퀀스 번호를 줄입니다.
(상대 엔트로피, 또는 실제 상동체에 대한 평균 예상 점수) 합의 위치당. NS
목표 상대 엔트로피는 두 매개변수 함수에 의해 제어됩니다.
매개변수는 다음으로 설정할 수 있습니다. --오히려--esigma.

--엔트 엔트로피 가중치 전략을 사용하여 유효 시퀀스 번호를 결정합니다.
목표 평균 일치 상태 상대 엔트로피를 제공합니다. 이 옵션은 기본값이며
로 끌 수 있습니다 --enone. 기본 목표 평균 일치 상태 상대
엔트로피는 염기쌍이 0.59개 이상인 모델의 경우 1비트, 모델의 경우 0.38비트입니다.
염기쌍이 XNUMX이지만 다음과 같이 변경되었습니다. --오히려. 기본값은 0.59 또는 0.38비트입니다.
모델의 총 상대 엔트로피(합계 일치)가 자동으로 변경됩니다.
상태 상대 엔트로피)는 기본적으로 6.0비트인 컷오프보다 작지만
문서화되지 않은 전문가와 함께 변경할 수 있습니다. --전 옵션. 정말로 원한다면
해당 옵션을 사용하려면 소스 코드를 참조하세요.

--에논
엔트로피 가중치 전략을 끕니다. 유효 시퀀스 번호는 다음과 같습니다.
정렬의 시퀀스 수입니다.

--오히려
목표 평균 일치 상태 상대 엔트로피를 다음과 같이 설정합니다. . 기본적으로 대상은
일치 위치당 상대 엔트로피는 0.59개 이상인 모델의 경우 1비트입니다.
염기쌍이 없는 모델의 경우 염기쌍이 0.38이고 염기쌍이 XNUMX인 모델의 경우 XNUMX입니다.

--eminseq
허용되는 최소 유효 시퀀스 번호를 다음과 같이 정의합니다. .

--에흐므레
목표 HMM 평균 일치 상태 상대 엔트로피를 다음과 같이 설정합니다. . 엔트로피
염기쌍 일치 상태는 소외된 염기쌍 방출을 사용하여 계산됩니다.
확률.

--에셋
엔트로피 가중치에 대한 유효 시퀀스 번호를 다음과 같이 설정합니다. .

옵션 제어 FILTER P7 HMM 건설


각 CM에 대해 cmbuild 구성, 동반 필터 p7 HMM은 입력으로부터 구축됩니다.
정렬도 그렇고. 이러한 옵션은 필터 HMM 구성을 제어합니다.

--p7ere
필터 p7 HMM에 대한 목표 평균 일치 상태 상대 엔트로피를 다음과 같이 설정합니다. . By
기본적으로 일치 위치당 대상 상대 엔트로피는 0.38비트입니다.

--p7ml CM에서 구축된 최대 우도 p7 HMM을 필터 HMM으로 사용합니다. 이 HMM은
CM과 최대한 유사해야 합니다(반드시 XNUMX차적인 사항은 무시합니다).
구조).

--devhelp 문서화되지 않은 추가 필터 HMM 구성 옵션을 보려면

옵션 제어 FILTER P7 HMM 구경 측정


각 필터 HMM을 구축한 후, cmbuild 사용할 적절한 E-값 매개변수를 결정합니다.
필터링하는 동안 cmsearchcmscan 일련의 시퀀스를 샘플링하고 검색하여
각 HMM 필터 구성 및 알고리즘을 사용합니다.

--엠엔 로컬 MSV 필터 HMM 교정을 위해 샘플링된 시퀀스 수를 다음으로 설정합니다. .
기본적으로 200입니다.

--EvN 로컬 Viterbi 필터 HMM 교정을 위해 샘플링된 시퀀스 수를 다음으로 설정합니다.
. 기본적으로 200입니다.

--엘프N 로컬 순방향 필터 HMM 교정을 위해 샘플링된 시퀀스 수를 다음으로 설정합니다.
. 기본적으로 200입니다.

--EgfN 글로컬 순방향 필터 HMM 교정을 위한 샘플링 시퀀스 수 설정
. 기본적으로 200입니다.

--devhelp 문서화되지 않은 추가 필터 HMM 교정 옵션을 보려면

옵션 위한 정제 L' 입력 조정


--정제
기대치를 사용하여 CM을 구축하기 전에 정렬을 개선해 보십시오.
최대화(EM). CM은 평소와 같이 초기 정렬부터 먼저 구축됩니다. 그 다음에,
정렬의 시퀀스가 ​​최적으로 다시 정렬됩니다(HMM 밴드 CYK 사용).
알고리즘, 최적은 대역이 주어진 최적을 의미) CM에 전달되고 새로운 CM이 구축됩니다.
결과 정렬에서. 그런 다음 시퀀스는 새 CM에 다시 정렬되고
새로운 CM은 이러한 정렬을 바탕으로 구축됩니다. 이는 수렴될 때까지 계속되며,
특히 두 번의 연속 반복에 대한 정렬이 그렇지 않은 경우
상당히 다릅니다(모든 시퀀스의 합산된 비트 점수는
두 번의 연속 반복 사이에 정렬이 1% 미만으로 변경됩니다. 마지막
정렬(에 기록되는 CM을 구축하는 데 사용되는 정렬) ) is
기록 .

-l--정제, 로컬 정렬 알고리즘을 켜면 정렬이 가능해집니다.
필요한 경우 두 개 이상의 하위 시퀀스를 확장합니다(예: 쿼리 구조가
모델과 대상 시퀀스는 부분적으로만 공유됨), 특정 대규모 허용
구조 내 삽입 및 삭제는 일반적인 경우와 다르게 처벌됩니다.
삽입 삭제. 기본값은 쿼리 모델을 대상 시퀀스에 전역적으로 정렬하는 것입니다.

--깁스
의 동작을 수정합니다. --정제 따라서 EM 대신 Gibbs 샘플링이 사용됩니다. 그만큼
차이점은 정렬 단계에서 정렬이 반드시 필요한 것은 아니라는 점입니다.
대신에 각 시퀀스에 대한 정렬(parsetree)이
Inside 알고리즘에 의해 결정된 정렬의 사후 분포입니다. 때문에
이 샘플링 단계 --깁스 비결정적이므로 동일한 내용으로 다른 실행이 가능합니다.
정렬하면 다른 결과가 나올 수 있습니다. 이는 사실이 아닙니다. --정제 사용
~없이 --깁스 옵션, 이 경우 최종 정렬과 CM은 항상
똑같다. 언제 --깁스 활성화되면 --씨앗 옵션을 사용하여 시드할 수 있습니다.
난수 생성기를 예측 가능하게 만들어 결과를 재현 가능하게 만듭니다. 목표는
전에, --깁스 옵션은 전문 RNA 정렬 큐레이터가 구조를 개선하도록 돕는 것입니다.
대안적인 높은 점수 정렬을 관찰할 수 있도록 하여 정렬을 수행합니다.

--씨앗
난수 생성기 시드 , 정수 >= 0. 이 옵션은
와 조합하여 사용하다 --깁스. If XNUMX이 아닌 확률적 샘플링
정렬이 재현 가능합니다. 동일한 명령은 동일한 결과를 제공합니다. 만약에
0이면 난수 생성기가 임의로 시드되며 확률론적입니다.
샘플링은 동일한 명령을 실행할 때마다 달라질 수 있습니다. 기본 시드는 0입니다.

--cyk--정제, CYK 알고리즘과 일치합니다. 기본적으로 최적의 정확도
알고리즘이 사용됩니다. 이에 대한 자세한 내용은 cmalign 매뉴얼 페이지.

--notrunc
--정제, 잘린 정렬 알고리즘을 끄십시오. 더 있습니다
이에 대한 정보는 cmalign 매뉴얼 페이지.

--devhelp 추가로 문서화되지 않은 정렬 개선 옵션을 다음과 같이 확인합니다.
단일 모델에 대해 여러 모델을 구축하기 위한 기타 출력 파일 옵션 및 옵션도 포함됩니다.
조정.

onworks.net 서비스를 사용하여 온라인으로 cmbuild 사용


무료 서버 및 워크스테이션

Windows 및 Linux 앱 다운로드

  • 1
    사무실 바닥
    사무실 바닥
    OfficeFloor는
    다음과 같은 커플링 제어: - 종속성
    주입 - 연속 주입 -
    스레드 주입 자세한 내용은
    방문하다...
    오피스플로어 다운로드
  • 2
    DivKit
    DivKit
    DivKit은 오픈 소스 서버 기반입니다.
    UI(SDUI) 프레임워크. 이를 통해 다음을 수행할 수 있습니다.
    서버 소스 업데이트 출시
    다양한 앱 버전. 또한,
    사용된 ...
    DivKit 다운로드
  • 3
    하위 변환기
    하위 변환기
    다양한 사이를 변환하는 유틸리티
    구독 형식. 섀도우로켓 사용자
    ss, ssr 또는 v2ray를 대상으로 사용해야 합니다.
    에 &remark=를 추가할 수 있습니다.
    텔레그램 같은 HT...
    하위 변환기 다운로드
  • 4
    튀기다
    튀기다
    SWASH는 범용 숫자
    비정상을 시뮬레이션하는 도구,
    비 정수압, 자유 표면,
    회전 흐름 및 수송 현상
    연안 해역에서 ...
    SWASH 다운로드
  • 5
    VBA-M(아카이브 - 현재 Github에 있음)
    VBA-M(아카이브 - 현재 Github에 있음)
    프로젝트가 다음으로 이동했습니다.
    https://github.com/visualboyadvance-m/visualboyadvance-m
    기능: 치트 생성 상태 저장멀티
    시스템, gba, gbc, gb, sgb 지원,
    sgb2Tu...
    VBA-M 다운로드(보관됨 - 현재 Github에 있음)
  • 6
    스태커
    스태커
    Linux 시스템 최적화 및 모니터링
    Github 리포지토리:
    https://github.com/oguzhaninan/Stacer.
    대상: 최종 사용자/데스크톱. 사용자
    인터페이스: Qt. 프로그래밍 라...
    스테이서 다운로드
  • 더»

Linux 명령

Ad