이것은 Ubuntu Online, Fedora Online, Windows online emulator 또는 MAC OS online emulator와 같은 다양한 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공자에서 실행할 수 있는 명령 phytime입니다.
프로그램:
이름
phytime - 대규모 시퀀스 정렬에서 분기 시간의 베이지안 추정
기술
분자 시퀀스에서 발산 시간의 베이지안 추정은 정교한
마르코프 체인 몬테카를로 기법과 메트로폴리스-헤이스팅스(MH) 샘플러가 사용되었습니다.
그 맥락에서 성공적으로 사용되었습니다. 이 접근 방식에는 다음과 같은 무거운 계산 부담이 포함됩니다.
대규모 계통유전체학 데이터 세트의 분석을 방해할 수 있습니다. 신뢰할 수 있는 발산 추정
시퀀스 정렬의 경우 시간이 매우 많이 소요되거나 불가능할 수도 있습니다.
약하거나 상충되는 계통발생학적 신호를 전달하여 더 많은 정보가 필요하다는 점을 강조합니다.
효율적인 샘플링 방법. 이 문서에서는 다음을 추정하는 새로운 접근 방식을 설명합니다.
대체율과 노드 시간의 사후 밀도. 비율의 사전 분포
노드 연령에 대한 사전 확률은 혈통을 따라 잠재적인 자기 상관 관계를 고려합니다.
균일한 밀도로 모델링됩니다. 또한, 우도 함수는 다음에 의해 근사됩니다.
다변수 정규 밀도. 이러한 구성 요소의 조합은 편리한
수학적 단순화를 통해 속도와 시간의 사후 분포를 허용합니다.
Gibbs 샘플링 알고리즘을 사용하여 추정. 4개의 실제 데이터 세트 분석
이 샘플러가 표준 MH 접근 방식보다 성능이 뛰어나며 다음을 보여줍니다.
이 새로운 방법은 방대하고/또는 어려운 데이터 세트를 분석하는 데 적합합니다.
개요
파이타임 [명령 인수]
옵션
아래 옵션은 '-i', '-u' 및 '--calibration'을 제외한 모두 선택 사항입니다.
명령 옵션:
-i (또는 --입력) seq_file_name
seq_file_name은 PHYLIP의 핵산염기 또는 아미노산 서열 파일의 이름입니다.
형식입니다.
-d (또는 --데이터 형식) 데이터 유형
data_type은 뉴클레오타이드(기본값)의 경우 'nt', 아미노산 서열의 경우 'aa' 또는
'generic'(여기서는 NEXUS 파일 형식 및 'symbols' 매개변수 사용).
-q (또는 --잇달아 일어나는)
인터리브 형식(기본값)을 순차 형식으로 변경합니다.
-m (또는 --모델) 모델
모델 : 대체 모델 이름. - 뉴클레오티드 기반 모델 : HKY85(기본값) |
JC69 | K80 | F81 | F84 | TN93 | GTR | custom (*) (*) : 사용자 정의 옵션의 경우
000000자리 숫자로 구성된 문자열은 모델을 식별합니다. 예를 들어, XNUMX
F81(또는 뉴클레오티드 빈도 분포가 다음과 같은 경우 JC69에 해당)
제복). 012345는 GTR에 해당합니다. 이 옵션은 모든 인코딩에 사용할 수 있습니다.
GTR 내에 중첩된 모델입니다.
- 아미노산 기반 모델: LG(기본값) | WAG | JTT | MtREV | Dayhoff | DCMut |
RtREV | CpREV | VT
블로섬62 | MtMam | MtArt | HIVw |
HIVb | 커스텀
--aa_rate_file 파일 이름
filename은 아미노산 치환율을 제공하는 파일의 이름입니다.
PAML 형식의 행렬. 아미노를 분석할 때 이 옵션을 반드시 사용해야 합니다.
'커스텀' 모델을 사용한 산성 시퀀스.
--구경 측정 파일 이름
filename은 사전에 정의된 교정 파일의 이름입니다.
노드 연령에 대한 경계입니다. 자세한 내용은 매뉴얼을 참조하세요.
이 파일의 형식입니다.
-t (또는 --ts/tv) ts/tv_비율
ts/tv_ratio: 전이/전환 비율. DNA 서열만 해당. 고정될 수 있음
양수 값(예: 4.0) 또는 e를 사용하여 최대 우도 추정값을 얻습니다.
-v (또는 --pinv) prop_invar
prop_invar : 불변 사이트의 비율. [0,1]의 고정 값이 될 수 있습니다.
범위 또는 e를 사용하여 최대 우도 추정치를 얻습니다.
-c (또는 --n클래스) nb_subst_cat
nb_subst_cat: 상대적 대체율 범주 수. 기본값:
nb_subst_cat=4. 양의 정수여야 합니다.
-a (또는 --알파) 감마
감마 : 감마 분포 모양 매개변수의 분포. 고정될 수 있음
양수 값 또는 e를 사용하여 최대 우도 추정치를 얻습니다.
-u (또는 --입력 트리) 사용자_트리_파일
user_tree_file : 시작 트리 파일 이름. 트리는 Newick 형식이어야 합니다.
--r_seed NUM
num은 난수 생성기를 시작하는 데 사용되는 시드입니다. 정수여야 합니다.
--run_id ID_문자열
각 PhyML 출력 파일의 끝에 ID_string 문자열을 추가합니다. 이 옵션은
PhyML과 관련된 시뮬레이션을 실행할 때 유용합니다.
--조용한
대화형 질문(배치 모드 실행용)이 없고 출력이 조용합니다.
--no_memory_check
메모리 사용량에 대한 대화식 질문이 없습니다(배치 모드에서 실행하는 경우). 정상 출력
그렇지 않으면.
--체인_길이 NUM
num은 마르코프 체인 몬테카를로의 세대 또는 실행 수입니다. 다음으로 설정됩니다.
기본값은 1E+6입니다. 정수여야 합니다.
--샘플_주파수 NUM
체인은 num 세대마다 샘플링됩니다. 기본적으로 1E+3으로 설정됩니다.
정수.
--데이터 없음
이 옵션을 사용하면 사전에서만 샘플링합니다(사후 관절이 아닌)
모델 매개변수의 밀도).
--빠르게
다변수 정규 근사를 사용하여 우도와 속도를 높이십시오.
계산
onworks.net 서비스를 사용하여 phytime을 온라인으로 이용하세요