Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 andi 명령입니다.
프로그램:
이름
andi - 진화 거리 추정
개요
앤디 [-jlv] [-b INT] [-p 흙손] [-m 모델] [-t INT] 파일...
기술
앤디 밀접하게 관련된 게놈 사이의 진화적 거리를 추정합니다. 이를 위해 앤디
에서 입력 시퀀스를 읽습니다. 파스타 파일을 작성하고 쌍별 앵커 거리를 계산합니다. 그만큼
이에 대한 아이디어는 Haubold et al.의 논문에 설명되어 있습니다. (아래 참조).
출력
출력은 다음의 대칭 거리 행렬입니다. 필립 형식, 각 항목은 다음을 나타냅니다.
양의 실수와의 발산. 거리가 XNUMX이라는 것은 두 시퀀스가 다음과 같다는 것을 의미합니다.
동일하지만 다른 값은 뉴클레오티드 대체율에 대한 추정치입니다(Jukes-
칸토어가 수정함). 기술적인 이유로 비교가 실패할 수 있으며 추정할 수 없습니다.
계산되었습니다. 그런 경우는 할머니 인쇄됩니다. 이는 입력 시퀀스가
우리 방법이 제대로 작동하기에는 너무 짧거나(<200bp) 너무 다양합니다(K>0.5).
옵션
-NS, --부트스트랩
다중 거리 행렬을 계산합니다. n-1 처음부터 부트스트랩되었습니다. 참조
자세한 설명은 Klötzl & Haubold(2016, 검토 중) 논문을 참조하세요.
-j, --가입하다
다음과 같은 경우에 이 모드를 사용하십시오. 파스타 파일은 수많은 어셈블리가 포함된 하나의 어셈블리를 나타냅니다.
콘티그. 앤디 그런 다음 파일당 포함된 모든 시퀀스를 단일로 처리합니다.
게놈. 이 모드에서는 명령줄을 통해 하나 이상의 파일 이름을 제공해야 합니다.
인수. 출력의 경우 파일 이름은 각 시퀀스를 식별하는 데 사용됩니다.
-l, --메모리 부족
멀티스레드 모드에서는 앤디 스레드 양에 선형적인 메모리가 필요합니다. 그만큼
메모리 부족 모드는 이를 사용된 숫자와 관계없이 일정한 요구로 변경합니다.
스레드의. 불행하게도 이는 상당한 런타임 비용을 발생시킵니다.
-m, --모델
다양한 뉴클레오티드 진화 모델이 지원됩니다. 기본적으로 Jukes-Cantor는
수정이 사용됩니다.
-p
앵커 쌍의 중요성 기본값: 0.05.
-t
사용할 스레드 수입니다. 기본적으로 사용 가능한 모든 프로세서가 사용됩니다.
멀티스레딩은 다음 경우에만 사용할 수 있습니다. 앤디 OpenMP 지원으로 컴파일되었습니다.
-v, --말 수가 많은
추가 정보를 인쇄합니다. 더 자세한 정보를 얻으려면 여러 번 적용하세요.
-h, --도움
개요와 사용 가능한 옵션에 대한 설명을 인쇄합니다.
--번역
버전 정보와 승인을 출력합니다.
저작권
저작권 © 2014, 2015 Fabian Klötzl 라이센스 GPLv3+: GNU GPL 버전 3 이상.
이것은 자유 소프트웨어입니다. 자유롭게 변경하고 재배포할 수 있습니다. 보증이 없습니다.
법이 허용하는 범위 내에서. 전체 라이센스 텍스트는 다음에서 사용할 수 있습니다.
<http://gnu.org/licenses/gpl.html>.
감사의 글
1) andi: Haubold, B. Klötzl, F. 및 Pfaffelhuber, P. (2015). andi: 빠르고 정확함
밀접하게 관련된 게놈 사이의 진화 거리 추정
2) 알고리즘: Ohlebusch, E. (2013). 생물정보학 알고리즘. 서열분석, 게놈
재배열 및 계통발생적 재구성. 118f쪽.
3) SA 구축: Mori, Y.(2005). 향상된 XNUMX단계 접미사에 대한 간단한 설명
정렬 알고리즘. http://homepage3.nifty.com/wpage/software/itssort.txt
onworks.net 서비스를 사용하여 온라인으로 andi 사용