수마트라 - 클라우드의 온라인

이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 sumatra 명령입니다.

프로그램:

이름


수마트라 - 서열의 빠르고 정확한 비교 및 ​​클러스터링

개요


수마트라 [옵션] [데이터세트2]

기술


수마트라는 모든 쌍별 LCS(Longest Common Subsequence) 점수를 계산합니다.
뉴클레오티드 데이터 세트 또는 두 개의 뉴클레오티드 데이터 세트 사이.

옵션


-h [H]도움말 - 인쇄 돕다

-l 참조 시퀀스 길이가 가장 짧습니다.

-L 참조 시퀀스 길이가 가장 깁니다.

-a 참조 시퀀스 길이는 정렬 길이(기본값)입니다.

-n 점수는 참조 시퀀스 길이(기본값)로 정규화됩니다.

-r 정규화되지 않은 원시 점수입니다.

-d 점수는 거리로 표시됩니다. (기본값: 점수는 유사도로 표시됩니다.)

-t ##.##
점수 기준. 점수를 정규화하여 유사성(기본값)으로 표현하면,
그것은 동일성입니다. 예를 들어 0.95%의 동일성을 위한 95입니다. 점수가 정규화되면
거리로 표현하면 (1.0 - 동일성), 예를 들어 동일성이 0.05%인 경우 95입니다.
점수가 정규화되지 않고 유사도로 표현되는 경우 해당 점수의 길이입니다.
가장 긴 공통 부분 수열. 점수가 정규화되지 않고
거리(기준 길이 - LCS 길이)입니다.
##.## 이상의 유사성을 갖는 시퀀스 쌍만 인쇄됩니다. 기본값: 0.00(아니요
한계점).

-p ## 계산에 사용되는 스레드 수(기본값=1)

-g n은 a로 대체됩니다(기본값: n이 있는 시퀀스는 버려짐).

-x 두 시퀀스의 개수와 길이를 포함하는 XNUMX개의 추가 열을 추가합니다.

데이터세트1
(첫 번째 인수) 분석할 뉴클레오티드 데이터 세트

데이터세트2
(두 번째 인수) 선택적으로 두 번째 뉴클레오티드 데이터세트

결과


결과 테이블 설명
열 1: 식별자 시퀀스 1
열 2: 식별자 시퀀스 2
3열 : 점수
열 4: 시퀀스 1의 개수(옵션에만 해당) -x)
열 5: 시퀀스 2의 개수(옵션에만 해당) -x)
열 6: 시퀀스 1의 길이(옵션에만 해당) -x)
열 7: 시퀀스 2의 길이(옵션에만 해당) -x)

onworks.net 서비스를 사용하여 온라인으로 Sumatra를 사용하세요.



최신 Linux 및 Windows 온라인 프로그램