emmae - 클라우드에서 온라인

이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공자에서 실행할 수 있는 명령 emmae입니다.

프로그램:

이름


emma - 다중 시퀀스 정렬(ClustalW 래퍼)

개요


엠마 -순서 시퀄 [-만든다 비녀장] -덴드 비녀장 -dendfile 인파일 [-느린 비녀장]
-pw매트릭스 명부 -pwdnamatrix 명부 -사용자 매트릭스 변수 -페어와이즈데이터파일 인파일
-매트릭스 명부 -usermamatrix 변수 -dnamatrix 명부 -우마매트릭스 변수
-mamatrixfile 인파일 -pwgapopen 뜨다 -pwgapextend 뜨다 -ktup 정수 -갭우 정수
-탑진단 정수 -창문 정수 -없음 부울 [- 가오픈 뜨다]
[-갭 확장 뜨다] [-끝간격 부울] [-갭디스트 정수] -노르갑 부울
-hgapres -노갑 부울 [-최대 분할 정수] - outseq seqoutset
-dendout파일 아웃파일

엠마 -도움

기술


엠마 EMBOSS("유럽 분자 생물학 오픈 소프트웨어
"Suite"). "정렬:다중" 명령 그룹의 일부입니다.

옵션


입력 섹션에 있어야 합니다.
-순서 시퀄

-만든다 비녀장
기본값: N

-덴드 비녀장
기본값: N

-dendfile 인파일

-느린 비녀장
각 시퀀스 쌍 사이의 거리가 계산되며 이를 사용합니다.
최종 다중 정렬을 안내하는 덴드로그램을 구성합니다. 점수는 다음과 같습니다.
별도의 쌍별 정렬을 통해 계산됩니다. 이는 두 가지 방법을 사용하여 계산할 수 있습니다.
동적 프로그래밍(느리지만 정확함) 또는 Wilbur와 Lipman의 방법
(매우 빠르지만 대략적입니다). 느리고 정확한 방법은 짧은 시퀀스에 적합합니다.
하지만 많은(예: 100개 이상) 긴(예: 1000개 이상 잔여물) 시퀀스의 경우 매우 느릴 것입니다.
기본값: Y

쌍으로 일직선으로하다 옵션
-pw매트릭스 명부
각 아미노산의 유사성을 설명하는 점수표입니다.
세 가지 '내장' 가중치 매트릭스 시리즈가 제공됩니다. 각 시리즈는 여러 가지로 구성됩니다.
서로 다른 진화적 거리에서 다르게 작동하는 행렬. 정확한 것을 보려면
자세한 내용은 설명서를 참조하세요. 간단히 말해서, 우리는 메모리에 여러 행렬을 저장합니다.
아미노산 거리의 전체 범위(거의 동일한 시퀀스에서
매우 유사한 시퀀스의 경우 엄격한 가중치를 사용하는 것이 가장 좋습니다.
정체성과 가장 선호하는 보수주의자에게만 높은 점수를 주는 매트릭스
대체. 더 다양한 시퀀스의 경우 'softer'를 사용하는 것이 적절합니다.
다른 많은 빈번한 대체에 높은 점수를 주는 행렬. 1) BLOSUM
(Henikoff). 이 행렬은 데이터베이스 수행에 가장 적합한 것으로 보입니다.
유사성(상동성 검색). 사용된 행렬은 Blosum80, 62, 45, 30입니다. 2) PAM
(데이호프). 이것들은 70년대 후반부터 매우 널리 사용되어 왔습니다. 우리는 PAM을 사용합니다.
120, 160, 250, 350 행렬. 3) GONNET. 이 행렬들은 거의
Dayhoff의 절차(위)와 동일하지만 훨씬 더 최신식이며
훨씬 더 큰 데이터 세트를 기반으로 합니다. 이들은 Dayhoff보다 더 민감한 것으로 보입니다.
시리즈입니다. 저희는 GONNET 40, 80, 120, 160, 250, 350 매트릭스를 사용합니다. 또한
두 개의 동일한 아미노산에 1.0의 점수를 부여하고
그렇지 않으면 0입니다. 이 행렬은 그다지 유용하지 않습니다. 기본값: b

-pwdnamatrix 명부
경기와 불일치에 할당된 점수를 설명하는 채점표
(IUB 모호성 코드 포함). 기본값: i

-사용자 매트릭스 변수

-페어와이즈데이터파일 인파일

매트릭스 옵션
-매트릭스 명부
여기에는 가중치 행렬을 선택할 수 있는 메뉴가 제공됩니다. 기본값은 다음과 같습니다.
단백질은 Gonnet과 동료들이 도출한 PAM 계열입니다. 참고로, 계열이 사용되었습니다!
실제로 사용되는 매트릭스는 정렬할 시퀀스가 ​​얼마나 유사한지에 따라 달라집니다.
이 정렬 단계는 다음과 같습니다. 각 진화 단계에서 서로 다른 행렬이 다르게 작동합니다.
거리. 세 가지 '내장' 가중치 행렬 시리즈가 제공됩니다. 각 행렬은 다음과 같습니다.
서로 다른 진화적 거리에서 다르게 작동하는 여러 행렬의. 보려면
정확한 세부 사항은 설명서를 참조하세요. 대략적으로, 우리는 여러 행렬을 저장합니다.
기억은 아미노산 거리의 전체 범위를 포괄합니다(거의 동일한 것부터)
매우 유사한 시퀀스의 경우 다음을 사용하는 것이 가장 좋습니다.
높은 점수를 신원과 가장 선호되는 것에만 부여하는 엄격한 가중치 행렬
보존적 치환. 더 다양한 시퀀스의 경우 다음을 사용하는 것이 적절합니다.
다른 많은 빈번한 대체에 높은 점수를 주는 '더 부드러운' 행렬입니다. 1)
BLOSUM(Henikoff). 이 매트릭스는 수행에 가장 적합한 것으로 보입니다.
데이터베이스 유사성(상동성 검색). 사용된 행렬은 Blosum80, 62, 45 및
30. 2) PAM(Dayhoff). 이 방식은 70년대 후반부터 매우 널리 사용되었습니다.
PAM 120, 160, 250 및 350 행렬을 사용합니다. 3) GONNET. 이 행렬들은
Dayhoff(위)와 거의 동일한 절차를 사용하지만 훨씬 더 최신입니다.
날짜이며 훨씬 더 큰 데이터 세트를 기반으로 합니다. 이는 다음보다 더 민감한 것으로 보입니다.
데이호프 급수. GONNET 40, 80, 120, 160, 250, 350 행렬을 사용합니다. 또한
두 개의 동일한 아미노산에 1.0의 점수를 부여하는 단위 행렬을 제공합니다.
그렇지 않으면 0점입니다. 이 행렬은 그다지 유용하지 않습니다. 또는 다음을 읽을 수 있습니다.
(시리즈가 아닌) 하나의 행렬로. 기본값: b

-usermamatrix 변수

-dnamatrix 명부
이는 단일 행렬(시리즈가 아님)을 선택할 수 있는 메뉴를 제공합니다. 기본값:
i

-우마매트릭스 변수

-mamatrixfile 인파일

추가 섹션에 있어야 합니다.
천천히 일직선으로하다 옵션
-pwgapopen 뜨다
쌍 정렬에서 갭을 열 경우의 페널티입니다. 기본값: 10.0

-pwgapextend 뜨다
쌍 정렬에서 갭을 1개 잔기만큼 확장할 경우의 페널티입니다. 기본값
값: 0.1

빠른 일직선으로하다 옵션
-ktup 정수
이것은 정확히 일치하는 조각의 크기입니다. 속도를 높이려면 늘리십시오(최대 = 2
단백질의 경우 4, DNA의 경우 4), 민감도 감소. 긴 시퀀스(예: >1000)의 경우
잔류물) 기본값을 늘려야 할 수도 있습니다. 기본값: @($(acdprotein)?1:2)

-갭우 정수
이는 빠른 정렬의 각 간격에 대한 페널티입니다. 이는 다음 사항에 거의 영향을 미치지 않습니다.
극단값을 제외한 속도 또는 감도. 기본값: @($(acdprotein)?3:5)

-탑진단 정수
각 대각선의 k-튜플 일치 수(가상의 도트 매트릭스 플롯에서)는 다음과 같습니다.
계산됨. 가장 일치하는 항목만 정렬에 사용됩니다.
매개변수는 개수를 지정합니다. 속도를 높이려면 줄이고, 민감도를 높이려면 늘립니다. 기본값
값: @($(acdprotein)?5:4)

-창문 정수
이는 각 '최상의' 대각선 주위에 있는 대각선의 개수입니다.
속도를 높이려면 낮추고, 민감도를 높이려면 높이세요. 기본값: @($(acdprotein)?5:4)

-없음 부울
기본값: N

옵션
- 가오픈 뜨다
정렬에서 틈을 열 때의 페널티입니다. 틈 열림 페널티 증가
간격이 덜 자주 발생합니다. 기본값: 10.0

-갭 확장 뜨다
갭을 1잔기 연장할 경우의 페널티. 갭 연장 페널티 증가
간격을 더 짧게 만듭니다. 터미널 간격에는 페널티가 적용되지 않습니다. 기본값: 5.0

-끝간격 부울
끝 간격 분리: 끝 간격을 내부 간격과 동일하게 처리합니다.
너무 가까운 간격('간격 분리 거리'로 설정)을 피합니다. 이것을 돌리면
끄면 이 목적을 위해 끝 간격이 무시됩니다. 이는 정렬하려는 경우 유용합니다.
끝 간격이 생물학적으로 의미가 없는 단편. 기본값: Y

-갭디스트 정수
갭 분리 거리: 갭이 서로 너무 가까워지는 가능성을 줄이려고 합니다.
기타. 이 거리보다 짧은 간격은 다른 간격보다 더 큰 페널티를 받습니다.
이것은 틈새가 닫히는 것을 막지 않습니다. 틈새가 덜 자주 생기도록 만들어 블록과 같은 현상을 촉진합니다.
정렬의 모양입니다. 기본값: 8

-노르갑 부울
잔류물 특정 페널티: 아미노산 특정 갭 페널티는 감소 또는 증가시킵니다.
정렬 또는 시퀀스의 각 위치에서 갭 오프닝 페널티.
예를 들어, 글리신이 풍부한 위치는 인접한 갭이 있을 가능성이 더 높습니다.
발린이 풍부한 위치보다. 기본값: N

-hgapres
이것은 친수성으로 '간주되는' 잔류물 집합입니다. 다음과 같은 경우에 사용됩니다.
친수성 갭 페널티 도입. 기본값: GPSNDQEKR

-노갑 부울
친수성 갭 페널티: 런 내 갭 발생 가능성을 높이는 데 사용됨(5 또는
친수성 아미노산의 잔류물이 더 많음; 이는 루프 또는 무작위 코일일 가능성이 높습니다.
갭이 더 흔한 지역. '고려되는' 잔류물은
친수성은 '-hgapres'로 설정합니다. 기본값: N

-최대 분할 정수
이 스위치는 가장 멀리 관련된 시퀀스의 정렬을 다음까지 지연시킵니다.
가장 밀접하게 관련된 시퀀스가 ​​정렬되었습니다. 설정은 백분율을 표시합니다.
시퀀스 추가를 지연하는 데 필요한 동일성 수준; 덜한 시퀀스
이 레벨보다 다른 시퀀스와 동일한 시퀀스는 나중에 정렬됩니다. 기본값:
30

산출 섹션에 있어야 합니다.
- outseq seqoutset

-dendout파일 아웃파일

onworks.net 서비스를 사용하여 emmae 온라인을 이용하세요



최신 Linux 및 Windows 온라인 프로그램