이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 공급자에서 실행할 수 있는 명령 2ndscore입니다.
프로그램:
이름
2등 - 각 위치에 고정된 가장 좋은 헤어핀을 찾으세요.
개요
2ndscore in.fasta > out.hairpins
기술
시퀀스의 각 위치에 대해 다음과 같은 줄이 출력됩니다.
-0.6 52 .. 62 TTCCTAAAGGTTCCA GCG CAAAA TGC CATAAGCACCACATT
(점수) (시작 .. 끝) (왼쪽 컨텍스트) (헤어핀) (오른쪽 컨텍스트)
시퀀스 끝부분 근처의 위치의 경우 컨텍스트는 'x'로 채워질 수 있습니다.
문자. 헤어핀을 찾을 수 없는 경우 점수는 '없음'이 됩니다.
여러 개의 fasta 파일을 제공할 수 있으며 각 fasta 파일에 여러 개의 시퀀스가 있을 수 있습니다.
각 시퀀스의 출력은 '>'로 시작하고 다음을 포함하는 줄로 구분됩니다.
서열에 대한 FASTA 설명입니다.
플러스 스트랜드와 마이너스 스트랜드의 헤어핀 점수가 다를 수 있기 때문입니다(GU로 인해)
RNA에서의 결합) 기본적으로 2ndscore는 모든 시퀀스에 대해 헤어핀의 두 세트를 출력합니다.
FORWARD 헤어핀과 REVERSE 헤어핀. 모든 포워드 헤어핀이 먼저 출력되고,
'>' 줄의 끝에 'FORWARD'라는 단어가 있어서 식별할 수 있습니다.
마찬가지로 REVERSE 헤어핀은 'REVERSE'로 끝나는 '>' 라인 뒤에 나열됩니다.
한쪽 또는 다른 쪽 가닥만 검색하려면 다음을 사용할 수 있습니다.
--no-fwd FORWARD 헤어핀을 인쇄하지 마십시오
--no-rvs 역방향 헤어핀을 인쇄하지 않습니다.
--gc, --au, --gu를 사용하여 transterm과 마찬가지로 사용되는 에너지 기능을 설정할 수 있습니다.
--mm, --gap 옵션. --min-loop, --max-loop, --max-len 옵션도 지원됩니다.
FORMAT OF L' .가방 파일
.bag 파일의 열은 순서대로 다음과 같습니다.
1. 유전자 이름
2. 종료자_시작
3. 종료자_끝
4. 헤어핀 스코어
5. 꼬리점수
6. 종료자 시퀀스
7. terminator_confidence : 헤어핀 스코어와 테일 스코어의 조합
이러한 점수가 무작위 순서로 나타날 가능성이 얼마나 되는지 고려합니다.
종료자에 대한 주요 "점수"이며 다음에 설명된 대로 계산됩니다.
종이.
8. APPROXIMATE_distance_from_end_of_gene: 염기의 *대략적인* 수
유전자의 끝과 종결자 시작 사이의 쌍입니다.
여러 면에서 대략적입니다. 첫째, (가장 중요한) TransTermHP
항상 실제 유전자 끝을 사용하지는 않습니다. 제공하는 옵션에 따라 다릅니다.
종료자를 처리하기 위해 유전자의 끝을 일부 잘라낼 수도 있습니다.
유전자와 부분적으로 중복됩니다. 둘째, 종결자가 "시작되는" 위치
그렇게 잘 정의되어 있지 않습니다. 이 필드는 정신 건강 검사에만 사용됩니다.
(유전자의 끝부분에 가장 좋다고 보고된 종료자는
(유전자의 끝부분으로부터 _너무 멀리_)
사용 트랜스터엠 없이 게놈 주석
TransTermHP는 알려진 유전자 정보를 3가지 용도로만 사용합니다: (1) 추정 태그 지정
종료자를 "내부 유전자" 또는 "유전자 간"으로 선택하여(2) 배경 GC를 선택합니다.
유전자는 종종 GC 함량이 다르기 때문에 점수를 계산하기 위해 함량 비율을 사용합니다.
유전자 간 영역보다 (3) 약간 더 읽기 쉬운 출력을 생성합니다. 항목(1)
그리고 (3)은 실제로 필요하지 않으며 (2) 유전자가 거의 동일한 경우 효과가 없습니다.
GC 함량을 유전자 간 영역으로 지정합니다.
불행히도 TransTermHP에는 아직 주석 없이 실행할 수 있는 간단한 옵션이 없습니다.
파일(.ptt 또는 .coords)이며 최소 2개의 유전자가 있어야 합니다. 솔루션
각 염색체를 둘러싼 가짜의 작은 유전자를 만드는 것입니다. 이를 위해 가짜 좌표를 만드십시오.
다음 두 줄만 포함된 파일:
fakegene1 1 2 chome_id
가짜 유전자2 L-1 L chrom_id
여기서 L은 입력 시퀀스의 길이이고 L-1은 입력 시퀀스의 길이보다 1 작습니다.
시퀀스. "chrom_id"는 .fasta 파일에서 ">" 바로 뒤에 오는 단어여야 합니다.
시퀀스를 포함합니다. (예를 들어, .fasta 파일이 ">seq1"로 시작하는 경우
chrom_id = seq1).
이는 시퀀스를 둘러싼 두 개의 1베이스 길이의 유전자로 "가짜" 주석을 생성합니다.
꼬리에서 꼬리로 배열: --> <--. TransTermHP는 다음으로 실행할 수 있습니다.
transterm -p expterm.dat 시퀀스.fasta 가짜.좌표
유전자 간 영역의 G/C 함량이 유전자와 거의 같다면,
점수 종료자가 받는 점수에 큰 영향을 미치지는 않을 것입니다. 반면에,
TransTermHP의 이 사용은 전혀 테스트되지 않았으므로 보증하기 어렵습니다.
정확성.
onworks.net 서비스를 사용하여 2ndscore를 온라인으로 사용하세요