GoGPT Best VPN GoSearch

온웍스 파비콘

htseq-count - 클라우드의 온라인

Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터를 통해 OnWorks 무료 호스팅 제공업체에서 htseq-count 실행

이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 공급자에서 실행할 수 있는 명령 htseq-count입니다.

프로그램:

이름


htseq-count - GFF 기능에 매핑되는 SAM 정렬 파일의 읽기 수를 계산합니다.

정렬된 시퀀싱 읽기 및 게놈 기능 목록이 있는 파일이 주어지면 일반적인 작업
각 기능에 매핑되는 읽기 수를 계산하는 것입니다.

여기서 특징은 염색체의 간격(즉, 위치 범위) 또는
그러한 간격.

RNA-Seq의 경우 특징은 일반적으로 각 유전자가 고려되는 유전자입니다.
여기 모든 엑손의 합집합으로. 각 엑손을 특징으로 고려할 수도 있습니다. 예:
대체 접합을 확인하기 위해. 비교 ChIP-Seq의 경우 기능은 다음과 같습니다.
미리 결정된 목록에서 바인딩 영역.

둘 이상 겹치는 읽기를 처리하는 방법을 결정할 때는 특별한 주의를 기울여야 합니다.
특징. NS htseq-카운트 스크립트는 세 가지 모드 중에서 선택할 수 있습니다. 물론 없으면
이 중 필요에 따라 HTSeq를 사용하여 고유한 스크립트를 작성할 수 있습니다. 장 보기 투어
방법에 대한 단계별 가이드를 참조하세요.

의 XNUMX가지 오버랩 해상도 모드 htseq-카운트 다음과 같이 작동합니다. 각 포지션에 대해 i in
읽기, 세트 시) 위치가 겹치는 모든 기능의 집합으로 정의됩니다. i. 그때,
세트를 고려 S, 이는 (와 i 읽기 내의 모든 위치를 통해 실행)

· 모든 집합의 합집합 시) 모드용 노동 조합.

· 모든 집합의 교집합 시) 모드용 엄격한 교차로.

· 비어 있지 않은 모든 집합의 교집합 시) 모드용 교차로 - 비어 있지 않음.

If S 정확히 하나의 기능을 포함하는 경우 이 기능에 대한 읽기가 계산됩니다. 포함하는 경우
기능이 둘 이상인 경우 읽기는 다음으로 계산됩니다. 모호한 (그리고 어떤 것으로도 계산되지 않음
기능), 그리고 만약 S 비어 있으면 읽기가 다음과 같이 계산됩니다. no_feature.

다음 그림은 이러한 세 가지 모드의 효과를 보여줍니다. [이미지]

사용법


HTSeq를 설치한 후(참조 설치), 당신은 실행할 수 있습니다 htseq-카운트 명령에서
행 :

htseq-count [옵션]

파일이 htseq-qa 경로에 없으면 다음을 사용하여 스크립트를 호출할 수 있습니다.

python -m HTSeq.scripts.count [옵션]

NS SAM 형식의 정렬된 읽기를 포함합니다. (참고로 SAM도구
대부분의 정렬 형식을 SAM으로 변환하는 Perl 스크립트를 포함합니다.)
TopHat과 같은 접합 인식 교정기. HTSeq-count는 다음 정보를 최대한 활용합니다.
시가 필드.

표준 입력에서 읽으려면 다음을 사용하십시오. - as .

페어드 엔드 데이터가 있는 경우 먼저 읽기 이름으로 SAM 파일을 정렬해야 합니다. (만약 당신의
정렬 도구는 큰 파일을 처리할 수 없습니다. 예를 들어 Ruan Jue의 정렬, 에서 사용 가능 SOAP
웹사이트.)

NS 의 기능을 포함합니다. GFF 체재.

스크립트는 각 기능에 대한 개수가 포함된 테이블을 출력하고 그 뒤에 특수 카운터가 표시됩니다.
다음과 같은 다양한 이유로 기능에 대해 계산되지 않은 읽기 수:

· no_feature: 어떤 기능에도 할당할 수 없는 읽기(세트 S 위에서 설명한대로
비어 있음).

· 모호한: 둘 이상의 기능에 할당될 수 있는 읽기
이들 중 어느 것에도 포함되지 않음(세트 S 하나 이상의 요소를 가짐).

· too_low_a퀄: 로 인해 계산되지 않은 읽기 -a 옵션, 아래 참조

· 정렬되지 않음: 정렬 없이 SAM 파일을 읽습니다.

· Alignment_not_unique: 둘 이상의 보고된 정렬로 읽습니다. 이러한 읽기는
에서 인정 NH 선택적 SAM 필드 태그. (얼라이너가 이 필드를 설정하지 않으면,
다중 정렬 읽기는 여러 번 계산됩니다.)

중요 사항: 좌초의 기본값은 . RNA-Seq 데이터가 생성되지 않은 경우
가닥 특정 프로토콜을 사용하면 읽기의 절반이 손실됩니다. 따라서
옵션을 설정해야 합니다. --stranded=아니요 가닥 관련 데이터가 없다면!

옵션
-m , --모드=
둘 이상의 기능이 겹치는 읽기를 처리하는 모드입니다. 가능한 값
are 노동 조합, 엄격한 교차로 그리고 교차로 - 비어 있지 않음 (기본: 노동 조합)

-s <그렇습니다. 아니 or 반전>, --좌초= 아니 or 반전>
데이터가 가닥 특이적 분석에서 나온 것인지 여부(기본값: )

Stranded=no의 경우 읽기는 다음과 상관없이 기능과 겹치는 것으로 간주됩니다.
피쳐와 동일한 가닥 또는 반대 가닥에 매핑되는지 여부. 을위한
Stranded=yes 및 단일 종단 읽기의 경우 읽기는 다음과 동일한 가닥에 매핑되어야 합니다.
기능. paired-end 읽기의 경우 첫 번째 읽기는 동일한 가닥에 있어야 하며
반대쪽 가닥에서 두 번째 읽기. 좌초 = 역의 경우 이러한 규칙은
반전.

-a , --a=
주어진 최소값보다 낮은 정렬 품질로 모든 읽기를 건너뜁니다(기본값:
0)

-t <특징 유형>, --유형= 유형>
사용할 기능 유형(GFF 파일의 세 번째 열), 다른 유형의 모든 기능은
무시됨(기본값, RNA-Seq 및 앙상블 GTF 파일 : 엑손)

-i <ID 속성>, --idattr= 속성>
기능 ID로 사용할 GFF 속성입니다. 동일한 기능 ID를 가진 여러 GFF 라인
동일한 기능의 일부로 간주됩니다. 기능 ID는 식별에 사용됩니다.
출력 테이블의 카운트. 기본, RNA-SEq 및 Ensembl GTF에 적합
파일은 유전자 아이디.

-o , --samout=
모든 SAM 정렬 레코드를 출력 SAM 파일에 기록 ,
기능 또는 특수 카운터에 대한 할당으로 각 줄에 주석을 추가합니다(
'XF' 태그가 있는 선택적 필드)

-NS, --조용한
진행 보고서 및 경고 표시 안 함

-시간, --도움
사용 요약 표시 및 종료

onworks.net 서비스를 사용하여 온라인으로 htseq-count 사용


무료 서버 및 워크스테이션

Windows 및 Linux 앱 다운로드

Linux 명령

Ad




×
광고
❤️여기에서 쇼핑, 예약, 구매하세요. 비용이 들지 않아 서비스를 무료로 유지하는 데 도움이 됩니다.