영어프랑스어스페인어

Ad


온웍스 파비콘

ipdSummary - 클라우드의 온라인

Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터를 통해 OnWorks 무료 호스팅 제공업체에서 ipdSummary 실행

Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 공급자에서 실행할 수 있는 ipdSummary 명령입니다.

프로그램:

이름


ipdSummary - 동역학 서명에서 DNA 염기 변형을 감지합니다.

기술


kineticsTool은 게놈의 각 위치에서 관찰된 IPD를 로드하고 해당 IPD를 비교합니다.
수정되지 않은 DNA에 대해 예상되는 값으로 변환하고 이 통계 테스트의 결과를 출력합니다.
수정되지 않은 DNA에 대한 예상 IPD 값은 인실리코 제어 또는
증폭 제어. in silico 컨트롤은 PacBio에 의해 훈련되고
패키지. 현재 주변의 로컬 시퀀스 컨텍스트를 사용하여 IPD를 예측합니다.
위치. 증폭된 제어 데이터 세트는 수정되지 않은 DNA를
테스트 샘플과 동일한 시퀀스. 증폭된 대조군 샘플은 일반적으로 다음과 같이 생성됩니다.
원본 샘플의 전체 게놈 증폭.

가감 Detection System
kineticsTools의 기본 모드는 각 위치에서 IPD를 독립적으로 비교합니다.
게놈, 각 가닥에 대한 다양한 통계를 CSV 및 GFF로 내보냅니다(A를 적용한 후).
유의 필터).

수정 식별
kinetics도구 또한 a 가감 식별 모드 풀다 다중 사이트 IPD
'지문' 으로 a 줄인 세트 of 통화 of 구체적인 수정. 기능 전에,
수행원 은혜:

· 동일한 베이스에서 발생하는 다른 변형을 구별할 수 있습니다(for
예 m5C 및 m4C)

· 한 수정의 신호가 하나의 통계로 결합되어 개선
민감도, 여분의 피크 제거 및 호출을 올바르게 중앙에 배치

옵션


다음으로 이 프로그램을 호출하십시오. --도움 사용 가능한 옵션을 보려면

연산


인조 Control
IPD와 시퀀스 컨텍스트 사이의 관계에 대한 연구는 대부분의
게놈 전체에 걸친 평균 IPD의 변화는 12개 염기 서열 컨텍스트에서 예측할 수 있습니다.
DNA 중합 효소의 활성 부위를 둘러싸고 있습니다. 관련 컨텍스트의 범위
창은 중합효소와 접촉하는 DNA의 창에 해당합니다.
DNA/폴리머라제 결정 구조. DNA 변형을 찾는 과정을 단순화하기 위해
PacBio 데이터와 함께 이 도구에는 12-mer DNA를 매핑하는 사전 훈련된 조회 테이블이 포함됩니다.
서열은 C2 화학에서 관찰된 IPD를 의미합니다.

필터링 트리밍
kineticsTools는 BLASR에서 생성되고 cmp.h5 파일에 저장된 Mapping QV를 사용하여
확실하게 매핑되지 않은 읽기는 무시합니다. 필요한 기본 최소 매핑 QV는 다음과 같습니다.
10, BLASR이 90\% 읽기가 올바르게 매핑되었다는 확신. 때문에
PacBio 데이터 고유의 읽기 길이 범위는 다음을 사용하여 변경할 수 있습니다.
--mapQvThreshold 명령줄 인수 또는 SMRTPortal 구성 대화 상자를 통해
수정 감지.

달성하기 위해 특별한 주의가 필요한 PacBio 데이터의 몇 가지 기능이 있습니다.
좋은 수정 감지 성능. kineticsTools는 사이의 정렬을 검사합니다.
관찰된 염기 및 참조 서열 -- IPD 측정을 위해
분석에 포함된 PacBio 판독 시퀀스는 참조 시퀀스와 일치해야 합니다. k
동족 기지 주변. 현재 모듈에서 k = 1 일부 유전자좌에서의 IPD 분포는
민감한 '정상적인' 통합 프로세스 IPD 사이의 혼합으로 생각
로컬 시퀀스 컨텍스트 및 DNA 수정 및 오염 '일시 중지' 프로세스
IPD 기간이 훨씬 더 길지만(평균보다 10배 이상 더 깁니다) 거의 발생하지 않습니다.
(IPD의 ~1%). 참고: 현재 우리는 일시 중지가 유용하지 않다는 것을 이해하고 있습니다.
DNA의 메틸화 상태에 대한 정보이지만 보다 신중한 분석이 필요할 수 있습니다.
보증합니다. 또한 약 1%의
관찰된 IPD는 일시 중지 이벤트에 의해 생성됩니다. 전 세계 99위에서 관찰된 IPD 상한
백분위 수는 강력한 가설 테스트의 이론에 의해 동기 부여됩니다. 일부 시퀀스 컨텍스트
해당 컨텍스트에서 너무 많은 데이터를 제한하지 않도록 자연스럽게 더 긴 IPD를 가질 수 있습니다.
임계값은 다음과 같이 컨텍스트별로 조정됩니다. capThreshold = max(global99,
5*modelPrediction, 백분위수(ipdObservations, 75))

통계적인 지원
샘플의 특정 유전자좌에서 관찰된 IPD가
변형되지 않은 DNA의 동일한 유전자좌에서 관찰된 IPD보다 긴 것을 의미합니다. 우리가 생성했다면
DNA 수정을 제거하는 Whole Genome Amplified 데이터 세트, 우리는 케이스 컨트롤을 사용합니다.
XNUMX-표본 t-검정. 이 도구는 사전 보정된 '합성 제어' 모델도 제공합니다.
12개의 기본 시퀀스 컨텍스트가 주어지면 수정되지 않은 IPD를 예측합니다. 합성에서
제어 사례에서는 XNUMX표본 t-검정을 사용하고 오차를 설명하기 위해 조정합니다.
합성 제어 모델.

입력


alignment_reads.cmp.h5
표준 cmp.h5 파일에는 정렬이 포함되어 있으며 IPD 정보는 동역학 데이터를 제공합니다.
수정 감지를 수행하는 데 사용됩니다. SMRTportal 작업의 표준 cmp.h5 파일은 다음과 같습니다.
데이터/aligned_read.cmp.h5.

참조 순서
이 도구에는 정렬을 수행하는 데 사용되는 참조 시퀀스가 ​​필요합니다. 현재 이것은 반드시
SMRTportal 참조 리포지토리 항목에 대한 경로를 통해 제공되어야 합니다.

출력


수정 감지 도구는 다음에 적합한 다양한 형식으로 결과를 제공합니다.
심층 통계 분석, 빠른 참조 및 시각화 도구에 의한 소비
PacBio SMRTView와 같은. 결과는 일반적으로 참조 위치 및
참조 가닥. 모든 경우에 스트랜드 값은 다음을 전달하는 스트랜드를 나타냅니다.
DNA 샘플의 변형. 수정의 운동 효과는 다음과 같다는 것을 기억하십시오.
반대 가닥에 정렬된 읽기 시퀀스에서 관찰됩니다. 그래서 에 정렬하여 읽습니다.
포지티브 스트랜드는 네거티브 스트랜드 및 바이스의 수정에 대한 정보를 전달합니다.
그 반대지만, 이 툴킷에서 우리는 항상 추정을 포함하는 가닥을 보고합니다.
가감.

수정.csv
modifys.csv 파일에는 각 (참조 위치, 가닥) 쌍에 대해 하나의 행이 포함되어 있습니다.
커버리지가 적어도 x인 데이터 세트에 나타난 x의 기본값은 3이지만
ipdSummary.py에 대한 '--minCoverage' 플래그로 구성 가능. 기준위치지수는
R 환경의 gff 파일과의 호환성을 위해 1 기반입니다.

산출
인실리코 제어 모드

┌───────────────────────────────────────────────────── ──┐
│컬럼 │ 설명 │
├───────────────────────────────────────────────────── ──┤
│refId │ 이것의 참조 시퀀스 ID │
│ │ 관찰 │
├───────────────────────────────────────────────────── ──┤
│tpl │ 1 기반 템플릿 위치 │
├───────────────────────────────────────────────────── ──┤
│가닥 │ 네이티브 샘플 가닥 여기서 │
│ │ 동역학이 생성되었습니다. '0'은 │
│ │ 원작의 가닥 │
│ │ FASTA, '1'은 반대 가닥 │
│ │ 파스타에서 │
├───────────────────────────────────────────────────── ──┤
│base │ 동족 염기 │
│ │ 참조 위치 │
├───────────────────────────────────────────────────── ──┤
│score │ Phred 변환된 pvalue
│ │ 운동 편차가 존재합니다 │
│ │ 위치 │
└───────────────────────────────────────────────────── ──┘

│tMean │ 정규화된 IPD의 캡핑된 평균 │
│ │ 이 위치에서 관찰됨 │
├───────────────────────────────────────────────────── ──┤
│tErr │ 캡핑된 표준 오차 │
│ │ 여기에서 관찰된 정규화된 IPD │
│ │ 위치(표준 편차 / │
│ │ sqrt(커버리지) │
├───────────────────────────────────────────────────── ──┤
│modelPrediction │ │에 의해 예측된 정규화된 평균 IPD
│ │ │에 대한 합성 제어 모델
│ │ 이 시퀀스 컨텍스트 │
├───────────────────────────────────────────────────── ──┤
│ipdRatio │ tMean / 모델예측 │
├───────────────────────────────────────────────────── ──┤
│커버리지 │ 현재 유효한 IPD 수 │
│ │ 위치(필터링 섹션 참조 │
│ │ 자세한 내용은) │
├───────────────────────────────────────────────────── ──┤
│frac │ 의 분수 추정치
│ │ │를 운반하는 분자
│ │ 수정 │
├───────────────────────────────────────────────────── ──┤
│fracLow │ frac의 2.5% 신뢰 한계 │
│ │ 견적 │
├───────────────────────────────────────────────────── ──┤
│fracUpp │ frac의 97.5% 신뢰 한계 │
│ │ 견적 │
└───────────────────────────────────────────────────── ──┘

케이스 컨트롤 모드

┌───────────────────────────────────────────────────── ──┐
│컬럼 │ 설명 │
├───────────────────────────────────────────────────── ──┤
│refId │ 이것의 참조 시퀀스 ID │
│ │ 관찰 │
├───────────────────────────────────────────────────── ──┤
│tpl │ 1 기반 템플릿 위치 │
├───────────────────────────────────────────────────── ──┤
│가닥 │ 네이티브 샘플 가닥 여기서 │
│ │ 동역학이 생성되었습니다. '0'은 │
│ │ 원작의 가닥 │
│ │ FASTA, '1'은 반대 가닥 │
│ │ 파스타에서 │
├───────────────────────────────────────────────────── ──┤
│base │ 동족 염기 │
│ │ 참조 위치 │
├───────────────────────────────────────────────────── ──┤
│score │ Phred 변환된 pvalue
│ │ 운동 편차가 존재합니다 │
│ │ 위치 │
├───────────────────────────────────────────────────── ──┤
│caseMean │ 정규화된 사례 IPD의 평균 │
│ │ 이 위치에서 관찰됨 │
├───────────────────────────────────────────────────── ──┤
│controlMean │ 정규화된 제어 IPD의 평균 │
│ │ 이 위치에서 관찰됨 │
├───────────────────────────────────────────────────── ──┤
│caseStd │ 케이스 IPD의 표준편차 │
│ │ 이 위치에서 관찰됨 │
├───────────────────────────────────────────────────── ──┤
│controlStd │ 제어 표준편차 │
│ │ 이 위치에서 관찰된 IPD │
└───────────────────────────────────────────────────── ──┘

│ipdRatio │ tMean / 모델예측 │
├───────────────────────────────────────────────────── ──┤
│testStatistic │ t-검정 통계량 │
├───────────────────────────────────────────────────── ──┤
│커버리지 │ 케이스와 컨트롤의 평균 │
│ │ 커버리지 │
├───────────────────────────────────────────────────── ──┤
│controlCoverage │ 유효한 제어 IPD의 수 │
│ │ 이 위치(필터링 참조 │
│ │ 자세한 내용은 섹션) │
├───────────────────────────────────────────────────── ──┤
│caseCoverage │ 유효한 케이스 IPD 수 │
│ │ 위치(필터링 섹션 참조 │
│ │ 자세한 내용은) │
└───────────────────────────────────────────────────── ──┘

수정.gff
modifys.gff는 GFF 버전 3 사양(-
http://www.sequenceontology.org/gff3.shtml). 각각의 템플릿 위치/가닥 쌍
p-value가 pvalue 임계값을 초과하면 행으로 나타납니다. 템플릿 위치는 1 기준이며,
GFF 사양에 따라 스트랜드 컬럼은 검출된
이는 변형을 감지하는 데 사용되는 가닥과 반대쪽 가닥입니다. 그만큼
GFF 신뢰 열은 Phred-transformed pvalue of detection입니다.

주의 사항 on 게놈 브라우저 호환성

modifys.gff 파일은 대부분의 게놈 브라우저에서 직접 작동하지 않습니다. 당신은
GFF 파일의 복사본을 만들고 _seqid_ 열을
PacBio에서 생성한 일반 'ref0000x' 이름을 원본에 있는 FASTA 헤더에
참조 FASTA 파일. 매핑 테이블은 modifys.gff의 헤더에 기록됩니다.
에있는 파일을 #시퀀스 헤더 태그. 이 문제는 1.4 릴리스에서 해결될 예정입니다.
kinetics도구.

GFF 파일의 보조 데이터 열에는 유용할 수 있는 다른 통계가 포함되어 있습니다.
다운스트림 분석 또는 필터링. 특히 읽기에 사용되는 범위 수준
전화를 걸고 사이트를 둘러싼 +/- 20bp 시퀀스 컨텍스트.

┌───────────┬─────────────────────────────────┐
│컬럼 │ 설명 │
├───────────┼────────────────────────────────┤
│seqid │ Fasta contig 이름 │
├───────────┼────────────────────────────────┤
│source │ 도구 이름 -- 'kinModCall' │
├───────────┼────────────────────────────────┤
│유형 │ 수정 유형 -- in │
│ │ 식별 모드가 됩니다 │
│ │ 식별된 m6A, m4C 또는 m5C │
│ │ 기본 또는 일반 태그 │
│ │ 동역학인 경우 'modified_base' │
│ │ 이벤트가 감지되지 않은 │
│ │ 알려진 수정과 일치 │
│ │ 서명 │
├───────────┼────────────────────────────────┤
│start │ contig의 수정 위치 │
├───────────┼────────────────────────────────┤
│end │ contig의 수정 위치 │
├───────────┼────────────────────────────────┤
│점수 │ │의 Phred 변환 p-값
│ │ 감지 - 이것은 │입니다.
│ │ 단일 사이트 탐지 p-값 │
├───────────┼────────────────────────────────┤
│strand │ │를 포함하는 샘플 가닥
│ │ 수정 │
└───────────┴─────────────────────────────────┘

│상 │ 해당 없음 │
├───────────┼────────────────────────────────┤
│속성 │ 기본과 관련된 추가 필드 │
│ │ 모드. IPDRatio는 전통적입니다 │
│ │ IPDRatio, 컨텍스트는 │
│ │ 참조 서열 -20bp ~ │
│ │ 수정 주위 +20bp, │
│ │ 및 커버리지 수준은 숫자 │
│ │ 이후에 사용된 IPD 관찰의 │
│ │ QV 필터링 매핑 및 │
│ │ 정확도 필터링. 행 │
│ │ 식별된 │의 결과
│ │ 수정 우리는 또한 │를 포함
│ │ │ 식별 Qv 태그
│ │ 수정에서 │
│ │ 식별 절차. │
│ │ 식별Qv는 │
│ │ pred-transformed 확률 │
│ │ 잘못된 식별, │
│ │ 로 식별된 염기
│ │ 특별한 │
│ │ 수정. frac, fracLow, │
│ │ fracUp은 추정치입니다 │
│ │ 분자의 분율 │
│ │ 수정 및 5% │
│ │ │의 신뢰 구간
│ │ 견적. 메틸화된 │
│ │ 분수 추정은 │
│ │ 베타 수준의 기능과 해야 할 것 │
│ │ 탐색용으로만 사용 │
│ │ 목적. │
└───────────┴─────────────────────────────────┘

모티프.gff
Motif Finder 도구를 실행하면 Motif Finder 도구가 재처리된 Motifs.gff를 생성합니다.
수정 사항 .gff를 다음과 같이 변경합니다. 감지된 수정 사항이
모티프 파인더에서 모티프를 감지하면 모티프 데이터로 수정 사항에 주석이 추가됩니다. 안
모티프 문자열을 포함하는 속성 'motif'가 추가되고 속성 'id'가 추가됩니다.
페어링되지 않은 모티프의 모티프 문자열인 모티프 ID를 포함하거나
모티프 쌍을 위한 'motifString1/motifString2'. 게놈에 모티프 인스턴스가 존재하는 경우,
그러나 modifys.gff에서 감지되지 않은 경우, 항목이 Motifs.gff에 추가되어
해당 모티프의 존재 및 해당 사이트에서 관찰된 동역학.

모티프_요약.csv
Motif Finder 도구를 실행하면 Motif_summary.csv가 생성되어 수정된 내용을 요약합니다.
도구에 의해 발견된 모티프. CSV에는 감지된 모티프당 하나의 행이 포함되며
다음 열

┌───────────────────┬──────────────────────────── ─────┐
│컬럼 │ 설명 │
├───────────────────┼──────────────────────────── ─────┤
│motifString │ 감지된 모티프 시퀀스 │
├───────────────────┼──────────────────────────── ─────┤
│centerPos │ │를 모티브로 한 위치
│ │ 수정(0기준) │
├───────────────────┼──────────────────────────── ─────┤
│fraction │ 이것의 인스턴스 비율 │
│ │ 위의 수정 QV가 있는 모티프 │
│ │ QV 임계값 │
├───────────────────┼──────────────────────────── ─────┤
│n감지됨 │ 인스턴스 수 │
│ │ 문턱값 이상 모티프 │
└───────────────────┴──────────────────────────── ─────┘

│nGenome │ 이것의 인스턴스 수 │
│ │ 참조 서열의 모티프 │
├───────────────────┼──────────────────────────── ─────┤
│groupTag │ 모티프를 식별하는 문자열 │
│ │ 그룹화. 페어 모티프는 이쪽 │
│ │ 입니다 │
│ │ " / ", │
│ │ 쌍을 이루지 않은 모티프의 경우 │와 같습니다.
│ │ 모티브 문자열 │
├───────────────────┼──────────────────────────── ─────┤
│partnerMotifString │ 짝을 이룬 모티프의 MotifString │
│ │ (│가 있는 모티프
│ │ 역 보완 │
│ │ 모티브 문자열) │
├───────────────────┼──────────────────────────── ─────┤
│meanScore │ 검출된 평균 수정 Qv │
│ │ 인스턴스 │
├───────────────────┼──────────────────────────── ─────┤
│meanIpdRatio │ 검출된 평균 IPD 비율 │
│ │ 인스턴스 │
├───────────────────┼──────────────────────────── ─────┤
│meanCoverage │ 감지된 평균 범위 │
│ │ 인스턴스 │
├───────────────────┼──────────────────────────── ─────┤
│objectiveScore │ 이 모티프의 객관적 점수 │
│ │ 모티프 찾기 알고리즘 │
└───────────────────┴──────────────────────────── ─────┘

onworks.net 서비스를 사용하여 온라인에서 ipdSummary 사용


무료 서버 및 워크스테이션

Windows 및 Linux 앱 다운로드

Linux 명령

Ad