АнглийскийФранцузскийИспанский

Ad


Значок OnWorks

ipdSummary - Интернет в облаке

Запустите ipdSummary в бесплатном хостинг-провайдере OnWorks через Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS

Это команда ipdSummary, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


ipdSummary - обнаружение модификаций оснований ДНК по кинетическим сигнатурам.

ОПИСАНИЕ


kineticsTool загружает IPD, наблюдаемые в каждой позиции генома, и сравнивает эти IPD.
значение, ожидаемое для немодифицированной ДНК, и выводит результат этого статистического теста.
Ожидаемое значение IPD для немодифицированной ДНК может быть получено либо из in-silico контроль или
усиливается контроль. Управление in silico обучено PacBio и поставляется с
упаковка. Он предсказывает предсказывает IPD, используя контекст локальной последовательности вокруг текущего
позиция. Амплифицированный контрольный набор данных создается путем секвенирования немодифицированной ДНК с
та же последовательность, что и в тестовом образце. Амплифицированный контрольный образец обычно получают
полногеномная амплификация исходного образца.

Модификация обнаружение
В базовом режиме kineticsTools выполняется независимое сравнение IPD в каждой позиции на
геном для каждой цепи и передает различную статистику в CSV и GFF (после применения
фильтр значимости).

изменения Идентификация
kineticsИнструменты Также и a Модификация Идентификация Режим который может декодировать мульти-сайт ИПД
'отпечатки пальцев' в a сниженный набор of звонки of конкретный изменения. Эта которая и домен
после выгоды:

· Можно выделить разные модификации, происходящие на одной и той же базе (для
пример m5C и m4C)

· Сигнал от одной модификации объединяется в одну статистику, улучшая
чувствительность, удаление лишних пиков и правильное центрирование вызова

ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ


Пожалуйста, позвоните в эту программу с --Помогите чтобы увидеть доступные варианты.

ALGORITHM / АЛГОРИТМ


Синтетический Control
Исследования взаимосвязи между IPD и контекстом последовательности показывают, что большинство
изменение среднего IPD в геноме можно предсказать из контекста последовательности из 12 оснований
окружает активный сайт ДНК-полимеразы. Границы релевантного контекста
окно соответствует окну ДНК в контакте с полимеразой, как показано на
Кристаллические структуры ДНК / полимеразы. Чтобы упростить процесс поиска модификаций ДНК
с данными PacBio инструмент включает предварительно обученную таблицу поиска, отображающую 12-мерную ДНК
Последовательности означают IPD, наблюдаемые в химии C2.

фильтрация и Обрезки
kineticsTools использует Mapping QV, созданный BLASR и сохраненный в файле cmp.h5 для
игнорировать чтения, которые не отображаются уверенно. Минимальный требуемый QV для сопоставления по умолчанию равен
10, подразумевая, что BLASR имеет 90 \% уверенность в том, что чтение правильно отображено. Из-за
диапазон длин считывания данных PacBio Это можно изменить с помощью
--mapQvThreshold аргумент командной строки или через диалоговое окно конфигурации SMRTPortal для
Обнаружение модификаций.

Есть несколько функций данных PacBio, которые требуют особого внимания для достижения
хорошая производительность обнаружения модификаций. kineticsTools проверяет выравнивание между
наблюдаемые основания и эталонная последовательность - для того, чтобы измерение IPD было
Включенная в анализ, последовательность чтения PacBio должна совпадать с эталонной последовательностью для k
вокруг родственной базы. В текущем модуле к = 1 Распределение IPD в некотором локусе может быть
рассматривается как смесь «нормального» процесса включения IPD, который является чувствительным
к локальному контексту последовательности и модификациям ДНК, а также к процессу "паузы"
IPD, которые имеют гораздо более длительную продолжительность (в среднем> 10 раз дольше, чем обычно), но случаются редко
(~ 1% IPD). Примечание. В настоящее время мы понимаем, что паузы бесполезны.
информация о состоянии метилирования ДНК, однако более тщательный анализ может быть
оправдано. Также обратите внимание, что модификации, которые резко увеличивают примерно 1%
наблюдаемые IPD генерируются событиями паузы. Ограничение наблюдаемых IPD на глобальном 99-м месте.
процентиль мотивируется теорией, основанной на надежной проверке гипотез. Некоторые контексты последовательности
могут иметь, естественно, более длинные IPD, чтобы избежать ограничения слишком большого количества данных в этих контекстах, ограничение
порог настраивается в зависимости от контекста следующим образом: capThreshold = max (global99,
5 * модель Прогнозирование, процентиль (ipdObservations, 75))

Статистический Тестирование
Мы проверяем гипотезу о том, что IPD, наблюдаемые в определенном локусе в выборке, имеют
длиннее означает, чем IPD, наблюдаемые в том же локусе в немодифицированной ДНК. Если мы сгенерировали
набор данных Whole Genome Amplified, который удаляет модификации ДНК, мы используем случай-контроль,
двухвыборочный t-критерий. Этот инструмент также предоставляет предварительно откалиброванную модель «синтетического контроля».
который предсказывает немодифицированный IPD с учетом контекста из 12 базовых последовательностей. В синтетическом
В контрольном случае мы используем t-критерий для одной выборки с корректировкой для учета ошибки в
синтетическая контрольная модель.

вводы


выровненный_reads.cmp.h5
Стандартный файл cmp.h5 содержит выравнивания, а информация IPD предоставляет кинетические данные.
используется для обнаружения модификации. Стандартный файл cmp.h5 заданий SMRTportal:
данные / align_read.cmp.h5.

Справка Последовательность
Инструменту требуется эталонная последовательность, используемая для выполнения выравнивания. В настоящее время это должно
передаваться через путь к записи репозитория справочника SMRTportal.

ВЫХОДЫ


Средство обнаружения изменений предоставляет результаты в различных форматах, подходящих для
углубленный статистический анализ, быстрая справка и использование инструментов визуализации
такие как PacBio SMRTView. Результаты обычно индексируются по ссылочной позиции и
эталонная прядь. Во всех случаях стоимость нити относится к нити, несущей
модификация в образце ДНК. Помните, что кинетический эффект модификации
наблюдается в последовательностях чтения, выравнивающих противоположную цепь. Так читает, выравнивая по
положительная нить несет информацию о модификации на отрицательной нити и тисках
наоборот, но в этом наборе инструментов мы всегда указываем цепочку, содержащую предполагаемый
модификация.

модификации.csv
Файл changes.csv содержит по одной строке для каждой пары (ссылочная позиция, нить).
которые появились в наборе данных с охватом не менее x. x по умолчанию 3, но
настраивается с помощью флага --minCoverage для ipdSummary.py. Индекс ссылочной позиции
1 для совместимости с файлом gff в среде R.

Результат столбцы
in-silico контроль Режим

┌────────────────┬────────────────────────────────── ──┐
│Колонка │ Описание │
├────────────────┼────────────────────────────────── ──┤
│refId │ ID эталонной последовательности этого │
│ │ наблюдение │
├────────────────┼────────────────────────────────── ──┤
│tpl │ Позиция шаблона на основе 1 │
├────────────────┼────────────────────────────────── ──┤
│ прядь │ нить нативного образца, где │
│ │ кинетики. '0' - это │
│ │ прядь оригинала │
│ │ FASTA, '1' - противоположная нить │
│ │ от FASTA │
├────────────────┼────────────────────────────────── ──┤
│base │ родственная основа в этом │
│ │ позиция в справочнике │
├────────────────┼────────────────────────────────── ──┤
│score │ pvalue, преобразованное с помощью Phred, которое a
│ │ кинетическое отклонение существует при этом │
│ │ положение │
└────────────────┴────────────────────────────────── ──┘

│tMean │ ограниченное среднее нормированных IPD │
│ │ наблюдается в этой позиции │
├────────────────┼────────────────────────────────── ──┤
│tErr │ ограничивает стандартную ошибку │
│ │ нормализованные IPD наблюдаются при этом │
│ │ положение (стандартное отклонение / │
│ │ sqrt (покрытие) │
├────────────────┼────────────────────────────────── ──┤
│modelPrediction │ нормализованное среднее IPD, предсказанное
│ │ синтетическая контрольная модель для │
│ │ контекст этой последовательности │
├────────────────┼────────────────────────────────── ──┤
│ipdRatio │ tMean/modelPrediction │
├────────────────┼────────────────────────────────── ──┤
│охват │ количество действующих IPD на этом │
│ │ положение (см. Раздел «Фильтрация» │
│ │ для подробностей) │
├────────────────┼────────────────────────────────── ──┤
│frac │ оценка доли
│ │ молекулы, несущие │
│ │ модификация │
├────────────────┼────────────────────────────────── ──┤
│fracLow │ 2.5% доверительная граница трещины │
│ │ оценка │
├────────────────┼────────────────────────────────── ──┤
│fracUpp │ 97.5% доверительная граница трещины │
│ │ оценка │
└────────────────┴────────────────────────────────── ──┘

случай-контроль Режим

┌────────────────┬────────────────────────────────── ──┐
│Колонка │ Описание │
├────────────────┼────────────────────────────────── ──┤
│refId │ ID эталонной последовательности этого │
│ │ наблюдение │
├────────────────┼────────────────────────────────── ──┤
│tpl │ Позиция шаблона на основе 1 │
├────────────────┼────────────────────────────────── ──┤
│ прядь │ нить нативного образца, где │
│ │ кинетики. '0' - это │
│ │ прядь оригинала │
│ │ FASTA, '1' - противоположная нить │
│ │ от FASTA │
├────────────────┼────────────────────────────────── ──┤
│base │ родственная основа в этом │
│ │ позиция в справочнике │
├────────────────┼────────────────────────────────── ──┤
│score │ pvalue, преобразованное с помощью Phred, которое a
│ │ кинетическое отклонение существует при этом │
│ │ положение │
├────────────────┼────────────────────────────────── ──┤
│caseMean │ среднее значение нормализованных IPD наблюдений │
│ │ наблюдается в этой позиции │
├────────────────┼────────────────────────────────── ──┤
│controlMean │ среднее значение нормализованных контрольных IPD │
│ │ наблюдается в этой позиции │
├────────────────┼────────────────────────────────── ──┤
│caseStd │ стандартное отклонение IPD случаев │
│ │ наблюдается в этой позиции │
├────────────────┼────────────────────────────────── ──┤
│controlStd │ стандартное отклонение контроля │
│ │ IPD наблюдаются в этой позиции │
└────────────────┴────────────────────────────────── ──┘

│ipdRatio │ tMean/modelPrediction │
├────────────────┼────────────────────────────────── ──┤
│testStatistic │ Статистика t-критерия │
├────────────────┼────────────────────────────────── ──┤
│ охват │ средство наблюдения и контроля │
│ │ покрытие │
├────────────────┼────────────────────────────────── ──┤
│controlCoverage │ количество допустимых управляющих IPD в │
│ │ это положение (см. Фильтрация │
│ │ раздел для деталей) │
├────────────────┼────────────────────────────────── ──┤
│caseCoverage │ количество действительных IPD кейсов в этом │
│ │ положение (см. Раздел «Фильтрация» │
│ │ для подробностей) │
└────────────────┴────────────────────────────────── ──┘

модификации.gff
Изменения.gff соответствуют спецификации GFF версии 3 (-
http://www.sequenceontology.org/gff3.shtml). Каждая пара положения шаблона / прядей, чья
p-значение превышает пороговое значение p-value отображается в виде строки. Позиция шаблона начинается с 1,
согласно спецификации GFF. Столбец прядей относится к прядям, несущим обнаруженные
модификация, которая является цепью, противоположной тем, которые используются для обнаружения модификации. В
Столбец достоверности GFF представляет собой p-значение обнаружения, преобразованное по методу Phred.

Внимание on геном браузер совместимость

Файл changes.gff не будет работать напрямую с большинством браузеров, использующих геном. Вы будете
вероятно, потребуется сделать копию файла GFF и преобразовать столбцы _seqid_ из
общие имена 'ref0000x', сгенерированные PacBio, к заголовкам FASTA, присутствующим в оригинале
справочный файл FASTA. Таблица маппинга написана в шапке модификаций. Gff
файл в # заголовок последовательности теги. Эта проблема будет решена в версии 1.4.
кинетикаИнструменты.

Столбец вспомогательных данных файла GFF содержит другую статистику, которая может быть полезна.
последующий анализ или фильтрация. В частности, уровень охвата считываний, используемых для
сделать звонок, и контекст последовательности +/- 20bp, окружающий сайт.

┌───────────┬────────────────────────────────────
│Колонка │ Описание │
├───────────┼────────────────────────────────────
│seqid │ Имя контига Fasta │
├───────────┼────────────────────────────────────
│source │ Название инструмента - 'kinModCall' │
├───────────┼────────────────────────────────────
│тип │ Тип модификации - в │
│ │ режим идентификации это будет │
│ │ m6A, m4C или m5C для идентифицированных │
│ │ базы, или общий тег │
│ │ 'modified_base', если кинетический │
│ │ обнаружено событие, которое не │
│ │ соответствует известной модификации │
│ │ подпись │
├───────────┼────────────────────────────────────
│start │ Модификация позиции на контиге │
├───────────┼────────────────────────────────────
│end │ Позиция модификации на контиге │
├───────────┼────────────────────────────────────
│score │ Фред преобразовал p-значение │
│ │ обнаружение - это │
│ │ p-значение одноцентрового обнаружения │
├───────────┼────────────────────────────────────
│ прядь │ Образец пряди, содержащей │
│ │ модификация │
└───────────┴────────────────────────────────────

│фаза │ Не применимо │
├───────────┼────────────────────────────────────
│attributes │ Дополнительные поля, относящиеся к базе │
│ │ моды. IPDRatio традиционный │
│ │ IPDRatio, контекст - это │
│ │ эталонная последовательность -20bp до │
│ │ + 20бп вокруг модификации, │
│ │ а уровень покрытия - это число │
│ │ наблюдений IPD, использованных после │
│ │ Отображение фильтрации QV и │
│ │ точность фильтрации. Если строка │
│ │ результаты идентифицированного │
│ │ модификации мы также включаем │
│ │ идентификация тега Qv с │
│ │ из модификации │
│ │ процедура идентификации. │
│ │ отождествлениеQv - это │
│ │ преобразованная в phred вероятность │
│ │ неправильная идентификация, для │
│ │ базы, которые были идентифицированы как │
│ │ имеющий особый │
│ │ модификация. frac, fracLow, │
│ │ fracUp - оценочные │
│ │ доля молекул, несущих │
│ │ модификация, а 5% │
│ │ доверительные интервалы │
│ │ оценка. Метилированный │
│ │ оценка дроби
│ │ функция бета-уровня и должна │
│ │ использовать только в исследовательских целях │
│ │ целей. │
└───────────┴────────────────────────────────────

мотивы.gff
Если инструмент Motif Finder запущен, он сгенерирует motifs.gff, который является повторно обработанной версией.
модификаций.gff со следующими изменениями. Если обнаруженная модификация происходит на
мотив, обнаруженный системой поиска мотивов, модификация аннотируется данными мотива. An
добавлен атрибут 'motif', содержащий строку мотива, и добавлен атрибут 'id'
содержащий идентификатор мотива, который является строкой для непарных мотивов или
motifString1 / motifString2 для парных мотивов. Если экземпляр мотива существует в геноме,
но не было обнаружено в модификациях.gff, в motifs.gff добавляется запись, указывающая на то, что
наличие этого мотива и кинетика, которая наблюдалась в этом месте.

мотив_summary.csv
Если запущен инструмент Motif Finder, создается motif_summary.csv, обобщающий измененные
мотивы, обнаруженные инструментом. CSV содержит по одной строке на каждый обнаруженный мотив, с
следующие столбцы

┌───────────────────┬─────────────────────────────── ─────┐
│Колонка │ Описание │
├────────────────────┼────────────────────────────── ─────┤
│motifString │ Обнаруженная последовательность мотивов │
├────────────────────┼────────────────────────────── ─────┤
│centerPos │ Позиция в мотиве │
│ │ модификация (на основе 0) │
├────────────────────┼────────────────────────────── ─────┤
│fraction │ Доля экземпляров этого │
│ │ мотив с модификацией QV выше │
│ │ порог QV │
├────────────────────┼────────────────────────────── ─────┤
│nDetected │ Количество экземпляров этого │
│ │ мотив с верхним порогом │
└────────────────────┴────────────────────────────── ─────┘

│nGenome │ Количество экземпляров этого │
│ │ мотив в эталонной последовательности │
├────────────────────┼────────────────────────────── ─────┤
│groupTag │ Строка, определяющая мотив │
│ │ группировка. Для парных мотивов это │
│ │ это │
│ │ " / ", │
│ │ Для непарных мотивов это равно │
│ │ мотивСтрока │
├────────────────────┼────────────────────────────── ─────┤
│partnerMotifString │ motifString парного мотива │
│ │ (мотив с │
│ │ обратный дополнительный │
│ │ строка мотива) │
├────────────────────┼────────────────────────────── ─────┤
│meanScore │ Среднее изменение Qv обнаруженного │
│ │ экземпляры │
├────────────────────┼────────────────────────────── ─────┤
│meanIpdRatio │ Среднее соотношение обнаруженных IPD │
│ │ экземпляры │
├────────────────────┼────────────────────────────── ─────┤
│meanCoverage │ Среднее покрытие обнаруженных │
│ │ экземпляры │
├────────────────────┼────────────────────────────── ─────┤
│objectiveScore │ Объективная оценка этого мотива в │
│ │ алгоритм поиска мотивов │
└────────────────────┴────────────────────────────── ─────┘

Используйте ipdSummary онлайн с помощью сервисов onworks.net


Бесплатные серверы и рабочие станции

Скачать приложения для Windows и Linux

  • 1
    ОфисЭтаж
    ОфисЭтаж
    OfficeFloor обеспечивает инверсию
    управление связью, с его: - зависимостью
    впрыск - продолжение впрыска -
    внедрение потока Для получения дополнительной информации
    посетить...
    Скачать OfficeFloor
  • 2
    ДивКит
    ДивКит
    DivKit — это серверный пакет с открытым исходным кодом.
    Фреймворк пользовательского интерфейса (SDUI). Это позволяет вам
    развертывать обновления с сервера для
    разные версии приложения. Также это может быть
    используется для ...
    Скачать DivKit
  • 3
    субконвертер
    субконвертер
    Утилита для преобразования между различными
    формат подписки. Пользователи Shadowrocket
    следует использовать ss, ssr или v2ray в качестве цели.
    Вы можете добавить &remark= к
    Telegram-любимый HT...
    Скачать субконвертер
  • 4
    СВЭШ
    СВЭШ
    SWASH - это числовой
    инструмент для моделирования неустойчивости,
    негидростатический, со свободной поверхностью,
    вращательный поток и явления переноса
    в прибрежных водах как ...
    Скачать SWASH
  • 5
    VBA-M (Архивировано - сейчас на Github)
    VBA-M (Архивировано - сейчас на Github)
    Проект переехал в
    https://github.com/visualboyadvance-m/visualboyadvance-m
    Особенности:Создание читовСохранить состояниямульти
    система, поддерживает gba, gbc, gb, sgb,
    sgb2Т...
    Скачать VBA-M (в архиве — сейчас на Github)
  • 6
    Stacer
    Stacer
    Оптимизатор системы Linux и мониторинг
    Репозиторий Github:
    https://github.com/oguzhaninan/Stacer.
    Аудитория: конечные пользователи / рабочий стол. Пользователь
    интерфейс: Qt. Программирование Ла...
    Скачать Стасер
  • Больше »

Команды Linux

Ad