anfo-tool - Интернет в облаке

Это командный anfo-инструмент, который можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


anfo-tool - обрабатывать собственные двоичные файлы ANFO

СИНТАКСИС


анфо-инструмент [ вариант | описания ... ]

ОПИСАНИЕ


анфо-инструмент используется для фильтрации, обработки и преобразования файлов, созданных анфо. Каждый узор
в командной строке раскрывается подстановочный знак, затем для каждого входного файла (или стандартного
ввод, если не указан шаблон), анфо-инструмент строит цепочку входных фильтров, затем объединяет
эти входные потоки одним из нескольких способов разбивают результат на несколько выходных
потоки, к каждому из которых может быть применена цепочка выходных фильтров.

ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ


Общие Возможности
Эти параметры применяются глобально и изменяют поведение всей программы. Они могут быть
помещается в любом месте командной строки.

-V, --версия
Распечатать номер версии и выйти.

-к, --тишина
Подавить весь вывод, кроме сообщений о фатальных ошибках.

-v, --подробный
Производите больше продукции, включая индикаторы прогресса для большинства операций.

--отлаживать
Создавать отладочные данные в дополнение к информации о ходе выполнения.

-n, -- пробный запуск
Проанализируйте командную строку, при необходимости распечатайте описание предполагаемых операций, затем
Выход.

--вмем Х
Ограничьте виртуальную память до X мегабайты. Если память закончится, анфо-инструмент пытается освободить
увеличить память, забывая о больших файлах, например, геномах. Используйте эту опцию, чтобы избежать
условия подкачки или нехватки памяти, когда операции включают большие или многократные
геномы.

настройка параметры
Параметр может быть установлен несколько раз в командной строке и перезапишет предыдущий
настройки. Любой вариант фильтра, которому требуется параметр, выбирает последнее определение, которое
появился перед опцией фильтра.

- set-slope S
Установите параметр крутизны на S, склон используется вместе с перехват в котором
фильтры применяются к оценкам выравнивания; расстановки баллов не хуже, чем склон * (Длина
- перехватить) считаются хорошими. По умолчанию - 7.5.

- установить-перехват L
Установите параметр перехвата на L, перехват используется вместе с склон
где фильтры применяются к оценкам выравнивания; расстановки баллов не хуже, чем склон *
(Длина - перехватить) считаются хорошими. По умолчанию - 20.

--set-контекст C
Установите для параметра контекста значение C. Контекст - это количество окружающих оснований
ссылка включается при печати выравниваний в текстовой форме. По умолчанию - 0.

--set-геном G
Установите параметр генома на G. Многие фильтры учитывают только лучшие выравнивания
к этому конкретному геному, если он установлен. Если геном не задан, лучший в мире
выравнивание.

--чистый геном
Очистите параметр генома. Фильтры применяются к лучшему в мире выравниванию
в конце.

ФИЛЬТР Возможности
Фильтры можно применять перед объединением входов или после разделения резервной копии.

-s, --sort-pos = n
Сортировать по положению выравнивания при буферизации не более n MiB в памяти. Если
геном установлен, используются выравнивания по этому геному.

-S, --sort-name = n
Сортировать по имени чтения, буферизуя не более n MiB в памяти.

-l, --filter-length = L
Сохранять выравнивания только при чтении не менее L длина баз. Читает сами
хранятся.

-f, --фильтр-оценка
Сохраняйте выравнивания только в том случае, если их оценка достаточно высока. Пользысклониперехват.

--filter-mapq = Q
Удалить выравнивания с качеством отображения ниже Q.

-h, --filter-hit = SEQ
Сохранять только те чтения, которые попадают в последовательность с именем SEQ. Если SEQ пусто, читает
сохраняются, если они имеют какое-либо попадание. Если геном параметр установлен, попадает только в этот
подсчет генома.

--delete-hit = SEQ
Удалить трассы для SEQ. Если SEQ пусто, все выравнивания удаляются. Если
геном задан параметр, удаляются только выравнивания этого генома.

--filter-qual = Q
Скрыть базы с качеством ниже Q. Такая база заменяется на N неоднозначность
код.

--кратность = N
Сохраняйте только чтения молекул, которые были секвенированы как минимум N раз. Читает
считается происходящим из одной и той же исходной молекулы, если их выровненные координаты равны
идентичны.

--подвыборка = F
Подвыборка дроби F результатов. Каждое чтение происходит независимо и случайным образом
выбрать оставить или нет.

--inside-region = ФАЙЛ
Прочитать список регионов из ФАЙЛОВ, затем оставьте только те выравнивания, которые перекрывают
аннотированная область.

--outside-region = ФАЙЛ
Прочитать список регионов из ФАЙЛОВ, затем оставьте только те выравнивания, которые не перекрывают
аннотированная область.

Особый Фильтры
-d, --rmdup = Q
Удалите дубликаты ПЦР, оцените качество зажима до Q. Считается, что два чтения
дубликаты, если их выровненные координаты идентичны. Если геном установлен,
используется наилучшее выравнивание по этому геному, в противном случае - наилучшее выравнивание в глобальном масштабе. Оба
выравнивания должны быть хорошими, как определено склониперехват. Для набора
дубликаты, это называется консенсусом, обычно повышающим качество. Если
итоговая оценка качества превышает Q, он установлен на Q. Этот фильтр требует ввода
для сортировки по координатам выравнивания на выбранных геном.

--duct-tape = ИМЯ Склейте выравнивание внахлест на контиги и вызовите консенсус
для них. Если геном установлено, выравнивание по этому геному используется, иначе
мировые лучшие выравнивания. Этот фильтр требует, чтобы входные данные были отсортированы по выравниванию.
координировать геном. Выход представляет собой набор контигов, каждой позиции назначается
база консенсуса, оценка качества и вероятность для всех возможных диаллелей. (Это
называется клейкой лентой, потому что она выглядит как сборка, но не совсем
как твердый.)

--edit-header = ED
Вызов редактора ED на текстовом представлении заголовка потока. Это может быть
используется для очистки жатки, в которой накопилось слишком много мусора.

Объединение Фильтры
В командной строке должен быть указан ровно один фильтр слияния, все параметры фильтра
происходящие до этого являются частью цепочек входных фильтров, все последующие фильтры становятся
выходные цепи. Если фильтр слияния не указан, --конкат предполагается, и все фильтры
входные фильтры.

-с, --конкат
Объедините все входные потоки в том порядке, в котором они появляются в командной строке.

-м, --слияние
Объединяйте отсортированные входные потоки, получая отсортированный результат. Все входы должны быть отсортированы
таким же образом.

-j, --присоединиться
Присоединяйтесь к входным потокам и сохраняйте лучшие результаты для каждого генома. Каждый вход
поток должен содержать запись для каждого чтения, чтения буферизируются в памяти до тех пор, пока все
их хитов собраны. Таким образом, соединение работает хорошо, если все входные данные почти
в том же порядке. Если в некоторых потоках отсутствуют чтения, присоединение к ним приведет к потере
Память.

--мега-слияние
Объедините множество потоков, например, созданных при запуске Anfo-Sge. Потоки, которые
работают на одних и тех же чтениях, объединяются, затем все объединяется.

Результат Возможности
Если в командной строке задана опция вывода, текущая цепочка выходных фильтров завершается.
и запускается новый. Если параметр вывода не задан, текстовое представление
последний поток записывается в стандартный вывод. Все параметры вывода принимаются - писать в stdout.

-o, --output ФАЙЛ
Записать собственный двоичный поток (сжатое сообщение protobuf) в ФАЙЛОВ. Написание
двоичный поток и чтение его обратно без потерь.

--output-text ФАЙЛ
Записать текстовый поток protobuf в ФАЙЛОВ. Если необходимые геномы доступны,
текстовое представление выравниваний включено. Если контекст параметр
установить, что многие дополнительные базы ссылки вверх и вниз по течению от
выравнивание включены.

--output-sam = ФАЙЛ
Записать выравнивания в формате SAM в ФАЙЛОВ.

--output-glz ФАЙЛ
Записать контиги в формате GLZ 0.9 в ФАЙЛОВ. Генерация GLZ работает только после
применение --Скотч, каждый контиг становится записью GLZ.

--output-3aln ФАЙЛ
Запишите контиги в формате на основе таблицы, чтобы ФАЙЛОВ. Формат по-прежнему подлежит
change, см. подробную документацию в исходном коде.

--output-fasta ФАЙЛ
Записать выравнивания (!) В формате FastA в ФАЙЛОВ. Выравнивания записываются как пара
ссылка и последовательность запроса, выровненные координаты указаны в описании
последовательности запроса. Если контекст установлен параметр, что много дополнительных баз
ссылки до и после совмещения включены. Этот
формат не рекомендуется для серьезного использования, он существует для поддержки устаревших
приложений.

--output-fastq ФАЙЛ
Записывать последовательности (!) В формате FastQ в ФАЙЛОВ. Эффективное написание FastQ
восстанавливает вход в АНФО если по результатам не производилась фильтрация.

--output-table ФАЙЛ
Записывать статистику выравнивания в ФАЙЛОВ. В файле три столбца: Â последовательность
длина, оценка выравнивания, разница до следующего лучшего выравнивания. В основном это полезно
анализировать / визуализировать распределение баллов выравнивания.

--stats ФАЙЛ
Напишите простую статистику в ФАЙЛОВ. Это приводит к простой сводной статистике
весь поток: количество выровненных последовательностей, средняя длина, содержание GC.

ОКРУЖАЮЩАЯ СРЕДА


ANFO_PATH
Разделенный двоеточием список каталогов, в которых производится поиск файлов генома и индексных файлов.

ANFO_TEMP
Временное пространство, используемое для сортировки больших файлов.

Используйте anfo-tool онлайн с помощью сервисов onworks.net



Новейшие онлайн-программы для Linux и Windows