англійськафранцузькаіспанська

Ad


Значок OnWorks

2-й рахунок

Запустіть 2ndscore у постачальника безкоштовного хостингу OnWorks через Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

Це команда 2ndscore, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

ПРОГРАМА:

ІМ'Я


2-й результат - знайдіть найкращу шпильку, закріплену на кожній позиції.

СИНТАКСИС


2ndscore in.fasta > out.hairpins

ОПИС


Для кожної позиції в послідовності це виведе рядок:

-0.6 52 .. 62 TTCCTAAAGGTTCCA GCG CAAAAA TGC CATAAGCACCACATT
(оцінка) (початок .. кінець) (лівий контекст) (шпилька) (правий зміст)

Для позицій поблизу кінців послідовностей контекст може бути доповнений 'x'
символів. Якщо шпильку не знайдено, оцінка буде «Немає».

У кожному файлі швидкого доступу можна надати декілька файлів швидкого виконання, а також декілька послідовностей. The
вихід для кожної послідовності буде розділений рядком, що починається з '>' і містить
FASTA опис послідовності.

Оскільки показники шпильки для плюсового та мінусового пасма можуть відрізнятися (через GU
зв’язування в РНК), за замовчуванням 2ndscore видає два набори шпильок для кожної послідовності:
Шпильки ПЕРЕДНІЙ і Зворотній. Всі передні шпильки виводяться першими і
ідентифікуються за допомогою слова «FORWARD» у кінці рядка «>», що передує їм.
Аналогічно, шпильки REVERSE перераховані після рядка «>», що закінчується на «REVERSE». Якщо ви
якщо ви хочете шукати лише одну чи іншу частину, ви можете використовувати:

--no-fwd Не друкуйте шпильки FORWARD
--no-rvs Не друкуйте Зворотні шпильки

Ви можете встановити використовувану функцію енергії, як і транстерм за допомогою --gc, --au, --gu,
--mm, --gap параметри. Параметри --min-loop, --max-loop та --max-len також підтримуються.

ФОРМАТ OF THE .СУМКА ФАЙЛИ
Стовпці для файлів .bag розташовані в такому порядку:

1. ім'я_гена
2. термінатор_старт
3. terminator_end
4. шпилька_оцінка
5. tail_score
6. термінатор_послідовність

7. terminator_confidence: комбінація шпильки та хвоста оцінює це
враховує, наскільки вірогідними є такі бали у випадковій послідовності. Це
є основним «оцінкою» для термінатора і обчислюється, як описано в
папір, документ.

8. APPROXIMATE_distance_from_end_of_gene: *приблизна* кількість бази
пари між кінцем гена і початком термінатора. Це
є наближеним кількома способами: По-перше, (і найважливіше) TransTermHP
не завжди використовує справжні гени. Залежно від наданих вами варіантів
він може обрізати деякі кінці генів, щоб впоратися з цими термінаторами
частково збігаються з генами. По-друге, де "починається" термінатор
це не так добре визначено. Це поле призначене лише для перевірки працездатності
(термінатори, про які повідомляється, що вони найкращі біля кінців генів, не повинні бути
_занадто далеко_ від кінця гена).

ВИКОРИСТАННЯ ТРАНСТЕРМ БЕЗ ГЕНОМ АНОТАЦІЇ
TransTermHP використовує відому інформацію про гени лише для 3 речей: (1) позначення ймовірного
термінатори як «внутрішні гени» або «міжгенні», (2) вибираючи фоновий GC-
відсоток вмісту для обчислення балів, оскільки гени часто мають різний вміст GC
ніж міжгенні регіони, і (3) виробляючи дещо більш читабельні результати. Предмети (1)
і (3) насправді не потрібні, і (2) не впливає, якщо ваші гени мають приблизно те саме
GC-вміст як ваші міжгенні регіони.

На жаль, TransTermHP ще не має простої можливості запуску без анотації
файл (або .ptt, або .coords) і вимагає наявності принаймні 2 генів. Рішення
полягає у створенні підроблених маленьких генів, які обмежують кожну хромосому. Для цього створіть fake.coords
файл, який містить лише ці два рядки:

fakegene1 1 2 chome_id
fakegene2 L-1 L chrom_id

де L – довжина вхідної послідовності, а L-1 на 1 менше довжини вхідної послідовності
послідовність. "chrom_id" має бути словом, що слідує за ">" у файлі .fasta
що містить вашу послідовність. (Якщо, наприклад, ваш файл .fasta починається з ">seq1", то
chrom_id = seq1).

Це створює «фальшиву» анотацію з двома генами довжиною 1 основа, що фланкують послідовність у
розташування хвоста до хвоста: --> <--. TransTermHP можна запустити за допомогою:

transterm -p expterm.dat sequence.fasta fake.coords

Якщо вміст G/C у ваших міжгенних регіонах приблизно такий же, як у ваших генах, то це
не матиме надто сильного впливу на бали, які отримують термінатори. З іншої сторони,
це використання TransTermHP взагалі мало перевірено, тому важко ручатися за його
точність

Використовуйте 2ndscore онлайн за допомогою служб onworks.net


Ad