Jest to polecenie dnaindex, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS
PROGRAM:
IMIĘ
dnaindex - plik indeksu dna do użytku z ANFO
STRESZCZENIE
dnaindeks [ opcja ... ]
OPIS
dnaindeks buduje indeks dla pliku dna. Pliki DNA muszą być zindeksowane, aby można było z nich korzystać
anfo(1), możliwe jest posiadanie wielu indeksów dla tego samego pliku dna.
OPCJE
-V, --wersja
Wydrukuj numer wersji i wyjdź.
-o plik, --plik wyjściowy
Zapisz dane wyjściowe do filet. filet zwykle kończy się na .idx. Domyślnie jest
nazwa_genu_rozmiar słowa.idx.
-g plik, --genome plik
Przeczytaj genom z filet. Ta nazwa pliku jest również zapisywana w wynikowym indeksie tzw
można go znaleźć automatycznie za każdym razem, gdy używany jest indeks. Dlatego najlepiej jeśli
filet to tylko nazwa pliku bez ścieżki.
-G reż, --genome-dir reż
Dodaj reż do ścieżki wyszukiwania genomu. Jest to przydatne, jeśli indeksowany jest genom
jeszcze nie w miejscu, w którym będzie później używany.
-d tekst, --tekst opisu
Dodaj XNUMX jako opis do indeksu. To ma charakter wyłącznie informacyjny.
-s rozmiar, --wordsize rozmiar
Ustaw rozmiar słowa na rozmiar. Mniejszy rozmiar słowa zwiększa precyzję kosztem
większe inwestycje obliczeniowe. Wartość domyślna to 12, co oznacza krok równy 8
daje dobry kompromis.
-S liczba, --stride liczba
Ustaw krok na num. Tylko jeden z num możliwe słowa DNA to w rzeczywistości
indeksowane. Mniejszy krok zwiększa precyzję kosztem większego indeksu.
Wartość domyślna to 8, co w połączeniu z rozmiarem słowa 12 daje wynik dobry
kompromis.
-l limit, --limit limit
Zapobiega indeksowaniu słów, które występują częściej niż lim czasy. To może być
używane do ignorowania powtarzających się nasion i oszczędzania miejsca do ich przechowywania. Dobra domyślność
zależy od rozmiaru indeksowanego genomu, w przypadku tego będzie działać około 500
ludzki genom o rozmiarze słowa 12 i kroku 8.
-h, --histogram
Utwórz histogram częstotliwości słów. Można to wykorzystać, aby dowiedzieć się, jak
rozkład częstotliwości, aby wybrać odpowiednią wartość --limit.
-v, --pełne
Wydrukuj wskaźnik postępu podczas pracy.
UWAGI
dnaindeks jest ograniczony do genomów nie dłuższych niż 4 gigabajty ze względu na użycie formatu 32-bitowego
indeksy. Indeks jest dość duży, więc w zależności od parametrów jest to platforma 64-bitowa
potrzebne dla genomów w zakresie gigabaz.
Jeśli genom zawiera kody niejednoznaczności IUPAC, dotknięte nasiona należy rozszerzyć. Jeśli
istnieje wiele kodów niejednoznaczności w małym regionie, co skutkuje niedopuszczalnie dużym kodem
index.
ŚRODOWISKO
ANFO_PATH
Oddzielona dwukropkami lista katalogów przeszukiwanych w poszukiwaniu plików genomu.
Korzystaj z dnaindex online, korzystając z usług onworks.net