Tiếng AnhTiếng PhápTiếng Tây Ban Nha

Ad


Biểu tượng yêu thích OnWorks

spidey - Trực tuyến trên đám mây

Chạy spidey trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks trên Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

Đây là lệnh spidey có thể được chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình giả lập trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


spidey - sắp xếp các trình tự mRNA thành một bộ gen

SYNOPSIS


có gai [-] [-F N] [-G] [-L N] [-M tên tập tin] [-N tên tập tin] [-R tên tập tin] [-S buổi chiều] [-T N]
[-X] [-a tên tập tin] [-c N] [-d] [-e X] [-f X] [-g X] -i tên tập tin [-j] [-k tên tập tin] [-l N]
-m tên tập tin [-n N] [-o str] [-p N] [-r c / d / m / p / v] [-s] [-t tên tập tin] [-u] [-w]

MÔ TẢ


có gai là một công cụ để sắp xếp một hoặc nhiều trình tự mRNA thành một trình tự gen nhất định.
có gai được viết với hai mục tiêu chính: tìm các liên kết tốt bất kể intron
kích thước; và tránh bị nhầm lẫn bởi các giả và mô tả gần đó. Hướng tới cái đầu tiên
mục tiêu, có gai sử dụng BLAST và Dot View (một công cụ căn chỉnh cục bộ khác) để tìm
sự liên kết; vì cả hai đều là công cụ căn chỉnh cục bộ, có gai không thực chất
ưu tiên intron ngắn hơn hoặc dài hơn và không có kích thước intron tối đa. Để tránh nhầm lẫn
bao gồm các exon từ paralogs và pseudogenes, có gai đầu tiên xác định các cửa sổ trên hệ gen
trình tự và sau đó thực hiện sự liên kết mRNA với bộ gen một cách riêng biệt trong mỗi cửa sổ.
Do cách các cửa sổ được xây dựng, các paralogs hoặc pseudogenes lân cận nên
nằm trong các cửa sổ riêng biệt và không được đưa vào căn chỉnh được ghép nối cuối cùng.

Ban đầu sự liên kết xây dựng of bộ gen cửa sổ
có gai nhận làm đầu vào là một trình tự bộ gen đơn lẻ và một tập hợp các truy nhập mRNA hoặc FASTA
trình tự. Tất cả quá trình xử lý được thực hiện một chuỗi mRNA tại một thời điểm. Bước đầu tiên cho mỗi
trình tự mRNA là một BLAST có độ nghiêm ngặt cao chống lại trình tự bộ gen. Các lần truy cập kết quả
được phân tích để tìm ra các cửa sổ bộ gen.

Các căn chỉnh BLAST được sắp xếp theo điểm và sau đó được gán vào các cửa sổ bằng một đệ quy
hàm lấy căn chỉnh đầu tiên và sau đó đi xuống danh sách căn chỉnh để tìm tất cả
sự liên kết phù hợp với sợi đầu tiên (cùng một sợi mRNA, cả mRNA và
tọa độ hệ gen không trùng lặp và nhất quán tuyến tính). Trong những lần vượt qua tiếp theo,
các liên kết còn lại được kiểm tra và được đưa vào phần không trùng lặp của riêng chúng,
cửa sổ nhất quán, cho đến khi không còn căn chỉnh nào. Tùy thuộc vào bao nhiêu mô hình gen
mong muốn, hàng đầu n các cửa sổ được chọn để chuyển sang bước tiếp theo và các cửa sổ khác
đã xóa.

Căn chỉnh in mỗi cửa sổ
Khi các cửa sổ bộ gen được xây dựng, các căn chỉnh BLAST ban đầu được giải phóng và
một tìm kiếm BLAST khác được thực hiện, lần này với toàn bộ mRNA chống lại hệ gen
vùng được xác định bởi cửa sổ và ở mức độ nghiêm ngặt thấp hơn so với tìm kiếm ban đầu. có gai
sau đó sử dụng một thuật toán tham lam để tạo ra một tập hợp con có điểm cao, không trùng lặp của
căn chỉnh từ tìm kiếm BLAST thứ hai. Tập hợp nhất quán này được phân tích cẩn thận để
đảm bảo rằng toàn bộ trình tự mRNA được bao phủ bởi các liên kết. Khi khoảng trống được tìm thấy
giữa các liên kết, vùng thích hợp của trình tự gen được tìm kiếm dựa trên
thiếu mRNA, trước tiên sử dụng BLAST có độ nghiêm ngặt rất thấp và nếu BLAST không tìm thấy
nhấn, sử dụng các chức năng DotView để xác định vị trí căn chỉnh. Khi khoảng trống được tìm thấy ở cuối
căn chỉnh, tìm kiếm BLAST và DotView thực sự được phép mở rộng qua
ranh giới của cửa sổ. Nếu đầu 3 'của mRNA không sắp xếp hoàn toàn, nó là
lần đầu tiên được kiểm tra sự hiện diện của đuôi poly (A). Không có nỗ lực nào được thực hiện để điều chỉnh
phần mRNA có vẻ là đuôi poly (A); đôi khi có một đuôi poly (A)
điều đó phù hợp với trình tự bộ gen và những điều này được ghi nhận vì chúng chỉ ra
khả năng của một gen giả.

Bây giờ mRNA được bao phủ hoàn toàn bởi tập hợp các liên kết, ranh giới của
căn chỉnh (hiện phải có một căn chỉnh cho mỗi exon) được điều chỉnh để
các liên kết tiếp giáp với nhau một cách chính xác và sao cho chúng tiếp giáp với nhà tài trợ mối nối tốt
và các trang web chấp nhận. Thông thường nhất, hai đường thẳng hàng của hai exon liền kề chồng lên nhau nhiều như
20 hoặc 30 cặp bazơ trên trình tự mRNA. Ranh giới exon thực sự có thể nằm ở bất kỳ đâu bên trong
sự chồng chéo này, hoặc (như chúng ta đã thấy theo kinh nghiệm) thậm chí là một vài cặp cơ sở bên ngoài sự chồng chéo.
Để định vị các ranh giới exon, sự chồng chéo cộng với một vài cặp cơ sở ở mỗi bên là
đã kiểm tra các vị trí của nhà tài trợ mối nối, sử dụng các hàm có các ma trận mối nối khác nhau
tùy thuộc vào sinh vật được chọn. Sau đó, một số trang web tài trợ mối nối hàng đầu (theo điểm số) là
được đánh giá về mức độ ảnh hưởng của chúng đến ranh giới căn chỉnh ban đầu. Trang web đó
ảnh hưởng đến các ranh giới ít nhất được chọn và được đánh giá là sự hiện diện của một
nơi chấp nhận. Các căn chỉnh được cắt bớt hoặc mở rộng khi cần thiết để chúng
kết thúc tại địa điểm của nhà tài trợ mối nối và để chúng không chồng chéo lên nhau.

Cuối cùng kết quả
Các cửa sổ được kiểm tra cẩn thận để có được phần trăm nhận dạng trên mỗi exon, số lượng
khoảng trống trên mỗi exon, phần trăm nhận dạng tổng thể, phần trăm bao phủ của mRNA, sự hiện diện của
đuôi poly (A) thẳng hàng hoặc không thẳng hàng, số lượng vị trí của nhà tài trợ mối nối và sự hiện diện hoặc
không có các vị trí cho và nhận mối nối cho mỗi exon và sự xuất hiện của mRNA
có đầu 5 'hoặc 3' (hoặc cả hai) không liên kết với trình tự bộ gen. Nếu
nhận dạng phần trăm tổng thể và phạm vi độ dài phần trăm nằm trên giới hạn do người dùng xác định, a
báo cáo tóm tắt được in và nếu được yêu cầu, căn chỉnh văn bản thể hiện danh tính và
không phù hợp cũng được in.

Giao lộ sự liên kết
có gai có khả năng thực hiện căn chỉnh giữa các cá thể xen kẽ. Sự khác biệt chính trong
sự liên kết giữa các loài là đặc điểm nhận dạng bộ gen mRNA sẽ không gần 100% vì nó
nằm trong sự liên kết giữa các loài cá; Ngoài ra, các liên kết có nhiều khoảng cách và dài. Nếu như
có gai được sử dụng ở chế độ bình thường để sắp xếp giữa các loài, nó tạo ra các mô hình gen
với nhiều, nhiều exon ngắn. Khi cờ của các loài xen kẽ được đặt, có gai sử dụng khác nhau
Thông số BLAST để khuyến khích khoảng cách dài hơn và nhiều hơn và không bị phạt nặng cho
không phù hợp. Bằng cách này, sự liên kết của các exon dài hơn và chặt chẽ hơn
gần đúng với cấu trúc gen thực tế.

Trích xuất CDS sự liên kết
Thời Gian có gai được chạy ở chế độ nhận biết mạng hoặc khi tệp ASN.1 được sử dụng cho mRNA
bản ghi, nó có khả năng trích xuất căn chỉnh CDS từ căn chỉnh mRNA và in
thông tin CDS cũng vậy. Vì sự liên kết CDS chỉ là một tập hợp con của sự liên kết mRNA,
tương đối đơn giản để cắt bớt các căn chỉnh exon khi cần thiết và để
tạo sự liên kết CDS. Hơn nữa, các vùng chưa được dịch hiện đã được xác định, vì vậy
phần trăm nhận dạng cho các vùng chưa được dịch 5 'và 3' cũng được tính toán.

LỰA CHỌN


Dưới đây là một bản tóm tắt các tùy chọn.

- In tin nhắn sử dụng.

-F N Bắt đầu của khoảng bộ gen mong muốn (từ; dựa trên 0).

-G Tệp đầu vào là một danh sách GI.

-L N Kích thước intron cực lớn để sử dụng (mặc định = 220000).

-M tên tập tin
Tập tin với ma trận mối nối của nhà tài trợ.

-N tên tập tin
Tệp với ma trận mối nối bộ chấp nhận.

-R tên tập tin
Tệp (bao gồm cả đường dẫn) để lặp lại cơ sở dữ liệu blast để lọc.

-S buổi chiều Giới hạn ở sợi cộng (p) hoặc trừ (m) của trình tự gen.

-T N Điểm dừng của khoảng bộ gen mong muốn (đến; dựa trên 0).

-X Sử dụng kích thước intron cực lớn (tăng giới hạn cho intron đầu và cuối
từ 100kb đến 240kb và cho tất cả những người khác từ 35kb đến 120kb); có thể dẫn đến
thời gian tính toán lâu hơn đáng kể.

-a tên tập tin
Tệp đầu ra cho các căn chỉnh khi được chuyển hướng đến một tệp riêng biệt với -p 3 (mặc định =
spidey.aln).

-c N Giới hạn nhận dạng, tính bằng phần trăm, cho mục đích kiểm soát chất lượng.

-d Cũng cố gắng căn chỉnh các trình tự mã hóa tương ứng với các bản ghi mRNA đã cho (có thể
yêu cầu truy cập mạng).

-e X Giá trị e-pass đầu tiên (mặc định = 1.0e-10). Giá trị cao hơn làm tăng tốc độ với chi phí
của độ nhạy.

-f X Giá trị điện tử chuyển thứ hai (mặc định = 0.001).

-g X Giá trị điện tử chuyển thứ ba (mặc định = 10).

-i tên tập tin
Tệp đầu vào chứa trình tự bộ gen ở định dạng ASN.1 hoặc FASTA. Nếu là của bạn
máy tính đang chạy trên mạng có thể truy cập GenBank, bạn có thể thay thế
số gia nhập mong muốn cho tên tệp.

-j In căn chỉnh ASN.1?

-k tên tập tin
Tệp cho đầu ra ASN.1 với -k (mặc định = spidey.asn).

-l N Giới hạn độ dài bao phủ, tính bằng phần trăm.

-m tên tập tin
Tệp đầu vào chứa (các) trình tự mRNA ở định dạng ASN.1 hoặc FASTA hoặc danh sách
sự gia nhập của họ (với -G). Nếu máy tính của bạn đang chạy trên một mạng có thể
truy cập GenBank, bạn có thể thay thế một số truy cập duy nhất cho tên tệp.

-n N Số lượng mô hình gen trả về trên mỗi mRNA đầu vào (mặc định = 1).

-o str Tệp đầu ra chính (mặc định = stdout; nội dung được kiểm soát bởi -p).

-p N Căn chỉnh in?
0 tóm tắt và căn chỉnh với nhau (mặc định)
1 chỉ là bản tóm tắt
2 chỉ là sự liên kết
3 tóm tắt và căn chỉnh trong các tệp khác nhau

-r c / d / m / p / v
Sinh vật của trình tự bộ gen, được sử dụng để xác định ma trận mối nối.
c C. Elegans
d Drosophila
m Dictyostelium discoideum
p cây
v động vật có xương sống (mặc định)

-s Điều chỉnh căn chỉnh giữa các loài xen kẽ.

-t tên tập tin
Tệp với bảng tính năng, trong 4 cột được phân cách bằng tab:
seqid (ví dụ, NM_04377.1)
tên (chỉ có khu vực lặp lại hiện đang được hỗ trợ)
Bắt đầu (Dựa trên 0)
dừng lại (Dựa trên 0)

-u Thực hiện một sự liên kết nhiều mặt của tất cả các mRNA đầu vào (phải chồng lên nhau trên bộ gen
sự nối tiếp).

-w Xem xét các ký tự chữ thường trong các chuỗi FASTA đầu vào được che đi.

Sử dụng spidey trực tuyến bằng các dịch vụ onworks.net


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

  • 1
    sạch sâu
    sạch sâu
    Một tập lệnh Kotlin kích hoạt tất cả các bản dựng
    cache từ các dự án Gradle/Android.
    Hữu ích khi Gradle hoặc IDE cho phép bạn
    xuống. Kịch bản đã được thử nghiệm trên
    macOS, nhưng ...
    Tải xuống sạch sâu
  • 2
    Trình cắm kiểu kiểm tra Eclipse
    Trình cắm kiểu kiểm tra Eclipse
    Trình cắm thêm Eclipse Checkstyle
    tích hợp mã Checkstyle Java
    đánh giá viên vào IDE Eclipse. Các
    plug-in cung cấp phản hồi theo thời gian thực để
    người dùng về vi phạm ...
    Tải xuống Trình cắm kiểu kiểm tra Eclipse
  • 3
    AstrOrzNgười Chơi
    AstrOrzNgười Chơi
    AstrOrz Player là trình phát đa phương tiện miễn phí
    phần mềm, một phần dựa trên WMP và VLC. Các
    người chơi theo phong cách tối giản, với
    hơn mười màu chủ đề và cũng có thể
    b ...
    Tải xuống AstrOrzPlayer
  • 4
    phim trường
    phim trường
    Kodi Movistar+ TV là một ADDON cho XBMC/
    Kodi que allowe disponer de un
    bộ giải mã dịch vụ IPTV
    Tích hợp Movistar en uno de los
    trung tâm truyền thông ...
    Tải phimstartv
  • 5
    Mã :: Khối
    Mã :: Khối
    Code::Blocks là mã nguồn mở, miễn phí,
    đa nền tảng C, C++ và Fortran IDE
    được xây dựng để đáp ứng những nhu cầu khắt khe nhất
    của người dùng của nó. Nó được thiết kế rất
    mở rộng ...
    Tải xuống mã::Khối
  • 6
    Ở giữa
    Ở giữa
    Giao diện Minecraft giữa hoặc nâng cao
    và Theo dõi Dữ liệu / Cấu trúc là một công cụ để
    hiển thị tổng quan về Minecraft
    thế giới mà không thực sự tạo ra nó. Nó
    có thể ...
    Tải về giữa
  • Khác »

Lệnh Linux

Ad