این فرمان ویژگی Counts است که می تواند در ارائه دهنده میزبانی رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
featureCounts - یک برنامه خلاصه خواندن بسیار کارآمد و دقیق
طریقه استفاده
تعداد ویژگی ها [گزینه ها] -a -o input_file1 [input_file2]
...
استدلال های مورد نیاز:
-a
نام یک فایل حاشیه نویسی فرمت GTF به صورت پیش فرض دیدن -F گزینه ای برای فرمت های بیشتر
-o
نام فایل خروجی شامل تعداد خوانده شده. یک فایل جداگانه شامل خلاصه
آمار نتایج شمارش نیز در خروجی گنجانده شده است (` .خلاصه')
input_files
لیست فایل های ورودی با فرمت BAM یا SAM. کاربران نیازی به تعیین BAM یا BAM ندارند
سام
استدلال های اختیاری:
-A
نام یک فایل محدود شده با کاما شامل نام مستعار کروموزوم مورد استفاده برای مطابقت
نام های کروموزوم مورد استفاده در حاشیه نویسی با نام های استفاده شده در ورودی BAM/SAM، در صورتی که
ناهمسان. برای فرمت فایل به راهنمای کاربران مراجعه کنید.
-F
فرمت فایل حاشیه نویسی ارائه شده را مشخص کنید. فرمت های قابل قبول عبارتند از 'GTF' و
"SAF". "GTF" به طور پیش فرض. برای توضیحات فرمت SAF به راهنمای کاربران مراجعه کنید.
-t
نوع ویژگی را در حاشیه نویسی GTF مشخص کنید. "exon" به طور پیش فرض. ویژگی های مورد استفاده برای خواندن
شمارش با استفاده از مقدار ارائه شده از حاشیه نویسی استخراج می شود.
-g
نوع ویژگی را در حاشیه نویسی GTF مشخص کنید. "gene_id" به طور پیش فرض. متا ویژگی های استفاده شده
برای شمارش خواندن با استفاده از مقدار ارائه شده از حاشیه نویسی استخراج می شود.
-f شمارش خواندن را در سطح ویژگی انجام دهید (مثلاً شمارش خواندن برای اگزون ها به جای
ژن).
-O خواندن را به همه متا ویژگیهای همپوشانی آنها (یا ویژگیها اگر.) اختصاص دهید -f is
مشخص شده).
-s
شمارش خواندنی خاص رشته را انجام دهید. مقادیر ممکن: 0 (بدون رشته)، 1
(رشته دار) و 2 (رشته معکوس). 0 به صورت پیش فرض
-M خواندن نقشه های چندگانه نیز شمارش خواهد شد. برای خواندن چند نقشه، همه آن گزارش شده است
ترازها شمارش خواهد شد. تگ "NH" در ورودی BAM/SAM برای شناسایی استفاده می شود
چند نقشه برداری می خواند.
-Q
حداقل نمره کیفیت نقشه برداری که خوانده می شود باید برآورده شود تا شمارش شود. برای
خواندن های جفتی، حداقل یک پایان باید این معیار را برآورده کند. 0 به صورت پیش فرض
-T
تعداد رشته ها 1 به طور پیش فرض
-v نسخه خروجی برنامه
-J تعداد خوانش هایی را که از هر پیوند اگزون-اگزون پشتیبانی می کنند، بشمارید. اتصالات بودند
شناسایی شده از خوانشهای فراگیر اگزون در ورودی (حاوی N در CIGAR
رشته). نتایج شمارش در فایلی با نام ذخیره می شود .jcounts'
-G
فایل Fasta حاوی ژنوم مرجع مورد استفاده در تولید ورودی SAM یا
فایل های BAM این آرگومان فقط هنگام انجام شمارش اتصال مورد نیاز است.
-R خروجی نتیجه تکلیف دقیق برای هر خواندن. یک فایل متنی برای
هر فایل ورودی شامل نام خوانده شده و متا ویژگی ها/ویژگی های خوانده شده بود
اختصاص یافته به. برای جزئیات بیشتر به راهنمای کاربران مراجعه کنید.
--بزرگترین همپوشانی
خواندن را به متاویژگی/ویژگی که دارای بیشترین تعداد همپوشانی است، اختصاص دهید
پایگاه ها
--minOverlap
حداقل تعداد پایه های همپوشانی مورد نیاز بین خواندن و a را مشخص کنید
متا ویژگی/ویژگی که خواندن به آن اختصاص داده شده است. 1 به طور پیش فرض
-- read2pos <5: 3>
قرائت ها را به 5' ترین پایه یا 3' ترین پایه آنها کاهش دهید. سپس شمارش خواندن انجام می شود
بر اساس پایه واحد خواندن به کاهش می یابد.
--readExtension5 خواندن توسط بالادست گسترش یافته است پایه از آنها
5' پایان.
--readExtension3 خواندن توسط بالادست گسترش یافته است پایه از آنها
3' پایان.
--کسر
برای هر تراز گزارش شده، به جای 1 (یک) از شمارش کسری 1/n استفاده کنید.
از یک نقشه چندگانه خوانده شده در شمارش خواندن. n تعداد کل ترازهای گزارش شده است
برای خواندن نقشه های چندگانه این گزینه باید همراه با گزینه '-M' استفاده شود.
--اولیه
فقط ترازهای اولیه را بشمارید. ترازهای اولیه با استفاده از بیت 0x100 اینچ شناسایی می شوند
میدان پرچم SAM/BAM.
--ignoreDup
خواندن های تکراری را در شمارش خواندن نادیده بگیرید. خواندن های تکراری با استفاده از بیت شناسایی می شوند
Ox400 در زمینه BAM/SAM FLAG. اگر یکی از خوانده شده ها باشد، کل جفت خوانده شده نادیده گرفته می شود
خواندن تکراری برای داده های پایانی جفت شده.
--countSplitAlignmentsOnly فقط ترازهای تقسیم را بشمارید (یعنی ترازها با
رشته سیگار حاوی «N»). نمونه ای از ترازهای تقسیم شده، قرائت های فراگیر اگزون است
در داده های RNA-seq.
-p به جای خواندن تک تک قطعات (جفت خوانده شده) را بشمارید. برای هر جفت خوانده شده، آن است
دو قرائت باید در ورودی BAM/SAM مجاور یکدیگر باشند.
-P هنگام شمارش جفتهای خوانده شده اعتبار فاصله پایان جفت را بررسی کنید. استفاده کنید -d و -D به
آستانه ها را تعیین کنید
-d
حداقل طول قطعه/الگو، 50 به طور پیش فرض.
-D
حداکثر طول قطعه/الگو، 600 به طور پیش فرض.
-B جفت های خوانده شده را بشمارید که هر دو انتهای آن ها فقط با موفقیت تراز شده اند.
-S
جهت دو خواندن از یک جفت را به طور پیش فرض «fr» مشخص کنید
(جلو/عقب).
-C جفتهای خوانده شده را که دو انتهای آنها با کروموزومهای مختلف نگاشت میشوند، حساب نکنید
یا نقشه برداری به کروموزوم مشابه اما روی رشته های مختلف.
--ناراحت کردن
خواندن ها را در ورودی BAM/SAM مرتب نکنید. توجه داشته باشید که خواندن از یک جفت مورد نیاز است
قرار گرفتن در کنار یکدیگر در ورودی.
--maxMOp
حداکثر تعداد عملیات "M" مجاز در یک رشته CIGAR. 10 به صورت پیش فرض هر دو
"X" و "=" به عنوان "M" و عملیات "M" مجاور در CIGAR ادغام می شوند.
رشته
با استفاده از خدمات onworks.net به صورت آنلاین از featureCounts استفاده کنید