PerM - آنلاین در ابر

این دستور PerM است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.

برنامه:

نام


پرم - نقشه برداری کارآمد از خواندن کوتاه با دانه های دوره ای

اگر سؤالی در مورد استفاده دارید، لطفاً به "yanghoch at usc dot edu" ایمیل بزنید.

خلاصه


برای استفاده از خط فرمان، تایپ کنید پرم با ارگ ها به ترتیب.

مثال ها


برای تک پایانی آمده است:

پرم کد عکس می خواند [گزینه های]

مثال:

پرم Ref.fasta Reads.fasta -v 5 -o out.mapping -u ummappedReads.fa

پرم RefFilesList.txt ReadsSetFilesList.txt -v 5 -u unmappedReads.fa -E

پرم Ref.fasta Reads.csfasta -v 5 -m -s my.index --delimiter ´,´ --seed F3

پرم my.index SingleEndReads.csfasta -v 5 -o out.sam -k 10 -a ambiguous10.csfasta

برای جفت شده آمده است:

پرم کد عکس -1 F3_Reads -2 R3_Reads [گزینه های]

مثال:

پرم ref.fa -1 F3.fa -2 R3.fa -U 3000 -L 100 -v 5 -A -m -s -o out.sam

پرم ref.txt -1 F3.fq -2 R3.fq -v 5 -m -s my.index -o out.mapping --seed F3

پرم my.index -1 F3.fq -2 R3.fq -U 3000 -L 100 -v 5 -A -o out.sam

به ساختن an شاخص فقط:

پرم کد عکس Read_Length -قالب خواندن <.csfasta|.fasta> -m -s شاخص مسیر -- دانه F3

مثال:

پرم hg18.txt 50 -قالب خواندن .csfasta -m -s hg18_50_SOLiD.index

OPTIONS


ضروری استدلال

· فایل مرجع باید در فرمت FASTA با یکی باشد .fasta, .fna، یا فا
فرمت فایل. برای یک رونوشت با چندین ژن یا ایزوفرم به عنوان مرجع،
تمام دنباله های FASTA را در یک فایل FASTA به هم متصل کنید. متناوبا، اگر وجود داشته باشد
بسیاری از فایل ها، به عنوان مثال یک در هر کروموزوم، مانند: chr1.fa تا chrY.fa، لیست FASTA
نام فایل در هر خط در فایلی که دارای این است کلیپ برد چند منظوره افزونه. را کلیپ برد چند منظوره مهم است
زیرا PerM پسوند فایل را بررسی می کند تا بداند آیا فایل ورودی لیستی از فایل است
نام فایل ها نام فایل باید شامل مسیر فایل (نسبی یا مطلق) باشد مگر اینکه
فایل های FASTA همه در همان دایرکتوری هستند که PerM از آن اجرا می شود.

· فایل(های) خوانده شده باید در قالب .fasta، .fastq، .csfasta یا csfastq. باشد. PerM
یک فایل را با توجه به پسوند آن یا فرمت مشخص شده توسط
-قالب خواندن پرچم. اگر چندین فایل خوانده شده وجود دارد، نام هر فایل را فهرست کنید
در هر خط، در یک فایل txt. PerM آن را به عنوان ورودی می گیرد و می تواند چندین مجموعه خواندن را در آن نقشه برداری کند
به موازات [http://en.wikipedia.org/wiki/OpenMP OpenMP].

کوتاه گزینه (گروه بندی شده by مربوط عملکرد)

-A تولید تمام ترازها در آستانه عدم تطابق (نگاه کنید به -v گزینه)، انتها به انتها.

-B تولید بهترین ترازها از نظر عدم تطابق در آستانه (نگاه کنید به -v گزینه). برای
به عنوان مثال، اگر یک خوانده شده هیچ تراز منطبق کاملی نداشته باشد، دو عدم تطابق پایه تکی
ترازها، و ترازهای اضافی با عدم تطابق بیشتر، فقط دو تک
ترازهای عدم تطابق پایه خروجی خواهد شد. -B حالت پیش فرض است اگر هیچ کدام -A or -B
مشخص شده است.

-E خروجی فقط نقشه های منحصر به فرد خوانده می شود باقی مانده بعد از la بهترین پایین انتخاب شده است
در صورت وجود اعمال شود. هنگامی که با -A گزینه، فقط با یک تک خوانده می شود
هم ترازی در آستانه عدم تطابق (نگاه کنید به -v گزینه) خروجی خواهد شد.

-v حداکثر تعداد عدم تطابق مجاز (یا در هر انتهای برای خوانده‌های انتهای جفت مجاز است).
مقدار پیش فرض تعداد عدم تطابق است که دانه استفاده شده کاملاً حساس است
به.

-k حداکثر تعداد ترازها را برای خروجی مشخص می کند. مقدار پیش فرض 200 است اگر
پرچم -k داده نشده است. ترازهایی برای خواندن نقشه برداری به بیش از تعداد حداکثر
موقعیت ها خروجی نخواهند داشت. از گزینه -a برای جمع آوری مطالبی که بیشتر از مقدار خوانده شده استفاده کنید
بیشترین.

-t تعداد پایه ها در انتهای 5' هر خوانده شده برای نادیده گرفتن. به عنوان مثال، اگر 5 مورد اول
پایه ها به عنوان بارکد یا برای نمایه سازی چندین نمونه با هم استفاده می شوند، از -t 5 استفاده کنید. اگر نه
مشخص شده است، هیچ پایه اولیه نادیده گرفته نخواهد شد.

-T تعداد پایه‌ها در هر خواندن برای استفاده، پس از نادیده گرفته شدن هر پایه توسط گزینه -t شروع می‌شود.
پایه های بعدی در 3´ خوانده شده نادیده گرفته می شوند. به عنوان مثال، -T 30 به معنای فقط استفاده است
30 پایه اول (سیگنال) بعد از هر پایه نادیده گرفته شده به دلیل گزینه -t.

-m نمایه مرجع را بدون استفاده مجدد از فهرست ذخیره شده حتی در صورت وجود ایجاد کنید.

-s مسیر
برای تسریع در نقشه برداری در آینده، فهرست مرجع را ذخیره کنید. اگر مسیر نیست
مشخص شده، ایندکس در دایرکتوری کاری فعلی ایجاد می شود (یعنی کجا
PerM از) با استفاده از نام ایندکس پیش فرض اجرا می شود. اگر مسیر یک فهرست، فهرست است
با استفاده از نام فهرست پیش فرض (دایرکتوری) در دایرکتوری مشخص شده ایجاد می شود
باید وجود داشته باشد؛ به طور خودکار ایجاد نمی شود). اگر مسیر یک مسیر فایل است،
ایندکس با نام مشخص شده ایجاد خواهد شد.

-o مسیر فایل
نام فایل خروجی نقشه برداری هنگام نگاشت یک مجموعه خواندنی. فرمت فایل خروجی
فرمت متن جدا شده از برگه نقشه برداری . یا فرمت SAM به عنوان
با پسوند نام فایل خروجی تعیین می شود. برای مثال {{{-o out.sam}}}
در فرمت SAM خروجی خواهد شد. {{{-o /path/to/out.mapping}}} در .mapping خروجی خواهد داشت
قالب استفاده کنید --فرمت خروجی برای نادیده گرفتن این رفتار در -o گزینه اعمال نمی شود
هنگامی که چندین مجموعه خواندن به طور همزمان نقشه برداری می شوند تا از مزایای متعدد استفاده کنند
CPU (هسته)؛ را ببینید -d گزینه ای برای آن مورد

-d dirpath
دایرکتوری خروجی برای نگاشت فایل های خروجی هنگام نگاشت چندین مجموعه خواندنی (خروجی
فایل ها به طور خودکار نامگذاری می شوند). اگر دایرکتوری مشخص شده وجود نداشته باشد،
پوشه خروجی به شرط وجود دایرکتوری والد ایجاد خواهد شد. اگر -d
سوئیچ مشخص نشده است، فایل ها در دایرکتوری که PerM از آن اجرا می شود، نوشته می شود.
توجه: اگر -d مسیر فایل هنگام نگاشت یک مجموعه خواندنی مشخص می شود، dirpath خواهد بود
به مسیر فایل; با این حال، این استفاده توصیه نمی شود.

-a مسیر فایل
یک فایل FASTA (FASTQ) برای خواندن های نگاشت شده به موقعیت های بیشتر از آستانه ایجاد کنید
با -k یا پیش فرض 200 مشخص شده است.

-b مسیر فایل
یک فایل FASTA (FASTQ) برای خواندن های کوتاه تر از طول مورد انتظار یا با آن ایجاد کنید
شخصیت های عجیب و غریب

-u مسیر فایل
یک فایل FASTA (FASTAQ) از خواندن های بدون نقشه ایجاد کنید. وقتی یک مجموعه خواندنی منفرد نقشه برداری می شود،
نام فایل نام فایل خروجی را مشخص می کند. وقتی چندین مجموعه خواندن نقشه برداری می شوند،
نام فایل بی ربط است و باید حذف شود. فایل های دنباله های نقشه برداری نشده خواهد شد
به طور خودکار نامگذاری می شود و در پوشه ای که PerM از آن اجرا می شود ایجاد می شود.

طولانی گزینه

--ambiguosReadOnly
خروجی فقط نگاشت مبهم برای یافتن تکرارها (مناطق مشابه در جانشینی
آستانه). هنگامی که این گزینه مشخص شده است، می خواند که به شماره بیش از نقشه نگاشت شده است
آستانه ای که توسط -k مشخص شده است همچنان چاپ خواهد شد.

--ambiguosReadInOneLine
خروجی نگاشت بیش از k مکان در یک خط را می خواند. وقتی این گزینه است
مشخص شده، می خواند که نگاشت شده به آستانه شماره بیش از نگاشت مشخص شده توسط -k will
هنوز چاپ می شود اما در یک خط چاپ می شود.

--noSamHeader
سرصفحه SAM اضافه نکنید. این امر به هم پیوستن چند SAM را آسان تر می کند
فایل های خروجی

--IncludeReadsWN
نقشه با پایه های N یا '.' مساوی یا کمتر از آستانه مشخص شده توسط خوانده می شود
رمزگذاری N یا ´.' به صورت A یا 3. خواندن با «N» بیشتر کنار گذاشته می شود. پیشفرض
تنظیم دور انداختن با هر «N» خوانده می شود.

--statsOnly
خروجی آمار نگاشت فقط به stdout، بدون ذخیره ترازها در فایل ها.

-- نادیده گرفتنQS
نمرات کیفیت در فایل های FASTQ یا QUAL را نادیده بگیرید.

--printNM
وقتی امتیازات کیفیت در دسترس است، از این پرچم برای چاپ تعداد عدم تطابق استفاده کنید.
به جای نمرات عدم تطابق در قالب نقشه برداری.

-- دانه {F,,0,, | F,,1,, | F,,2,, | F,,3,, | F,,4,, | S,,11,, | S,,20,, | S,,12,,}
الگوی بذر را مشخص کنید. دانه های F,,0,,, F,,1,,, F,,2,,, F,,3,,, و F,,4,.
کاملاً به ترتیب به عدم تطابق 0-4 حساس است. دانه های S,,11,, S,,20,, S,,12,
برای ترتیب سنج SOLID طراحی شده اند. یک دانه S,,kj,, کاملاً به k حساس است
جفت عدم تطابق مجاور (امضای SNP فضای رنگ است) و عدم تطابق j جدا شده.
دیدن [http://code.google.com/p/perm/wiki/Algorithms صفحه الگوریتم] برای اطلاعات بیشتر
اطلاعات در مورد الگوهای بذر

--refFormat {فستا | فهرست | شاخص }
به جای حدس زدن، توالی(های) مراجع را در قالب مشخص شده فرض کنید
با توجه به پسوند فایل

-قالب خواندن |{فستا | fastq | csfasta | csfastq}
فرض کنید خواندن ها در قالب مشخص شده هستند، به جای حدس زدن بر اساس
پسوند فایل(ها).

--فرمت خروجی { سام | نقشه برداری }
گزینه فرمت نگاشت خروجی پیش‌فرض را لغو کنید یا آن را به صراحت مشخص کنید
پسوند فایل خروجی .sam یا .mapping نیست.

--حائل، جداکننده ارابه
ارابه کاراکتری است که به عنوان جداکننده برای جدا کردن شناسه خوانده شده و the استفاده می شود
اطلاعات اضافی در خط > هنگام خواندن یک فایل FASTA یا CSFASTA.

-- ثبت نام مسیر فایل
مسیر فایل نام فایل log را که حاوی آمار نقشه برداری است مشخص می کند
که روی صفحه نیز چاپ خواهد شد.

- فقط به جلو
نقشه فقط برای رشته رو به جلو خوانده می شود: (این مخصوص رشته SOLiD است
ترتیب دهی).

-- فقط معکوس
نقشه فقط برای رشته معکوس خوانده می شود: (این برای رشته SOLiD خاص است
ترتیب دهی)

گزینه برای پایان جفت شده می خواند

PerM با نگاشت هر انتها به طور جداگانه با خواندن های جفت شده سروکار دارد. همه ترکیبات از
جفت های جفت نگاشت به دنباله مرجع مشابه در صورت جداسازی آنها خروجی خواهد شد
در محدوده مجاز مشخص شده توسط -L و -U پرچم ها

-e جفت مبهم را حذف کنید.

-L / --کران پایین INT
کران پایین برای فاصله جدایی جفت جفت

-U / --کران بالا INT
کران بالایی برای فاصله جدایی جفت جفت

کران بالا و کران پایین می تواند منفی باشد، که ممکن است ترتیب مجدد را جلب کند
تغییرات. استفاده کنید -A استدلال برای جلوگیری از از دست دادن جفت های صحیح. با این حال، این ممکن است
اگر هر دو انتها در مناطق تکراری باشند، زمان اجرا را بسیار افزایش دهید.

--fr نقشه جفت پایان فقط برای رشته های مختلف خوانده می شود

--ff نقشه جفت پایان فقط برای همان رشته خوانده می شود

--printRefSeq
توالی جفت مرجع نگاشت شده را به عنوان دو ستون آخر در .mapping چاپ کنید
قالب | نگاشت خروجی گزینه پیش فرض در هر دو رشته یکسان یا متفاوت.

نمایندگی تنظیمات


موارد زیر تنظیمات پیش فرض هستند زمانی که گزینه خط فرمان مربوطه وجود ندارد
مشخص شده. لطفاً گزینه تغییر تنظیمات پیش فرض را مشخص کنید.

فقط در هر انتها فقط دو عدم تطابق را مجاز کنید و از seed F,,2,, S,,11, یا F,,3,, استفاده کنید.
، با توجه به طول و نوع خواندن انتخاب شده است.

· بهترین ترازها را برای هر خوانده شده از نظر تعداد عدم تطابق چاپ کنید.

· خروجی فایل ها در *قالب نقشه برداری.

· قبل از ساخت نمایه جدید، یک فهرست ذخیره شده با نام فایل پیش فرض را جستجو می کند.

· فهرست را در فایل ذخیره نمی کند، مگر اینکه {{{-s}}} مشخص شده باشد.

· برای خواندن انتهای جفت شده، فاصله جداسازی مجاز پیش فرض 0-3000 جفت باز است. تغییر دادن
با -L و -U گزینه.

موازی نقشه برداری

PerM به طور همزمان چندین مجموعه خواندن را در یک لیست با پرس و جو از یک شاخص ترسیم می کند. خواهد شد
تعداد CPU (هسته) موجود را شناسایی کنید و به هر یک از آنها یک مجموعه خواندن اختصاص دهید. اگر خوانده شود
تنظیم انجام شد، مجموعه خواندن بعدی در لیست به طور خودکار پردازش می شود. هر مجموعه خوانده شده
فایل خروجی نقشه برداری خود را خواهد داشت. برای استفاده بهتر از تمام پردازنده های مرکزی روی یک گره، خواندن بزرگ است
مجموعه باید به بسیاری از مجموعه های خواندنی کوچک تقسیم شود و در یک لیست قرار گیرد. وقتی چندین گره هستند
در همان فایل سیستم استفاده می شود، ایندکس باید ابتدا توسط یک گره از پیش ساخته شود. دیگری
گره ها دوباره ایندکس از پیش ساخته شده را بدون نمایه ساختمان می خوانند. بدون شاخص از پیش ساخته شده،
هر ماشین سعی می کند شاخص خود را بسازد و زمان CPU و فضای ذخیره سازی را هدر می دهد.

خروج کد


PerM پس از تکمیل موفقیت آمیز، کد خروج را روی 0 تنظیم می کند، یعنی رفتار عادی یونیکس. اگر
برنامه از طریق Ctrl-C (SIGINT) خاتمه می یابد، کد خروج 2 خواهد بود، شماره برای SIGINT
(نگاه کنید به مرد کشتن). اگر PerM را از زبان دیگری فراخوانی کنید، می توانید کد برگشتی را بررسی کنید
و کاری هوشمندانه انجام دهید در اینجا یک مثال شبه کد پرل آمده است:

در حالی که (... نوعی حلقه ...) {
my $cmd = "PerM ... آرگومان ها و سوئیچ ها";
my $ec = system($cmd);
اگر ($ec == 2) {
چاپ STDERR "PerM از طریق Ctrl-C پایان یافت. توقف اجرا.\n\n";
# شاید پاکسازی هایی مانند حذف فایل های کوچکی که فایل خوانده شده بود انجام دهید
# تقسیم برای پردازش موازی.
خروج ($ec)؛
}
}

استفاده کنید PerM on کهکشان


با تشکر از پروفسور Anton Nekrutenko و Kelly Vincent در PSU، اکنون می توانید از PerM در
[http://test.g2.bx.psu.edu/ گلکسی اس آزمون سرور]. لینک صفحه Galaxy را دنبال کنید،
و روی NGS:Mapping در منوی ابزار کلیک کنید. لطفا انتخاب کنید نقشه با PerM برای جامد و
الیومینا. می توانید مرجع خود را آپلود کنید یا از شاخص از پیش ساخته شده hg19 در سیستم استفاده کنید.
لطفا در صورت بروز هرگونه مشکل به من ایمیل بزنید. هنگامی که سیستم پایداری خود را ثابت کرد،
به سرور اصلی Galaxy با شاخص مرجع از پیش ساخته شده بیشتری منتقل می شود.

واحد تست


هنگامی که PerM توسعه یافت، یک واحد تست واحد cppUnit نیز آماده شد. اگر شما
علاقه مند به کد تست PerM، لطفا به من ایمیل بزنید.

از PerM به صورت آنلاین با استفاده از خدمات onworks.net استفاده کنید



جدیدترین برنامه های آنلاین لینوکس و ویندوز