นี่คือคำสั่ง map2slimp ที่สามารถเรียกใช้ในผู้ให้บริการโฮสติ้งฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
map2slim - แมปการเชื่อมโยงของยีนกับ ontology ที่ 'บาง'
เรื่องย่อ
ซีดีไปเลย
map2slim GO_slims/goslim_generic.obo ontology/gene_ontology.obo สมาคมยีน/gene_association.fb
DESCRIPTION
ให้ไฟล์ GO slim และ ontology ปัจจุบัน (ในไฟล์อย่างน้อยหนึ่งไฟล์) สคริปต์นี้จะแมป
ไฟล์การเชื่อมโยงยีน (มีคำอธิบายประกอบสำหรับ GO แบบเต็ม) กับเงื่อนไขใน GO
บาง.
สคริปต์สามารถใช้เพื่อสร้างไฟล์การเชื่อมโยงยีนใหม่ ซึ่งประกอบด้วยไฟล์ most
ภาคยานุวัติ GO slim ที่เกี่ยวข้องหรือในโหมดนับซึ่งในกรณีนี้จะให้ยีนที่แตกต่างกัน
จำนวนผลิตภัณฑ์สำหรับแต่ละคำที่บาง
รูปแบบไฟล์ความสัมพันธ์มีอธิบายไว้ที่นี่:
<http://www.geneontology.org/GO.annotation.shtml#file>
อาร์กิวเมนต์
-b ถัง บาง ไฟล์
อาร์กิวเมนต์นี้เพิ่ม ถัง เงื่อนไขการใช้บริการ เพื่อบาง ontology; ดูเอกสารด้านล่างสำหรับ
คำอธิบาย. ไฟล์ ontology แบบบางใหม่ รวมถึงเงื่อนไขของบัคเก็ตจะถูกเขียนไปที่
ถัง บาง ไฟล์
-แผนที่ออก บาง การทำแผนที่ ไฟล์
สิ่งนี้จะสร้างไฟล์การแมปสำหรับทุกคำในภววิทยาแบบเต็มซึ่งแสดงทั้ง
คำบางคำที่เกี่ยวข้องมากที่สุดและคำบางคำที่เป็นบรรพบุรุษ ถ้าคุณใช้สิ่งนี้
ตัวเลือก ห้ามส่งไฟล์ที่เกี่ยวข้องกับยีน
ชื่อเล่น
(ใช้ได้กับ -outmap เท่านั้น)
แสดงชื่อคำศัพท์ในไฟล์การแมปแบบบาง
-c สิ่งนี้จะบังคับ map2slim ให้นับไฟล์ assoc แทนที่จะทำการแมป
-t เมื่อใช้ร่วมกับ -c จะแท็บผลลัพธ์เพื่อให้การเยื้องสะท้อน
ลำดับชั้นของต้นไม้ในไฟล์แบบบาง
-o ออก ไฟล์
สิ่งนี้จะเขียน assocs ที่แมป (หรือนับ) ไปยังไฟล์ที่ระบุแทนที่จะเขียนถึง
หน้าจอ
ดาวน์โหลด
สคริปต์นี้เป็นส่วนหนึ่งของ ไป-perl แพ็คเกจจากCPAN
<http://search.cpan.org/~cmungall/go-perl/>
สคริปต์นี้จะไม่ทำงานหากไม่มีการติดตั้ง go-perl
ทำแผนที่ อัลกอริธึม
GO เป็น DAG ไม่ใช่ต้นไม้ ซึ่งหมายความว่ามักจะมีมากกว่าหนึ่งเส้นทางจากเทอม GO
จนถึงโหนดรูท Gene_Ontology; เส้นทางอาจตัดกันหลายคำใน slim
ontology - ซึ่งหมายความว่าคำอธิบายประกอบหนึ่งรายการสามารถจับคู่กับคำที่บางเฉียบได้หลายคำ!
(หมายเหตุ คุณต้องดูสิ่งนี้ทางออนไลน์เพื่อดูภาพด้านล่าง - หากคุณไม่ได้ดูสิ่งนี้บน
http://www.geneontology.org เว็บไซต์ คุณสามารถดู URL ต่อไปนี้:
<http://geneontology.cvs.sourceforge.net/*ชำระเงิน*/geneontology/go-dev/go-perl/doc/map2slim.gif>
)
ตัวอย่างสมมุติฐานวงกลมสีน้ำเงินแสดงคำศัพท์ใน GO slim และวงกลมสีเหลืองแสดง
เงื่อนไขในอภิปรัชญาเต็ม ontology แบบเต็มอยู่ภายใต้ความบาง ดังนั้นคำศัพท์สีน้ำเงินคือ
ใน ontology ด้วย
GO ID MAPS สู่ SLIM ID ALL SLIM บรรพบุรุษ
===== ============== ==================
5 2+3 2,3,1
6 3 เท่านั้น 3,1
7 4 เท่านั้น 4,3,1
8 3 เท่านั้น 3,1
9 4 เท่านั้น 4,3,1
10 2+3 2,3,1
คอลัมน์ที่ 2 แสดง ID ที่เกี่ยวข้องมากที่สุดในการทำแผนที่โดยตรงแบบบาง ครั้งที่ 3
คอลัมน์แสดงบรรพบุรุษทั้งหมดในสลิม
สังเกตโดยเฉพาะอย่างยิ่งการแมปของ ID 9 แม้ว่าจะมีสองเส้นทางไปยังรูทผ่าน
ความบางผ่าน 3 และ 4, 3 ถูกละทิ้งเพราะถูกย่อยด้วย 4
ในทางกลับกัน 10 แมปกับทั้ง 2 และ 3 เพราะเป็นทั้ง Slim ID ตัวแรกใน
สองพาธที่ถูกต้องไปยังรูท และไม่ย่อยอีกเส้นทางหนึ่ง
อัลกอริทึมที่ใช้คือ:
เพื่อแมปคำศัพท์ใดคำหนึ่งในภววิทยาแบบเต็ม: ค้นหาเส้นทางที่ถูกต้องทั้งหมดผ่านไปยังโหนดรูทใน
อภิปรัชญาเต็มรูปแบบ
สำหรับแต่ละเส้นทาง ใช้คำบางคำแรกที่พบในเส้นทาง
ละทิ้งคำบางคำที่ซ้ำซากจำเจในชุดนี้ เช่น คำที่บางเฉียบที่ถูกแทนที่ด้วยคำที่บางเฉียบอื่นๆ
ในชุด
ถัง เงื่อนไข
หากคุณเรียกใช้สคริปต์ด้วยตัวเลือก -b เงื่อนไขของบัคเก็ตจะถูกเพิ่มเข้าไป สำหรับเทอมใดๆ P in
ตัวบาง ถ้า P มีลูก C อย่างน้อยหนึ่งตัว คำที่ฝากข้อมูล P' จะถูกสร้างขึ้นภายใต้ P นี่คือ
คำศัพท์ catch-all สำหรับการทำแผนที่คำใดๆ ใน ontology แบบเต็มที่เป็นลูกหลานของ P แต่
ไม่ใช่ทายาทของลูกของ P ในออนโทโลยีที่เพรียวบาง
ตัวอย่างเช่น slim generic.0208 มีข้อกำหนดและโครงสร้างดังต่อไปนี้:
%การผูกมัด DNA ; GO:0003677
%การจับโครมาติน ; GO:0003682
%กิจกรรมปัจจัยการถอดความ ; GO:0003700, GO:0000130
หลังจากเพิ่มเงื่อนไขที่ฝากข้อมูลแล้ว จะมีลักษณะดังนี้:
%การผูกมัด DNA ; GO:0003677
%การจับโครมาติน ; GO:0003682
%กิจกรรมปัจจัยการถอดความ ; GO:0003700 ; คำพ้องความหมาย:GO:0000130
@bucket:Z-OTHER-DNA มีผลผูกพัน ; slim_temp_id:12
คำศัพท์จากภววิทยาแบบเต็มที่เป็นลูกอื่นๆ ที่มีผลผูกพัน DNA เช่น single-
การผูกมัด DNA ที่ควั่นและการสืบเชื้อสายของมันจะจับคู่กับระยะที่ฝากข้อมูล
ระยะที่ฝากข้อมูลมี ID แบบบางซึ่งชั่วคราวและมีเพียงเพื่ออำนวยความสะดวก
การทำแผนที่ ไม่ควรใช้ภายนอก
ระยะที่ฝากข้อมูลมีคำนำหน้า Z-OTHER; Z เป็นแฮ็คเพื่อให้แน่ใจว่าคำว่า is
เรียงตามลำดับตัวอักษรเสมอ
อัลกอริทึมจะได้รับการแก้ไขเล็กน้อยหากใช้เงื่อนไขของที่เก็บข้อมูล ระยะที่ฝากข้อมูลมี an
ความสัมพันธ์โดยปริยายกับพี่น้อง OTHER คนอื่นๆ ที่ไม่ได้อยู่ในรูปร่างผอมบาง
Do I จำเป็นต้อง ถัง เงื่อนไข?
ทุกวันนี้ไฟล์ที่บางเฉียบส่วนใหญ่นั้นทั้งหมดหรือเกือบ 'สมบูรณ์' ซึ่งไม่มีช่องว่าง
ซึ่งหมายความว่าตัวเลือก -b จะไม่ให้ผลลัพธ์ที่แตกต่างกันอย่างเห็นได้ชัด ตัวอย่างเช่น,
คุณอาจเห็นคำที่ฝากข้อมูล การเชื่อมโยงอื่น ๆ ที่สร้างขึ้นโดยไม่มีคำอธิบายประกอบ: เพราะทั้งหมด
ลูกของการผูกใน GO จะแสดงในไฟล์แบบบาง
ตัวเลือกที่ฝากข้อมูลจำเป็นสำหรับไฟล์บางไฟล์ที่เก่ากว่าเท่านั้น
ซึ่งเป็นแบบคงที่และถูกสร้างขึ้นในลักษณะที่ค่อนข้างเฉพาะกิจ พวกเขามักจะสะสม 'ช่องว่าง'
เมื่อเวลาผ่านไป (เช่น GO จะเพิ่มลูกใหม่ของการเชื่อมโยง แต่ไฟล์ static slim จะไม่ถึง
วันที่ ดังนั้นผลิตภัณฑ์ยีนใดๆ ที่มีหมายเหตุประกอบสำหรับคำใหม่นี้จะจับคู่กับ OTHER-binding ใน
บาง)
กราฟ ไม่ตรงกัน
โปรดทราบว่าไฟล์ ontology แบบบางอาจล้าสมัยเมื่อเทียบกับไฟล์ปัจจุบัน
อภิปรัชญา
ปัจจุบัน map2slim ไม่ได้ตั้งค่าสถานะกราฟไม่ตรงกันระหว่างกราฟแบบบางและกราฟใน
ไฟล์ ontology แบบเต็ม มันใช้ภววิทยาเต็มรูปแบบเป็นกราฟที่แท้จริง อย่างไรก็ตาม
Slim ontology จะถูกใช้เพื่อจัดรูปแบบผลลัพธ์หากคุณเลือก -t -c เป็นตัวเลือก
เอาท์พุท
ในโหมดปกติ ไฟล์การเชื่อมโยงยีนรูปแบบมาตรฐานจะถูกเขียนขึ้น คอลัมน์ GO ID
(5) จะมี GO slim IDs การแมปสอดคล้องกับคอลัมน์ที่ 2 ในตาราง
ข้างต้น. โปรดทราบว่าไฟล์เอาต์พุตอาจมีบรรทัดมากกว่าไฟล์อินพุต นี่คือ
เนื่องจาก GO ID แบบเต็มบางรายการมี Slim ID ที่เกี่ยวข้องมากกว่าหนึ่งรายการ
COUNT โหมด
map2slim สามารถเรียกใช้ด้วยตัวเลือก -c ซึ่งจะให้จำนวนยีนที่แตกต่างกัน
ผลิตภัณฑ์ที่แมปกับคำบางคำ คอลัมน์มีดังนี้
ไประยะ
คอลัมน์แรกคือ GO ID ตามด้วยชื่อคำศัพท์ (ชื่อคำถูกระบุเป็น
มันถูกพบทั้งใน GO แบบเต็มและ ontology ที่บางเฉียบ - สิ่งเหล่านี้มักจะเหมือนกัน
แต่บางครั้งไฟล์แบบบางจะล้าหลังการเปลี่ยนแปลงในไฟล์ GO)
จำนวนผลิตภัณฑ์ยีนที่เป็นคำที่เพรียวบางที่เกี่ยวข้องมากที่สุด
จำนวนผลิตภัณฑ์ยีนที่แตกต่างกันซึ่งมีความเกี่ยวข้องมากที่สุด/ตรงที่สุด
NS. โดยส่วนใหญ่ เราหมายความว่าการเชื่อมโยงใด ๆ กับคำนี้โดยตรง
หรือสมาคมทำขึ้นเพื่อลูกที่ผอมบางนี้และไม่มีเด็กผอม
คำที่สมาคมเชื่อมโยงไปถึง
สำหรับคนผอมส่วนใหญ่ การนับนี้จะเท่ากับจำนวนการเชื่อมโยงโดยตรง
จับคู่กับคำที่บางเฉียบนี้ อย่างไรก็ตาม ไฟล์บางรุ่นเก่าบางไฟล์ "ขาดๆ หายๆ" ตรงที่ไฟล์เหล่านั้น
ยอมรับ "ช่องว่าง" เช่น ถ้าผอมมีลูกทั้งหมดของ "กระบวนการทางชีวภาพ" ด้วย
ข้อยกเว้นของ "พฤติกรรม" ดังนั้นคำอธิบายประกอบทั้งหมดของ "พฤติกรรม" หรือลูกของมันจะเป็น
นับที่นี่
ดูตัวอย่างด้านล่าง
จำนวนผลิตภัณฑ์ยีนที่อนุมานว่ามีความเกี่ยวข้องกับระยะผอม
และจำนวนผลิตภัณฑ์ยีนที่แตกต่างกันซึ่งระบุถึงผู้สืบเชื้อสายของสิ่งนี้
slim ID (หรือใส่คำอธิบายประกอบโดยตรงกับ slim ID)
ธงล้าสมัย
ไปอภิปรัชญา
ยกตัวอย่าง; ถ้าเราใช้ -t และ -c ดังนี้:
map2slim -t -c GO_slims/goslim_generic.obo ontology/gene_ontology.obo การเชื่อมโยงยีน/gene_association.fb
ผลลัพธ์บางส่วนอาจมีลักษณะดังนี้:
GO:0008150 กระบวนการทางชีวภาพ (กระบวนการทางชีวภาพ) 34 10025 กระบวนการทางชีววิทยา
GO:0007610 พฤติกรรม (พฤติกรรม) 632 632 กระบวนการทางชีวภาพ
GO:0000004 ไม่ทราบกระบวนการทางชีวภาพ (ไม่ทราบกระบวนการทางชีวภาพ) 832 832 bio_process
GO:0007154 การสื่อสารของเซลล์ (การสื่อสารของเซลล์) 333 1701 กระบวนการทางชีววิทยา
GO:0008037 การจดจำเซลล์ (การจดจำเซลล์) 19 19 กระบวนการทางชีววิทยา
ผลิตภัณฑ์ 19 รายการถูกแมปกับ GO:0008037 หรือผลิตภัณฑ์ลูกใดผลิตภัณฑ์หนึ่ง (GO:0008037 เป็นโหนดลีฟในตัวเครื่องบาง ดังนั้น การนับทั้งสองจึงเหมือนกัน)
ในทางกลับกัน GO:0008150 ได้รับสินค้าเพียง 34 ชิ้นซึ่งมีความเกี่ยวข้องมากที่สุด
ภาคเรียน. นี่เป็นเพราะคำอธิบายประกอบส่วนใหญ่จะจับคู่กับลูกของ GO:0008150 ที่บางเฉียบ
เช่น GO:0007610 (พฤติกรรม) ผลิตภัณฑ์ยีนทั้ง 34 ชิ้นนี้มีคำอธิบายประกอบโดยตรงกับ
GO:0008150 หรือเด็กบางคนในเทอมนี้ซึ่งไม่ผอมเพรียว สิ่งนี้สามารถชี้ไปที่
'ช่องว่าง' ในแบบบาง โปรดทราบว่าการรัน map2slim ด้วยตัวเลือก -b จะ 'เสียบ' ช่องว่างเหล่านี้
ด้วยเงื่อนไขฟิลเลอร์เทียม
ใช้ map2slimp ออนไลน์โดยใช้บริการ onworks.net