นี่คือคำสั่ง lamboot ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
lamboot - เริ่มการทำงานของคอมพิวเตอร์หลายเครื่อง LAM
เรื่องย่อ
แกะ [-b] [-d] [-h] [-H] [-l] [-s] [-v] [-V] [-x] [-nn] [-np] [-c ไฟล์ conf ] [-คำนำหน้า
/lam/install/path/] [-sessionprefix value] [-sessionsuffix value]
[-withlamprefixpath ค่า] [-ssi ค่าคีย์] [bhost]
OPTIONS
-b สมมติว่าโลคัลและรีโมตเชลล์เหมือนกัน ซึ่งหมายความว่ามีรีโมตเชลล์เพียงตัวเดียว
การเรียกใช้จะใช้กับแต่ละโหนด ถ้า -b ไม่ได้ใช้การเรียกใช้เชลล์ระยะไกลสองครั้ง
ใช้กับแต่ละโหนด
-d เปิดเอาต์พุตการดีบัก นี่หมายความว่า -v
-h พิมพ์เมนูวิธีใช้คำสั่ง
-l ความล่าช้าในการแก้ไขชื่อโฮสต์ไปยังที่อยู่ IP
-คำนำหน้า ใช้การติดตั้ง LAM ที่ระบุใน /lam/install/path/ เข้ากันไม่ได้กับ
เวอร์ชัน LAM/MPI ก่อน 7.1
-s ปิด stdio บนโหนดท้องถิ่น
-ssi สำคัญ ความคุ้มค่า
ส่งอาร์กิวเมนต์ไปยังโมดูล SSI ต่างๆ ดูส่วน "SSI" ด้านล่าง
-v ละเอียด.
-x ทำงานในโหมดทนต่อข้อผิดพลาด
-H อย่าแสดงส่วนหัวของคำสั่ง
-nn อย่าเพิ่ม "-n" ลงในบรรทัดคำสั่งตัวแทนระยะไกล
-เช่น อย่าบังคับให้ดำเนินการ $HOME/.profile บนโฮสต์ระยะไกล
-เซสชัน-คำนำหน้า ความคุ้มค่า
ตั้งค่าคำนำหน้าเซสชัน แทนที่ LAM_MPI_SESSION_PREFIX
-เซสชัน-คำต่อท้าย ความคุ้มค่า
ตั้งค่าส่วนต่อท้ายเซสชัน แทนที่ LAM_MPI_SESSION_SUFFIX
-กับโคมไฟคำนำหน้าเส้นทาง ความคุ้มค่า
แทนที่พาธการติดตั้งภายใน สำหรับใช้ภายในเท่านั้น ห้ามใช้เว้นแต่
คุณรู้ว่าคุณกำลังทำอะไรอยู่
และพวกเรา ตัวแปร
LAM_MPI_SESSION_PREFIX
LAM_MPI_SESSION_SUFFIX
เป็นไปได้ที่จะเปลี่ยนไดเร็กทอรีเซสชันที่ใช้โดย LAM/MPI ตามปกติของ
รูปแบบ:
tmpdir/lam-username@hostname[-ต่อท้าย]
tmpdir จะถูกตั้งค่าเป็น LAM_MPI_SESSION_PREFIX ถ้าตั้ง. มิเช่นนั้นจะถอยกลับไป
ค่าของ ทีเอ็มพีดีอาร์. หากไม่มีการตั้งค่าเหล่านี้ ค่าดีฟอลต์คือ /tmp
คำต่อท้ายสามารถแทนที่ได้โดย LAM_MPI_SESSION_SUFFIX ตัวแปรสภาพแวดล้อม ถ้า
LAM_MPI_SESSION_SUFFIX ไม่ได้ตั้งค่าและ LAM กำลังทำงานภายใต้ batch . ที่รองรับ
ระบบตั้งเวลา, $ต่อท้าย จะเป็นค่าที่ไม่ซ้ำกับงานที่กำลังทำงานอยู่
DESCRIPTION
พื้นที่ แกะ เครื่องมือเริ่มซอฟต์แวร์ LAM ในแต่ละเครื่องที่ระบุในการบู๊ต
สคีมา โฮสต์. บูตสกีมาระบุชื่อโฮสต์ของโหนดที่จะใช้ในการรัน
สภาพแวดล้อมเวลา MPI และอาจแสดงรายการว่า CPU LAM อาจใช้ในแต่ละโหนดได้อย่างไร NS
ผู้ใช้อาจต้องการเรียกใช้ .ก่อน ลาดตระเวน(1) เครื่องมือในการตรวจสอบว่า LAM สามารถเริ่มทำงานได้
การสตาร์ท LAM เป็นขั้นตอนสามขั้นตอน ในขั้นแรก บูต(1) ถูกเรียกใช้ในแต่ละ
เครื่องที่ระบุ จากนั้นแต่ละเครื่องจะจัดสรรพอร์ตแบบไดนามิกและสื่อสาร
กลับไป แกะ ซึ่งรวบรวมพวกเขา ในขั้นตอนที่สาม แกะ ให้แต่ละเครื่อง
รายการเครื่องจักร/พอร์ตเพื่อสร้างโทโพโลยีที่เชื่อมต่ออย่างสมบูรณ์ ถ้าเครื่องไหนเป็น
ไม่สามารถเริ่มได้ หรือหากระยะหมดเวลาหมดลงก่อนขั้นตอนแรกจะเสร็จสิ้น แกะ
จะเรียก แลมไวเป้(1) ยุติ LAM และรายงานข้อผิดพลาด
พื้นที่ โฮสต์ file เป็นสคีมาการบูต LAM ที่เขียนในไวยากรณ์ไฟล์โฮสต์ ดู โฮสต์(5)
แทนที่จะระบุบรรทัดคำสั่ง สามารถระบุบูตสกีมาในสภาพแวดล้อม LAMBHOST
ตัวแปร. มิฉะนั้น ไฟล์เริ่มต้น lam-bhost.def จะถูกใช้ LAM ค้นหา โฮสต์ เป็นครั้งแรก
ในไดเร็กทอรีโลคัลและจากนั้นในไดเร็กทอรีการติดตั้งภายใต้ etc/
นอกจากนี้ แกะ ใช้สคีมากระบวนการสำหรับโหนด LAM แต่ละรายการ สคีมากระบวนการ
(ดู conf(5)) เป็นคำอธิบายของกระบวนการที่ประกอบขึ้นเป็นระบบปฏิบัติการบน a
โหนด โดยทั่วไป ผู้ดูแลระบบจะรักษาไฟล์นี้ -- ผู้ใช้ LAM/MPI จะ
โดยทั่วไปไม่จำเป็นต้องเปลี่ยนไฟล์นี้ นอกจากนี้ยังเป็นไปได้สำหรับผู้ใช้ในการปรับแต่ง
ซอฟต์แวร์ LAM พร้อมสคีมากระบวนการส่วนตัว
พื้นที่ โฮสต์ ไฟล์
รูปแบบของ โฮสต์ ไฟล์ได้รับการบันทึกไว้ใน โฮสต์(5) หน้าคน
แกะ จะแก้ไขชื่อทั้งหมดใน โฮสต์ บนโหนดที่ แกะ ถูกเรียก (the
โหนดต้นทาง) หลังจากนั้น LAM จะใช้เฉพาะที่อยู่ IP ไม่ใช่ชื่อ โดยเฉพาะ
ไม่ได้ใช้การกำหนดค่าการแก้ปัญหาชื่อบนโหนดอื่นทั้งหมด ดังนั้นโหนดต้นทาง
จะต้องสามารถแก้ชื่อทั้งหมดใน โฮสต์ ไปยังที่อยู่ที่ทุกคนเข้าถึงได้
โหนดอื่น ๆ
ข้อผิดพลาดทั่วไปคือการแสดงรายการ localhost (หรือชื่อใด ๆ ที่ลงมติเป็นที่อยู่พิเศษ
127.0.0.1 -- อุปกรณ์ TCP/IP แบบวนกลับ) ใน a โฮสต์ ไฟล์ที่มีโหนดอื่น ใน
ในกรณีนี้ ที่อยู่ 127.0.0.1 จะถูกส่งไปยังโหนดอื่นแต่ละโหนดเป็นที่อยู่
ของโหนดต้นทาง หากโหนดอื่นพยายามใช้ 127.0.0.1 เพื่อติดต่อกับโหนดต้นทาง
พวกเขาจะติดต่อตัวเองจริง ๆ และในที่สุดก็หมดเวลาและล้มเหลว
ที่อยู่ IP ที่ได้รับจาก โฮสต์ ใช้สำหรับข้อความเมตาของ LAM: การเริ่มต้นและ
การปิดงาน ข้อความนอกวงที่ใช้สำหรับการประสานงาน ฯลฯ ปริมาณการรับส่งข้อมูล
ค่อนข้างต่ำ (เว้นแต่จะใช้โหมด "lamd" ของข้อความ MPI ที่ส่งผ่าน ซึ่งในกรณีนี้ MPI . ทั้งหมด
การรับส่งข้อมูลจะใช้ข้อความเมตาของ LAM สำหรับการขนส่งด้วย -- ดู มปีรัน(1)). เมื่อใช้
TCP RPI ที่อยู่ IP เหล่านี้ยังใช้สำหรับข้อความ MPI ที่ส่งผ่านซ็อกเก็ตโดยตรง
ระหว่างโหนดแต่ละคู่
กรณีทั่วไปคือเมื่อโหนด "หลัก" มีหลายการ์ดอินเทอร์เฟซเครือข่าย (NIC) -- one
ที่เชื่อมต่อกับเครือข่ายสาธารณะและเครือข่ายที่เชื่อมต่อกับเครือข่ายส่วนตัว
ที่ซึ่งงานคู่ขนานจะถูกรัน เพื่อรวมโหนดหลักในa โฮสต์ ไฟล์ IP
ชื่อ (หรือที่อยู่) ของ NIC บนเครือข่ายส่วนตัวควรอยู่ใน โฮสต์. นี้
ตรวจสอบให้แน่ใจว่าโหนดอื่น ๆ ทั้งหมดสามารถเข้าถึงโหนดหลักบนเครือข่ายส่วนตัวได้
อีกตัวอย่างหนึ่ง การกำหนดค่าบางอย่างมี TCP/IP NIC หลายตัวในแต่ละโหนดของa
งานคู่ขนาน. NIC หนึ่งถือว่า "ช้า" (เช่น 10Mbps) ในขณะที่อีกอันหนึ่งถือว่า
"เร็ว" (เช่น 100Mbps) เป็นที่พึงปรารถนาที่จะให้ LAM ใช้ประโยชน์จากที่สูงขึ้น
แบนด์วิดท์บนเครือข่าย "เร็ว" สำหรับข้อความ MPI ดังกล่าว โฮสต์ ควรแสดงรายการชื่อ IP
(หรือที่อยู่) ของ NIC ที่ "เร็ว" ทั้งหมด อย่างไรก็ตาม หาก LAM RPI ไม่ได้ใช้ TCP/IP (เช่น
Myrinet/GM RPI), the โฮสต์ ไฟล์น่าจะแสดงรายการ NIC ที่ "ช้า" เพื่อให้ LAM's
ทราฟฟิกข้อความเมตาไม่ทำให้เกิดโอเวอร์เฮดและอาจลดประสิทธิภาพการทำงานบน
เครือข่าย "เร็ว" จากแอปพลิเคชันประสิทธิภาพสูงอื่นๆ
การล่าช้า ชื่อโฮสต์ การค้นหา
โดยปกติการจำแนกชื่อของชื่อโฮสต์จะทำบนเครื่องโดยที่ แกะ ถูกเรียก
สิ่งนี้ทำเพื่อเหตุผลในการเพิ่มประสิทธิภาพ เพื่อให้รายการชื่อโฮสต์ต้องเป็น .เท่านั้น
แก้ไขครั้งเดียว (อาจลดจำนวน DNS หรือเครือข่ายค้นหาชื่อโฮสต์อื่น ๆ ให้น้อยที่สุด
การจราจร).
อย่างไรก็ตาม ในสภาพแวดล้อมเครือข่ายที่ไม่สม่ำเสมอบางอย่าง นี่ยังไม่เพียงพอเพราะแต่ละอย่าง
โฮสต์อาจมีที่อยู่ IP ที่แตกต่างกันในแต่ละเพียร์ ตัวอย่างเช่น โฮสต์ A อาจมี
ที่อยู่ Z บนโฮสต์ B แต่มีที่อยู่ Y บนโฮสต์ C
พื้นที่ -l ตัวเลือก แกะ จะทำให้ LAM กระจายชื่อโฮสต์ไปยังแต่ละโหนดมากกว่าa
ชุดที่อยู่ IP ที่ได้รับการแก้ไขอย่างสมบูรณ์ ดังนั้นแต่ละโหนดที่บูต LAM จะทำด้วยตัวเอง
การแก้ไขชื่อในรายการชื่อโฮสต์
SSI (ระบบ บริการ อินเตอร์เฟซ)
พื้นที่ -ssi สวิตช์อนุญาตให้ส่งผ่านพารามิเตอร์ไปยังโมดูล SSI ต่างๆ SSI . ของ LAM
โมดูลอธิบายโดยละเอียดใน ล่ำซือ(7). โมดูล SSI มีผลกระทบโดยตรงต่อMPI
โปรแกรมเพราะอนุญาตให้ตั้งค่าพารามิเตอร์ที่ปรับได้ในขณะใช้งาน (เช่น boot ตัวใด)
ไดรเวอร์อุปกรณ์ที่จะใช้ พารามิเตอร์ใดที่จะส่งผ่านไปยังไดรเวอร์นั้น ฯลฯ)
พื้นที่ -ssi สวิตช์รับสองอาร์กิวเมนต์: สำคัญ และ ความคุ้มค่า. สำคัญ อาร์กิวเมนต์โดยทั่วไประบุ
โมดูล SSI ใดจะได้รับค่า ตัวอย่างเช่น สำคัญ "boot" ใช้สำหรับเลือก
RPI ใดที่จะใช้สำหรับเริ่มต้นกระบวนการบนโหนดระยะไกล NS ความคุ้มค่า อาร์กิวเมนต์คือ
ค่าที่ผ่าน ตัวอย่างเช่น:
lamboot -ssi บูต TM
บอก LAM ให้ใช้โมดูลบูต "tm" สำหรับการเปิดตัวแบบเนทีฟใน PBSPro / OpenPBS
สภาพแวดล้อม (โมดูลการบูต tm ไม่ต้องการบูตสกีมา)
lamboot -ssi บูต rsh -ssi rsh_agent "ssh -x" boot_schema
บอกให้ LAM ใช้โมดูลการบูต "rsh" และบอกให้โมดูล rsh ใช้ "ssh -x" เป็น
เอเจนต์เฉพาะเพื่อเรียกทำงาน executables บนรีโมตโหนด
และอื่นๆ. โมดูล SSI สำหรับบูตของ LAM ได้อธิบายไว้ใน lamssi_boot(7). หน้านี้ควรจะ
ปรึกษาการดำเนินการเฉพาะที่ดำเนินการและวิธีปรับแต่งพฤติกรรมรันไทม์
ของแต่ละโมดูลการบูต
พื้นที่ -ssi สวิตช์ใช้ได้หลายครั้งเพื่อระบุความแตกต่าง สำคัญ และ / หรือ ความคุ้มค่า
อาร์กิวเมนต์ ถ้าเหมือนกัน สำคัญ ถูกระบุมากกว่าหนึ่งครั้ง ความคุ้มค่าs ถูกเชื่อมด้วย
เครื่องหมายจุลภาค (",") คั่นพวกเขา
โปรดทราบว่า -ssi สวิตช์เป็นเพียงทางลัดสำหรับการตั้งค่าตัวแปรสภาพแวดล้อม NS
ผลกระทบเดียวกันสามารถทำได้โดยการตั้งค่าตัวแปรสภาพแวดล้อมที่สอดคล้องกันก่อน
วิ่ง แกะ. รูปแบบของตัวแปรสภาพแวดล้อมที่ LAM ตั้งค่าคือ:
LAM_MPI_SSI_key=ค่า.
โปรดทราบว่า -ssi สวิตช์จะแทนที่ตัวแปรสภาพแวดล้อมที่ตั้งไว้ก่อนหน้านี้ โปรดทราบด้วย
ที่ไม่รู้จัก สำคัญ อาร์กิวเมนต์ยังคงถูกตั้งค่าเป็นตัวแปรสภาพแวดล้อม - ไม่ได้ตรวจสอบ
(โดย แลมไวเป้) เพื่อความถูกต้อง ผิดกฎหมายหรือไม่ถูกต้อง ความคุ้มค่า อาร์กิวเมนต์อาจจะหรืออาจจะไม่
รายงาน -- ขึ้นอยู่กับโมดูล SSI เฉพาะ
ห่างไกล ปฏิบัติการ การภาวนา
ทุกแง่มุมที่ปรับแต่งได้ของการเรียกใช้ปฏิบัติการบนโหนดระยะไกลในระหว่าง แกะ เป็น
กล่าวถึงใน ล่ำซือ(7) และ lamssi_boot(7). หัวข้อรวมถึง (แต่ไม่จำกัดเพียง):
การค้นพบรีโมตเชลล์ การแทนที่รันไทม์ของเอเจนต์ที่ใช้เพื่อเรียกใช้รีโมต
ไฟล์ปฏิบัติการ (เช่น rsh และ ssh) เป็นต้น
ปิด สตูดิโอ
stdio ของ LAM daemon แต่ละตัวบนรีโมตโฮสต์ที่เปิดใช้โดย แกะ ปิดโดย
ค่าเริ่มต้น. โดยปกติ stdio ของ LAM daemon ที่เปิดใช้งานบนโลคัลโฮสต์จะถูกเปิดทิ้งไว้ดังนั้น
ว่าภายใน LAM ทีเอสทีดิโอ(3) แพ็คเกจทำงานอย่างถูกต้อง อย่างไรก็ตาม บางครั้งก็
เป็นที่พึงปรารถนาในการปิด stdio ของ LAM daemon ในพื้นที่เช่นกัน ตัวอย่างเช่น:
rsh somenode lambboot -s ไฟล์โฮสต์
นี้เป็นเพราะ รช รอสองเงื่อนไขก่อนออก: แกะ เพื่อออกและ stdout /
stderr ที่จะถูกปิด ปราศจาก -s, stdout / stderr จะไม่ถูกปิดและ รช (และ SSH)
จะแขวนแม้ว่า แกะ เสร็จเรียบร้อยแล้ว -s ทำให้เกิด stdout / stderr ของท้องถิ่น
LAM daemon จะถูกปิดเมื่อมีการเรียกใช้ ซึ่งจะอนุญาต รช ทำให้สมบูรณ์. โดยใช้ -s จะ
ไม่ส่งผลกระทบ แกะ อย่างอื่นก็ได้ แต่จะป้องกันไม่ให้ ทีเอสทีดิโอ(3) แพ็คเกจจาก
ทำงานอย่างถูกต้อง
ความผิด ความอดทน
ถ้า -x มีตัวเลือกให้ LAM ทำงานในโหมดทนต่อข้อผิดพลาด ในโหมดนี้ โหนดแลกเปลี่ยน
ข้อความ ``หัวใจเต้น'' เป็นระยะเพื่อให้แน่ใจว่าโหนดทั้งหมดกำลังทำงานและลิงก์
เชื่อมต่อพวกมันใช้งานได้ เมื่อหัวใจของโหนดหยุดเต้น จะมีการประกาศว่า ``ตาย'
และโหนด LAM ทั้งหมด (และกระบวนการ) จะได้รับแจ้ง ซึ่งช่วยให้ผู้ใช้สามารถเขียนทนต่อความผิดพลาดได้
แอปพลิเคชันที่สามารถลดลงอย่างสง่างามหรือกู้คืนได้อย่างเต็มที่โดยแทนที่โหนดที่หมดอายุ
กับคนอื่น (ดู แลมโกรว์(1)). เนื่องจากโหมดนี้แนะนำบทลงโทษด้านประสิทธิภาพ จึงเป็น
ไม่ได้เปิดใช้งานโดยค่าเริ่มต้น
ตัวอย่าง
แกะ -v
เริ่ม LAM บนเครื่องที่อธิบายไว้ในสคีมาการบูตเริ่มต้น รายงานเกี่ยวกับ
ขั้นตอนสำคัญเมื่อทำเสร็จแล้ว
lambboot -d ไฟล์โฮสต์
เริ่ม LAM บนเครื่องที่อธิบายไว้ในไฟล์ ไฟล์โฮสต์. ให้รายละเอียดอย่างเหลือเชื่อ
รายงานสิ่งที่เกิดขึ้นในแต่ละขั้นตอนในกระบวนการบูต
แกะ mynodes
เริ่ม LAM บนเครื่องที่อธิบายไว้ใน boot schema ไมโหนด. ดำเนินการอย่างเงียบ ๆ
ใช้ lambot ออนไลน์โดยใช้บริการ onworks.net