英语法语西班牙语

Ad


OnWorks 网站图标

dmtcp_sshd - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 dmtcp_sshd

这是 dmtcp_sshd 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


dmtcp - 分布式多线程检查点

概要


dmtcp_协调员 [港口]

dmtcp_启动 命令 [参数...]

dmtcp_重启 ckpt_FILE1.dmtcp [ckpt_FILE2.dmtcp...]

dmtcp_命令 协调员命令

商品描述


数据传输协议 是一种透明地检查任意一组程序的状态的工具
分布在许多机器上并通过套接字连接。 它不会修改用户的
程序或操作系统。 传输控制协议 是 DMTCP 的独立组件,可用作
单个进程的检查点库。

配置


对于每个命令,--help 或 -h 标志将显示命令行选项。 大多数命令
行选项也可以通过环境变量来控制。 这些可以设置在
bash 使用“export NAME=value”或在 tcsh 中使用“setenv NAME value”。

DMTCP_CHECKPOINT_INTERVAL=整数
自动检查点之间的时间(以秒为单位)。 也可以发起检查点
通过在协调器中手动输入“c”。 (默认值:0,禁用;
仅 dmtcp_coordinator)

DMTCP_HOST=字符串
运行集群范围协调器的主机名。 (默认:本地主机;
dmtcp_launch,仅 dmtcp_restart)

DMTCP_PORT=整数
集群范围的协调器监听的端口。 (默认:7779)

DMTCP_GZIP=(1|0)
设置为“0”以禁用检查点图像的压缩。 (默认值:1,压缩
启用; dmtcp_launch only)警告:gzip 增加了秒数。 没有gzip,
ckpt/restart 通常小于 1 s

DMTCP_CHECKPOINT_DIR=路径
存储检查点图像的目录。(默认:./)

DMTCP_SIGCKPT=整数
用于检查点的内部信号编号。 不得由用户使用
程序。 (默认值:SIGUSR2;仅 dmtcp_launch)

DMTCP_COORDINATOR


每个要检查点的计算必须包括一个 DMTCP 协调器进程。 一罐
通过 dmtcp_coordinator 显式启动协调器,或允许启动协调器
通过 dmtcp_launch 或 dmtcp_restart 在后台隐式运行。 地址
应由 dmtcp_launch、dmtcp_restart 和
dmtcp_command 通过 --host 和 --port 命令行标志或通过
DMTCP_HOST 和 DMTCP_PORT 环境变量。 如果两者都没有给出,则主机端口对
默认为 localhost-7779。 与特定协调器关联的主机端口对
由 dmtcp_coordinator 命令中使用的命令行标志给出,或者
环境变量然后生效,或 localhost-7779 的默认值。

协调器是无状态的,并且是 不能 检查点。 重新启动时,可以使用现有的
或新的协调员。 DMTCP 控制下的多个计算可以通过提供
每个此类计算的唯一协调器(具有唯一的主机端口对)。

协调器为其计算组中的所有进程启动一个检查点。
检查点可以:在一个时间间隔内自动执行(见 DMTCP_CHECKPOINT_INTERVAL
以上); 或在协调器的标准输入上手动启动(见下
段落); 或通过计算直接在程序控制下启动
dmtcpaware API(见下文)。

协调器在其标准输入上接受以下命令。 每个命令应该
紧随其后的是钥匙。 命令是:
l : 列出连接的节点
s : 打印状态信息
c : 检查所有节点
f :即使缺少节点也强制重启(调试)
k : 杀死所有节点
q : 杀死所有节点并退出
? : 显示此消息

协调器命令也可以使用远程发出 dmtcp_命令.

用法


1. 在单独的终端窗口中,启动 dmtcp_coodinator。
(见上一节。)

dmtcp_协调员

2. 在单独的终端中,将每个命令替换为“dmtcp_launch
[command]”。检查点程序将连接到由指定的协调器
DMTCP_HOST 和 DMTCP_PORT。 新线程将作为检查点的一部分
过程。 子进程将自动被检查点。 远程进程
通过 SSH 将自动检查点。 (在内部,DMTCP 修改
SSH 在远程主机上调用 dmtcp_launch 的命令行。)

dmtcp_launch ./myprogram

3. 要手动启动检查点,请运行以下命令
或键入“c”后跟进入协调员。 每个检查点文件
进程将写入 DMTCP_CHECKPOINT_DIR。 dmtcp_coordinator 会写
“dmtcp_restart_script.sh”到其工作目录。 该脚本包含
对 dmtcp_restart 的必要调用以重新启动整个计算,包括
通过创建远程进程 SSH.

dmtcp_命令-c
或:dmtcp_command --checkpoint

4. 重启,执行dmtcp_restart_script.sh,即
由 dmtcp_coordinator 在其工作目录中创建
检查站。 可以选择编辑此脚本以将进程迁移到不同的
主机。 默认情况下,只有一个重启的进程会在前台重启
并接收标准输入。 可以编辑脚本以选择哪个进程
将在前台重新启动。

./dmtcp_restart_script.sh

DMTCPAware API


DMTCP 提供了一个编程接口,允许检查点应用程序与
dmtcp。 在源码分发中,函数见dmtcpaware/dmtcpaware.h
可用的。 有关三个示例应用程序,请参见 test/dmtcpaware[123].c。 例如
它的用法,请尝试:

光盘测试; rm dmtcpaware1; 使 dmtcpaware1; ./autotest -v dmtcpaware1

用户应用程序应与 libdmtcpaware.so (-ldmtcpaware) 链接并使用标头
文件 dmtcp/dmtcpaware.h。

数据传输协议 PLUGIN 课程结构


源代码分发包括一个顶级 插入 目录,并附有如何操作的示例
为 DMTCP 编写一个插件模块。 进一步的例子在 测试/插件 目录。 的
插件功能增加了三个新的用户可编程功能。 插件可以: 添加包装器
围绕系统调用; 在某些事件期间(例如预检查点、
恢复/检查点后,重新启动); 并且可以将键值对插入到数据库中
重新启动时间,然后可用于由重新启动的进程查询
计算。 (插件功能可用的事件形成了事件的超集
可与 dmtcpaware 接口一起使用。)通过一个列表调用一个或多个插件
冒号分隔的绝对路径名。

dmtcp_launch --with-plugin PLUGIN1[:PLUGIN2]...

返回 守则


DMTCP 控制下的目标程序通常返回与执行时相同的返回码
没有 DMTCP。 但是,如果 DMTCP 失败(与目标程序失败相反),DMTCP
返回特定于 DMTCP 的返回码 rc(或 rc+1、rc+2 用于两种特殊情况),其中 rc
如果设置,则是环境变量 DMTCP_FAIL_RC 的整数值,否则为默认值
值,99。

使用 onworks.net 服务在线使用 dmtcp_sshd


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad