GoGPT Best VPN GoSearch

OnWorks 网站图标

unidesc - 云端在线

在 OnWorks 免费托管服务提供商中通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器运行 unidesc

这是 unidesc 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


unidesc - 描述 Unicode 文本文件的内容

概要


新闻中心 ([选项 标志]) ( 名称>)

如果没有提供输入文件名, 新闻中心 从标准输入读取。

商品描述


新闻中心 通过报告字符范围来描述 Unicode 文本文件的内容
文本的哪些不同部分属于。 报告的范围包括官方
Unicode 范围和已注册的私人使用区域内的构造语言范围
使用 Conscript Unicode Registry (http://www.evertype.com/standards/csur/)。 对于每个
字符范围, 新闻中心 打印开头的字符或字节偏移量
范围,范围结束的字符或字节偏移量,以及范围的名称。
偏移量从 0 开始。

由于 ASCII 数字、标点符号和空白字符被经常使用
其他书写系统,默认情况下,这些字符被视为中性,即不
只属于任何特定的字符范围。 这些字符被视为
属于它们之前的任何字符的范围。

如果输入以中性字符开头,则将它们视为属于
跟随他们的任何字符。 如果文件完全由中性字符组成,则
范围被识别为 一般 其次是 基础版 拉丁语 在方括号中。

标识 Unicode 编码的幻数不是 Unicode 标准的一部分,因此
纯 Unicode 文件不包含幻数。 然而,非正式公约有
为此目的而产生。 如果命令行标志 -m 给出, 新闻中心 将尝试
通过检查输入的前几个字节来识别 Unicode 子类型。 如果输入
被标识为两种可接受的类型之一,UTF-8 或本机顺序 UTF-32,它将
然后继续描述输入的内容。 否则,它将报告它所拥有的
学习并退出。 请注意,如果文件确实包含幻数,则必须使用 -m
旗帜。 没有这个标志 新闻中心 假设输入由纯 Unicode 组成
字符数据立即开始。 因此它会被魔法甩掉
数。

默认情况下,输入应为 UTF-8。 本机顺序 UTF-32 也是可以接受的。 UTF-32
可以通过命令行标志指定 -u 或者,如果命令行标志 -m 给出,
通过幻数。

指挥 LINE 旗帜


-b 以字节而不是字符提供文件偏移量。

-d 将 ASCII 数字视为仅属于基本拉丁语范围。

-h 打印使用信息。

-L 按字母顺序列出 Unicode 范围。

-l 按代码点列出 Unicode 范围。

-m 检查文件的幻数以确定 Unicode 子类型。

-p 将 ASCII 标点视为只属于基本拉丁语范围。

-r 不列出遇到的范围,只列出检测到的范围
在读取所有输入之后。

-u 输入是本机顺序 UTF-32。

-v 打印版本信息。

-w 将 ASCII 空格视为只属于基本拉丁语范围。

使用 onworks.net 服务在线使用 unidesc


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad




×
广告
❤️在这里购物、预订或购买——免费,有助于保持服务免费。