20 - 文本处理
所有类 Unix 操作系统都严重依赖文本文件进行数据存储。 因此,有许多用于操作文本的工具是有道理的。 在本章中,我们将研究用于“切片和切块”文本的程序。 在下一章中,我们将研究更多的文本处理,重点介绍用于格式化文本以供打印和其他类型的人类消费的程序。
本章将重温一些老朋友,并介绍一些新朋友:
● 猫 – 连接文件并在标准输出上打印
● 分类 - 对文本文件的行进行排序
● 优衣库 – 报告或省略重复的行
● 切 – 从文件的每一行中删除部分
● 糊 - 合并文件行
● 加入 – 在公共字段上连接两个文件的行
● COMM – 逐行比较两个排序的文件
● 差异 – 逐行比较文件
● 补丁 – 将差异文件应用于原始文件
● tr – 翻译或删除字符
● 口渴 - 用于过滤和转换文本的流编辑器
● 阿斯佩尔 - 交互式拼写检查器