Unix & Linux text

4

如何配置快捷键以将文本字符串发送到当前程序？目的是更快地键入常用条目（电子邮件地址，街道地址，电话号码，用户名，收藏夹引号等）。除了输入文字外，我不需要任何进一步的自动化。 Gentoo Linux（3.2.12-gentoo）Xfce桌面环境（版本4.8）

14 keyboard keyboard-shortcuts text macro

5

从终端复制不需要的换行符的长单行文本

locate ... | less 输出一条长路径，虽然实际上是一条线，但在终端中显示为多条线。我通过使用鼠标选择文本并单击Ctrl+ Shift+ 从终端复制路径C。当我将其粘贴到文本文件中时，在文本中会出现不需要的更改行，与在终端中显示的完全相同。但是我记得有时可以复制的长路径输出locate ... | less，而不会引入不必要的换行，有时则不能。我不知道我是否做不同的事情。因此，我想知道如何确保该问题不会发生？谢谢！我的操作系统：Ubuntu 12.04。我的终端机：Gnome终端机3.4.1.1

14 ubuntu terminal text

2

按颜色过滤命令输出

我正在运行的实用程序没有提供过滤其输出的方法。输出文本中没有任何内容表明特定功能失败，但确实显示为红色。输出是如此之长，以至于当它报告一些错误时最后，我不能总是滚动查看发生错误的输出。如何过滤出非红色文本？伪代码： dolongtask | grep -color red 编辑该命令也会输出其他颜色，我需要能够过滤掉所有非红色的文本。文本着色也是多行的。

13 grep colors text filter

2

如何从文本文件中删除特定符号的所有实例？

我有一个巨大的（大约一半的GiB，不可能在其上使用常规的文本编辑器）CSV文件，其中的字段用双引号括起来，"abc","def"但需要一个不带引号的文件（我相信这不会破坏文件的一致性-永远不要在其中的值中使用逗号）。如何删除所有引号（不在其位置引入空格）？

13 text-processing text

1

md5sum命令二进制和文本模式

GNU md5sum命令有两种模式：二进制模式和文本模式。我想区别仅在于如何处理换行符？我对吗？在GNU / Linux上，这两种模式总是产生相同的结果，因此-band -t选项的唯一用途是指示文件名之前使用的标志（*或）？模式在什么情况下可以产生不同的结果？在Windows / MacOS系统上？（这些平台的版本可用吗？）

13 binary text hashsum

5

如何知道一个文本文件是否是另一个文件的子集

我试图找到一种方法来确定文本文件是否是另一个文件的子集。例如： foo bar 是...的子集 foo bar pluto 而： foo pluto 和 foo bar 不是彼此的子集... 有没有办法用命令来做到这一点？此检查必须是交叉检查，并且必须返回： file1 subset of file2 : True file2 subset of file1 : True otherwise : False

12 files diff text file-comparison vimdiff

4

如何删除文本文件中的所有英文行？

我有这个文本文件： 714 01:11:22,267 --> 01:11:27,731 Auch wenn noch viele Generationen auf einen Wechsel hoffen, Even if it takes many generations hoping for a change, 715 01:11:27,732 --> 01:11:31,920 werde ich mein Bestes geben und hoffe, dass andere das gleiche tun. I'm giving mine, I'm doing my best hoping the other …

11 text

3

如何在bash中将UTF-8 txt文件转换为全部大写？

我有一些UTF-8 .txt文件，我想将其转换为全部大写。如果只是ASCII，我可以使用： tr [:lower:] [:upper:] 但是由于我正在使用变音符号和其他东西，所以它似乎不起作用。我想如果设置适当的语言环境可能会起作用，但是我需要此脚本可移植。

10 locale unicode text tr

3

屏幕上现有的命令行文本可归档吗？（非图形Linux）

在tty2上，如何拍摄命令行的文本截图？

9 command-line text

1

将.docx文件转换为纯文本并保留换行符以维护对源文档的行号引用：howto和含义？

我正在将MS Word内容导出为纯文本，以便与文本和文件实用程序一起使用。我有一个约束，其中在MS软件中已启用行编号功能，并且最终输出中对行编号的任何引用都必须与该编号匹配。因此输入“编号行”：（EA坡）显然，对于Word来说，这种编号不会在换行符处打断行，而是在右边距（或其他位置）后打断“行” 。像这样的脚本docx2txt，默认情况下似乎并没有解决这个问题，并在换行符处换行。因此，如果我使用grep -n编号，则行将与源行号功能不匹配，如上所示。从文档中还不清楚，在这种情况下，我将需要如何编辑Perl脚本来转换文件： our $config_newLine = "\n"; # Alternative is "\r\n". our $config_lineWidth = 80; # Line width, used for short line justification. 我尝试替代\n，\r\n但这似乎对我不起作用。因此，我采取了以下设置（在v.2013,64pc上另存为纯文本格式）直接从Word导出文档： Unicode（UTF-8）用（CR / LF）插入换行符+结束行允许字符替换现在的确，当我使用这些.txt文件时，源编号功能中的行号与grep -n输出之间的匹配非常完美。是否有任何我应该了解的特定配置/过程docx2txt或类似的命令行实用程序，该实用程序可以让我将.docx文件转换为纯文本，同时保留换行符，而无需像以前那样依靠Word？关于换行符和格式设置，将MS Word文档（可能包含重音符号）导出为纯文本以与文件/文本实用程序一起使用的最佳实践是什么；我为导出选择的设置是否有负面影响，即插入CR / LF？样品根据建议，我提供了一个示例。在这个rar 档案中，我将.docx文件与简单的段落捆绑在一起，并将其导出的.txt文件使用Word与上述选项捆绑在一起。可以将后者与docx2txt源文件的默认运行进行比较。

9 scripting conversion text microsoft-word

3

如何用纯UTF-8文本替换所有百分比编码的UTF-8子字符串？

我有一个HTML文件，URL中包含许多％编码的UTF-8文本。例如，“％D1％80％D0％B5％D1％81％D1％83％D1％80％D1％81％D1％8B”代表“ресурсы”（俄语中的“资源”）。任务是用可读的UTF-8文本替换所有此类子字符串。为了简化任务，我们可以考虑%文件中没有其他符号使用。字母数字可以是大写和小写。我怀疑这可以用优雅来完成sed，perl，awk或东西，但不知道怎么办。该Web应用程序似乎可以解决您粘贴到此处的文本的问题。

9 text-processing character-encoding text unicode

1

确定文本文件中的换行符？

给定文本，是否有一个程序可以检测换行符是Windows，Mac还是Linux？例如，以下文字显示为 less 内存：^ M ^ CPU可以直接访问的Mis存储^ M ^ M术语“内存”通常（但不总是）与可寻址的半导体存储器关联，即由基于硅的晶体管组成的集成电路。^ M半导体存储器被组织为^记忆细胞我以为^ M是Mac下的换行符。但是在emacs中，我按Ctrl-q Ctrl-m进行了搜索，但没有发现任何内容。谢谢。

8 text

Questions tagged «text»