Questions tagged «text»

供人类读者使用的文本,通常由以下段落组成的人类语言句子组成

4
键盘快捷键将文本字符串发送给程序
如何配置快捷键以将文本字符串发送到当前程序? 目的是更快地键入常用条目(电子邮件地址,街道地址,电话号码,用户名,收藏夹引号等)。 除了输入文字外,我不需要任何进一步的自动化。 Gentoo Linux(3.2.12-gentoo)Xfce桌面环境(版本4.8)

5
从终端复制不需要的换行符的长单行文本
locate ... | less 输出一条长路径,虽然实际上是一条线,但在终端中显示为多条线。 我通过使用鼠标选择文本并单击Ctrl+ Shift+ 从终端复制路径C。当我将其粘贴到文本文件中时,在文本中会出现不需要的更改行,与在终端中显示的完全相同。 但是我记得有时可以复制的长路径输出locate ... | less,而不会引入不必要的换行,有时则不能。我不知道我是否做不同的事情。 因此,我想知道如何确保该问题不会发生?谢谢! 我的操作系统:Ubuntu 12.04。 我的终端机:Gnome终端机3.4.1.1
14 ubuntu  terminal  text 

2
按颜色过滤命令输出
我正在运行的实用程序没有提供过滤其输出的方法。输出文本中没有任何内容表明特定功能失败,但确实显示为红色。输出是如此之长,以至于当它报告一些错误时最后,我不能总是滚动查看发生错误的输出。 如何过滤出非红色文本? 伪代码: dolongtask | grep -color red 编辑 该命令也会输出其他颜色,我需要能够过滤掉所有非红色的文本。文本着色也是多行的。
13 grep  colors  text  filter 

2
如何从文本文件中删除特定符号的所有实例?
我有一个巨大的(大约一半的GiB,不可能在其上使用常规的文本编辑器)CSV文件,其中的字段用双引号括起来,"abc","def"但需要一个不带引号的文件(我相信这不会破坏文件的一致性-永远不要在其中的值中使用逗号)。 如何删除所有引号(不在其位置引入空格)?

1
md5sum命令二进制和文本模式
GNU md5sum命令有两种模式:二进制模式和文本模式。我想区别仅在于如何处理换行符?我对吗? 在GNU / Linux上,这两种模式总是产生相同的结果,因此-band -t选项的唯一用途是指示文件名之前使用的标志(*或)? 模式在什么情况下可以产生不同的结果?在Windows / MacOS系统上?(这些平台的版本可用吗?)
13 binary  text  hashsum 


4
如何删除文本文件中的所有英文行?
我有这个文本文件: 714 01:11:22,267 --> 01:11:27,731 Auch wenn noch viele Generationen auf einen Wechsel hoffen, Even if it takes many generations hoping for a change, 715 01:11:27,732 --> 01:11:31,920 werde ich mein Bestes geben und hoffe, dass andere das gleiche tun. I'm giving mine, I'm doing my best hoping the other …
11 text 

3
如何在bash中将UTF-8 txt文件转换为全部大写?
我有一些UTF-8 .txt文件,我想将其转换为全部大写。如果只是ASCII,我可以使用: tr [:lower:] [:upper:] 但是由于我正在使用变音符号和其他东西,所以它似乎不起作用。我想如果设置适当的语言环境可能会起作用,但是我需要此脚本可移植。
10 locale  unicode  text  tr 


1
将.docx文件转换为纯文本并保留换行符以维护对源文档的行号引用:howto和含义?
我正在将MS Word内容导出为纯文本,以便与文本和文件实用程序一起使用。我有一个约束,其中在MS软件中已启用行编号功能,并且最终输出中对行编号的任何引用都必须与该编号匹配。因此输入“编号行”: (EA坡) 显然,对于Word来说,这种编号不会在换行符处打断行,而是在右边距(或其他位置)后打断“行” 。像这样的脚本docx2txt,默认情况下似乎并没有解决这个问题,并在换行符处换行。因此,如果我使用grep -n编号,则行将与源行号功能不匹配,如上所示。从文档中还不清楚,在这种情况下,我将需要如何编辑Perl脚本来转换文件: our $config_newLine = "\n"; # Alternative is "\r\n". our $config_lineWidth = 80; # Line width, used for short line justification. 我尝试替代\n,\r\n但这似乎对我不起作用。因此,我采取了以下设置(在v.2013,64pc上另存为纯文本格式)直接从Word导出文档: Unicode(UTF-8) 用(CR / LF)插入换行符+结束行 允许字符替换 现在的确,当我使用这些.txt文件时,源编号功能中的行号与grep -n输出之间的匹配非常完美。 是否有任何我应该了解的特定配置/过程docx2txt或类似的命令行实用程序,该实用程序可以让我将.docx文件转换为纯文本,同时保留换行符,而无需像以前那样依靠Word? 关于换行符和格式设置,将MS Word文档(可能包含重音符号)导出为纯文本以与文件/文本实用程序一起使用的最佳实践是什么;我为导出选择的设置是否有负面影响,即插入CR / LF? 样品 根据建议,我提供了一个示例。在这个rar 档案中,我将.docx文件与简单的段落捆绑在一起,并将其导出的.txt文件使用Word与上述选项捆绑在一起。可以将后者与docx2txt源文件的默认运行进行比较。

3
如何用纯UTF-8文本替换所有百分比编码的UTF-8子字符串?
我有一个HTML文件,URL中包含许多%编码的UTF-8文本。 例如,“%D1%80%D0%B5%D1%81%D1%83%D1%80%D1%81%D1%8B”代表“ресурсы”(俄语中的“资源”)。 任务是用可读的UTF-8文本替换所有此类子字符串。 为了简化任务,我们可以考虑%文件中没有其他符号使用。字母数字可以是大写和小写。 我怀疑这可以用优雅来完成sed,perl,awk或东西,但不知道怎么办。 该Web应用程序似乎可以解决您粘贴到此处的文本的问题。

1
确定文本文件中的换行符?
给定文本,是否有一个程序可以检测换行符是Windows,Mac还是Linux? 例如,以下文字显示为 less 内存:^ M ^ CPU可以直接访问的Mis存储^ M ^ M术语“内存”通常(但不总是)与可寻址的半导体存储器关联,即由基于硅的晶体管组成的集成电路。^ M半导体存储器被组织为^记忆细胞 我以为^ M是Mac下的换行符。但是在emacs中,我按Ctrl-q Ctrl-m进行了搜索,但没有发现任何内容。 谢谢。
8 text 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.