我有以下行的文件1:
ATM 1434.972183
BMPR2 10762.78192
BMPR2 10762.78192
BMPR2 1469.14535
BMPR2 1469.14535
BMPR2 1738.479639
BMS1 4907.841667
BMS1 4907.841667
BMS1 880.4532628
BMS1 880.4532628
BMS1P17 1249.75
BMS1P17 1249.75
BMS1P17 1606.821429
BMS1P17 1606.821429
BMS1P17 1666.333333
BMS1P17 1666.333333
BMS1P17 2108.460317
BMS1P17 2108
文件2包含单词列表:
ATM
BMS1
因此,输出将如下所示:
ATM 1434.972183
BMS1 4907.841667
BMS1 4907.841667
BMS1 880.4532628
BMS1 880.4532628
我知道这确实是一个重复的问题,但是我尝试了所有类型的grep
and sed
和awk
,也许可以通过这个小例子与你们一起工作,但是我的文件很大> 1M lines
,以前的方法都无济于事
它返回包含这些单词的行的一部分,尽管其中还有其他单词file 2
与来自file 1
如果众所周知的副本不起作用,那么文件可能存在一些非标准的东西(例如DOS样式的行尾或其他隐藏的嵌入式字符)?
—
钢铁司机
这是一个很大的文件,我可以快速检查一下,而且还可以,是否有任何命令可以帮助我检查类似的内容?
—
萨拉·瓦斯
file yourfile
可能会报告类似的内容,ASCII text, with CRLF line terminators
或者您可以使用cat -A yourfile