我有一个包含推文的文本文件,我需要计算推文中提到一个单词的次数。例如,文件包含:
Apple iPhone X is going to worth a fortune
The iPhone X is Apple's latest flagship iPhone. How will it pit against it's competitors?
假设我想计算文件中提到iPhone一词的次数。这就是我尝试过的。
cut -f 1 Tweet_Data | grep -i "iPhone" | wc -l
它当然可以工作,但是我对UNIX中的“ wc”命令感到困惑。如果尝试以下操作,有什么区别:
cut -f 1 Tweet_Data | grep -c "iPhone"
在哪里使用-c代替?在一个充满推文的大文件中,这两种方法都产生不同的结果,我对其工作方式感到困惑。正确的计数方法是哪种?
cut -f1
根据标签页进行裁剪,此处的功能不多。您确定这wc -l
确实为您提供了正确的计数吗?它在这里显示2,但我计算了3个“ iPhone”实例。