Answers:
老学校-您可以使用dd
:
dd if=A_FILE bs=1 skip=3
输入文件为A_FILE
,块大小为1个字符(字节),跳过前3个“块”(字节)。(对于某些dd
类似GNU的变体dd
,您可以bs=1c
在这里使用-以及其他选择,例如bs=1k
在其他情况下以1 KB的块读取。dd
似乎在AIX上不支持此功能; BSD(macOS Sierra)变体不支持c
但是不支持k
,m
,g
,等)
还有其他方法可以达到相同的结果:
sed '1s/^...//' A_FILE
如果第一行有3个或更多字符,则此方法有效。
tail -c +4 A_FILE
您也可以使用Perl,Python等。
除了使用,cat
您可以这样使用tail
:
tail -c +4 FILE
这将打印出整个文件,但前3个字节除外。请咨询man tail
以获取更多信息。
/usr/xpg4/bin/tail
至少在我的机器上必须在Solaris上使用。尽管如此,还是不错的提示!
我最近需要做类似的事情。我正在协助解决现场支持问题,需要让技术人员在进行更改时查看实时绘图。数据存储在全天不断增长的二进制日志中。我有可以解析和绘制日志中数据的软件,但目前不是实时的。我要做的是在开始处理数据之前捕获日志的大小,然后进入处理数据的循环,每次通过都会创建一个新文件,其中文件的字节尚未处理。
#!/usr/bin/env bash
# I named this little script hackjob.sh
# The purpose of this is to process an input file and load the results into
# a database. The file is constantly being update, so this runs in a loop
# and every pass it creates a new temp file with bytes that have not yet been
# processed. It runs about 15 seconds behind real time so it's
# pseudo real time. This will eventually be replaced by a real time
# queue based version, but this does work and surprisingly well actually.
set -x
# Current data in YYYYMMDD fomat
DATE=`date +%Y%m%d`
INPUT_PATH=/path/to/my/data
IFILE1=${INPUT_PATH}/${DATE}_my_input_file.dat
OUTPUT_PATH=/tmp
OFILE1=${OUTPUT_PATH}/${DATE}_my_input_file.dat
# Capture the size of the original file
SIZE1=`ls -l ${IFILE1} | awk '{print $5}'`
# Copy the original file to /tmp
cp ${IFILE1} ${OFILE1}
while :
do
sleep 5
# process_my_data.py ${OFILE1}
rm ${OFILE1}
# Copy IFILE1 to OFILE1 minus skipping the amount of data already processed
dd skip=${SIZE1} bs=1 if=${IFILE1} of=${OFILE1}
# Update the size of the input file
SIZE1=`ls -l ${IFILE1} | awk '{print $5}'`
echo
DATE=`date +%Y%m%d`
done
ls
; 的输出进行编码 您是否考虑过使用stat -c'%s' "${IFILE}"
而不是该ls|awk
组合?也就是说,假设GNU coreutils ...
如果系统上装有Python,则可以使用小型python脚本来利用seek()
函数来从第n个字节开始读取,如下所示:
#!/usr/bin/env python3
import sys
with open(sys.argv[1],'rb') as fd:
fd.seek(int(sys.argv[2]))
for line in fd:
print(line.decode().strip())
用法如下所示:
$ ./skip_bytes.py input.txt 3
请注意,字节计数从0开始(因此第一个字节实际上是索引0),因此通过指定3,我们有效地将读数定位为从3 + 1 =第4个字节开始
dd if=A_FILE bs=1 skip=3
在AIX 6.1