Answers:
wdiff -w "$(tput bold;tput setaf 1)" -x "$(tput sgr0)" -y "$(tput bold;tput setaf 2)" -z "$(tput sgr0)" file1 file2
wdiff a b | colordiff
dwdiff
工具,大多数与兼容,wdiff
但也支持彩色输出以及其他一些功能。而且它在某些Linux发行版(例如Arch)中更可用。
wdiff -n a b | colordiff
,建议man colordiff
。
另一个使用git-diff的方法:
git diff -U0 --word-diff --no-index -- foo bar | grep -v ^@@
如果对差异位置不感兴趣,则使用grep -v。
vimdiff -c 'set wrap' -c 'wincmd w' -c 'set wrap' a b
,建议使用stackoverflow.com/a/45333535/2097284。
这是一种“ ..狗咬你的头发”的方法
diff
。用它来带你进一步...
这是使用样本线对的输出... ☻
表示TAB
Paris in the spring
Paris in the the spring
vvvv ^
A ca t on a hot tin roof.
a cant on a hot in roof
║ v ^ ^
the quikc brown box jupps ober the laze dogs
The☻qui ckbrown fox jumps over the lazy dogs
║ ║ ^ ║ ║ ║ ║ ║ ^
这是脚本。.您只需要以某种方式找出线对。.(在今天之前,我仅使用diff一次(两次?),所以我不知道它的很多选项,并为此选择选项脚本对我来说足够了,有一天:) ..我认为它必须足够简单,但是我要休息一下....
#
# Name: hair-of-the-diff
# Note: This script hasn't been extensively tested, so beware the alpha bug :)
#
# Brief: Uses 'diff' to identify the differences between two lines of text
# $1 is a filename of a file which contains line pairs to be processed
#
# If $1 is null "", then the sample pairs are processed (see below: Paris in the spring
#
# ║ = changed character
# ^ = exists if first line, but not in second
# v = exists if second line, but not in first
bname="$(basename "$0")"
workd="/tmp/$USER/$bname"; [[ ! -d "$workd" ]] && mkdir -p "$workd"
# Use $1 as the input file-name, else use this Test-data
# Note: this test loop expands \t \n etc ...(my editor auto converts \t to spaces)
if [[ "$1" == '' ]] ;then
ifile="$workd/ifile"
{ while IFS= read -r line ;do echo -e "$line" ;done <<EOF
Paris in the spring
Paris in the the spring
A cat on a hot tin roof.
a cant on a hot in roof
the quikc brown box jupps ober the laze dogs
The\tquickbrown fox jumps over the lazy dogs
EOF
} >"$ifile"
else
ifile="$1"
fi
#
[[ -f "$ifile" ]] || { echo "ERROR: Input file NOT found:" ;echo "$ifile" ;exit 1 ; }
#
# Check for balanced pairs of lines
ilct=$(<"$ifile" wc -l)
((ilct%2==0)) || { echo "ERROR: Uneven number of lines ($ilct) in the input." ;exit 2 ; }
#
ifs="$IFS" ;IFS=$'\n' ;set -f
ix=0 ;left=0 ;right=1
while IFS= read -r line ;do
pair[ix]="$line" ;((ix++))
if ((ix%2==0)) ;then
# Change \x20 to \x02 to simplify parsing diff's output,
#+ then change \x02 back to \x20 for the final output.
# Change \x09 to \x01 to simplify parsing diff's output,
#+ then change \x01 into ☻ U+263B (BLACK SMILING FACE)
#+ to the keep the final display columns in line.
#+ '☻' is hopefully unique and obvious enough (otherwise change it)
diff --text -yt -W 19 \
<(echo "${pair[0]}" |sed -e "s/\x09/\x01/g" -e "s/\x20/\x02/g" -e "s/\(.\)/\1\n/g") \
<(echo "${pair[1]}" |sed -e "s/\x09/\x01/g" -e "s/\x20/\x02/g" -e "s/\(.\)/\1\n/g") \
|sed -e "s/\x01/☻/g" -e "s/\x02/ /g" \
|sed -e "s/^\(.\) *\x3C$/\1 \x3C /g" \
|sed -n "s/\(.\) *\(.\) \(.\)$/\1\2\3/p" \
>"$workd/out"
# (gedit "$workd/out" &)
<"$workd/out" sed -e "s/^\(.\)..$/\1/" |tr -d '\n' ;echo
<"$workd/out" sed -e "s/^..\(.\)$/\1/" |tr -d '\n' ;echo
<"$workd/out" sed -e "s/^.\(.\).$/\1/" -e "s/|/║/" -e "s/</^/" -e "s/>/v/" |tr -d '\n' ;echo
echo
((ix=0))
fi
done <"$ifile"
IFS="$ifs" ;set +f
exit
#
wdiff
实际上是逐字比较文件的一种非常古老的方法。它的工作方式是重新格式化文件,然后使用diff
查找差异并将其再次传回。我本人建议添加上下文,以使每个单词都被其他“上下文”单词包围,而不是逐单词进行比较。这使得diff可以更好地在文件中的普通段落上进行自我同步,尤其是当文件之间的差异很大,只有几个普通字块时。例如,在比较文本以进行窃或重复使用时。
dwdiff
后来从创建wdiff
。但 dwdiff
在Windows中使用该文本重新格式化功能效果良好dwfilter
。这是一个了不起的进步–这意味着您可以重新格式化一个文本以匹配另一个文本,然后使用任何逐行图形化diff显示器来比较它们。例如,将其与“ diffuse”图形差异一起使用。
dwfilter file1 file2 diffuse -w
重新格式化file1
为的格式,file2
并diffuse
进行可视化比较。file2
未修改,因此您可以直接在中编辑和合并单词差异diffuse
。如果要编辑file1
,可以添加-r
以重新格式化哪个文件。试试看,您会发现它非常强大!
我更喜欢图形差异(如上所示),diffuse
因为它感觉更简洁,更有用。它还是一个独立的python程序,这意味着它很容易安装并分发到其他UNIX系统。
以@ Peter.O的解决方案为基础,我重写了它以进行许多更改。
./hairOfTheDiff.sh file1.txt file2.txt
demo
源代码;这可能为花哨的管道打开了大门,以便也不需要使用两个文件输入paste
和多个文件描述符的文件。没有突出显示意味着角色在两行中,突出显示意味着它在第一行中,红色意味着它在第二行中。
颜色可以通过脚本顶部的变量来更改,甚至可以通过使用正常字符表示差异来完全放弃颜色。
#!/bin/bash
same='-' #unchanged
up='△' #exists in first line, but not in second
down='▽' #exists in second line, but not in first
reset=''
reset=$'\e[0m'
same=$reset
up=$reset$'\e[1m\e[7m'
down=$reset$'\e[1m\e[7m\e[31m'
timeout=1
if [[ "$1" != '' ]]
then
paste -d'\n' "$1" "$2" | "$0"
exit
fi
function demo {
"$0" <<EOF
Paris in the spring
Paris in the the spring
A cat on a hot tin roof.
a cant on a hot in roof
the quikc brown box jupps ober the laze dogs
The quickbrown fox jumps over the lazy dogs
EOF
}
# Change \x20 to \x02 to simplify parsing diff's output,
#+ then change \x02 back to \x20 for the final output.
# Change \x09 to \x01 to simplify parsing diff's output,
#+ then change \x01 into → U+1F143 (Squared Latin Capital Letter T)
function input {
sed \
-e "s/\x09/\x01/g" \
-e "s/\x20/\x02/g" \
-e "s/\(.\)/\1\n/g"
}
function output {
sed -n \
-e "s/\x01/→/g" \
-e "s/\x02/ /g" \
-e "s/^\(.\) *\x3C$/\1 \x3C /g" \
-e "s/\(.\) *\(.\) \(.\)$/\1\2\3/p"
}
ifs="$IFS"
IFS=$'\n'
demo=true
while IFS= read -t "$timeout" -r a
do
demo=false
IFS= read -t "$timeout" -r b
if [[ $? -ne 0 ]]
then
echo 'No corresponding line to compare with' > /dev/stderr
exit 1
fi
diff --text -yt -W 19 \
<(echo "$a" | input) \
<(echo "$b" | input) \
| \
output | \
{
type=''
buf=''
while read -r line
do
if [[ "${line:1:1}" != "$type" ]]
then
if [[ "$type" = '|' ]]
then
type='>'
echo -n "$down$buf"
buf=''
fi
if [[ "${line:1:1}" != "$type" ]]
then
type="${line:1:1}"
echo -n "$type" \
| sed \
-e "s/[<|]/$up/" \
-e "s/>/$down/" \
-e "s/ /$same/"
fi
fi
case "$type" in
'|')
buf="$buf${line:2:1}"
echo -n "${line:0:1}"
;;
'>')
echo -n "${line:2:1}"
;;
*)
echo -n "${line:0:1}"
;;
esac
done
if [[ "$type" = '|' ]]
then
echo -n "$down$buf"
fi
}
echo -e "$reset"
done
IFS="$ifs"
if $demo
then
demo
fi
这是一个简单的单线:
diff -y <(cat a.txt | sed -e 's/,/\n/g') <(cat b.txt | sed -e 's/,/\n/g')
想法是使用换行符替换逗号(或您希望使用的任何定界符)sed
。diff
然后照顾其余的。
.csv
很容易制作一个电子表格,并(A7==K7) ? "" : "diff"
插入公式或类似内容,然后复制粘贴。如果我正确阅读了您的问题,那么我会使用diff -y
这种方法。
它使并排比较的比较容易得多,以找出哪些行引发了差异。
我遇到了同样的问题,并使用PHP Fine Diff(一个允许您指定粒度的在线工具)解决了该问题。我知道从技术上讲它不是* nix工具,但我并不是真的想下载一个程序来进行一次字符级差异检查。