计算Hausdorff距离


21

介绍

豪斯多夫距离测量度量空间的两个子集之间的差异。直观地来说,度量空间只是带有内置距离函数的某个集合。在这个挑战中,我们将使用具有普通距离的自然数d(a, b) := abs(a - b)。两个非空有限集之间的Hausdorff距离AB由下式给出

max(max(min(d(a, b) for b in B) for a in A),
    max(min(d(a, b) for a in A) for b in B))

以类似Python的符号表示。Hausdorff距离的计算方法是:找到与A的最近元素的B距离最大的元素B,与到的最近元素的A距离最大的元素,然后取这些距离中的最大值。换句话说,如果Hausdorff距离为d,则的每个元素A都在d的某个元素的距离内B,反之亦然。

输入项

您的输入是一个整数列表。它仅包含元素0,1,2,3,这意味着该列表的给定索引是否是的元件既不A也不B,仅AB或两者AB。例如,输入[0,1,1,0,2,3]表示A = {1,2,5}B = {4,5},如果我们使用基于0的索引(这没有区别,因为我们的度量标准是转换不变的)。

输出量

您的输出是A和之间的Hausdorff距离B。在上面的示例中,它是3。如果任何一组为空,则距离没有定义,您应返回-1

规则

您可以编写完整的程序或函数。最低字节数获胜,并且不允许出现标准漏洞。

测试用例

[] -> -1
[0] -> -1
[0,1,0] -> -1
[2,0,0,2] -> -1
[0,1,2,3] -> 1
[0,3,3,0,0,0,0,3] -> 0
[1,0,0,1,0,0,1,3,1] -> 7
[1,0,0,0,0,3,0,0,0,0,2] -> 5
[0,1,1,3,1,3,2,1,1,3,0,3] -> 2
[2,2,2,1,2,0,3,1,3,1,0,3] -> 3
[1,3,0,2,0,2,2,1,0,3,2,1,1,2,2] -> 2
[1,0,1,1,2,0,1,2,3,1,0,0,0,1,2,0] -> 4

在您的方程式中,我认为它太长了,max(max(min(d(a, b) for b in B) for a in A))应该足够了。这是因为d(a,b)返回绝对值,因此两个max函数每次都将返回相同的数字。
弥敦道·美林

6
@NathanMerrill可能是的每个元素A都非常接近之一B,但是有些元素B距离却很远A(例如,如果A是的子集B)。在这种情况下,简短公式不正确。
Zgarb 2015年

Answers:


7

CJam,53 52 46 38 37字节

3,q~f{f&:L,{L=},}$~ff{-z}_z+::e<W+:e>

将STDIN上的输入作为CJam样式数组:

[0 1 2 3]

这是一个测试工具,可以将所有测试用例转换为这种格式,并在其上运行代码。尽管结果在输入字段中,但代码并未使用它们(如果您不信任我,请删除它们:)。

说明

首先,我们解析输入以获得两组A和B:

3,q~f{f&:L,{L=},}$~
3,                  "Push [0 1 2]. 1 is for A, 2 is for B, and 0 we can luckily ignore
                     as we'll see later.";
  q~                "Read and evaluate the input.";
    f{          }   "Map this block onto the [0 1 2] array, copying in the input for
                     each iteration.";
      f&:L          "Take the bitwise AND with each element of the input and store the
                     result in L.";
          ,{  },    "Get the length N, and filter the range [0 .. N-1] by evaluating
                     the block for each element.";
            L=      "Check if the bitwise AND at that index yielded something non-zero.
                     This gives an empty array for 0, A for 1 and B for 2.";
                 $  "Sort the three arrays. This has two important effects: a) it moves
                     the empty array resulting from 0 to the front, and b) if only one
                     of A and B is empty, it moves the non-empty one to the end.";
                  ~ "Unwrap the array, dumping all three sets on the stack.";

现在我们找到绝对差异并选择分钟的最大值:

ff{-z}_z+::e<W+:e>
ff{-z}             "Turn A and B into a matrix of absolute differences.";
      _z           "Duplicate and transpose.";
        +          "Add the two together, so I've got one row of distances for
                    each element in either A or B.";
         ::e<      "Find the minimum of each row.";
             W+    "Add a -1 in case one set was empty.";
               :e> "Get the overall maximum.";

请注意,我们一直将由初始值生成的空数组始终保留在0堆栈的底部,但是空数组不会对输出有任何贡献。


5

CJam,57 56 52字节

我认为这可以打些高尔夫,但是这里有:

q~ee_{W=2%},\{W=1>},]0ff=_W%]{~ff-{:z$1<~}%W+$W=}/e>

输入像CJam样式列表一样输入。

[1 0 0 0 0 3 0 0 0 0 2]

5

运作方式

该代码分为两部分:

将输入解析为列表AB

q~ee_{W=2%},\{W=1>},]0ff=_W%]
q~                               "Eval the input array";
  ee                             "Enumerate and prepend index with each element. For ex:
                                  [5 3 6]ee gives [[0 5] [1 3] [2 6]]";
    _{W=2%},                     "Make a copy and filter out elements with value 1 or 3";
            \{W=1>},             "On the original, filter elements with value 2 or 3";
                    ]            "Wrap stack in an array. Stack right now contains
                                  enumerated A and B in an array";
                     0ff=        "Get the index of the enumerated arrays. Stack is [A B]";
                         _W%     "Make a copy and swap order. Stack is now [A B] [B A]";
                            ]    "Wrap this in an array";

执行对两对需要采取的行动AB

{~ff-{:z$1<~}%W+$W=}/e>
{                  }/            "Run this loop for both the pairs, [A B] and [B A]"
 ~ff-                            "Unwrap [A B] and take difference of every pair";
     {      }%                   "For each row in the matrix difference";
      :z$                        "abs each term and then sort";
         1<~                     "Take only the first element of the array";
              W+                 "Add -1 to compensate for an empty array";
                $W=              "Take max";
                     e>          "Take max of the two maximums";

在这里在线尝试


5

Lua,235个字节

绝对不是赢家,但至少是一个有趣的挑战。

A={}B={}c={}d={}m=math p=m.min q=m.max u=unpack for k=1,#arg do for h=0,1 do if
arg[k]/2^h%2>=1 then A[#A+1]=k for i=1,#B do l=m.abs(B[i]-k)d[i]=p(d[i]or
l,l)c[#A]=p(c[#A]or l,l)end end A,B=B,A c,d=d,c end end
print(q(q(-1,u(c)),u(d)))

输入的工作方式如下:

lua hausdorff.lua <space-separated-sequence>

...这是一个测试脚本:

local testcase = arg[1] or 'hausdorff.lua'
print('testing '..testcase)
local function run(args) 
    return function(expected)
        local result = tonumber(
            io.popen('lua.exe '..testcase..' '..args):read'*a':match'%S+')
        print(args..' -> '..expected..' :: '..result)
        assert(result == expected,
            ("for input %q expected %s but got %s"):format(
                args, expected, result))
    end
end
run''(-1)
run'0'(-1)
run'0 1 0'(-1)
run'2 0 0 2'(-1)
run'0 1 2 3'(1)
run'0 3 3 0 0 0 0 3'(0)
run'1 0 0 1 0 0 1 3 1'(7)
run'1 0 0 0 0 3 0 0 0 0 2'(5)
run'0 1 1 3 1 3 2 1 1 3 0 3'(2)
run'2 2 2 1 2 0 3 1 3 1 0 3'(3)
run'1 3 0 2 0 2 2 1 0 3 2 1 1 2 2'(2)
run'1 0 1 1 2 0 1 2 3 1 0 0 0 1 2 0'(4)

...产生...

testing hausdorff.lua
 -> -1 :: -1
0 -> -1 :: -1
0 1 0 -> -1 :: -1
2 0 0 2 -> -1 :: -1
0 1 2 3 -> 1 :: 1
0 3 3 0 0 0 0 3 -> 0 :: 0
1 0 0 1 0 0 1 3 1 -> 7 :: 7
1 0 0 0 0 3 0 0 0 0 2 -> 5 :: 5
0 1 1 3 1 3 2 1 1 3 0 3 -> 2 :: 2
2 2 2 1 2 0 3 1 3 1 0 3 -> 3 :: 3
1 3 0 2 0 2 2 1 0 3 2 1 1 2 2 -> 2 :: 2
1 0 1 1 2 0 1 2 3 1 0 0 0 1 2 0 -> 4 :: 4

4

Pyth,43 40 39 38字节

J+m0yQQLq3.|Fb?eS.e&Yfy:J-kT+hkT0JyJ_1

我的算法直接在输入字符串上操作,从不转换这些数字。它只会计算一次最大值,而不会计算最小值。

感谢@isaacg节省了一个字节。

在线尝试:Pyth编译器/执行器

说明:

首先,我将在输入前面插入很多零。

          implicit: Q = input()
    yQ    powerset(Q)
  m0yQ    map each element of the powerset to 0 (creates 2^Q zeros, I said lots)
 +    Q   zeros + Q
J         assign to J

然后,我定义一个辅助函数y,该函数指示列表的索引(如输入一个)是否同时出现在集合A和BEg中y([0, 1, 0, 0, 1, 1]) = False,但是y([0, 1, 0, 2]) = y([3]) = True

Lq3.|Fb
L          define a function y(b), which returns _
   .|Fb       fold b by bitwise or
 q3            == 3

之后,我首先检查结果是否为-1

?...yJ_1   print ... if numbers appear in both sets (`yJ`) else -1   

现在到有趣的东西:

  .e              J    map each pair k,Y in enumerate(J) to:
    &Y                   Y and ... (acts as 0 if Y == 0 else ...)
      f          0       find the first number T >= 0, where:
       y                    indices appear in both sets in the substring
        :J-kT+hkT           J[k-T:k+T+1]
eS                     sort and take last element (maximum)

注意,我将始终找到一个数字T,因为我已经知道索引出现在列表J的两个集合中。该数字是maximal length(Q)。这也是插入零的原因。如果至少length(Q)插入了零,k-T则始终为>= 0,这是列表切片所必需的。那么,为什么要插入2^length(Q)零而不是length(Q)零?在测试用例中,[]我至少需要1个零,否则yJ将返回错误。


><Cab是一样的:Cba
isaacg 2015年

很好的一点是,测试用例不包含大量输入...
TLW

3

Mathematica,88个字节

Max[Min/@#,Min/@Thread@#,-1]/.∞->-1&@Outer[Abs[#-#2]&,p=Position;p[#,1|3],p[#,2|3],1]&

1
很好的答案。有关Hausdorff距离的更一般性发现,可以使用m=MaxValue;Max[m[RegionDistance[#[[1]],s],s\[Element]#[[2]]]/.m[__]->-1&/@{#,Reverse@c}]& 它然后应用于像这样的多维对象%@{Sphere[],Line[{{1,1,0},{3,3,3}}]}
Kelly Lowder

3

Haskell中,145个 126 124字节

s t x=[e|(e,i)<-zip[0..]x,t i]
d#e=maximum[minimum[abs$i-j|j<-e]|i<-d]
[]%_= -1
_%[]= -1
d%e=max(d#e)$e#d
f x=s(>1)x%s odd x

测试运行:

*Main> map f [[], [0], [0,1,0], [2,0,0,2], [0,1,2,3],
              [0,3,3,0,0,0,0,3], [1,0,0,1,0,0,1,3,1],
              [1,0,0,0,0,3,0,0,0,0,2], [0,1,1,3,1,3,2,1,1,3,0,3],
              [2,2,2,1,2,0,3,1,3,1,0,3],
              [1,3,0,2,0,2,2,1,0,3,2,1,1,2,2],
              [1,0,1,1,2,0,1,2,3,1,0,0,0,1,2,0]]

[-1,-1,-1,-1,1,0,7,5,2,3,2,4]

s根据谓词t和输入列表过滤自然数x#计算其参数d和的最大距离e%抓住空集A或B或需要的最终的最大d#ee#df是调用的主要功能%使用集合A和B。

编辑:@Zgarb发现很多字节要保存;@ ali0sha另外2.谢谢!


mod 2似乎没有必要。您也可以受益于未定义ab明确定义。
Zgarb 2015年

您可以使用[]%_= -1- 节省2个字节,但您击败了我的尝试:)
alexander-brett 2015年

3

佩尔56 55

为增加了+2 -lp

输入列表应在stdin上给出,不能有空格,例如:

echo 1011201231000120 | perl -lp hausdorf.pl

hausdorf.pl

s%%$z=$_&=$p|=$'|P.$p;$q+=!!y/12/3/%eg;$_=$z=~3?$q:-1

为了在输入列表的元素之间留出空格,只需将最终字符除以$q2,就得出2笔费用


2

Python 2,124

这肯定感觉不太理想。那好吧。

lambda a,E=enumerate:-min([1]+[~l*(n<3)for i,n in E(a)for l,_ in E(a)if{0}|set(n*a+n/3*[5])>{0,n}>=set(a[max(i-l,0):i-~l])])

1

APL(49)

{(⊂⍬)∊∆←(↓2 2⊤⍵)/¨⊂⍳⍴⍵:¯1⋄⌈/{⌈/⌊/⍵}¨(+,⍉¨)|∘.-/∆}

测试用例:

      ({(⊂⍬)∊∆←(↓2 2⊤⍵)/¨⊂⍳⍴⍵:¯1⋄⌈/{⌈/⌊/⍵}¨(+,⍉¨)|∘.-/∆} ¨ testcases) ,⍨ '→',⍨ ↑ ⍕¨testcases
                               → ¯1
0                              → ¯1
0 1 0                          → ¯1
2 0 0 2                        → ¯1
0 1 2 3                        →  1
0 3 3 0 0 0 0 3                →  0
1 0 0 1 0 0 1 3 1              →  7
1 0 0 0 0 3 0 0 0 0 2          →  5
0 1 1 3 1 3 2 1 1 3 0 3        →  2
2 2 2 1 2 0 3 1 3 1 0 3        →  3
1 3 0 2 0 2 2 1 0 3 2 1 1 2 2  →  2
1 0 1 1 2 0 1 2 3 1 0 0 0 1 2 0→  4

说明:

  • ⍳⍴⍵:获取从1到输入列表长度的数字列表
  • ↓2 2⊤⍵:对于输入列表中的每个值,获取第一个字节和第二个字节
  • ∆←(... )/⊂⍳⍴⍵:对于两个字节列表,从中选择相应的值⍳⍴⍵。将它们存储在中
  • (⊂⍬)∊∆... :¯1:如果此列表包含空列表,则返回-1。除此以外:

  • |∘.-/∆:获取每对值之间的绝对差,给出一个矩阵

  • (+,⍉¨):获取该矩阵的旋转副本和非旋转副本
  • {⌈/⌊/⍵}:对于两个矩阵,获取行的最小值中的最大值
  • ⌈/:然后得到最大的

@Optimizer:我以某种方式设法从具有错误的早期版本中复制测试输出。该代码本身是正确的,现在仍然是。如果您不相信我,请在这里尝试。(请注意,您必须输入一个单元素列表,X,以将其与标量区分开X。)
marinus 2015年

啊,我明白了。我的懒不去在线编译器和测试..
优化

1

Perl中,189 176 157B

现在状态增加了500%。

use List::Util qw'max min';@I=<>;sub f{$n=($n%2)+1;map{$I[$_]&$n?$_:()}0..$#I}sub i{@t=f;max map{$b=$_;min map{abs$_-$b}@t}f}$r=max i,i;print defined$r?$r:-1

清晰:

use List::Util qw'max min';
@I=<>;
sub f {
    $n = ($n%2) + 1;
    map { $I[$_] & $n ? $_ : () } 0..$#I
}
sub i {
    @t = f;
    max map {
        $b = $_;
        min map { abs $_ - $b } @t
    } f
}
$r = max i,i;
print defined $r ? $r : -1

用法示例:

输入

0
1
2
3

perl golf.pl < input


0

Clojure,167个字节

#(let[P apply F(fn[I](filter(fn[i](I(% i)))(range(count %))))A(F #{1 3})B(F #{2 3})d(fn[X Y](P min(for[x X](P max(for[y Y](P -(sort[x y])))))))](-(min(d A B)(d B A))))

应该有一个更短的方法……是吗?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.