如何使用jq根据内部数组中的值过滤对象数组?


239

鉴于此输入:

[
  {
    "Id": "cb94e7a42732b598ad18a8f27454a886c1aa8bbba6167646d8f064cd86191e2b",
    "Names": [
      "condescending_jones",
      "loving_hoover"
    ]
  },
  {
    "Id": "186db739b7509eb0114a09e14bcd16bf637019860d23c4fc20e98cbe068b55aa",
    "Names": [
      "foo_data"
    ]
  },
  {
    "Id": "a4b7e6f5752d8dcb906a5901f7ab82e403b9dff4eaaeebea767a04bac4aada19",
    "Names": [
      "jovial_wozniak"
    ]
  },
  {
    "Id": "76b71c496556912012c20dc3cbd37a54a1f05bffad3d5e92466900a003fbb623",
    "Names": [
      "bar_data"
    ]
  }
]

我正在尝试使用jq构造一个过滤器,该过滤器返回Ids的所有对象,这些s 的内部数组中包含“数据” Names,并且输出以换行符分隔。对于以上数据,我想要的输出是

cb94e7a42732b598ad18a8f27454a886c1aa8bbba6167646d8f064cd86191e2b
a4b7e6f5752d8dcb906a5901f7ab82e403b9dff4eaaeebea767a04bac4aada19

我想我与此有点接近:

(. - select(.Names[] contains("data"))) | .[] .Id

select过滤器不正确,并且无法编译(获取error: syntax error, unexpected IDENT)。

Answers:


372

很接近!在select表达式中,您必须在之前使用管道(|contains

该滤波器产生预期的输出。

. - map(select(.Names[] | contains ("data"))) | .[] .Id

JQ食谱具有语法的一个例子。

根据键的内容过滤对象

例如,我只想要类型键包含“ house”的对象。

$ json='[{"genre":"deep house"}, {"genre": "progressive house"}, {"genre": "dubstep"}]'
$ echo "$json" | jq -c '.[] | select(.genre | contains("house"))'
{"genre":"deep house"}
{"genre":"progressive house"}

Colin D询问如何保留数组的JSON结构,以便最终输出是单个JSON数组而不是JSON对象流。

最简单的方法是将整个表达式包装在数组构造函数中:

$ echo "$json" | jq -c '[ .[] | select( .genre | contains("house")) ]'
[{"genre":"deep house"},{"genre":"progressive house"}]

您还可以使用地图功能:

$ echo "$json" | jq -c 'map(select(.genre | contains("house")))'
[{"genre":"deep house"},{"genre":"progressive house"}]

map解压缩输入数组,将过滤器应用于每个元素,然后创建一个新数组。换句话说,map(f)等于[.[]|f]


谢谢,效果很好!我确实看到了这个示例,但只是未能使其适应我的情况:-)
Abe Voelker

1
无论如何,“保留数组的json结构”吗?我喜欢这种类型的示例,但它输出两个“ json行”。我也没有必要弄清楚地图部分
科林·d

4
@ColinD我对reduce解决方案不是很满意,因此我用对map函数的解释代替了它。有帮助吗?
伊恩·塞缪尔·麦克莱恩

@IainElder-当搜索词的一部分(在本例中为house)是变量时会发生什么?所以说使用--args term se。So contains(“ hou $ term”)
SnazzyBootMan

@Chris变量$term将被视为字符串,因此您应使用字符串串联:contains("hou" + $term)
Iain Samuel McLean Elder

17

这是另一个使用any / 2的解决方案

map(select(any(.Names[]; contains("data"))|not)|.Id)[]

带有样本数据及其-r产生的选项

cb94e7a42732b598ad18a8f27454a886c1aa8bbba6167646d8f064cd86191e2b
a4b7e6f5752d8dcb906a5901f7ab82e403b9dff4eaaeebea767a04bac4aada19

正是我要找的东西-为什么此功能只能使用分号.Names[] ; contains()而不是管道.Names[] | contains()
马特

3
啊,是any(generator; condition)表格。我发现如果不对同一对象进行多次匹配,则不使用它any()会导致结果重复select()
马特
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.