Ich mag es, Json-Dateien mit jq zu filtern:
jq . some.json
Angenommen, der Json enthält ein Array von Objekten:
{
"theList": [
{
"id": 1,
"name": "Horst"
},
{
"id": 2,
"name": "Fritz"
},
{
"id": 3,
"name": "Walter"
},
{
"id": 4,
"name": "Gerhart"
},
{
"id": 5,
"name": "Harmut"
}
]
}
Ich möchte diese Liste so filtern, dass nur die Elemente angezeigt werden, deren ID den Wert 2 und 4 hat. Die erwartete Ausgabe lautet also:
{
"id": 2,
"name": "Fritz"
},
{
"id": 4,
"name": "Gerhart"
}
Wie filtere ich den Json mit JQ? Ich habe mit select und map herumgespielt, aber ich hatte keine davon zum Arbeiten, z.
$ jq '.theList[] | select(.id == 2) or select(.id == 4)' array.json
true
Aus den Dokumenten:
jq '.[] | select(.id == "second")'
Eingabe
[{"id": "first", "val": 1}, {"id": "second", "val": 2}]
Ausgabe
{"id": "second", "val": 2}
Ich denke, Sie können so etwas tun:
jq '.theList[] | select(.id == 2 or .id == 4)' array.json
Sie könnten select
innerhalb von map
verwenden.
.theList | map(select(.id == (2, 4)))
Oder kompakter:
[ .theList[] | select(.id == (2, 4)) ]
Auf diese Weise geschrieben ist jedoch etwas ineffizient, da der Ausdruck für jeden verglichenen Wert dupliziert wird. Es wird effizienter und möglicherweise lesbarer geschrieben:
[ .theList[] | select(any(2, 4; . == .id)) ]
Die Verwendung von select(.id == (2, 4))
ist in der Regel ineffizient (siehe unten).
Wenn Ihr jq IN/1
hat, kann es verwendet werden, um eine effizientere Lösung zu erzielen:
.theList[] | select( .id | IN(2,3))
Wenn Ihr jq kein IN/1
hat, können Sie es wie folgt definieren:
def IN(s): first(select(s == .)) // false;
Effizienz
Eine Möglichkeit, die Ineffizienz zu erkennen, ist die Verwendung von debug
. Der folgende Ausdruck führt beispielsweise zu 10 Aufrufen von debug
, während tatsächlich nur 9 Gleichheitsprüfungen erforderlich sind:
.theList[] | select( (.id == (2,3)) | debug )
["DEBUG:",false]
["DEBUG:",false]
["DEBUG:",true]
{
"id": 2,
"name": "Fritz"
}
["DEBUG:",false]
["DEBUG:",false]
["DEBUG:",true]
{
"id": 3,
"name": "Walter"
}
["DEBUG:",false]
["DEBUG:",false]
["DEBUG:",false]
["DEBUG:",false]
index/1
Im Prinzip sollte die Verwendung von index/1
effizient sein, aber zum Zeitpunkt des Schreibens (Oktober 2017) ist seine Implementierung zwar schnell (in C geschrieben), jedoch ineffizient.
Hier ist eine Lösung mit Indizes :
.theList | [ .[map(.id)|indices(2,4)[]] ]