Scripting: что проще всего извлечь значение в теге XML-файла?

Я хочу прочитать пом.xml ("объектная модель проекта" Maven) и извлечь информацию о версии. Приведем пример:

<?xml version="1.0" encoding="UTF-8"?><project 
xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">

    <modelVersion>4.0.0</modelVersion>
    <groupId>com.mycompany</groupId>
    <artifactId>project-parent</artifactId>
    <name>project-parent</name>
    <version>1.0.74-SNAPSHOT</version>
    <dependencies>
        <dependency>
        <groupId>com.sybase.jconnect</groupId>
        <artifactId>jconnect</artifactId>
        <version>6.05-26023</version>
    </dependency>
    <dependency>
        <groupId>joda-time</groupId>
        <artifactId>joda-time</artifactId>
        <version>1.5.2</version>
    </dependency>
    <dependency>
        <groupId>com.sun.jdmk</groupId>
        <artifactId>jmxtools</artifactId>
        <version>1.2.1</version>
    </dependency>
    <dependency>
        <groupId>org.easymock</groupId>
        <artifactId>easymock</artifactId>
        <version>2.4</version>
    </dependency>       
</dependencies>
</project>

Как я могу извлечь версию '1.0.74-SNAPSHOT' сверху?

хотелось бы иметь возможность сделать это с помощью простых сценариев bash sed или awk. В противном случае предпочтителен простой python.

EDIT

  1. ограничения

    поле для Linux в корпоративной среде, так что я могу используйте только инструменты, которые уже установлены (не то, чтобы я не мог запросить утилиту, такую как xml2, но мне нужно пройти через много волокиты). Некоторые из решений очень хороши (узнайте несколько новых трюков уже), но они могут быть неприменимы из-за ограниченной среды

  2. обновленный XML в листинге

    Я добавил тег dependencies в исходный список. Это покажет некоторые hacky решение не может работать в этом дело

  3. Distro

    Я использую дистрибутив RHEL4

5
задан Cyrus
источник

13 ответов

xml2 может конвертировать xml в / из линейно-ориентированного формата:

xml2 < pom.xml  | grep /project/version= | sed 's/.*=//'
16
отвечен Vi. 2011-12-20 22:21:51
источник

используя python

$ python -c 'from xml.etree.ElementTree import ElementTree; print ElementTree(file="pom.xml").findtext("{http://maven.apache.org/POM/4.0.0}version")'
1.0.74-SNAPSHOT

используя xmlstarlet

$ xml sel -N x="http://maven.apache.org/POM/4.0.0" -t -m 'x:project/x:version' -v . pom.xml
1.0.74-SNAPSHOT

используя xmllint

$ echo -e 'setns x=http://maven.apache.org/POM/4.0.0\ncat /x:project/x:version/text()' | xmllint --shell pom.xml | grep -v /
1.0.74-SNAPSHOT
6
отвечен kev 2011-12-21 05:39:02
источник

другой способ: xmlgrep и XPath:

xmlgrep --text_only '/project/version' pom.xml

недостаток: низкая

5
отвечен Vi. 2011-12-20 23:10:49
источник

в Clojure пути. Требуется только jvm со специальным файлом jar:

java -cp clojure.jar clojure.main -e "(use 'clojure.xml) (->> (java.io.File. \"pom.xml\") (clojure.xml/parse) (:content) (filter #(= (:tag %) :version)) (first) (:content) (first) (println))"

Scala путь:

java -Xbootclasspath/a:scala-library.jar -cp scala-compiler.jar scala.tools.nsc.MainGenericRunner -e 'import scala.xml._; println((XML.load(new java.io.FileInputStream("pom.xml")) match { case <project>{children @ _*}</project> => for (i <- children if (i  match { case <version>{children @ _*}</version> => true; case _ => false;  }))  yield i })(0) match { case <version>{Text(x)}</version> => x })'

Заводной образом:

java -classpath groovy-all.jar groovy.ui.GroovyMain -e 'println (new XmlParser().parse(new File("pom.xml")).value().findAll({ it.name().getLocalPart()=="version" }).first().value().first())'
5
отвечен Vi. 2011-12-21 09:25:56
источник

вот альтернатива в Perl

$ perl -MXML::Simple -e'print XMLin("pom.xml")->{version}."\n"'
1.0.74-SNAPSHOT

он работает с пересмотренным / расширенным примером в вопросах, который имеет несколько элементов "версии" на разной глубине.

4
отвечен RedGrittyBrick 2011-12-21 16:50:33
источник

Hacky путь:

perl -e '$_ = join "", <>; m!<project[^>]*>.*\n(?:    |\t)<version[^>]*>\s*([^<]+?)\s*</version>.*</project>!s and print "\n"' pom.xml

полагается на правильный отступ требуется <version>

3
отвечен Vi. 2017-05-23 12:41:49
источник

разработать очень неуклюжий, один лайнер решение

python -c "from xml.dom.minidom import parse;dom = parse('pom.xml');print [n for n in dom.getElementsByTagName('version') if n.parentNode == dom.childNodes[0]][0].toxml()" | sed -e "s/.*>\(.*\)<.*//g"

sed в конце очень уродлив, но я не смог распечатать текст узла только с помощью mindom.

обновление от _Vi:

менее hacky Python версия:

python -c "from xml.dom.minidom import parse;dom = parse('pom.xml');print [i.childNodes.item(0).nodeValue for i in dom.firstChild.childNodes if i.nodeName == 'version'].pop()"

обновление от меня

другая версия:

    python -c "from  xml.dom.minidom import parse;dom = parse('pom.xml');print [n.firstChild.data for n in dom.childNodes[0].childNodes if n.firstChild and n.tagName == 'version']"
3
отвечен Anthony Kong 2011-12-29 06:09:22
источник

XSLT путь:

<?xml version="1.0" encoding="ISO-8859-1"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
        <xsl:output method="text"/>

        <xsl:template match="/">
                <xsl:for-each select="*[local-name()='project']">
                    <xsl:for-each select="*[local-name()='version']">
                        <xsl:value-of select="text()"/>
                    </xsl:for-each>
                </xsl:for-each>
        </xsl:template>
</xsl:stylesheet>
xalan -xsl x.xsl -in pom.xml
2
отвечен Vi. 2011-12-21 01:16:55
источник

если "в xml много тегов version", то вам лучше забыть об этом с помощью "простых инструментов" и регулярных выражений, которые этого не сделают.

попробуйте python (без зависимостей):

from xml.dom.minidom import parse

dom = parse('pom.xml')
project = dom.getElementsByTagName('project')[0]
for node in project.childNodes:
    if node.nodeType == node.ELEMENT_NODE and node.tagName == 'version':
        print node.firstChild.nodeValue
2
отвечен Samus_ 2011-12-22 01:38:49
источник

здесь ОДН-вкладыш используя sed:

sed '/<dependencies>/,/<\/dependencies>/d;/<version>/!d;s/ *<\/\?version> *//g' pom.xml
1
отвечен chickenkiller 2011-12-21 15:53:16
источник
Return_text_val=$(xmllint --xpath "//*[local-name()='$TagElmnt']" $FILE )

вот, попробуй это:

$TagElmnt - TagName
$FILE - xml file to parse
0
отвечен Vijayababu 2015-05-13 13:08:24
источник
sed -n "/<name>project-parent/{n;s/.*>\(.*\)<.*//p;q}" pom.xml

на -n опция позволяет избежать печати несовпадающих строк; первое совпадение (/.../) стоит на строке перед строкой с текстом wanted;n команда переходит к следующей строке, где s извлекает соответствующую информацию через группу захвата (\(...\)), и обратной ссылкой (). p распечатывает, q завершает работу.

0
отвечен SΛLVΘ 2015-10-29 01:27:27
источник

Я знаю, что ваш вопрос говорит Linux, но если у вас есть необходимость сделать это на Windows, без необходимости каких-либо сторонних инструментов, таких что вы можете поместить его в пакетный файл, Powershell может извлечь любой узел из вашего pom.xml файл вроде так:

powershell -Command "& {select-xml //pom:project/pom:properties/pom:mypluginversion -path pom.xml -Namespace  @{pom='http://maven.apache.org/POM/4.0.0'} | foreach {$_.Node.Innerxml}}" > myPluginVersion.txt
-1
отвечен Peter Lubczynski 2015-10-26 21:55:28
источник

Другие вопросы bash linux python unix xml