Techioz Blog

Nokogiri がサポートしている xpath のバージョンはどれですか?

概要

Nokogiri がサポートする xpath のバージョンに関する公式の声明が見つかりません。誰か手伝ってくれませんか?実際には、指定された部分文字列で始まる属性を持ついくつかの要素を抽出したいと考えています。たとえば、文字 C で始まる category 属性を持つすべての Book 要素を取得したいとします。nokogiri でこれを行うにはどうすればよいでしょうか?

<?xml version="1.0" encoding="ISO-8859-1"?>
<!-- Edited by XMLSpy?-->
<bookstore>

<book category="COOKING">
  <title lang="en">Everyday Italian</title>
  <author>Giada De Laurentiis</author>
  <year>2005</year>
  <price>30.00</price>
</book>

<book category="CHILDREN">
  <title lang="en">Harry Potter</title>
  <author>J K. Rowling</author>
  <year>2005</year>
  <price>29.99</price>
</book>

<book category="WEB">
  <title lang="en">XQuery Kick Start</title>
  <author>James McGovern</author>
  <author>Per Bothner</author>
  <author>Kurt Cagle</author>
  <author>James Linn</author>
  <author>Vaidyanathan Nagarajan</author>
  <year>2003</year>
  <price>49.99</price>
</book>

<book category="WEB">
  <title lang="en">Learning XML</title>
  <author>Erik T. Ray</author>
  <year>2003</year>
  <price>39.95</price>
</book>

</bookstore>

解決策

XPath Nokogiri の具体的なバージョンがどのバージョンをサポートしているかはわかりません。ただし、次のようにすることもできます。

XPath の「starts-with」を使用します。

doc = Nokogiri::XML(your_xml)
doc.search('//book[starts-with(@category, "C")]').each { |e| puts e['category'] }
# output is:
# COOKING
# CHILDREN

CSS3 の「で始まる」セレクターを使用することもできます。

doc = Nokogiri::XML(your_xml)
doc.search('book[category^=C]').each { |e| puts e['category'] }
# output is:
# COOKING
# CHILDREN