如何通过innerText获取元素


Answers:


147

您将不得不手动遍历。

var aTags = document.getElementsByTagName("a");
var searchText = "SearchingText";
var found;

for (var i = 0; i < aTags.length; i++) {
  if (aTags[i].textContent == searchText) {
    found = aTags[i];
    break;
  }
}

// Use `found`.

1
@AutoSponge实际上,innerHTML是标准的。innerText在FF中不起作用
AnaMaria

更新了示例,在这种情况下,textContent可能是您想要的。谢谢大家:)
August Lilleaas

1
@AugustLilleaas,这是i < il怎么回事?那是在做什么
David Sawyer

1
我发现,如果您有<span> <span>搜索文本</ span> </ span>,则此方法可能会返回外部跨度而不是内部跨度。
凯文·惠勒

5
不,这个问题是关于JavaScript和HTML的,而不是Java的问题
August Lilleaas

159

您可以使用xpath完成此操作

var xpath = "//a[text()='SearchingText']";
var matchingElement = document.evaluate(xpath, document, null, XPathResult.FIRST_ORDERED_NODE_TYPE, null).singleNodeValue;

您还可以使用以下xpath搜索包含一些文本的元素:

var xpath = "//a[contains(text(),'Searching')]";

7
这应该是最佳答案。XPath可以做更多的事情,例如按属性值选择节点,选择节点集……简单介绍:w3schools.com/xml/xpath_syntax.asp
Timathon

1
问题是,此
技巧

2
@vsync我认为这将比其他任何答案都快,因为xpath是由浏览器提供的算法执行的,而不是像此处所有其他答案一样在javascript中执行。不过,这是一个有趣的问题。
carlin.scott

1
IE浏览器中似乎Document.evaluate() 不应该使用
vsync

1
我不知道为什么,但是不知何故var xpath = "//a[text()='SearchingText']"; ,但这 var xpath = "//a[contains(text(),'Searching')]"; 行得通。请注意带反斜线的字符,例如\'\'。
乔伊·乔

38

使用当前可用的最现代语法,可以很干净地完成此操作:

for (const a of document.querySelectorAll("a")) {
  if (a.textContent.includes("your search term")) {
    console.log(a.textContent)
  }
}

或使用单独的过滤器:

[...document.querySelectorAll("a")]
   .filter(a => a.textContent.includes("your search term"))
   .forEach(a => console.log(a.textContent))

自然,旧版浏览器不会处理此问题,但是如果需要旧版支持,则可以使用翻译器。


<3过滤方法
John Vandivier


15

function findByTextContent(needle, haystack, precise) {
  // needle: String, the string to be found within the elements.
  // haystack: String, a selector to be passed to document.querySelectorAll(),
  //           NodeList, Array - to be iterated over within the function:
  // precise: Boolean, true - searches for that precise string, surrounded by
  //                          word-breaks,
  //                   false - searches for the string occurring anywhere
  var elems;

  // no haystack we quit here, to avoid having to search
  // the entire document:
  if (!haystack) {
    return false;
  }
  // if haystack is a string, we pass it to document.querySelectorAll(),
  // and turn the results into an Array:
  else if ('string' == typeof haystack) {
    elems = [].slice.call(document.querySelectorAll(haystack), 0);
  }
  // if haystack has a length property, we convert it to an Array
  // (if it's already an array, this is pointless, but not harmful):
  else if (haystack.length) {
    elems = [].slice.call(haystack, 0);
  }

  // work out whether we're looking at innerText (IE), or textContent 
  // (in most other browsers)
  var textProp = 'textContent' in document ? 'textContent' : 'innerText',
    // creating a regex depending on whether we want a precise match, or not:
    reg = precise === true ? new RegExp('\\b' + needle + '\\b') : new RegExp(needle),
    // iterating over the elems array:
    found = elems.filter(function(el) {
      // returning the elements in which the text is, or includes,
      // the needle to be found:
      return reg.test(el[textProp]);
    });
  return found.length ? found : false;;
}


findByTextContent('link', document.querySelectorAll('li'), false).forEach(function(elem) {
  elem.style.fontSize = '2em';
});

findByTextContent('link3', 'a').forEach(function(elem) {
  elem.style.color = '#f90';
});
<ul>
  <li><a href="#">link1</a>
  </li>
  <li><a href="#">link2</a>
  </li>
  <li><a href="#">link3</a>
  </li>
  <li><a href="#">link4</a>
  </li>
  <li><a href="#">link5</a>
  </li>
</ul>

当然,仍然有些简单的方法是:

var textProp = 'textContent' in document ? 'textContent' : 'innerText';

// directly converting the found 'a' elements into an Array,
// then iterating over that array with Array.prototype.forEach():
[].slice.call(document.querySelectorAll('a'), 0).forEach(function(aEl) {
  // if the text of the aEl Node contains the text 'link1':
  if (aEl[textProp].indexOf('link1') > -1) {
    // we update its style:
    aEl.style.fontSize = '2em';
    aEl.style.color = '#f90';
  }
});
<ul>
  <li><a href="#">link1</a>
  </li>
  <li><a href="#">link2</a>
  </li>
  <li><a href="#">link3</a>
  </li>
  <li><a href="#">link4</a>
  </li>
  <li><a href="#">link5</a>
  </li>
</ul>

参考文献:


14

功能方法。返回所有匹配元素的数组,并在检查时修剪周围的空格。

function getElementsByText(str, tag = 'a') {
  return Array.prototype.slice.call(document.getElementsByTagName(tag)).filter(el => el.textContent.trim() === str.trim());
}

用法

getElementsByText('Text here'); // second parameter is optional tag (default "a")

如果您正在浏览不同的标签,例如跨度或按钮

getElementsByText('Text here', 'span');
getElementsByText('Text here', 'button');

默认值标签='a'对于旧版浏览器将需要Babel


这是不正确的,因为它还包括所有子节点的结果。即如果子节点a将包含str- el将包含在getElementsByText结果中;这是错误的。
avalanche1

@ avalanche1这取决于是否不可取。即使包裹在另一个标签(即<span> </ span>)中,也可能需要按文本进行选择
Pawel

5

只需将您的子字符串传递到以下行:

外层HTML

document.documentElement.outerHTML.includes('substring')

内部HTML

document.documentElement.innerHTML.includes('substring')

您可以使用它们搜索整个文档并检索包含您的搜索词的标签:

function get_elements_by_inner(word) {
    res = []
    elems = [...document.getElementsByTagName('a')];
    elems.forEach((elem) => { 
        if(elem.outerHTML.includes(word)) {
            res.push(elem)
        }
    })
    return(res)
}

用法

此页面上提到用户“ T3rm1”多少次?

get_elements_by_inner("T3rm1").length

1个

jQuery被提及了多少次?

get_elements_by_inner("jQuery").length

3

获取所有包含单词“ Cyber​​netic”的元素:

get_elements_by_inner("Cybernetic")

在此处输入图片说明


这将返回true或false,但不会返回element。
T3rm1

您可以使用真理条件遍历检索到的元素,并从这些元素中获取所需的任何内容。查看最新答案。
控制论

4

我发现使用新语法比其他答案要短一些。所以这是我的建议:

const callback = element => element.innerHTML == 'My research'

const elements = Array.from(document.getElementsByTagName('a'))
// [a, a, a, ...]

const result = elements.filter(callback)

console.log(result)
// [a]

JSfiddle.net


2

如果需要的话,要从使用<= IE11的user1106925获取过滤方法

您可以将价差运算符替换为:

[].slice.call(document.querySelectorAll("a"))

和include调用 a.textContent.match("your search term")

它非常整洁地工作:

[].slice.call(document.querySelectorAll("a"))
   .filter(a => a.textContent.match("your search term"))
   .forEach(a => console.log(a.textContent))

我喜欢这种方法。您也可以Array.from代替[].slice.call。例如: Array.from(document.querySelectorAll('a'))
理查德

1

尽管有可能了解内在文字,但我认为您的做法是错误的。内部字符串是动态生成的吗?如果是这样,您可以在文本进入标签时为标签提供一个类或更好的ID。如果它是静态的,那就更容易了。


1

您可以使用TreeWalker来遍历DOM节点,找到包含文本的所有文本节点,并返回其父节点:

const findNodeByContent = (text, root = document.body) => {
  const treeWalker = document.createTreeWalker(root, NodeFilter.SHOW_TEXT);

  const nodeList = [];

  while (treeWalker.nextNode()) {
    const node = treeWalker.currentNode;

    if (node.nodeType === Node.TEXT_NODE && node.textContent.includes(text)) {
      nodeList.push(node.parentNode);
    }
  };

  return nodeList;
}

const result = findNodeByContent('SearchingText');

console.log(result);
<a ...>SearchingText</a>


0

我认为您需要对我们有所帮助。

  1. 您如何找到这个?Javascript?PHP的?Perl?
  2. 您可以将ID属性应用于标签吗?

如果文本是唯一的(或者确实是,如果不是,但是您必须遍历数组),则可以运行正则表达式来查找它。使用PHP的preg_match()可以解决此问题。

如果使用Javascript并可以插入ID属性,则可以使用getElementById('id')。然后,您可以通过DOM访问返回的元素的属性:https : //developer.mozilla.org/en/DOM/element.1


0

我只需要一种方法来获取包含特定文本的元素,这就是我想出的。

使用document.getElementsByInnerText()获得多个元素(多个元素可能具有相同的确切文本),并利用document.getElementByInnerText()得到的只是一个元素(第一场比赛)。

另外,您可以使用元素(例如someElement.getElementByInnerText())代替来本地化搜索document

您可能需要对其进行调整,以使其跨浏览器或满足您的需求。

我认为代码是不言自明的,因此我将其保持原样。

HTMLElement.prototype.getElementsByInnerText = function (text, escape) {
    var nodes  = this.querySelectorAll("*");
    var matches = [];
    for (var i = 0; i < nodes.length; i++) {
        if (nodes[i].innerText == text) {
            matches.push(nodes[i]);
        }
    }
    if (escape) {
        return matches;
    }
    var result = [];
    for (var i = 0; i < matches.length; i++) {
        var filter = matches[i].getElementsByInnerText(text, true);
        if (filter.length == 0) {
            result.push(matches[i]);
        }
    }
    return result;
};
document.getElementsByInnerText = HTMLElement.prototype.getElementsByInnerText;

HTMLElement.prototype.getElementByInnerText = function (text) {
    var result = this.getElementsByInnerText(text);
    if (result.length == 0) return null;
    return result[0];
}
document.getElementByInnerText = HTMLElement.prototype.getElementByInnerText;

console.log(document.getElementsByInnerText("Text1"));
console.log(document.getElementsByInnerText("Text2"));
console.log(document.getElementsByInnerText("Text4"));
console.log(document.getElementsByInnerText("Text6"));

console.log(document.getElementByInnerText("Text1"));
console.log(document.getElementByInnerText("Text2"));
console.log(document.getElementByInnerText("Text4"));
console.log(document.getElementByInnerText("Text6"));
<table>
    <tr>
        <td>Text1</td>
    </tr>
    <tr>
        <td>Text2</td>
    </tr>
    <tr>
        <td>
            <a href="#">Text2</a>
        </td>
    </tr>
    <tr>
        <td>
            <a href="#"><span>Text3</span></a>
        </td>
    </tr>
    <tr>
        <td>
            <a href="#">Special <span>Text4</span></a>
        </td>
    </tr>
    <tr>
        <td>
            Text5
            <a href="#">Text6</a>
            Text7
        </td>
    </tr>
</table>


0

这样就可以了。
返回包含的节点数组text

function get_nodes_containing_text(selector, text) {
    const elements = [...document.querySelectorAll(selector)];

    return elements.filter(
      (element) =>
        element.childNodes[0]
        && element.childNodes[0].nodeValue
        && RegExp(text, "u").test(element.childNodes[0].nodeValue.trim())
    );
  }
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.