本文整理汇总了C#中HtmlAgilityPack.HtmlNode.GetElementsByTagName方法的典型用法代码示例。如果您正苦于以下问题:C# HtmlNode.GetElementsByTagName方法的具体用法?C# HtmlNode.GetElementsByTagName怎么用?C# HtmlNode.GetElementsByTagName使用的例子?那么恭喜您, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在类HtmlAgilityPack.HtmlNode
的用法示例。
在下文中一共展示了HtmlNode.GetElementsByTagName方法的4个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的C#代码示例。
示例1: DeleteImageNodes
private static void DeleteImageNodes(HtmlNode articleNode)
{
var imageNotes = articleNode.GetElementsByTagName("img");
foreach (var image in imageNotes)
{
image.Remove();
}
}
示例2: GetLinkDensity
private static double GetLinkDensity(HtmlNode node)
{
var links = node.GetElementsByTagName("a");
var textLength = GetInnerText(node).Length;
var linkLength = links.Sum(l => GetInnerText(l).Length);
return linkLength * 1.0 / textLength;
}
示例3: RemoveScripts
private static void RemoveScripts(HtmlNode node)
{
foreach (var script in node.GetElementsByTagName("script"))
{
script.Remove();
}
}
示例4: GetArticleTitle
private static string GetArticleTitle(HtmlNode htmlNode)
{
var titleNode = htmlNode.GetElementsByTagName("title").FirstOrDefault();
if (titleNode == null) return null;
string currTitle, origTitle;
currTitle = origTitle = GetInnerText(titleNode);
if (Regex.IsMatch(currTitle, @" [\|\-] "))
{
currTitle = Regex.Replace(origTitle, @"(.*)[\|\-] .*", "$1");
if (currTitle.Split(' ').Length < 3)
{
currTitle = origTitle.Replace(@"[^\|\-]*[\|\-](.*)", "$1");
}
}
else if (currTitle.IndexOf(": ") != -1)
{
currTitle = Regex.Replace(origTitle, @".*:(.*)", "$1");
if(currTitle.Split(' ').Length < 3)
{
currTitle = Regex.Replace(origTitle, @"[^:]*[:](.*)", "$1");
}
}
else if (currTitle.Length > 150 || currTitle.Length < 15)
{
var hOnes = htmlNode.GetElementsByTagName("h1");
if (hOnes.Count == 1)
{
currTitle = GetInnerText(hOnes[0]);
}
}
if (currTitle.Split(' ').Length <= 4)
{
currTitle = origTitle;
}
return currTitle.Trim();
}