当前位置: 首页>>代码示例>>Java>>正文


Java Page.getHtml方法代码示例

本文整理汇总了Java中us.codecraft.webmagic.Page.getHtml方法的典型用法代码示例。如果您正苦于以下问题:Java Page.getHtml方法的具体用法?Java Page.getHtml怎么用?Java Page.getHtml使用的例子?那么, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在us.codecraft.webmagic.Page的用法示例。


在下文中一共展示了Page.getHtml方法的3个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Java代码示例。

示例1: process

import us.codecraft.webmagic.Page; //导入方法依赖的package包/类
public void process(Page page) {

        Html html = page.getHtml();
        List<String> questionList =  html.xpath("//table[@class='tgCustomerCommunityCenterColumn']//div[@class='content']//table[@class='dataGrid']//tr").all();

        if(questionList != null && questionList.size() > 1)
        {
            //i=0是列名称,所以i从1开始
            for( int i = 1 ; i < questionList.size(); i++)
            {
                System.out.println(questionList.get(i));
                Html tempHtml =  Html.create("<table>"+questionList.get(i)+"</table>");
                String comment = tempHtml.xpath("//td[@class='title']//a/text()").toString();
                System.out.println(comment);
                String answerNum =  tempHtml.xpath("//td[@class='num']/text()").toString();
                System.out.println(answerNum);
                String createTime = tempHtml.xpath("//td[3]/text()").toString();
                System.out.println(createTime);

				/* Document doc = Jsoup.parse(questionList.get(i));
				 Html hmt  = Html.create(questionList.get(i)) ;
			     String str = hmt.links().toString();
				  String   content =   doc.getElementsByTag("a").text();
				  String ss = doc.text();*/

            }
        }

    }
 
开发者ID:mikeqian,项目名称:house,代码行数:30,代码来源:AmanzonPageProcessor.java

示例2: download

import us.codecraft.webmagic.Page; //导入方法依赖的package包/类
/**
 * 直接下载页面的简便方法
 * 
 * @param url
 * @return
 */
public Html download(String url) {
	Page page = download(new Request(url), null);
	return (Html) page.getHtml();
}
 
开发者ID:yuany,项目名称:en-webmagic,代码行数:11,代码来源:HttpClientDownloader.java

示例3: download

import us.codecraft.webmagic.Page; //导入方法依赖的package包/类
/**
 * A simple method to download a url.
 *
 * @param url url
 * @param charset charset
 * @return html
 */
public Html download(String url, String charset) {
    Page page = download(new Request(url), Site.me().setCharset(charset).toTask());
    return (Html) page.getHtml();
}
 
开发者ID:code4craft,项目名称:webmagic,代码行数:12,代码来源:AbstractDownloader.java


注:本文中的us.codecraft.webmagic.Page.getHtml方法示例由纯净天空整理自Github/MSDocs等开源代码及文档管理平台,相关代码片段筛选自各路编程大神贡献的开源项目,源码版权归原作者所有,传播和使用请参考对应项目的License;未经允许,请勿转载。