当前位置: 首页>>代码示例>>Java>>正文


Java Selectable类代码示例

本文整理汇总了Java中us.codecraft.webmagic.selector.Selectable的典型用法代码示例。如果您正苦于以下问题:Java Selectable类的具体用法?Java Selectable怎么用?Java Selectable使用的例子?那么恭喜您, 这里精选的类代码示例或许可以为您提供帮助。


Selectable类属于us.codecraft.webmagic.selector包,在下文中一共展示了Selectable类的12个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Java代码示例。

示例1: process

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
@Override
public void process(Page page) {
    List<Selectable> nodes = page.getHtml().xpath("//ul[@id=ma-thumb-list]/li").nodes();
    StringBuilder accum = new StringBuilder();
    for (Selectable node : nodes) {
        accum.append("img:").append(node.xpath("//a/@href").get()).append("\n");
        accum.append("title:").append(node.xpath("//img/@alt").get()).append("\n");
    }
    page.putField("",accum.toString());
    if (accum.length() == 0) {
        page.setSkip(true);
    }
    page.addTargetRequests(page.getHtml().links().regex("http://www\\.mama\\.cn/photo/.*\\.html").all());
}
 
开发者ID:mikeqian,项目名称:house,代码行数:15,代码来源:MamacnPageProcessor.java

示例2: process

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
@Override
public void process(Page page) {
    Html html = page.getHtml();
    count++;
    Selectable sel = html.links().regex("("+URLREG+"[a-zA-Z0-9\\d]+.shtml)");
    page.addTargetRequests(sel.all());
    if(count!=1) {
        for(String f:fields){
            String key = config.getProperty(f);
            if(!"".equals(key)) {
                String pro = config.getProperty(f+"_deleteTag");
                if(pro!=null) {
                    String[] tags = pro.split(",");
                    String value = html.xpath(key).toString();
                    if("content".equals(f))
                        page.putField(f,value);
                    else
                        page.putField(f, deleteTag(value, tags).replaceAll(config.getProperty(f + "_replaceStr"), ""));
                }
            }
        }
        try {
            page.putField("area", new String(Area.getBytes("ISO-8859-1"),"utf-8"));
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
    }
    System.out.println("############=====> "+count);
}
 
开发者ID:blogshun,项目名称:ants-project,代码行数:30,代码来源:MySpider.java

示例3: testNthNodesGet

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
@Test
public void testNthNodesGet(){
	Html html = new Html("<a data-tip=\"p$t$xxx\" href=\"/xx/xx\">xx</a>");
	assertThat(html.xpath("//a[1]/@href").get()).isEqualTo("/xx/xx");
	Selectable selectable = html.xpath("//a[1]").nodes().get(0);
	assertThat(selectable.xpath("/a/@href").get()).isEqualTo("/xx/xx");
}
 
开发者ID:code4craft,项目名称:webmagic,代码行数:8,代码来源:HtmlTest.java

示例4: getUrl

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
@Override
public Selectable getUrl() {
    return page.getUrl();
}
 
开发者ID:laidu,项目名称:java-learn,代码行数:5,代码来源:PageProxy.java

示例5: parseAllTopics

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
public void parseAllTopics(Page page) {
	Selectable selectable = page.getHtml().xpath("//div[@id='group-topics']//a");
	List<Selectable> selectables = selectable.nodes();
	selectables.stream().filter((s) -> s.match()).forEach(System.out::print);
	page.putField("allTopics", selectables);
}
 
开发者ID:xyalan,项目名称:findhouse,代码行数:7,代码来源:DoubanHouseProcessor.java

示例6: setHtml

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
public void setHtml(Selectable html) {
    this.html = html;
}
 
开发者ID:yuany,项目名称:en-webmagic,代码行数:4,代码来源:Page.java

示例7: setUrl

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
public void setUrl(Selectable url) {
    this.url = url;
}
 
开发者ID:code4craft,项目名称:webmagic,代码行数:4,代码来源:Page.java

示例8: getHtml

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
/**
 * 获取页面的html内容
 *
 * @return html 页面的html内容
 */
public Selectable getHtml() {
    return html;
}
 
开发者ID:yuany,项目名称:en-webmagic,代码行数:9,代码来源:Page.java

示例9: getUrl

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
/**
 * 获取页面的Url
 *
 * @return url 当前页面的url,可用于抽取
 */
public Selectable getUrl() {
    return url;
}
 
开发者ID:yuany,项目名称:en-webmagic,代码行数:9,代码来源:Page.java

示例10: setUrl

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
/**
 * 设置url
 *
 * @param url
 */
public void setUrl(Selectable url) {
    this.url = url;
}
 
开发者ID:yuany,项目名称:en-webmagic,代码行数:9,代码来源:Page.java

示例11: getUrl

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
/**
 * get url of current page
 *
 * @return url of current page
 */
public Selectable getUrl() {
    return url;
}
 
开发者ID:code4craft,项目名称:webmagic,代码行数:9,代码来源:Page.java

示例12: getUrl

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
Selectable getUrl(); 
开发者ID:laidu,项目名称:java-learn,代码行数:2,代码来源:Page.java


注:本文中的us.codecraft.webmagic.selector.Selectable类示例由纯净天空整理自Github/MSDocs等开源代码及文档管理平台,相关代码片段筛选自各路编程大神贡献的开源项目,源码版权归原作者所有,传播和使用请参考对应项目的License;未经允许,请勿转载。