當前位置: 首頁>>代碼示例>>Golang>>正文


Golang Request.GetUrl方法代碼示例

本文整理匯總了Golang中github.com/henrylee2cn/pholcus/app/downloader/context.Request.GetUrl方法的典型用法代碼示例。如果您正苦於以下問題:Golang Request.GetUrl方法的具體用法?Golang Request.GetUrl怎麽用?Golang Request.GetUrl使用的例子?那麽, 這裏精選的方法代碼示例或許可以為您提供幫助。您也可以進一步了解該方法所在github.com/henrylee2cn/pholcus/app/downloader/context.Request的用法示例。


在下文中一共展示了Request.GetUrl方法的10個代碼示例,這些例子默認根據受歡迎程度排序。您可以為喜歡或者感覺有用的代碼點讚,您的評價將有助於係統推薦出更棒的Golang代碼示例。

示例1: Push

// 添加請求到隊列
func (self *scheduler) Push(req *context.Request) {
	// 初始化該蜘蛛的隊列
	spiderId, ok := req.GetSpiderId()
	if !ok {
		return
	}

	self.RLock()
	defer self.RUnlock()

	if self.status == status.STOP {
		return
	}

	// 當req不可重複時,有重複則返回
	if !req.GetDuplicatable() && self.Deduplicate(req.GetUrl()+req.GetMethod()) {
		return
	}

	// 初始化該蜘蛛下該優先級隊列
	priority := req.GetPriority()
	if !self.foundPriority(spiderId, priority) {
		self.addPriority(spiderId, priority)
	}

	defer func() {
		recover()
	}()

	// 添加請求到隊列
	self.queue[spiderId][priority] = append(self.queue[spiderId][priority], req)
}
開發者ID:jununfly,項目名稱:pholcus,代碼行數:33,代碼來源:scheduler.go

示例2: Download

func (self *Surfer) Download(cReq *context.Request) *context.Response {
	cResp := context.NewResponse(nil)

	var resp *http.Response
	var err error

	switch cReq.GetDownloaderID() {
	case SURF_ID:
		resp, err = self.surf.Download(cReq)
	case PHANTOM_ID:
		resp, err = self.phantom.Download(cReq)
	}

	if resp != nil {
		// 確保Response與Request中的Url字符串相等
		resp.Request.URL, _ = url.Parse(cReq.GetUrl())
	}

	cResp.SetRequest(cReq)

	cResp.SetResponse(resp)

	cResp.SetError(err)

	return cResp
}
開發者ID:BobbWu,項目名稱:pholcus,代碼行數:26,代碼來源:downloader_surfer.go

示例3: Download

func (self *Surfer) Download(cReq *context.Request) *context.Response {
	cResp := context.NewResponse(nil)

	resp, err := self.download.Download(cReq.GetMethod(), cReq.GetUrl(), cReq.GetReferer(), cReq.GetPostData(), cReq.GetHeader(), cReq.GetCookies())

	cResp.SetRequest(cReq)

	cResp.SetResponse(resp)

	cResp.SetError(err)

	return cResp
}
開發者ID:no2key,項目名稱:pholcus-1,代碼行數:13,代碼來源:downloader_surfer.go

示例4: SetFailure

func (self *Matrix) SetFailure(req *context.Request) bool {
	self.Lock()
	defer self.Unlock()
	unique := makeUnique(req)
	if _, ok := self.failures[unique]; !ok {
		// 首次失敗時,在任務隊列末尾重新執行一次
		self.failures[unique] = req
		logs.Log.Informational(" *     + 失敗請求: [%v]\n", req.GetUrl())
		return true
	}
	// 失敗兩次後,加入曆史失敗記錄
	UpsertFailure(req)
	return false
}
開發者ID:TonyFStark,項目名稱:pholcus,代碼行數:14,代碼來源:scheduler.go

示例5: Push

// 添加請求到隊列
func (self *scheduler) Push(req *context.Request) {
	self.pushMutex.Lock()
	defer self.pushMutex.Unlock()

	if self.status == status.STOP {
		return
	}

	// 當req不可重複時,有重複則返回
	if !req.GetDuplicatable() && self.Deduplicate(req.GetUrl()+req.GetMethod()) {
		return
	}

	self.SrcManage.Push(req)
}
開發者ID:JanChou,項目名稱:pholcus,代碼行數:16,代碼來源:scheduler.go

示例6: Process

// core processer
func (self *crawler) Process(req *context.Request) {

	defer func() {
		if err := recover(); err != nil { // do not affect other
			logs.Log.Error(" *     Process panic: %v", err)
		}
	}()
	// logs.Log.Debug("**************斷點 1 ***********")
	// download page
	resp := self.Downloader.Download(req)

	// logs.Log.Debug("**************斷點 2 ***********")
	// if fail do not need process
	if resp.GetError() != nil {
		// 取消該請求的去重樣本
		scheduler.Sdl.DelDeduplication(req.GetUrl() + req.GetMethod())
		logs.Log.Error(" *     %v", resp.GetError())
		// 統計下載失敗的頁數
		cache.PageFailCount()
		return
	}

	// logs.Log.Debug("**************斷點 3 ***********")
	// 過程處理,提煉數據
	self.Spider.ExecParse(resp)
	// logs.Log.Debug("**************斷點 5 ***********")
	// 該條請求文本結果存入pipeline
	for _, data := range resp.GetItems() {
		self.Pipeline.CollectData(
			resp.GetRuleName(), //DataCell.RuleName
			data,               //DataCell.Data
			resp.GetUrl(),      //DataCell.Url
			resp.GetReferer(),  //DataCell.ParentUrl
			time.Now().Format("2006-01-02 15:04:05"),
		)
	}

	// 該條請求文件結果存入pipeline
	for _, img := range resp.GetFiles() {
		self.Pipeline.CollectFile(
			resp.GetRuleName(),
			img["Name"].(string),
			img["Body"].(io.ReadCloser),
		)
	}

	// logs.Log.Debug("**************斷點 end ***********")
}
開發者ID:WangCrystal,項目名稱:pholcus,代碼行數:49,代碼來源:crawl.go

示例7: Download

func (self *Surfer) Download(cReq *context.Request) *context.Response {
	cResp := context.NewResponse(nil)

	resp, err := self.download.Download(cReq.GetMethod(), cReq.GetUrl(), cReq.GetReferer(), cReq.GetPostData(), cReq.GetHeader(), cReq.GetCookies())

	cResp.SetRequest(cReq)

	cResp.SetResponse(resp)

	if err != nil {
		logs.Log.Error(" *     %v", err)
		// cResp.SetStatus(false, err.Error())
		// return cResp
	}

	cResp.SetStatus(true, "")
	return cResp
}
開發者ID:treejames,項目名稱:pholcus-1,代碼行數:18,代碼來源:downloader_surfer.go

示例8: Push

// 添加請求到隊列
func (self *scheduler) Push(req *context.Request) {
	pushMutex.Lock()
	defer func() {
		pushMutex.Unlock()
	}()

	if self.status == status.STOP {
		return
	}

	// 有重複則返回
	if self.Compare(req.GetUrl() + req.GetMethod()) {
		return
	}

	// 留作未來分發請求用
	// if pholcus.Self.GetRunMode() == config.SERVER || req.CanOutsource() {
	// 	return
	// }

	self.SrcManage.Push(req)
}
開發者ID:no2key,項目名稱:pholcus-1,代碼行數:23,代碼來源:scheduler.go

示例9: Process

// core processer
func (self *crawler) Process(req *context.Request) {
	defer func() {
		if err := recover(); err != nil {
			// do not affect other
			scheduler.Sdl.DelDeduplication(req.GetUrl() + req.GetMethod())
			// 統計失敗數
			cache.PageFailCount()
			// 提示錯誤
			logs.Log.Error(" *     Fail [process panic]: %v", err)
		}
	}()
	// download page
	resp := self.Downloader.Download(req)

	// if fail do not need process
	if resp.GetError() != nil {
		// 刪除該請求的去重樣本
		scheduler.Sdl.DelDeduplication(req.GetUrl() + req.GetMethod())
		// 統計失敗數
		cache.PageFailCount()
		// 提示錯誤
		logs.Log.Error(" *     Fail [download]: %v", resp.GetError())
		return
	}

	// 過程處理,提煉數據
	spider.NewContext(self.Spider, resp).Parse(resp.GetRuleName())

	// 統計成功頁數
	cache.PageSuccCount()
	// 提示抓取成功
	logs.Log.Informational(" *     Success: %v", req.GetUrl())

	// 該條請求文本結果存入pipeline
	for _, data := range resp.GetItems() {
		self.Pipeline.CollectData(
			resp.GetRuleName(), //DataCell.RuleName
			data,               //DataCell.Data
			resp.GetUrl(),      //DataCell.Url
			resp.GetReferer(),  //DataCell.ParentUrl
			time.Now().Format("2006-01-02 15:04:05"),
		)
	}

	// 該條請求文件結果存入pipeline
	for _, img := range resp.GetFiles() {
		self.Pipeline.CollectFile(
			resp.GetRuleName(),
			img["Name"].(string),
			img["Body"].(io.ReadCloser),
		)
	}
}
開發者ID:BobbWu,項目名稱:pholcus,代碼行數:54,代碼來源:crawl.go

示例10: makeUnique

func makeUnique(req *context.Request) string {
	return util.MakeUnique(req.GetUrl() + req.GetMethod())
}
開發者ID:TonyFStark,項目名稱:pholcus,代碼行數:3,代碼來源:scheduler.go


注:本文中的github.com/henrylee2cn/pholcus/app/downloader/context.Request.GetUrl方法示例由純淨天空整理自Github/MSDocs等開源代碼及文檔管理平台,相關代碼片段篩選自各路編程大神貢獻的開源項目,源碼版權歸原作者所有,傳播和使用請參考對應項目的License;未經允許,請勿轉載。