999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Quartz的可視化爬蟲管理系統

2020-05-18 02:41:13劉曉東林鳳德朱文歡
科技創新與應用 2020年14期
關鍵詞:管理

劉曉東 林鳳德 朱文歡

摘? 要:分布式爬蟲系統復雜的構建過程使其在運行過程中出現任務錯誤的時候得不到及時的反饋和提醒,從而可能導致對應任務渠道的數據存在缺失;另外,對過程數據缺少必要的監控還可能導致所獲數據并非我們最終所需。基于Quartz的可視化爬蟲管理系統可以實現對爬蟲任務狀態和數據進行有效的監控和管理,確保分布式爬蟲系統的穩定、高效運轉,從而解決以上兩點問題。

關鍵詞:網絡爬蟲;Quartz;監控;管理

中圖分類號:TP311.52 文獻標志碼:A? ? ? ? ?文章編號:2095-2945(2020)14-0193-03

Abstract: The complex construction process of the distributed crawler system makes it unable to get timely feedback and reminder when there is a task error in the running process, which may lead to the lack of data in the corresponding task channel. In addition, the lack of necessary monitoring of the process data may also lead to the fact that the data obtained is not what we ultimately need. The visual crawler management system based on Quartz can effectively monitor and manage the crawler task status and data, and thus ensure the stable and efficient operation of the distributed crawler system, so as to solve the above two problems.

Keywords: Web crawler; Quartz; monitoring; management

1 概述

眾所周知,管理是為了提高效率和質量。同樣的,爬蟲管理系統是為了能夠監控分布式爬蟲系統,讓分布式爬蟲系統數據獲取高效,保證數據的質量。爬蟲管理系統是分布式爬蟲系統的有力補充,兩者是相輔相成的[1]。

實現爬蟲管理系統除了要達到監控和管理的基本要求外,一般還要求系統的開發要簡單易上手。Quartz的以下特點可以很好的滿足構建可視化爬蟲管理系統的要求:第一,功能豐富且配置簡單。Quartz的環境依賴程度低,Java的普通應用均能使用;第二,能夠完成較為復雜的定時任務,實現穩定、快速的分布式定時爬蟲系統的構建;第三,由于Quartz各個節點的狀態保存在數據庫中,在已有數據庫表狀態上開發對應的爬蟲管理系統,能夠很好的對分布式系統實現增刪改查的監控和管理[2],提高系統的可操作性和穩定性;第四,Quartz可以結合現如今非常熱門的SpringBoot,使其開發簡單易上手。

2 爬蟲系統的上下游

分布式爬蟲系統的上下游如圖1所示,爬蟲系統集群從網絡中獲取所需數據,根據數據的特性進行編碼,引入Redis來去重,去重后的數據發Kafka集群,供下游應用;同時爬蟲管理端提供RESTful接口,監控爬蟲集群,管理集群中的任務[3]。基于Quartz的分布式實現需要以數據庫作為邊界,為此選取Mysql為基礎數據庫[4]。

3 系統監控和管理

基于Quartz開發的可視化爬蟲管理系統能夠實現監控和管理兩個主要的功能[5]。對于監控會從任務和數據兩個層面來闡述;而對于管理功能主要體現在能夠實現動態的增刪改查。

3.1 任務監控

根據Quartz本身維護的mysql數據庫基礎表并結合自己設計的t_crawler_task表和t_sched_card表可以實現對爬蟲任務的可視化。Quartz本身維護的mysql數據庫表具有節點狀態、任務狀態及抓取數據的統計等內容。如圖2展示了各個節點的狀態。

當要查看單節點中正在運行任務信息時,只需點擊操作就能獲取到相應的信息。如圖3所示,圖中展示了節點中正在運行的所有任務及相關信息。對于任務維度來說,任務自身帶有一些信息,在爬蟲管理端中也實現了對于任務的監控。如圖4所示,在頁面中會展示該任務對應的爬蟲規則,以及是否在集群中運行,是否正在運行,而且還可以通過操作來獲取更多信息,從多個維度來監控任務。總結來說,從節點切入,然后到運行的任務,從而轉向任務層面。任務的監控內容包括任務的基本屬性以及任務與集群的相應關系。如果能實時獲取任務當前狀態,并且提供相應操作提醒,就能實現很好的監控功能。

3.2 數據監控

從整體層次來看,需要監控的就是同種類型數據每天的數據量以及總的數據量。這里,我們只選取一些主要的渠道,每天的數據量和總的數據量,如門戶網站的新聞、快訊、自媒體新聞等等。在對總體數據做粗粒度監控后就需要監控每個渠道對應數據。這里,每個渠道的數據取該渠道過去一周的平均值,且標記出距離當前時間最近一條數據的時間節點。當超過三天沒有數據,對應的渠道的字體就會加粗變色,同時發郵件或短信告知管理者需要關注該渠道出現的問題,如圖5所示。點擊監控可以了解對應渠道在近一個月內每天爬取的數據統計情況,如圖6所示(圖中的例子是看看新聞網渠道)。從以上的展示來看,對于數據的監控先從整體監控,而后轉到關注每一個渠道每天數據量的監控,這樣既能夠很好的從面上展示整體數據,也能夠從細節上監控好每個渠道獲取的數據量。

3.3 動態管理任務

動態的管理任務一方面是指能夠在集群系統正常工作時進行操作,另一方面是指對任務的動態增刪改查及定制化。由于Quartz的實現需要對任務進行各種參數配置,所以要實現動態增加任務,需要在網頁上把對應任務的信息配置到數據庫中,并且通過預留的接口把任務添加到集群中;對于動態修改各種參數,需要先將該任務從集群中剔除,隨后把設置好的任務重新動態添加到集群中;對于刪除任務,需要先把任務從集群中剔除,然后再刪除配置表,這個任務才算完整刪除。

對于按賬號或關鍵字來獲取數據,要實現動態操作賬號或關鍵字的數據,需要維護一張對應的任務賬號表,當需要操作賬號的時候,只需在頁面中修改對應任務賬號表就能夠實現動態操作,而無需停止該任務。

4 結束語

本文基于Quartz架構的特性來構建可視化的爬蟲管理系統,在保證分布式爬蟲系統正常運行的同時還監控了數據的可靠性。爬蟲管理系統是分布式爬蟲系統的有力補充,有了該系統,對于大規模的增加爬蟲渠道、增加數據爬取的維度,只需在網頁上操作,方便且簡易。

參考文獻:

[1]劉志鵬,衛晨.基于Quartz與Spring的動態任務調度系統的設計與實現[J].計算機光盤軟件與應用,2014(13):263-264.

[2]張康.基于Quartz的分布式定時任務調度模塊的設計與實現[D].南京大學,2019.

[3]梁思率,王臻,楊樹國.清華大學儀器共享平臺性能優化實踐[J].實驗技術與管理,2016,33(04):240-243.

[4]張鵬,白朝旭,王錕,等.基于Quartz的集團化調度任務分布部署研究[J].現代電子技術,2014(2):80-83.

[5]葉剛.基于Quartz的可視化定時任務管理方案[J].電子技術與軟件工程,2018(17):139-140.

猜你喜歡
管理
棗前期管理再好,后期管不好,前功盡棄
今日農業(2022年15期)2022-09-20 06:56:20
《水利建設與管理》征訂啟事
聆聽兩會
——關注自然資源管理
2020年《水利建設與管理》征稿函
運行管理
管理就是溝通
中國制筆(2019年1期)2019-08-28 10:07:26
加強土木工程造價的控制與管理
如何加強土木工程造價的控制與管理
解秘眼健康管理
“這下管理創新了!等7則
雜文月刊(2016年1期)2016-02-11 10:35:51
主站蜘蛛池模板: 亚洲国产一成久久精品国产成人综合| 日韩国产一区二区三区无码| 久久精品国产电影| 亚洲三级电影在线播放 | 亚洲 欧美 日韩综合一区| 91成人免费观看在线观看| 成年免费在线观看| 青青久视频| 有专无码视频| 亚洲一区二区三区国产精品 | 久久久久久尹人网香蕉| 在线国产你懂的| 久久人搡人人玩人妻精品 | 国产91无毒不卡在线观看| 91久久偷偷做嫩草影院精品| 午夜高清国产拍精品| 国产成人精品免费视频大全五级| 综合社区亚洲熟妇p| 高清无码不卡视频| 99热线精品大全在线观看| 99re视频在线| 日韩毛片视频| 综合色区亚洲熟妇在线| 无码啪啪精品天堂浪潮av| 精品撒尿视频一区二区三区| 就去色综合| 特级做a爰片毛片免费69| 欧美伦理一区| 鲁鲁鲁爽爽爽在线视频观看| 成人一区专区在线观看| 免费国产高清精品一区在线| 99视频在线免费| 国产精品天干天干在线观看| 国产男人天堂| 久久人搡人人玩人妻精品| 亚洲成人动漫在线观看| 在线无码av一区二区三区| 成人在线观看不卡| 在线观看国产小视频| 欧美亚洲国产精品第一页| 夜色爽爽影院18禁妓女影院| 欧美日韩亚洲国产| 色偷偷综合网| 区国产精品搜索视频| 99在线视频精品| 国产啪在线| 99人体免费视频| 在线观看免费国产| 2020久久国产综合精品swag| 超清无码一区二区三区| 不卡无码网| 在线观看的黄网| 四虎成人在线视频| 国产成人1024精品下载| 露脸一二三区国语对白| 少妇精品在线| 蜜桃视频一区二区| 少妇人妻无码首页| 国产精品综合久久久| 国产91成人| 国产成人做受免费视频| 91蜜芽尤物福利在线观看| 色窝窝免费一区二区三区 | 欧美狠狠干| 亚洲天堂.com| 久久综合九九亚洲一区| 福利视频一区| 人人澡人人爽欧美一区| 日韩黄色在线| 欧美国产日本高清不卡| 欲色天天综合网| 亚洲国产无码有码| 亚洲va欧美ⅴa国产va影院| 国产亚洲欧美日韩在线一区二区三区| 99热精品久久| 亚洲开心婷婷中文字幕| 五月婷婷丁香综合| 久久精品无码一区二区日韩免费| 欧美日韩精品在线播放| 婷婷午夜天| 91免费国产在线观看尤物| 在线观看亚洲精品福利片|