楊力
摘 要 在互聯網發展當中開放服務已經成為重要發展趨勢,有大多數企業都在互聯網上發布Web服務,這樣就逐漸突出了其在日常生活學習當中的重要性。現階段,互聯網Web服務主要包括傳統結構化服務和非結構化服務等。此次研究主要是探討分析RESTfulWeb服務開放平臺的設計與實現,希望能夠對相關人員起到參考性價值。
關鍵詞 RESTful Web 服務開放平臺 設計實現
隨著移動互聯網產品的發展,逐漸進入了移動互聯網時代,因此在開發產品期間需要接入第三方Web服務,這樣能夠在較短時間內完成產品開發,全面提升產品的用戶體驗。作為分布式計算模型,Web服務能夠是將異構平臺上運行的不同應用不需要依靠于第三方根據,只需要根據Web服務規范實施操作,就能夠對數據進行交換。所以,在互聯網發展期間Web能夠給予大量的數據信息。
1基于余弦相似度的RESTfulWeb服務識別算法
1.1算法過程
在算法步驟當中主要包括以下幾個步驟:(1)抓取原始數據,利用爬蟲引擎抓取HTML頁面,保存為原始頁面庫,這樣能夠為后續操作提供原始數據;(2)網頁去噪:對原始HTML頁面實施去噪預處理,輸出頁面主體內容。(3)使用Python開源中文分詞庫對頁面主體文本實施分詞處理,輸出頁面單詞庫;(4)將停用詞去除,對比分析停用詞表和(3)當中的輸出單詞庫,將單詞庫當中的停用詞去除,輸出有效單詞庫。(5)特征向量提取,使用TF-IDF算法能夠對單詞庫當中的詞語權重進行計算,之后按照其權重排序獲取文件特征詞庫,將特征向量輸出;(6)匹配特征向量的余弦相似度。
1.2實驗結果與分析
(1)實驗數據來源:在此次實驗當中訓練樣本集為RESTfulWeb服務文檔頁面,分別采集百度APIStore和云聚數據等中文API市場;測試樣本主要是在網購開放平臺上抓取的普通JTTP頁面合成,使用識別算法處理和識別測試樣本集。
(2)實驗過程:為了驗證此次研究當中RESTfulWeb服務的實效性,需要按照算法步驟對樣本進行分詞處理,頁面去燥,對單詞庫當中詞語權重進行計算,之后根據權重進行排列。設置特征向量維度為dimen,將前dimin個單詞作為特征單詞,因此權重構成訓練集特征向量。對于測試樣本集來說,則需要根據COSINE_SIMILAPITY_MATCHING算法過程,將識別結果輸出。
(3)分析實驗結果:此次研究主要是從RESTfulWeb服務識別結果的召回率和準確率方面分析實驗結果,召回率為識別結果為“真實服務”的RESTfulWeb服務中識別正確個數所占測試樣本集中存在的服務比例,準確率是識別結果為“真實服務”的RESTfulWeb服務所占比例。對測試樣本集當中的RESTfulWeb服務總數記錄為total,識別結果為“true”的RESTfulWeb服務總數記錄為“rec”,因此在以上服務當中識別正確的個數rst“”,因此召回率為rst/total,準確率為rst/rec。
在對算法過程進行分析能夠看出,余弦相似度匹配閾值threshold和特征向量維度dimen會影響實驗結果的召回率和準確率。按照此次實驗結果能夠看出,本章所提出的余弦相似度RESTfulWeb服務識別方法效果良好,能夠滿足目標。算法步驟較為清晰,能夠達到準確性和高效性,能夠實現服務識別和發現功能要求。此算法所具備的服務發現和識別模塊能夠給予服務開放平臺準確穩定的服務來源,并且為服務接入提供技術支持。
2設計與實現
2.1服務搜索架構設計
該服務搜索主要包括檢索系統,服務庫,搜索界面以及索引系統等,服務搜索模塊流程為利用HTTP解析器解析服務庫當中的服務接口頁面,由Luence索引模塊建立索引,存儲索引文件。用戶利用搜索界面輸入所需服務信息,過濾和分析輸入信息和分析模塊,之后在存儲文件當中檢索,在處理檢索結果之后反饋給用戶。
2.2服務接入設計
服務接入架構主要包括服務路由,請求,服務節點和響應接口等。其中響應接口與請求與用戶實現數據交互,將用戶請求輸送到服務路由模塊,之后將訪問結果反饋給用戶。服務路由能夠拆分用戶請求參數,之后按照參數將其輸送到各相應服務節點處理,可以在服務緩存數據庫當中查詢,在服務庫當中相同服務能夠組成同類服務節點,在服務成功之后能夠更新服務緩存數據庫。
2.3實現方案
主要流程:服務接入模塊主要包括數據庫緩存,參數拆分,服務節點響應和請求分發等功能。其工作流程為:(1)請求接口接入用戶請求,之后在日志系統中記錄請求;(2)處理用戶服務請求,驗證和轉換參數;(3)按照參數選擇合適的服務緩存,若本地服務緩存不存在本地緩存,則不使用本地緩存,需要選擇對應的服務節點進行響應,避免直接在本地緩存當中查找數據。(4)對于本地無法成功響應的服務請求來說,則需要按照參數路由到響應服務節點,能夠詳細記錄該節點冗余服務列表,之后根據列表當中的優先級順序對服務器請求進行調用。
3結束語
綜上所述,本文主要是分析研究了RESTfulWeb服務開放平臺當中服務接入模塊的設計與實現,介紹了RESTfulWeb服務識別算法,并且對原始服務器當中存在問題進行分析,全面促進RESTfulWeb服務開放平臺的優化設計。
參考文獻
[1] 劉靖,陳文杰.基于變異測試的RESTful Web服務測試數據優化生成方法[J].東南大學學報(自然科學版),2017,47(03):472-477.