摘要:采用asp語言,開發基于IIS+MS SQL Server 2003系統的信息服務平臺,采用模塊化的設計思想,建立了大容量、高速度、高安全性的水產品信息網。該信息網能夠實現信息的自動采集、處理、發布與存儲,信息資源具有較好的準確性、時效性和擴展性。信息網具有供求信息發布,企業名錄,產品展示平臺,商業服務平臺,會員助手等欄目,并具提供分級審核的后臺管理。本研究所建立的水產品信息網可以為水產品加工企業和相關從業人員及時、準確地傳遞水產品加工行業的政策、科研、生產與商場信息,為正確地指導水產品加工、生產、銷售、加強宏觀調控提供依據。
關鍵詞:水產品;信息采集;網絡建設;信息網
中圖分類號:S126文獻標識碼:ADOI編碼:10.3969/j.issn.1006-6500.2011.01.036
Establishment of the Information Station of Fishery Products
ZHANG Qiu-liang1,2, XIONG Shan-bai1,2, ZHAO Si-ming1,2, HONG Jun1
(1.College of Food Science and Technology, Huazhong Agricultural University, Wuhan, Hubei 430070, China; 2.National R D Branch Center for Conventional Freshwater Fish Processing, Wuhan, Hubei 430070, China)
Abstract:Asp language has been used to develop a information platform based on IIS + MS SQL Server 2003 systems. A large capacity, high speed and high security information station of aquatic products was built by using modular design. The information station integrates automatic information collection, processing, distribution and storage and information resources showed better accuracy, timeliness and expansibility. The information station provides with supply information dissemination, business directories, product exhibition platform, business service platform, membership assistant and other columns and also offers the background management of a classification review. These aquatic information stations were established for aquatic product processing enterprises and related employees to timely and accurately transmit the information of industry policy, research, manufacture and marketing and to provide the basis for the correct guidance of aquatic products processing, production, sales, strengthening the macro-control.
Key words: fishery products; Information-gathering; network construct; information station
隨著網絡信息時代的到來,水產品加工信息化已經成為增強企業的綜合實力和市場競爭力的一個十分有效的手段[1]。中國地域遼闊,水產資源豐富,但水產品生產情況和水產品經濟狀況在不同地區差別很大,即使在一個省的范圍內也是如此。因此,只有通過水產品加工信息化建設,企業才能更有效地提高生產效率降低成本,提高產品質量和增強企業的市場反應能力,各級政府才能做出及時、正確的決策[2]。近年來,中國水產品加工業作為一個傳統的行業在信息化建設方面也已取得了一些成就,但還遠遠不夠,信息化程度與發達國家相比還有相當的差距。
水產品網絡信息化在發達國家已經非常完善,目前國外重要漁業網站有:亞太水產養殖中心網、聯合國糧農組織漁業、世界水產養殖學會、歐洲水產養殖學會等魚類網站[3]。這些網站的優點是信息發布權威及時、信息量大、內容專業,服務專業化等。相對而言,中國的水產加工信息化建設起步較晚,但這幾年也有較快的發展,目前國內重要漁業網站有:中國水產網、中國漁貿網、中國漁網、中國漁市、中國漁業網等魚類網站[4],但大多數網站僅僅局限于簡單的新聞發布,信息量及更新速度比較有限[5]。
信息經濟作為一種比工業經濟更高級的嶄新經濟階段,將為中國水產品發展提供千載難逢的機遇,如果我們能夠抓住它并充分合理利用,則可加速中國水產品現代化目標的實現[6]。水產品加工信息化的核心是開發利用水產品信息資源,而本水產品加工信息網的建立旨在提供一個一體化的信息管理平臺,相對目前的信息交流商務平臺具有一定的先進性,但要想建立具有一定影響力的信息權威平臺任重而道遠,筆者旨對水產品加工信息網的建立做出一定的探索[7]。
1 水產品加工信息網系統設計
1.1 試驗工具及平臺
開發平臺:本程序基于WINXP+IIS+Microsoft SQL 2003數據庫,采用ASP編寫。
開發工具:Macromedia Dreamweaver 2004,Macromedia Fireworks MX 2004,Macromedia Flash MX 2004。
1.2 系統設計
1.2.1 系統功能 水產品加工信息網是提供信息采集,加工,交流的互動平臺,該平臺主要提供以下功能:對水產品信息網的資源進行輔助采集,保證采集資源的實時性和高效性;對水產品加工的相關內容進行加工,發布;能夠實現供應,采購、產品展示、信息咨詢及人才招聘等商務平臺功能。
1.2.2 設計思想 水產品加工信息網的特點就是利用Browser/Server(B/S)結構,實現水產加工信息采集、交換的功能。這種系統的優勢在于系統功能比較完善,集成度高,擴充能力良好以及能夠方便地跨地域操作等性能[8]。
本系統的功能目標是要將現有的水產品加工的信息進行有機的整合,在充分挖掘現有信息資源的基礎上,使企業直接面對客戶,加速信息采集交流的速度,以期創造更多的價值[6]。圖1是網絡應用原理示意圖。
1.2.3 設計方法 (1)搭建合適的硬件平臺:Windows XP + IIS 6.0 + MS SQL SERVER 2003。
(2)采取模塊化設計,現根據系統要求設計出各個模塊。
(3)對于程序的調試采取一邊編寫一邊調試的方法,這樣可以減少日后修改程序的工作量。
(4)對于界面設計采取先在紙面上設計好草圖,然后用Fireworks MX 2004設計出效果圖,如果滿意后用工具自帶的切片功能將效果圖切分成基本網頁形式 ,然后用 Dreamweaver MX 2004編輯,做進一步的修改,最后再將ASP及Javascripts代碼插入相應的位置[9]。
1.3 系統配置
(1)本系統使用Microsoft的IIS 6.0作為系統服務器程序平臺,使用Windows 2000高級服務器版;(2)進入IIS服務器的WEB根目錄創建ASP應用程序。
2 系統數據庫設計
根據系統功能設計的要求以及功能模塊的劃分,下面給出在水產品加工信息網的各個組成部分的數據項和數據結構。
(1)管理員信息數據庫:用戶ID、用戶名、密碼、管理權限,最后一次登陸的時間、最后一次登陸的IP地址。
(2)企業名錄管理信息數據庫:應包括用戶基本信息,如用戶ID、密碼、密碼提示問題等;企業信息,如企業名稱、類別(加工企業、養殖企業、銷售商等)、性質、企業簡介、產品,聯系方式等相關信息;是否注冊為高級會員、付費會員通過標志、公司名錄審核標志、會員審核標志等。
(3)留言本數據庫:留言ID、信息內容、聯系人、公司名稱等信息。
(4)行業大類信息數據庫:大類編號、大類名稱等。
(5)行業小類信息數據庫:小類編號、所屬大類名稱等。
(6)商業服務信息數據庫:內容ID號、內容標題、文件名、文件路徑、內容等信息。
(7)行業信息數據庫:信息ID、標題、內容、點擊次數等。
(8)在線咨詢信息數據庫:信息ID、用戶姓名、電話、電子郵件等信息。
(9)貿易機會信息數據庫:信息ID、內容顯示標題、價格說明、信息有效期等。
(10)招聘信息發布數據庫:信息ID、招聘主題、信息類型、信息內容、招聘人數、工作地點等信息。
(11)招聘信息人才資源數據庫:帳號、密碼、姓名、身份證、性別等個人信息。
(12)網站新聞信息數據庫:信息ID、標題內容、發布人、點擊數、所在欄目、添加時間。
(13)產品展示信息數據庫:信息ID、產品編號、產品名稱、大類(淡水類、海水類)、小類(魚類、蝦蟹類、貝類等)、生產廠家、產品商標、產品產地、價格等。
3 網絡程序基本模塊的開發設計
3.1 信息采集模塊
作為一個信息資源網,必須保證其具有足夠多并且有效信息量,所以在本信息網日常維護中,信息采集是一個非常重要的環節。本模塊開發的目的是提高信息采集準確性和時效性。
本模塊設計的面向水產加工主題的Web采集模塊,采用頁面鏈接級、頁面鏈接上下文級、頁面內容級三重過濾機制,這樣既保證信息采集的質量,又能提高信息采集的效率。在輸入一批種子鏈接作為信息收集起點之后,就可以在盡量短的時間內收集到盡量多的與水產加工主題相關的Web頁面。
3.1.1 Web 信息采集模塊結構 信息采集模塊結構見圖2。
信息采集模塊的工作過程是當下載庫為非空時,自動選擇與主題相關度最高的URL進行頁面下載,通過頁面內容相關度計算來過濾頁面,相關度低的頁面做丟棄處理,重新選擇下載庫中的URL進行下載。對于相關度高的頁面首先儲存該頁面文檔并同時抽取該頁面中的子鏈接。為提高頁面的收集速度需要對抽取的子鏈接進行頁面鏈接級及頁面鏈接上下文級兩層過濾,低相關度的子鏈接丟棄,一般相關度的子鏈接放入待選庫由人工來選擇,而具有較高相關度的子鏈接通過URL記錄驗證后放入下載庫成為新的頁面下載鏈接,如此過程反復循環直到下載庫為空或人工干預停止,以達到基于主題的Web采集目的。此外,由頁面內容過濾后所儲存的頁面文檔,首先按重要性排序后,由模塊自動安排頁面的重新下載,保證含有重要內容的頁面得到及時的更新。
3.1.2 模塊的關鍵技術及其實現 前面介紹過該采集模塊的工作過程,下面將敘述該模塊的幾個關鍵部分的主要技術實現。
(1)主題的框定及相關度計算。由于用文檔矢量模型來表示頁面文檔內容,不僅算法簡單而且在此基礎上的文檔相關度計算的計算復雜度也小,非常適合于實時的網頁處理,故本模塊采用了文檔矢量模型來表示頁面文檔的內容。主題的框定實質就是生成能夠代表主題相關文檔的基準文檔向量RDV。RDV 的生成是一個不斷重復的過程,首先對一個樣本關鍵字進行抽取,將樣本文檔表示為關鍵字的向量形式,然后與先前得到的RDV進行合并,在先前得到的RDV 中沒有出現過的關鍵字加入RDV 中,并對RDV已有的關鍵字的權值進行調整。這樣經過大量樣品文檔的訓練,最終得到一個能代表特定主題文檔內容的基準向量[10]。
1)文檔的矢量空間表示
參照文獻[11],設D是一個包含m篇文檔的文檔集合,D={d1,…,di,…,dm}i=1,2,…,m。文檔集合中的任一文檔di都可以表示為關鍵字空間中一個n維向量,di={di1,…,dij,…,dim},i=1,2,…,m,j=1,2,…,n,其中dij,為文檔di的第j個關鍵字分量。具體文檔矢量有以下幾種表示方法:
簡單的二值矢量
dij=1第j個關鍵詞屬于dij
0第j個關鍵詞不屬于dij
基于詞頻的表示
dij=tij第j個關鍵詞在dij中出現的次數
0第j個關鍵詞不在dij中
基于tf.idf表示
dij=tij×lg(N/nj)
N是文檔數據庫中文檔總數,nj是文檔數據庫中含有第j個關鍵詞的文檔數。這種方法可以得到相關主題的特有特征信息,精度較高。
2)文檔相關度計算模型
參照文獻[11],假設用Di={di1,…,dim},Dj={dj1,…,djm}分別表示第i個和第j個文檔矢量,采用余弦系數法計算文檔的相關度,
similarity(Di,Dj)=
在系統主題框定,信息過濾及搜索算法中都將用到該公式去計算兩文檔之間的相關度。
(2)頁面三重過濾與頁面搜索算法
對于鏈接的相關度的計算,本模塊參照潘春華的三重過濾結合啟發式搜索算法。同時,因為本系統希望盡可能持續下載盡可能多的相關頁面,取消了網絡檢索深度、檢索節點個數限制和檢索時間限制,改為由人工發布命令結束過程,或當下載庫為空時自動結束。該算法將Internet看成是一個具有大量節點和節點間連線的網絡模型(圖3)。頁面是節點,超鏈接是節點間的連接。算法從一個節點開始,給定代表主題的RDV和鏈接級限制條件,以該原始節點為中心,查看周邊節點,查找與主題最可能相關的頁面節點。它用矢量模型來表示文檔,用矢量模型的相關度計算模型來計算頁面文檔間的相關度similarity。在計算一個子鏈接的相關度時,綜合利用了文檔鏈接的上下文信息。包括鏈接中的Anchor文本,以及鏈接周圍的文字,都參加了該鏈接相關度的計算。在每輪預測后,取具有最高預測相關度的鏈接URL進行下載,然后再進行新一輪的預測計算。一直到下載庫為空或收到停指令為止[10]。
(3)網站重要程度計算模型
由于Internet上的信息時刻都在不斷地更新、不斷增長,為了使已經下載下來頁面信息與網絡上的信息保持一致,需要不斷地刷新本地頁面庫。在本模塊中是根據網站的重要程度由模塊來安排更新策略的。在計算網頁的重要程度時,本模塊借鑒了Hub(Site)和Authority(Site)的概念[12]。
Authority (page) = sim (page) + ΣHub (link_page)i
Hub (page) = sim(page) + ΣAuthority (link_page)i
H (site) = ΣHub(site_relevant_page)i
A (site) = ΣAuthority (site_relevant_page)i
Importance (site) = m×H (site) + (1-m)×A (site)
在本模塊中根據Importance (site)來衡量網頁的重要程度,以便在更新數據庫信息時作出合理的安排。
3.2 信息輸出模塊
信息輸出模塊是水產品信息網的重要組成部分,在這里,會員用戶可以獲取到本信網所收集到的國內外最新水產相關信息資源,企業可以在此進行產品展示及企業形象推廣等。信息輸出模塊包括信息發布、產品展示及企業展示等幾個部分。
3.2.1 信息發布該模塊采取的是傳統的文章管理發布模式,它的原理在這里只做簡要介紹:它的關鍵在于內容的分類整理,所以在設計中采取一級和二級欄目,這樣可以找到需要的資源。該模塊的流程如圖4。
3.2.2 產品展示該模塊主要是提供一個企業優秀產品的展示平臺。它將企業的產品通過圖文并茂的形式展現出來,開發關鍵是產品的各種屬性之間的關系,如圖5產品展示模塊。
3.2.3 企業展示在構建信息網的時候,筆者考慮要為企業用戶提供盡可能多的有價值信息。本信息網可以通過為企業用戶提供一站式服務。如圖6所示企業展示模塊。
3.3 管理類模塊
本模塊服務包括對會員登錄本站的賬號、密碼、自設問題和自設答案進行修改。可以登錄會員助手管理界面,在導航欄上點擊會員助手即可登陸。
3.3.1基本資料管理該項服務包括對會員登錄本站的賬號、密碼、自設問題和自設答案,以及會員注冊提交的基本資料進行修改。
3.3.2公司信息管理該模塊服務幫助會員將自己的公司信息添加到“企業名錄”中,輕松擁有在水產品加工信息網的公司網站;網站的功能全智能化服務,會員可以隨時進行管理、修改所發布的公司網頁,并借助于水產品加工信息網的系統平臺達到企業名錄的目的,這樣大大地提高了公司整體形象和產品信息的宣傳推廣。
3.3.3供求信息管理該模塊服務幫助會員輕松地發布供求信息,同時會員還可以隨時管理、修改其所發布的信息。
3.3.4 產品信息管理該模塊服務幫助會員輕松地發布會員企業的產品信息,同時會員還可以隨時管理、修改所發布的產品信息。
3.3.5人才市場管理該模塊服務幫助會員輕松地發布企業的招聘信息,在線查詢人才。同時,會員還可以隨時管理、修改所發布的招聘信息。
3.3.6反饋信息管理查看每天客戶的反饋信息,與客戶在線溝通交流,實現網上交易的目的。
4系統安全性
因為IIS(即Internet Information Server)的方便性和易用性,使它成為最受歡迎的Web服務器軟件之一。但是,IIS的安全性卻一直令人擔憂。而水產品加工信息網在安全方面提出了更高的要求。創建一個安全可靠的Web服務器,必須要實現Windows 2000和IIS的雙重安全,因為IIS的用戶同時也是Windows 2000的用戶,并且IIS目錄的權限依賴Windows的NTFS文件系統的權限控制[13]。
5 程序試運行
水產品加工信息網設計采取模塊化設計思想,結構清晰,不會因為信息量的劇增造成信息的混亂。如圖7為系統主界面。本系統從“http://localhost/caiji/main.Asp”即可以進入系統界面。在主界面點擊信息采集就可進入信息采集模塊,圖8為采集模塊實時采集的頁面。
圖9是企業名錄管理界面,在這里,會員可以按行業、類別尋找貿易伙伴,了解相關企業的詳細資訊。同時,會員也可以將自己的企業信息免費添加到企業名錄中,用戶可以輕松地進行企業形象推廣和產品信息發布等活動。圖10是水產品加工信息網的商務服務界面,信息網主管部門可以通過此模塊向用戶提供有價值的商業服務相關的信息,包括職業培訓、營銷技巧、企業管理、法律咨詢、合同樣本、規章制度等相關信息內容。
6 結 論
本信息資源網是基于IIS+MS SQL Server 2003服務系統,采用asp語言開發的高性能信息共享平臺。該信息網采用模塊化設計,能夠實現信息的自動采集、處理、發布與存儲,面向主題的信息采集及自動分級更新設計使得本站信息資源具有較高的準確性、實時性和擴展性。本信息網包含信息發布、供求信息發布、企業名錄、產品展示平臺、商業服務平臺、會員助手等欄目,并配有分級管理的后臺程序。
參考文獻:
[1] 李明樹. 農業信息技術的發展趨勢[J]. 智能機研究動態, 2002 (2): 25-29.
[2] 宗穎生. 關于中國農業信息化問題的探討[J]. 生產力研究, 2001 (6): 105-138.
[3] 徐克英. 21世紀農業現代化的發展趨勢[J]. 農業信息化, 1999, 20 (4): 215-217.
[4] 王治國. 關于我國農業信息化建設的思考[J]. 農業圖書情報學刊, 1997 (2): 68-75.
[5] Udink ten Cate A J, Dijkhuizen A A. Information and communication technology applications in agriculture [J]. Computers and Electronics in Agriculture, 1999, 22: 83-250.
[6] 趙承, 蔣建科. 我國農業信息化初具規模[N]. 人民日報, 2000-11-30.
[7] Godwin R J, Wheeler P N, O’Dogherty M J, et al. Cumulative mass determination for yield maps of non-grain crops [J]. Computers and Electronics in Agriculture, 1999, 23 (2): 85-101.
[8] Tomaszewski M A, Dijkhuizen A A, Huirne R B M, et al. Management information system impact on dairy production for selected herds in Texas [J]. Computers and Electronics in Agriculture, 2000, 26 (1): 1-11.
[9] 高亮之. 農業信息化[J].技術監督實用技術,1998 (4): 13-14.
[10] 潘春華, 武港山. 面向主題的Web信息收集系統的設計與實現[J]. 小型微型計算機系統, 2003, 24 (12): 2150-2154.
[11] Salton G, McGill M. Introduction to modern information retrieval [M]. New York: McGraw-Hill, 1983: 450-451.
[12] Jon M K. Authoritative sources in a hyperlinked environment [J]. Journal of the AMC, 1999,46(5):604-632.
[13] 宋治文, 賈寶紅. 網絡環境下農業信息資源的建設及開發利用[J]. 農業圖書情報學刊, 2001 (2): 51-52.