王加年
(常熟理工學院 江蘇 常熟 215500)
近年來,高等教育信息化高速發展,教育管理部門管理信息化、決策科學化水平不斷提高,高校辦公自動化系統的開發和應用得到了廣泛的重視。國外辦公自動化概念提出的較早,發展也較快。以美國為例,從上個世紀60年代初到現在,它的辦公自動化產品每年以20%的速度增長1。至今,全美國80%的信息業已實現了辦公自動化。美國政府高度重視辦公自動化系統的發展和應用,白宮在十多年前已建立了辦公業務系統,這是一個具有一千多個終端的局域網。到21世紀初,美國各高校基本上都建立了適合自身的標準辦公自動化信息系統。
隨著信息技術的高速發展,人們積累的數據量急劇增長,動輒以TB計,如何從海量的數據中提取有用的知識成為當務之急。數據挖掘就是為順應這種需要應運而生發展起來的數據處理技術。是知識發現 (knowledge discovery in database)的關鍵步驟。
數據挖掘(data mining)是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。
數據挖掘在商業上是一種新的商業信息處理技術,其主要特點是對商業數據庫中的大量業務數據進行抽取、轉換、分析和其他模型化處理,從中提取輔助商業決策的關鍵性數據[2]。
簡而言之,數據挖掘其實是一類深層次的數據分析方法。數據分析本身已經有很多年的歷史,只不過在過去數據收集和分析的目的是用于科學研究,另外,由于當時計算能力的限制,對大數據量進行分析的復雜數據分析方法受到很大限制。現在,由于各行業業務自動化的實現,商業領域產生了大量的業務數據,這些數據不再是為了分析的目的而收集的,而是由于純機會的(Opportunistic)商業運作而產生。分析這些數據也不再是單純為了研究的需要,更主要是為商業決策提供真正有價值的信息,進而獲得利潤。但所有企業面臨的一個共同問題是:企業數據量非常大,而其中真正有價值的信息卻很少,因此從大量的數據中經過深層分析,獲得有利于商業運作、提高競爭力的信息,就像從礦石中淘金一樣,數據挖掘也因此而得名。
因此,數據挖掘可以描述為:按企業既定業務目標,對大量的企業數據進行探索和分析,揭示隱藏的、未知的或驗證已知的規律性,并進一步將其模型化的先進有效的方法。

圖1 數據挖掘定義示意圖Fig.1 Schematic diagram of data mining
神經網絡由于本身良好的魯棒性、自組織自適應性、并行處理、分布存儲和高度容錯等特性非常適合解決數據挖掘的問題,因此近年來越來越受到人們的關注。典型的神經網絡模型主要分3大類:以感知機、bp反向傳播模型、函數型網絡為代表的,用于分類、預測和模式識別的前饋式神經網絡模型;以hopfield的離散模型和連續模型為代表的,分別用于聯想記憶和優化計算的反饋式神經網絡模型;以art模型、koholon模型為代表的,用于聚類的自組織映射方法。神經網絡方法的缺點是"黑箱"性,人們難以理解網絡的學習和決策過程。
遺傳算法是一種基于生物自然選擇與遺傳機理的隨機搜索算法,是一種仿生全局優化方法。遺傳算法具有的隱含并行性、易于和其它模型結合等性質使得它在數據挖掘中被加以應用[3]。sunil已成功地開發了一個基于遺傳算法的數據挖掘工具,利用該工具對兩個飛機失事的真實數據庫進行了數據挖掘實驗,結果表明遺傳算法是進行數據挖掘的有效方法之一。遺傳算法的應用還體現在與神經網絡、粗集等技術的結合上。如利用遺傳算法優化神經網絡結構,在不增加錯誤率的前提下,刪除多余的連接和隱層單元;用遺傳算法和bp算法結合訓練神經網絡,然后從網絡提取規則等。但遺傳算法的算法較復雜,收斂于局部極小的較早收斂問題尚未解決。
在設計中主要遵循以下原則:
系統性原則——系統是作為一個整體而存在,因此在系統設計中,要從整個系統的角度進行考慮,系統的代碼要統一、設計規范要標準,傳遞語言要盡量一致,對系統的數據采集要做到數出一處,全局共享。
實用性原則——系統應以用戶的實際需求為導向,并結合先進、合理的管理模式對系統各功能加以實現。確保系統功能實用、操作簡單、易學易用,適合各類人群。
先進性原則——采用的技術既要反映當今的先進水平,又要具有很好的發展潛力,力求方案的先進、靈活、高效。
安全性原則——辦公自動化系統應能保證辦公數據的安全性、有效性和一致性。
擴展性原則——系統的設計既要考慮當前的實際需要及經濟承受能力,又要考慮長遠發展的需要,保證系統的可擴展性,保護原有的投資。
隨著網絡技術和計算機技術在學院內部所發揮的作用日益深厚,數據、公文等信息量的逐漸增大,而且這樣的信息量都是涉及到了各個部門。
因此,諸如文件、報表等傳統的手工處理方式已經不能滿足學院日益發展的需要,這樣的處理方式也會直接制約到學院的發展。針對該狀況,學院迫切需要整合現擁有的計算機和網絡資源,加快實現信息化的速度,促進校方的數據、信息的流通和利用。0A系統在現階段技術手段成熟的條件下,整合了學院先用計算機設備與技術,通過學院工作人員的工作,逐步實現辦公的自動化,從而提高工作效率,最終實現一套完善、成熟的工作流程[4]。該辦公自動化系統目的改善現有舊的工作及教學方式,提供一種隨著時代發展更新的信息化工作環境,以完善的管理信息系統為學院實現全面信息化教學奠定良好的基礎。正是由于該辦公自動化系統的實施,也推動了校園其他信息化基礎的發展。
辦公自動化系統建設是學院實現信息化教育的基礎,旨在推動學院在高科技迅速發展的今天實現教育現代化水平,適應時代的要求,創造出一個嶄新的教學工作環境[5]。而且該以系統又涉及到了學院管理的方方面面,是一項極其復雜的系統工程,因此也受到很多因素的限制。該系統從學院工作的總體出發運用綜合平衡的方法,最終達到最理想的情況。因此,發展辦公自動化系統一般都要經過從小到大、從點到面、從低級到高級的發展過程。
近來,學院的綜合實力不斷提升,學校也感覺到改變整合現用的教學制度,提高學校的管理水平對于一個學院的重要性,原有的辦公制度的弊病也逐步顯示,并且隨著時間的發展,問題越來越尖銳,主要表現在:現有的學院文件和信息在辦公的全過程中都是通過紙張傳遞和貯藏的,純手工上的操作,相較于自動化辦公系統,其存在以下缺點:
速度慢:學校要制定一份文稿,在起草人員修改完后成交由領導審閱,通過了領導審閱領導簽發后又再到發送到相關部門,這樣的流程白白消耗了大部分的時間。如果遇到的是緊急事件,時間就有點倉促了,需要相關人員加班加點。而對于這種情況,計算機網絡就可以大顯身手了,文件定稿后便可以迅速發送到各有關部門,極大地提高了辦事效率。
不便于存儲及查詢:隨著時間得推移,學校的信息量像滾雪球一樣越來越大,紙質載體不斷增加,量大就非常不利于儲藏,也不便查找。文件在簽批后,可能需要同時在多個單位傳閱,需要大約兩周的時間,文件才能回機要室,而且在流轉的過程中可能有部份文件會損壞或者丟失。
成本高:學校用于紙質文件印刷的耗材費用投入巨大。
本辦公自動化系統分為以下六大模塊,幾個模塊之間彼此相對獨立,它們之間的交流主要是用戶的信息,如用戶的賬號和密碼等,功能上都非常獨立,每一個功能實現不同的工作流程控制、信息管理等。現分別敘述如下:
每位教職員工訪問校園辦公自動化系統之后,首先進入系統的登錄界面,只有輸入正確的用戶名和密碼,經過系統的身份驗證之后,才能進入系統的主頁面,系統同時要保存用戶的相關信息。
每位普通用戶都可以通過該模塊查看已制定好的工作日程的詳細信息,包括具體的內容:標題、日期、完成時間等,并可以設為自動提醒;對于個人工作日程,用戶還可以修改、刪除。通過該模塊,用戶可以與他人通過電子郵件相聯系,加強彼此之間的交流,以促進協同工作,同時還可以添加自己的聯系人。
信息瀏覽:每個高校員工能夠通過該模塊查看校園的新聞公告、會議通知、各類教學管理信息,以及共享資源的使用情況,如:計算機機房,各類實驗室,多媒體教室、車輛等。點擊信息標題,可以彈出子窗口顯示其詳細內容。
信息管理:通過管理員的權限設置,某些員工可以擁有對各類信息進行管理的權利,可以定期地添加一些新的信息,對于一些過時的信息予以刪除,并對某些內容及時地做出更新,但是不能修改和刪除他人所管理的信息內容。
根據模塊之間的關系,系統在數據庫端主要分為8個表,為了查詢方便設計了視圖。模型的設計是根據模塊之間的關聯性和獨立性來劃分的。比如會議申請模塊所用到的表包括會議室表和用戶表。下面以核心業務為例來描述數據庫的具體實現[6]。
用戶表(BJ_Users)用來保存用戶的基本信息,如代碼、姓名、密碼等,其中密碼長度在程序中控制,長度不超過 10。結構如表所示。

表1 用戶表Tab.1 The user table
部門表(BJ_Depts)用來保存用戶所在部門的基本信息,如部門代碼、部門名稱、上級部門等。
發文管理主要包括發布發文、發文刪除兩部分。

表2 部門表Tab.2 Department table

表3 發文管理模塊實體屬性表Tab.3 Document management module entity attribute table
會議管理主要包括會議修改、會議刪除、會議發布3部分。當用戶單擊會議標題超鏈接時,進入相關的會議信息詳細頁面,可對會議的詳細信息進行瀏覽。

表4 會議管理模塊實體屬性表Tab.4 Conference management module entity attribute table
一般說來,文件包括內部發文和外部收文兩類。內部發文流程要經過以下幾個步驟:擬稿、核稿、修改、簽發、辦公室審閱、排版打印和存檔;外部收文要經過簽收、領導批閱、下發、相關部門閱辦等步驟。
下面是本系統的開發環境。
1)技術平臺JSP框架。
2)信息服務器:Internet Information Service5.1版本。
3)開發語言:JSP技術框架,實現語言完全采用JAVA語言。
4)數據庫:SQL Server 2005。
5)服務器操作系統:開發過程采用Windows XP Professional操作系統,系統實施后可采用的Windows 2000 Server:或Windows 2003 Server服務器操作系統。
系統登錄是用戶進入系統給的窗口。用戶要進入系統必須輸入正確的用戶名、密碼和驗證碼,否則會進入登錄失敗頁面。登錄模塊的流程圖如圖2所示。

圖2 登錄模塊流程圖Fig.2 Login module flow chart
本模塊中通過對用戶名和密碼的參數綁定來驗證用戶的合法性。本模塊及系統的其他模塊都采用HQL檢索方式。它與SQL語法有些相似,但是HQL是面向對象的,它操作的是持久化類的類名和類的屬性,而SQL操作的是表名和字段。Query接口封裝了HQL查詢語言。在使用HQL檢索方式檢索數據之前,HQL檢索數據的執行步驟如下:
l)通過 Session類的 CreateQuery()方法創建一個 Query對象,CreateQuery()方法的入口參數為String型的SQL語句,在HQL語句中可以包含命名參數.
2)為命名參數賦值 query.setstring(“str User Name”, str User Name);
3)通過調用Query類的list()方法執行數據檢索,它的返回值為List型的結果集。
此外用戶登錄系統還需要輸入正確的驗證碼,來提高系統的安全性。本系統的Images/num文件夾下有文件名為(0-9).gif的10張圖片。利用Math類的random()方法可得到一個大于等于0.0小于1.0的隨機數,這個隨機數用于獲得名稱與隨機數相同的圖片。值得注意的是random()方法產生一個個大于等于0.0小于1.0的隨機數返回值為double類型,在應用時應對其進行強制轉換。
日常管理模塊中主要有會議管理和公告管理兩項功能,如果用戶的權限是“只讀”,則允許用戶查看公告和會議記錄;如果用戶的權限為“系統”,則用戶可以對會議和公告進行添加、修改和刪除等操作。系統支持增加會議室,界面如下圖。

圖3 日常事務管理Fig.3 Daily affairs management
在日常管理模塊中,主要應用了Hibernate技術從數據庫中查找、增加、刪除、修改數據,并對查出來的數據進行分頁顯示。完成上述操作主要應用了Session接口提供了眾多的持久化方法,如 save()、update()和 delete()方法。
1)利用Session的save()方法將臨時對象轉化為持久化對 象 ,session.save (PersistenCeclassesName), 參 數PersistenCeclassesName表示持久化類名稱,用于指定將哪個持久化對象保存到數據庫中。
2)session的delete()方法用來刪除與傳入的持久化對象對應的數據庫當中的記錄,session.delete(Persisten Ceclasse sName);
3)Session的update()方法用來將游離對象重新轉變為持久化對象,也就是更新一個已存在的業務實體到數據庫中session.save;系統所有的分頁查詢方法中都用到了Query接口提供的分頁方法。
系統管理是系統管理員(系統管理權限)的信息維護及管理平臺。主要包括:用戶管理、部門管理、權限管理、論壇管理、公文管理、文件管理[7]。
1)用戶管理:主要實現用戶信息管理、新增加員工、員工調動。包括用戶信息管理頁面person-manage.aspx、新增加員工頁面addmember.aspx、員工調動頁面即deptchange.aspx。用戶信息管理頁面personmanage.aspx。主要有Gridview控件和LinkButton控件。員工管理窗口界面如下圖。

圖4 系統管理界面Fig.4 System management interface
Gridview控件綁定了數據庫表emp和dept,設置控件ID=ernpview,AllowPaging=True,AutogEneratecolumns=False,DataKeyNames=empid。
然后再進入Gridview任務中的編輯列,編輯empview。添加6個BoundField字段,3個CommandField字段。6個BoundField字段為:
員 工 ID:DataField=empid,HeaderText= 員 工 ID,Readonly=True;
姓名:DataField=empname,HeaderText=姓名;
性別:DataField=sex,HeaderText=性別;
所在部門:DataField=meetaddr,HeaderText=所在部門;
住址:DataFiel=address,HeaderText=住址;
郵箱:DataFidd=email,HeaderText=郵箱。
3個commandField字段為:
選擇: HeaderText=選擇,ShowselectButton=True;
刪除: HeaderText=刪除,showDeleteButton=True。
2)部門管理(deptchange.aspx):主要針對部門信息進行修改、設置部門主管、添加部門。
部門信息表設計中Gridview控件綁定了數據庫表dept和emp,后臺代碼調用了oa.cs文件里的oa.BindGridview函數。
部門主管設置設計的后臺代碼調用了oa.cs文件里的oa.bind--dropdownlist函數,完成兩個下拉框的數據綁定。
添加部門設計的后臺代碼調用了oa.cs文件里的oa.bind-dropdownlist函數,完成了部門主管下拉框的數據綁定。
權限管理(access--manage.aspx):管理員設置用戶權限使得用戶可以瀏覽或禁止查看某些信息[8],并對用戶對某項功能的操作有所限制。后臺代碼調用了oa.cs文件里的oa.bind_dropdownlist函數,完成兩個下拉oa.cs文件里的oa.bind_dropdownlist函數,完成兩個下拉框的數據綁定。
全面集成高校自動化辦公的主要業務工作、信息服務和內務管理工作,提供人性化個性化的服務,更加的直觀,可用性、易用性有了相當大的提高。目前,結合數據挖掘的高校自動化辦公系統已經基本開發完畢,從測試情況來看,這套系統基本上達到了預期的設計目標。
[1]馬費成.信息管理與信息系統研究進展[M].武漢:武漢大學出版社,2010.
[2]鄺孔武,王曉敏.數據挖掘開發與管理[M].北京:中國人民大學出版社,2009.
[3]左美云.數據挖掘項目管理[M].清華大學出版社2008.
[4]黃勁榮.關于高校辦公自動化系統建設的思考[J].中國科技信息,2010(21):165,173.
HUANG Jin-rong.The research on construction of office automation system in Colleges and universities[J].China Science and Technology Information,2010(21):165,173.
[5]宋莉芳.構建基于數據挖掘理念的校友管理信息化系統[J].網友世界,2012(22):26.
SONG Li-fang.Construction of concept of alumni management information system based on data mining[J].Net World,2012(22):26.
[6]王國寧.高校辦公自動化系統的設計與建設[D].河南:山東師范學,2009.
[7]李夏隆,張峰.基于Web的校務管理系統架構集成與實施模式研究[J].榆林學院學報,2012(2):58-61.
LI Xia-long,ZHANG Feng.Study on integration architecture school management system based on Web and implementation of the model[J].Journal of Yulin University,2012(2):58-61.
[8]肖笑.基于BCC算法的多機系統PSS參數優化設計[J].陜西電力,2012(12):51-54.
XIAO Xiao.Optimal design of multi-machine power system stabilizer parameters based on bacterial colony chemotaxis algorithm[J].Shaanxi Electric Power,2012(12):51-54.