摘 要:教師科研文獻信息的自動搜集是科研成果有效管理的重要手段,將網頁信息的提取方法用于網絡數據庫中文獻信息的自動搜集有廣大的應用前景。提出基于DOM樹和模板的文獻信息提取方法,利用HTML標記間的嵌套關系將web網頁表示成一棵DOM樹,將DOM樹結構用于網頁相似度的度量和自動分類,相似度高的網頁應用同一模板進行信息提取。實驗結果表明該方法在提取網絡數據庫中文獻信息的準確率在94%以上。關鍵詞:網頁信息提取;文檔對象模型樹;模板;文獻信息搜集
計算機應用研究2010年12期
1《師道·教研》2024年10期
2《思維與智慧·上半月》2024年11期
3《現代工業經濟和信息化》2024年2期
4《微型小說月報》2024年10期
5《工業微生物》2024年1期
6《雪蓮》2024年9期
7《世界博覽》2024年21期
8《中小企業管理與科技》2024年6期
9《現代食品》2024年4期
10《衛生職業教育》2024年10期
關于參考網