摘要:天文星表的交叉認證是天文研究中非常重要的基礎工作。新巡天項目和更強大望遠鏡的投入使用,使天文數據爆炸增長,數據量的增加使得兩個星表之間的交叉認證變得非常耗時。描述了如何利用MapReduce實現并行天文星表交叉認證,綜合考慮了算法與體系結構的匹配問題,并給出了在大數據天文星表交叉認證工作的性能評估,通過與廣泛使用的PostgreSQL數據庫的比較,證明了基于MapReduce交叉認證方法的有效性。
關鍵詞:映射化簡;交叉認證;并行;大規模
中圖分類號:TP311 文獻標志碼:A 文章編號:1001-3695(2010)10-3740-04