摘 要:轉錄因子結合位點的計算預測定研究基因轉錄調控的重要環節,但常用的位置特異得分矩陣方法預測特異性偏低。通過深入分析結合位點的生物特征,提出了一種綜合利用序列保守模體和局部構象信息的結合位點預測方法,以極大相關得分矩陣作為保守模體的描述模型,并根據二苷參數模型計算位點序列的局部構象,將兩類信息得分組合為多維特征向量,在二次判別分析的框架下進行訓練和滑動預測。預測過程中還引入了位置信息量以優化似然得分和過濾備選結果。針對大腸桿菌GRP和Fis結合位點數據的留一法測試結果表明,描述模型的改進和多種信息的融合能有效地改善預測方法的性能,大幅度提高特異性。
關鍵詞:轉錄因子結合位點;計算預測;保守模體;極大相關得分矩陣;局部構象;二次判別分析
中圖分類號:Q527
文獻標識碼:A
文章編號:1007—7847(2006)03—0215—09