999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Perl語言統計核酸GC含量程序開發

2019-08-13 08:49:34張婷婷龐雪原晏佳蕓
科技資訊 2019年13期

張婷婷 龐雪原 晏佳蕓

摘 ?要:生命科學領域中無論是PCR還是測序,都需要了解目的核酸的GC含量。由于目前缺乏獨立統計核酸GC含量的程序。該文采用Perl語言編程,設計處理了核酸序列統計GC含量的程序。程序采用了BioPerl環境,利用字符串拆分、遍歷算法和正則表達式對核酸序列進行GC堿基的挖掘。最后該腳本可以應用于Windows和Linux系統。適合用于多環境。

關鍵詞:GC含量 ?生命科學 ?Perl語言編程 ?字符串拆分 ?正則表達式

中圖分類號:TP311.1 ? 文獻標識碼:A ? ? ? ? ? 文章編號:1672-3791(2019)05(a)-0022-02

在生命科學領域中無論是設計引物還是分析高通量測序數據質量都非常關注核酸的GC含量[1]。這是因為在DNA雙鏈中G堿基與C堿基是互補配對的,而且兩個配對堿基之間有3個氫鍵連接(A堿基與T堿基之間是2個氫鍵連接)。所以GC含量的多少對于核酸穩定性來說是十分重要的一個因素,GC含量越高核酸的退火溫度越高,核酸也越相對更穩定。在高通量數據質控中,GC含量也是非常重要的因素。通過檢測GC含量可以判斷測序儀測序是否測序足夠隨機,是否有其他DNA污染。但是,目前沒有一個能夠獨立統計核酸GC含量的程序。雖然在Primer軟件中有統計GC含量的插件,但是不可能把所有的序列都放入Primer中進行逐一統一序列的GC含量,高通量分析軟件fastqc也有統計GC含量插件,但是該軟件僅僅識別fq文件,對于fa文件則不識別。絕大多數時候我們所用的文件是fa(FASTA)文件。

Perl是一種穩定的跨平臺編程語言,是報表提取和報告語言(Practical Extraction and Report Language)的縮寫[2]。它適合用于處理字符串類型的數據。Perl語言是一種開源軟件,根據GUN通用公共許可證(GPL)獲得許可[3]。根據Perl語言的特點,可以設計相關程序完成對核酸序列的GC含量統計。由于DNA序列是由ATCG四種字符組成的字符串,RNA是由AUCG四種字符組成的字符串,所以它們也是一種字符串的數據。利用Perl語言設計程序統計GC含量是可行的。

1 ?分析方法

Perl語言中有專門的叫BioPerl的子程序可以進行核酸文件的讀取。Bioperl可以安裝在普通Windows系統上。統計GC含量的基本原則是C堿基和G堿基總共的數量占整條核酸序列堿基數量的百分比。對于核酸的GC含量分析首先需要對核酸字符串進行分割,拆分成一個一個堿基。拆分后的順序也需要與原序列保持一致。然后使用遍歷算法,逐一進行正則表達式匹配,如果匹配上C或者G就記錄[4],否則不記錄繼續進行分析。具體代碼為:

use Bio::SeqIO;#加載BioPerl子程序

my $input_mutiseq_file=$ARGV[0];#讀取輸入的核酸序列文件

my $Muti_seq=Bio::SeqIO->new(#利用BioPerl中的函數打開核酸序列文件

-file=>$input_mutiseq_file,

-format=>'fasta',);

my @GC_count;#先定義GC含量的變量,數據格式為數組格式,可儲存多條核酸GC含量

my$j=1;

while (my$seq=$Muti_seq->next_seq()){#使用遍歷算法拆分讀取堿基

my $id=$seq->id;

my $seq_seq=$seq->seq;

my $seq_length=length$seq_seq;

my @split_seq = split//,$seq_seq;

my $GC_count;

for (my$i=0;$i<@split_seq;$i=$i+1,){

if(@split_seq[$i]=~"G|C"){$GC_count=$GC_count+1} #使用正則表達式匹配C或G

else{$GC_count = $GC_count}};

$GC_count = $GC_count/$seq_length;

@GC_count[$j]=$id."\t"."GCcount=".$GC_count."\n";

$j=$j+1;};

print @GC_count;#輸出結果

以不同HN分析的流感病毒的4號核酸片段為例,運行該程序得到不同流感病毒4號核酸片段的GC含量結果(見圖1)。

2 ?結語

利用Perl語言開發統計核酸序列的GC含量,對于研究核酸穩定性、測序的隨機性和判斷測序是否有污染具有指導意義。缺陷,由于該腳本的正確運行需要計算機同時擁有Perl語言和BioPerl環境,而整個Perl語言及其環境配置相對繁瑣。

參考文獻

[1] 陳永孜.基因表達譜芯片及核酸測序技術在癌癥研究中的應用現狀[EB/OL].[2019-04-04].http://kns.cnki.net/kcms/detail/23.1513.Q.20190308.1256.002.html.

[2] 劉磊,朱敏.Perl&R在語料庫語言學中的應用[J].軟件導刊,2018,17(1):53-55.

[3] 顧武雄.Linux代理程序安裝[J].網絡安全和信息化,2018(11):87.

[4] 武明,孫壘,高磊,等.Perl腳本在試驗數據解析中的應用[J].遙測遙控,2016,37(3):54-56.

主站蜘蛛池模板: 亚洲成a人片| 少妇高潮惨叫久久久久久| 国产在线第二页| 国产资源免费观看| 麻豆精品在线视频| 欧美一级在线看| 国产浮力第一页永久地址| 人妻91无码色偷偷色噜噜噜| 夜夜操国产| 久久精品国产精品青草app| 久无码久无码av无码| 伊人色天堂| 中文字幕调教一区二区视频| 国产高清无码麻豆精品| 国产成人综合日韩精品无码首页| 亚洲侵犯无码网址在线观看| 亚洲中文字幕97久久精品少妇| 国产女人18毛片水真多1| 91福利免费| 成年人免费国产视频| 五月婷婷丁香综合| 国产91在线|日本| 欧美日韩激情| 88av在线看| 中文毛片无遮挡播放免费| 国产乱人激情H在线观看| 日韩在线观看网站| 婷婷色在线视频| 免费日韩在线视频| 日本人妻丰满熟妇区| av在线手机播放| 视频二区亚洲精品| 日本亚洲欧美在线| a级毛片一区二区免费视频| 欧美午夜在线视频| 国产理论一区| 国产女人在线观看| 国产一区二区三区视频| 91娇喘视频| 99中文字幕亚洲一区二区| 成人综合网址| 亚洲三级影院| 国产又黄又硬又粗| 亚洲日韩AV无码一区二区三区人| 免费毛片a| 久久精品电影| 永久天堂网Av| 国产精品无码作爱| 久青草网站| 欧美一级片在线| 全部免费特黄特色大片视频| 亚洲福利片无码最新在线播放| 91日本在线观看亚洲精品| 成人年鲁鲁在线观看视频| 狠狠操夜夜爽| 在线亚洲小视频| 久无码久无码av无码| 久久久受www免费人成| 极品性荡少妇一区二区色欲| 中文无码日韩精品| 欧美在线网| 国产av剧情无码精品色午夜| 国产裸舞福利在线视频合集| 手机在线免费不卡一区二| 亚洲欧美成人影院| 97精品国产高清久久久久蜜芽| 欧美不卡在线视频| 国产xx在线观看| 无码又爽又刺激的高潮视频| 久久亚洲黄色视频| 露脸一二三区国语对白| 亚洲精品福利视频| 久久性妇女精品免费| 色AV色 综合网站| 亚洲首页在线观看| 国产95在线 | 中文字幕乱码二三区免费| 国产91高清视频| 精品国产成人高清在线| 国产性猛交XXXX免费看| 亚洲另类色| 欧美第二区|