黃威威 郭子健
摘? 要:自從世界第一臺計算機問世將近一百年歷史了,從初代占地幾間房子到現在可隨身攜帶,計算機的發展大家有目共睹。計算機的進步也方便了科學研究,變成良性循環。跟著科學的發展,計算機也將有不同的發展方向。本文主要闡述了計算機大型網站的技術與排錯。
關鍵詞:大型網站;網站排錯
大型網站架構演化發展歷程
初始階段的網站架構
小網站最開始沒有太多人訪問。架構:應用程序、數據庫、文件等所有的資源都在一臺服務器上。
應用服務和數據服務分離
在應用與數據分離后,整個網站使用了三臺服務器,對硬件資源有不同的要求:應用服務器處理大量的業務邏輯,需要更快、更強大的 cpu;用于快速磁盤檢索和數據緩存的數據庫服務器需要更快的磁盤和更大的內存;用戶上傳大量文件的文件服務器需要更大的磁盤。
大型網站應用及排錯
服務器硬件問題
1.網線故障--丟包--失聯? ==>更換網線? ethtool? 網卡協商速率speed:1000mb/s-100mb/s。怎么樣判斷一個服務器是否丟包??登陸服務器然后ping網關。(1k-5K次)ping -t 10000 -i 0.01?? x.x.x.1;ping的結果怎么計算出來的?網線線序:橙白 橙? 綠白 藍? 藍白 綠? 棕白 棕?? 568B或 綠白 綠? 橙白 藍? 藍白 橙? 棕白 棕?? 568A?? 1 3? 26對調ethtool 網卡名字
2.板載網卡故障---->更換主板(幾率很小)萬兆網卡是外接的網卡-->安裝驅動-->重啟機器 ixgbe? 使用光纖+萬兆光模塊? 無光對有光,有光對無光(怎么插光纖)萬兆網卡協商速率是 10000m/s? inter原廠萬兆網卡只識別原廠inter萬兆模塊,不識別oem(白牌)(a貨)四口bond浪費交換機端口? 如果上完萬兆的機器不通,怎么處理?1 首先現場ip a? 看看網卡起沒起來,有沒有IP地址 2 登陸交換機去看看VLAN劃沒劃錯 3 讓現場再次確認光纖是不是插錯了,是不是物理鏈路有問題 4 換個模塊試試,有時候模塊故障率非常高
先系統再硬件的方式去排查1有一些應用服務起不來,一定要看看是不是機器沒有內存了2內存如果出現故障會導致什么現象:自動重啟。無緣無故自動重啟-->crontab---->rc.local--->開機啟動的腳本--->看看內存,現象2:卡在F1界面要按F1才能過去,進入系統。please press F1 to解決方法? 更換內存 或者插拔內存(同型號 同容量)DIMM電源問題-->1單電? 2雙電???? -->冗余工作方式 不同型號及品牌的服務器電源冗余工作方式是不一樣的,電源1-->工作? 電源1-->工作? 電源2--> 工作? 電源2-->備用 1壞2頂上電源分為750W? 500W? 570W? 650W?? 瓦特? 根據舊的型號去換。不能隨便換判斷電源故障:1外觀? 燈(綠)(紅)(不亮)故障 2管理卡日志PSU1 erro PSU2 erro(電源) 3 開機自檢報錯 故障燈--(紅) 滅 psu1 error??? psu2 error
主板故障解決
現象:開機黑屏或開機死機,更換主板,不影響數據(這些操作由機房值守或者廠家來做)前提:a有值守 b服務器在保修期內(專業點:在保)。RAID卡故障(陣列卡),現象:無法顯示硬盤(所有)及不能CTRL+R進入RAID卡。解決方法更換 raid卡? 或者首先插拔RAID卡。硬盤背板故障,現象:硬盤燈全部不亮,解決方法:更換硬盤背板及SAS線,如單個硬盤燈不亮或者為紅為硬盤故障。風扇不轉了,管理卡日志:fan1 error fan3 error解決方法:更換? 遠程管理卡(板載)如果想要使用必須進入bios配置管理卡遠程管理IP地址。如果出現故障,可以忽略。所有操作現場弄
IP地址及網卡
只要通電管理卡即可使用,管理卡有管理卡的ip地址,實現無人值守機房的故障處理,可實現設備重裝操作,重啟操作,等任何操作,不依賴內外網 網絡,依靠自己的管理卡網絡,需提前劃分。賬號問題(sudo)升級內核失敗(內核調參)(內核可以選擇)內核調參是系統優化里的東西,升級內核,不要刪除其他內核,防止內核升級失敗,可以用其他內核啟動機器。網卡配置文件問題 ping ip 解決方法 查看及修改和重啟網絡? /etc/sysconfig/-----ifcfg-eth0-----ifcfg-eth3修改前備份:ifcfg-eth0.bak 單獨開啟和關閉一個網卡的命令:ifdown eth0? ifup eth0這是經過修改的。如果直接使用centos鏡像安裝網卡名字是 ifcfg-im? 是否有IP地址 eth0 eth1 eth2 網絡層VLAN,系統(IP),本地都沒有問題,但是就是ping不通服務器。a 95%?? 機器沒有路由了,需要添加路由 b 防火墻過濾規則,不允許你的IP地址ping 服務器
路由器問題
添加路由2種方法 ?1種 臨時添加(重啟失效)2種 永久添加(永久生效)查看路由表route -n 添加靜態路由:# route add -net 10.18.45.0 netmask 255.255.255.0 gw 10.18.45.1 刪除靜態路由:# route del -net 10.18.45.0 netmask 255.255.255.0 gw 10.18.45.1路由 route -n 添加默認路由或者靜態路由(重啟就沒了) 防火墻(默認關閉)selinux(disabled)1 臨時添加及刪除及查看本機路由? 2? 永久添加路由? 如果做了bond 還要查看bond配置文件(/etc/modprobe.d/),eth0,eth1配置文件,及模塊加載文件modpro
PXE 網絡自動化安裝系統的瓶頸
PXE最大的瓶頸就是網絡帶寬,千萬不要同時大批量一起安裝,會出現一批裝上,一批裝不上,非常麻煩。建議 一次安裝機器的數量:48臺以內, 20臺 20臺一起裝最好,簡單方法:20臺機器先統一做好RAID,然后一起安裝操作系統。文件系統損壞現象:卡在 control +d 界面讓你輸入ROOT密碼 解決方法:輸入root密碼,如果沒有請破解。輸入密碼后 請執行fsck -y /dev/sda2? XFS_repire sda???? xfs磁盤分區:fdisk 4主??? gdisk(2T)128主必須要有的3個分區 / /boot /swap 執行df -h
云服務器
云服務器中使用公網IP地址連接,但是在系統下查看,只有eth0,不顯示公網IP在云服務器上搭建任何服務,必須要開放安全策略端口,否則所有服務不成功。購買的新云服務器默認只開啟80 443 22等幾個常用端口。在搭建任何服務器前,一定要在虛擬機環境先做一遍,不要上真機直接操作。
結語
大型網站軟件系統以其并發性高、流量大、數據量大、用戶分布廣、網絡環境復雜、安全環境惡劣、需求快速變化、發布頻繁、發展漸進等特點,成為現代科學技術不可缺少的產品。