砍站
维基百科,自由的百科全书
| 建議将此條目或章節合併至离线浏览。(討論) |
砍站就是使用軟體將整個網站的資料內容複製回自己本機硬碟裡,因為砍站軟體時常一次發出許多的連線數,使得伺服器的硬體資源無法承受,且佔去網站的頻寬,導致連線速度變的很緩慢,甚至是伺服器主機當機,導致真正有瀏覽網站的需求的網友無法連上網站。
目录 |
[编辑] 何謂砍站?
在這裡說明的砍站不是指把整個網站砍掉,而是指使用者將目標網站整個複製到自己的電腦裡面,通常會這麼做的使用者有以下原因:
- 備份自己所喜歡的網站,可以連網站中的資源都複製到自己的電腦裡
- 備份網站所提供的服務內容,例如部落格
[编辑] 砍站的原理
砍站的原理是利用瀏覽Web會得取伺服器提供給客戶端的原始碼為基礎,利用軟體分析其中的結構,例如連結到其他頁面的超連結,以及網站中的相關檔案。
而砍一個站所需要花費的時間,則跟網站的深度、網站的檔案數目、網站的檔案大小有關,如果網站的深度越深越複雜,所需要花費解析的時間則越多。
比較優秀的砍站軟體會分析其中重複的連結,可以在條件中設定排除或者是要抓取的網站目錄、檔案類型或者是檔案名稱,從中以比較快的方式分析結構納入抓取排程,如果結構非常的複雜,則還需要使用者電腦的運算速度所影響。
而網站的檔案數目、檔案大小則影響下載的速度,增加速度的方式可經由使用者網路環境的速度、或者是網路連線的數目去做調整,越大的網路速度、越多的網路連線數目可以有效的增加砍站的速度。
[编辑] 防砍站的手法
[编辑] 限制頻寬
限制頻寬的缺點是,倘若網站有提供檔案下載,那麼使用者可能會不滿檔案的下載速度。
[编辑] 限制連線數目
[编辑] 封鎖IP地址
封鎖IP地址是經由網站伺服器的LOG檔或者是伺服器防火牆去分析不正常且頻繁的瀏覽要求。
例如:一個IP地址瞬間同時開啟許多頁面
(一般正常的瀏覽者不可能在一段時間內達到每秒數個頁面同時瀏覽,發生這種狀況則非常有可能是被砍站)
[编辑] 砍站軟體
- Teleport Pro,俗稱「瑞士刀」,為Shareware,原創公司:Tennyson Maxwell Information Systems, Inc.。
- HTTrack,為Freeware,原創公司:Xavier Roche & Yann Philippot.。
- wget,為Freeware,作業系統:UNIX。