很多時(shí)候,一個(gè)網(wǎng)站的內(nèi)容并不希望被搜索引擎抓取并且呈現(xiàn)在搜索結(jié)果中,比如一個(gè)網(wǎng)站的后臺(tái)管理頁面,一些付費(fèi)頁面,登陸頁面等等.這個(gè)時(shí)候,大家在進(jìn)行網(wǎng)站制作的時(shí)候,就要學(xué)會(huì)適當(dāng)?shù)氖褂肦OBOTS文件或者M(jìn)ATE ROBOTS標(biāo)簽.
Robots文件的禁止機(jī)制
當(dāng)搜索引擎到了一個(gè)站點(diǎn)的時(shí)候,會(huì)先看看這個(gè)網(wǎng)站的根目錄下有沒有ROBOTS.TXT文件,這是一個(gè)文本文件.用來告訴搜索引擎這個(gè)網(wǎng)站里面的那些內(nèi)容或者是一些特定的部分不想被搜索引擎抓取,因?yàn)楹芏嗍菍?duì)排名沒有意義的頁面或者是一些牽涉到網(wǎng)站隱私的部分.如果沒有發(fā)現(xiàn)這個(gè)文件或者是里面的內(nèi)容為空,那么搜索引擎就認(rèn)為這個(gè)網(wǎng)站的所有的東西自己都能夠進(jìn)行訪問并抓取.
關(guān)鍵字段是USER-AGENT: 一般使用*代表所有的搜索引擎,或者也可以指定特定的搜索引擎的蜘蛛.Disallow: 后面寫指定的禁止訪問收錄的文件目錄,如果不寫的話,就表示允許.需要注意的是如果有好幾個(gè)目錄,一定要分開寫,每一個(gè)不想讓收錄的頁面都使用一個(gè)DISALLOW.
目前,絕大部分的搜索引擎都會(huì)遵守這個(gè)指令,不過被這個(gè)指令禁止搜錄的頁面的網(wǎng)址還能夠以URL的形式在搜索的結(jié)果當(dāng)中.要想讓URL也完全的不出現(xiàn),最好在頁面上使用META ROBOTS標(biāo)簽.所以,建議各位在做網(wǎng)站建設(shè)的朋友們根據(jù)需要自己的需要來設(shè)置好,千萬不能設(shè)置錯(cuò)了.
META ROBOTS標(biāo)簽的禁止機(jī)制
這個(gè)標(biāo)簽是網(wǎng)頁META標(biāo)簽的一種,主要作用是讓搜索引擎不要索引這個(gè)頁面的內(nèi)容.meta的名稱是robots,內(nèi)容是寫不像被搜索跟蹤的內(nèi)容.比如下面:
NOINDEX:讓搜索引擎不要索引這個(gè)頁面;
NOFOLLOW:讓搜索引擎不要追蹤這個(gè)頁面上的鏈接;
NOARCHIVE:讓搜索引擎不顯示網(wǎng)頁快照.
這里需要重點(diǎn)強(qiáng)調(diào)的是,NOINDEX使用之后,頁面還是能被抓取,不會(huì)索引這個(gè)頁面,但搜索引擎還是能夠追蹤網(wǎng)頁上的一些鏈接,也能夠通過鏈接傳遞權(quán)重.
上海網(wǎng)站制作的小編總結(jié):很多時(shí)候,一些行業(yè)的朋友由于記錯(cuò)了或者理解的不夠牢,會(huì)出現(xiàn)一些寫錯(cuò)了的情況,這里提醒大家,千萬要重視啊!
本文由上海藝覺網(wǎng)絡(luò)科技有限公司(http://www.zhongxin999.cn)原創(chuàng)編輯轉(zhuǎn)載請(qǐng)注明。