天天做天天爱天天综合网-天天做天天爱天天影视综合-天天做天天爱天天爽综合区-天天做天天爱天天爽天天综合-福利一区二区在线观看-福利一区二区视频

互聯網+內容
134-1887-2552

深圳網站建設公司:Robots文件寫法+3個實戰經驗分享小白看過來

標簽:深圳網站建設公司2021-09-11 1784

最近看到高端SEO社群里有同學討論Robots相關問題,我們從實戰的角度,給大家講講怎么寫Robots寫法,以及在實戰中可能遇到的問題,都給大家講一下!希望可以幫助更多不懂的同學!

Robots定義

什么是Robots,簡單來講,其實Robots就是放在網站根目錄下的一個TXT文件,但是這個TXT文件對搜索引擎規定,哪些頁面可以訪問,哪些頁面不行。

Robots一般放在網站根目錄下,文件名固定為robots.txt的(全部小寫)、當搜索引擎要爬取我們網站的時候,會先讀一下robots.txt里面的內容,判斷哪些URL可以訪問,哪些不行,然后進行爬取、收錄。

Robots規則

常用的幾類語法:

User-agent: 定義搜索引擎的類型

google蜘蛛:googlebot

百度蜘蛛:baiduspider

yahoo蜘蛛:slurp

alexa蜘蛛:ia_archiver

msn蜘蛛:msnbot

Disallow: 定義禁止搜索引擎收錄的地址

舉個例子來講:User-agent: * Disallow: /

禁止所有搜索引擎訪問網站,(*)為通配符

Allow: 定義允許搜索引擎收錄的地址

User-agent: * Disallow: /a/ Allow: /a/b

如上面例子,限制搜索引擎抓取a目錄,但允許搜索引擎抓取a目錄下的b目錄

$通配符

User-agent: * Allow: .htm$

匹配URL結尾的字符。如下面代碼將允許蜘蛛訪問以.htm為后綴的URL:

*通配符

User-agent: * Disallow: /*.htm

告訴蜘蛛匹配任意一段字符。如下面一段代碼將禁止所有蜘蛛抓取所有htm文件:

Sitemaps位置

Sitemap:

Robots心得

1、許多朋友都喜歡讓搜索引擎不抓取自己的后臺,于是將自己的后臺地址寫到robots.txt里面,其實個人不建議這樣做,因為考慮到網絡安全,許多Hack都喜歡通過robots.txt看大家的后臺,方便攻擊!

2、網站必須要有robots.txt,如果網站沒有robots.txt,搜索引擎隨意抓取的話,可能會抓取到一些低質量頁面,從而導致網站收錄、流量受到影響,如上圖是沒有robots.txt。

3、當我們做完robots.txt后,一定要去【百度站長工具平臺】抓取、測試robots.txt,以及測試URL是否可以抓取。

微信分享領紅包!
相關閱讀 / 返回上一頁
主站蜘蛛池模板: 另类国产精品一区二区| 亚洲另类在线观看| 国产精品手机视频一区二区| 亚洲欧美日韩成人| 337p日本欧洲亚洲大胆精品| 国产精品亚洲精品日韩动图| 精品日韩一区| 91福利国产在线观一区二区| 亚洲伊人久久大香线蕉综合图片| 国产在线精品一区二区夜色| 国产日韩一区| 亚洲尹人九九大色香蕉网站| 国产日本精品| 午夜日本一区二区三区| 成人国产一区二区| 欧美日韩伦理| 一区二区免费播放| 国产日韩中文字幕| 亚洲精品99久久久久中文字幕 | 99精品国产成人一区二区| 91精品国产91久久综合| 特黄日韩免费一区二区三区| 日韩在线视频网| 国产成人高清一区二区私人| 国产在线不卡视频| 国产精品综合一区二区| 欧美色爽| 国产欧美精品一区二区三区四区| 伊人网中文字幕| 国产欧美日韩在线播放| 国外欧美一区另类中文字幕| 一级黄毛片| 亚洲国产精品一区二区九九| 国产一区二区日韩欧美在线| 一级一级一级毛片免费毛片| 视频在线一区| 国产精品伦理久久久久| 欧美xxxxxbbbbb| 欧美日韩在线观看一区二区| 精品一区二区久久久久久久网精| 日韩亚洲欧美一区|