百度都支持哪些Robots Meta标签?-seo-网站优化
百度都支持哪些Robots Meta标签?
百度支持什么机器人元标签?
百度支持nofollow和noarchive。
详见:.baidu/search/robots.html
禁止搜索引擎包含的方法
1.什么是robots.txt文件?
搜索引擎使用蜘蛛程序自动访问互联网上的网页并获取网页信息。当蜘蛛访问网站时,它会首先检查在网站的根域下是否有一个名为robots.txt的纯文本文件,该文件用于指定蜘蛛在网站上的爬行范围。您可以在您的网站中创建一个robots.txt,并在文件中声明网站不希望包含在搜索引擎中,或者指定搜索引擎只包含特定的部分。
请注意,只有当您的网站包含您不想包含在搜索引擎中的内容时,您才需要使用robots.txt文件。如果你想让搜索引擎包含网站上的所有内容,不要创建robots.txt文件。
2.机器人在哪里。txt文件?
Txt文件应该放在网站的根目录下。例如,当蜘蛛访问一个网站时,它会首先检查网站上是否有.abc/robots.txt文件。如果Spider找到该文件,它将根据该文件的内容确定其访问权限的范围。
对应于网站网址的机器人网址
.w3.org/·.w3.org/robots.txt
.w3.org:80/·.w3.org:80/robots.txt
.w3.org:1234/·.w3.org:1234/robots.txt
w3.org/·w3.org/robots.txt
3.我在机器人网上设置了百度被禁止包含我网站的内容。为什么它仍然出现在百度搜索结果中?
如果其他网站链接了您的robots.txt文件中设置的禁止网页,这些网页可能仍会出现在百度的搜索结果中,但您网页上的内容不会被抓取、索引和显示。百度的搜索结果只显示其他网站对你相关网页的描述。
4.搜索引擎被禁止跟踪网页的链接,只能索引网页
如果您不想让搜索引擎跟踪此页面上的链接,也不想传递链接的权重,请将此元标签放在页面的以下部分:
如果您不想让百度跟踪某个特定的链接,并且百度支持更精确的控制,请将此标记直接写在链接上:
签到
为了允许其他搜索引擎跟踪,但只阻止百度跟踪您网页的链接,请将此元标签放入网页的以下部分:
5.搜索引擎禁止在搜索结果中显示网页快照,只能对网页进行索引。
为了防止所有搜索引擎显示您网站的快照,请将此元标签放在网页的以下部分:
要允许其他搜索引擎显示快照,但只阻止百度显示它们,请使用以下标签:
注意:此标志仅禁止百度显示网页快照。百度将继续索引网页,并在搜索结果中显示网页摘要。
6.我想禁止百度搜索一些图片。如何设置它?
禁止Baiduspider抓取网站上的所有图片,禁止或允许Baiduspider抓取网站上特定格式的图片文件,可以通过设置机器人来实现。请参考& ldquorobots.txt文件的使用示例示例10、11和12英寸。
7.格式7。robots.txt文件
“机器人。该文件包含一条或多条记录,这些记录由空行分隔(以字符识别符、字符识别符/字符识别符或字符识别符作为终止符),每条记录的格式如下:
“:& quot
在这个文件中,您可以用#对其进行注释,这与UNIX中的约定相同。该文件中的记录通常以一行或多行用户代理开始,然后是几行不允许和允许,如下所示:
用户代理:
该项的值用于描述搜索引擎机器人的名称。在“机器人”网站在文件中,如果有多个用户代理记录,这意味着多个机器人将收到“机器人对于此文件,必须至少有一个用户代理记录。如果此项目的值设置为*,它对任何机器人都有效,并且在“robots.txt”中有效在文件中,“用户代理:* & quot这样的记录只能有一个。如果在“机器人”中文件,添加“用户代理:某个机器人还有几个不允许和允许的行,名字是“SomeBot。仅受“用户代理:某些机器人”的影响以下“不允许”和“允许”行的限制。
不允许:
该项的值用于描述一组不希望被访问的网址。该值可以是完整路径,也可以是路径的非空前缀。机器人将无法访问以“不允许”项目的值开头的网址。例如“不允许:/帮助机器人被禁止访问/help.html、/helpabc.html、/help /index.html和“不允许:/help/& quot;机器人可以访问/help.html和/helpabc.html,但不能访问/help/index.html..”不允许解释所有允许机器人访问网站的网址,网址可以在“机器人”中找到文件中必须至少有一条“不允许”记录。如果/robots.txt。如果文件不存在或空,该网站对所有搜索引擎机器人开放。
允许:
该项的值用于描述要访问的一组网址。与“不允许”项目类似,该值可以是完整路径或路径的前缀。允许机器人访问以允许项目的值开始的网址。例如“允许:/hibidu & quot;允许机器人访问/hibidu . htm、/hibiducom . html、/hibidu . com . html。默认情况下,网站的所有网址都是允许的,所以允许通常与不允许一起使用,以实现允许访问某些网页而禁止访问所有其他网址的功能。
使用“* & quot和quot$ & quot:
Baiduspider支持使用通配符“* & quot以及“$ & quot模糊匹配的URL。
“$ & quot匹配线终止符。
“* & quot匹配0个或更多任意字符。
8.网址匹配示例
允许或不允许的值网址匹配结果
/tmp /tmp是
/tmp /tmp.html是
/tmp /tmp/a.html是
/tmp /tmp编号
/tmp /tmphoho no
/你好*/你好
/何*罗/你好,罗罗是的
你好,哈哈不
html$ /tmpa.html是
/a.html$ /a.html是
html $/a . html no
9.例9。robots.txt文件用法
例1。禁止所有搜索引擎访问网站的任何部分
下载机器人文件用户代理:*
不允许:/
例2。允许所有机器人进入
(或者您可以创建一个空文件”/robots.txt。)用户代理:*
允许:/
例3。只有Baiduspider被禁止访问您的网站用户代理:Baiduspider
不允许:/
例4。只有Baiduspider被允许访问您的网站用户代理:Baiduspider
允许:/
用户代理:*
不允许:/
例5。只有Baiduspider和Googlebot被允许访问用户代理:Baiduspider
允许:/
用户代理:谷歌机器人
允许:/
用户代理:*
不允许:/
例6。禁止spider访问特定目录
在这个例子中,网站有三个目录限制搜索引擎的访问,也就是说,机器人不会访问这三个目录。应该注意,每个目录必须单独声明,不能写成“不允许:/CGI-bin//tmp/& quot;。用户代理:*
不允许:/cgi-bin/
不允许:/tmp/
不允许:/~joe/
例7。允许访问特定目录中的某些网址用户代理:*
允许:/CGI-bin/请参阅
允许:/tmp/hi
允许:/~乔/看
不允许:/cgi-bin/
不允许:/tmp/
不允许:/~joe/
例8。使用“* & quot受限访问url
使用”访问/cgi-bin/目录中的所有文件。htm带后缀的网址(包括子目录)。用户代理:*
不允许:/cgi-bin/*。html文件的后缀
例9。使用“$ & quot受限访问url
仅允许访问”。htm作为后缀的网址。用户代理:*
允许:/*。htm$
不允许:/
例10。禁止访问网站用户代理中的所有动态页面:*
不允许:/*?*
例11。禁止Baiduspider抓取网站上的所有图片
只允许对网页进行爬网,不允许对图片进行爬网。用户代理:Baiduspider
不允许:/*。jpg$
不允许:/*。jpeg$
不允许:/*。gif$
不允许:/*。巴布亚新几内亚美元
不允许:/*。bmp$
例12。只有Baiduspider被允许抓取网页和图片。gif格式
允许对网页和gif格式的图片进行爬网,但不允许对其他格式的图片进行爬网。用户代理:Baiduspider
允许:/*。gif$
不允许:/*。jpg$
不允许:/*。jpeg$
不允许:/*。巴布亚新几内亚美元
不允许:/*。bmp$
例13。只有Baiduspider被禁止抓图。jpg格式用户代理:Baiduspider
不允许:/*。jpg$
[版权和免责声明]如果在内容中发现版权问题,请提供相关信息并发送至1655730209@qq,我们将及时沟通和处理。除非本网站来源注明简书网搜索引擎优化(.388m),否则本网站内容由网友转载,涉及的言论和版权与本网站无关。