您当前的位置: 首页 > 知识百科 > 百度都支持哪些Robots Meta标签?-seo-网站优化

百度都支持哪些Robots Meta标签?-seo-网站优化

时间:2023-07-01 14:05 阅读数:62 人阅读 分类:知识百科

百度都支持哪些Robots Meta标签?

百度支持什么机器人元标签?

百度支持nofollow和noarchive。

详见:.baidu/search/robots.html

禁止搜索引擎包含的方法

1.什么是robots.txt文件?

搜索引擎使用蜘蛛程序自动访问互联网上的网页并获取网页信息。当蜘蛛访问网站时,它会首先检查在网站的根域下是否有一个名为robots.txt的纯文本文件,该文件用于指定蜘蛛在网站上的爬行范围。您可以在您的网站中创建一个robots.txt,并在文件中声明网站不希望包含在搜索引擎中,或者指定搜索引擎只包含特定的部分。

请注意,只有当您的网站包含您不想包含在搜索引擎中的内容时,您才需要使用robots.txt文件。如果你想让搜索引擎包含网站上的所有内容,不要创建robots.txt文件。

2.机器人在哪里。txt文件?

Txt文件应该放在网站的根目录下。例如,当蜘蛛访问一个网站时,它会首先检查网站上是否有.abc/robots.txt文件。如果Spider找到该文件,它将根据该文件的内容确定其访问权限的范围。

对应于网站网址的机器人网址

.w3.org/·.w3.org/robots.txt

.w3.org:80/·.w3.org:80/robots.txt

.w3.org:1234/·.w3.org:1234/robots.txt

w3.org/·w3.org/robots.txt

3.我在机器人网上设置了百度被禁止包含我网站的内容。为什么它仍然出现在百度搜索结果中?

如果其他网站链接了您的robots.txt文件中设置的禁止网页,这些网页可能仍会出现在百度的搜索结果中,但您网页上的内容不会被抓取、索引和显示。百度的搜索结果只显示其他网站对你相关网页的描述。

4.搜索引擎被禁止跟踪网页的链接,只能索引网页

如果您不想让搜索引擎跟踪此页面上的链接,也不想传递链接的权重,请将此元标签放在页面的以下部分:

如果您不想让百度跟踪某个特定的链接,并且百度支持更精确的控制,请将此标记直接写在链接上:

签到

为了允许其他搜索引擎跟踪,但只阻止百度跟踪您网页的链接,请将此元标签放入网页的以下部分:

5.搜索引擎禁止在搜索结果中显示网页快照,只能对网页进行索引。

为了防止所有搜索引擎显示您网站的快照,请将此元标签放在网页的以下部分:

要允许其他搜索引擎显示快照,但只阻止百度显示它们,请使用以下标签:

注意:此标志仅禁止百度显示网页快照。百度将继续索引网页,并在搜索结果中显示网页摘要。

6.我想禁止百度搜索一些图片。如何设置它?

禁止Baiduspider抓取网站上的所有图片,禁止或允许Baiduspider抓取网站上特定格式的图片文件,可以通过设置机器人来实现。请参考& ldquorobots.txt文件的使用示例示例10、11和12英寸。

7.格式7。robots.txt文件

“机器人。该文件包含一条或多条记录,这些记录由空行分隔(以字符识别符、字符识别符/字符识别符或字符识别符作为终止符),每条记录的格式如下:

“:& quot

在这个文件中,您可以用#对其进行注释,这与UNIX中的约定相同。该文件中的记录通常以一行或多行用户代理开始,然后是几行不允许和允许,如下所示:

用户代理:

该项的值用于描述搜索引擎机器人的名称。在“机器人”网站在文件中,如果有多个用户代理记录,这意味着多个机器人将收到“机器人对于此文件,必须至少有一个用户代理记录。如果此项目的值设置为*,它对任何机器人都有效,并且在“robots.txt”中有效在文件中,“用户代理:* & quot这样的记录只能有一个。如果在“机器人”中文件,添加“用户代理:某个机器人还有几个不允许和允许的行,名字是“SomeBot。仅受“用户代理:某些机器人”的影响以下“不允许”和“允许”行的限制。

不允许:

该项的值用于描述一组不希望被访问的网址。该值可以是完整路径,也可以是路径的非空前缀。机器人将无法访问以“不允许”项目的值开头的网址。例如“不允许:/帮助机器人被禁止访问/help.html、/helpabc.html、/help /index.html和“不允许:/help/& quot;机器人可以访问/help.html和/helpabc.html,但不能访问/help/index.html..”不允许解释所有允许机器人访问网站的网址,网址可以在“机器人”中找到文件中必须至少有一条“不允许”记录。如果/robots.txt。如果文件不存在或空,该网站对所有搜索引擎机器人开放。

允许:

该项的值用于描述要访问的一组网址。与“不允许”项目类似,该值可以是完整路径或路径的前缀。允许机器人访问以允许项目的值开始的网址。例如“允许:/hibidu & quot;允许机器人访问/hibidu . htm、/hibiducom . html、/hibidu . com . html。默认情况下,网站的所有网址都是允许的,所以允许通常与不允许一起使用,以实现允许访问某些网页而禁止访问所有其他网址的功能。

使用“* & quot和quot$ & quot:

Baiduspider支持使用通配符“* & quot以及“$ & quot模糊匹配的URL。

“$ & quot匹配线终止符。

“* & quot匹配0个或更多任意字符。

8.网址匹配示例

允许或不允许的值网址匹配结果

/tmp /tmp是

/tmp /tmp.html是

/tmp /tmp/a.html是

/tmp /tmp编号

/tmp /tmphoho no

/你好*/你好

/何*罗/你好,罗罗是的

你好,哈哈不

html$ /tmpa.html是

/a.html$ /a.html是

html $/a . html no

9.例9。robots.txt文件用法

例1。禁止所有搜索引擎访问网站的任何部分

下载机器人文件用户代理:*

不允许:/

例2。允许所有机器人进入

(或者您可以创建一个空文件”/robots.txt。)用户代理:*

允许:/

例3。只有Baiduspider被禁止访问您的网站用户代理:Baiduspider

不允许:/

例4。只有Baiduspider被允许访问您的网站用户代理:Baiduspider

允许:/

用户代理:*

不允许:/

例5。只有Baiduspider和Googlebot被允许访问用户代理:Baiduspider

允许:/

用户代理:谷歌机器人

允许:/

用户代理:*

不允许:/

例6。禁止spider访问特定目录

在这个例子中,网站有三个目录限制搜索引擎的访问,也就是说,机器人不会访问这三个目录。应该注意,每个目录必须单独声明,不能写成“不允许:/CGI-bin//tmp/& quot;。用户代理:*

不允许:/cgi-bin/

不允许:/tmp/

不允许:/~joe/

例7。允许访问特定目录中的某些网址用户代理:*

允许:/CGI-bin/请参阅

允许:/tmp/hi

允许:/~乔/看

不允许:/cgi-bin/

不允许:/tmp/

不允许:/~joe/

例8。使用“* & quot受限访问url

使用”访问/cgi-bin/目录中的所有文件。htm带后缀的网址(包括子目录)。用户代理:*

不允许:/cgi-bin/*。html文件的后缀

例9。使用“$ & quot受限访问url

仅允许访问”。htm作为后缀的网址。用户代理:*

允许:/*。htm$

不允许:/

例10。禁止访问网站用户代理中的所有动态页面:*

不允许:/*?*

例11。禁止Baiduspider抓取网站上的所有图片

只允许对网页进行爬网,不允许对图片进行爬网。用户代理:Baiduspider

不允许:/*。jpg$

不允许:/*。jpeg$

不允许:/*。gif$

不允许:/*。巴布亚新几内亚美元

不允许:/*。bmp$

例12。只有Baiduspider被允许抓取网页和图片。gif格式

允许对网页和gif格式的图片进行爬网,但不允许对其他格式的图片进行爬网。用户代理:Baiduspider

允许:/*。gif$

不允许:/*。jpg$

不允许:/*。jpeg$

不允许:/*。巴布亚新几内亚美元

不允许:/*。bmp$

例13。只有Baiduspider被禁止抓图。jpg格式用户代理:Baiduspider

不允许:/*。jpg$

[版权和免责声明]如果在内容中发现版权问题,请提供相关信息并发送至1655730209@qq,我们将及时沟通和处理。除非本网站来源注明简书网搜索引擎优化(.388m),否则本网站内容由网友转载,涉及的言论和版权与本网站无关。