搜索引擎会引用Robots.txt文件来索引您的网站内容。这些对于防止某些内容(例如隐藏在表单后面的内容)不会在搜索引擎结果中返回很有用。
请注意:实施robots.txt文件方法后,Google和其他搜索引擎无法追溯地从搜索结果中删除页面。尽管这告诉蜘蛛不要抓取页面,但是,如果存在其他网站指向您页面的入站链接,搜索引擎仍可以为您的内容编制索引。如果您的页面已经被索引,并且希望追溯地将其从搜索引擎中删除,则可能需要使用“无索引”元标记方法。
robots.txt文件如何工作
您的robots.txt文件告诉搜索引擎如何抓取您网站上托管的页面。robots.txt文件的两个主要组成部分是:
- user-agent:定义规则适用的搜索引擎或网络漫游器。 星号(*)可以与用户代理一起用作通配符,以包括所有搜索引擎。
- Disallow:建议搜索引擎不要对文件,页面或目录进行爬取和编制索引。
还可以使用站长工具robots.txt生成器工具来创建文件。
请注意:如果要在文件管理器中阻止抓取路径,请自定义文件,使其托管在您的一个域中。然后,您可以将文件URL添加到robots.txt文件中。