网页搜索
- 如何查看我的网站是否收录?
- 如何向雅虎提交我的网站?
- 如何让雅虎收录我的网页?
- 如何让雅虎更多更快的收录我的网页?
- 中文域名是否可以提交的搜索引擎中
- 网站已经提交到雅虎搜索很长时间,但仍然没有被雅虎收录的原因
- 哪些类型的网站是作弊网站?
- 网站排列位置由什么决定?
- 雅虎是如何对我的网站进行抓取的?
- 如何使雅虎只索引某些网页?
- 雅虎的抓取程序能够跟踪动态链接吗?
- 怎样减少搜索引擎对某站点的抓取频率?
- 我的网站禁止所有搜索引擎访问,应该如何设置?
- 雅虎抓取程序是如何发现我网站上的文件的?
- 为什么网页搜索每天搜索到的结果量不同?
- 网站内容已更新,为什么网页快照没有及时更新?
- 我的网址已经变更,为什么搜索结果没有及时更新?
- 可以只删除个别的网页吗?
- 如何删除搜索结果中的网页快照?
- 我的网站不想出现在雅虎的搜索结果中,如何删除?
联系我们
相关信息
怎样减少搜索引擎对某站点的抓取频率?
由于我们从整个因特网上抓取数以百亿计的网页,对于网络抓取我们采取大量系统,因此,您的网络服务器会从不同的YST抓取程序的客户端IP地址登录请求。不同的抓取程序系统彼此配合,来限制任何来自单一网络服务器的活动。所谓单一网络服务器,是由IP地址判断的。因此,如果您的服务器主机拥有多个IP,它的活动则会处于更高的级别。 在robots.txt 里,YST有一个特定的扩展名,可以通过它对我们的抓取程序设定一个较低的抓取请求频率。您可以加入Crawl-delay:xx指示,其中,“XX”是指在crawler程序两次进入站点时,以秒为单位的最低延时。如果crawler频率对您的服务器是一个负担,您可以将这个延时设定为任何您认为恰当的数字,例如60或300。
例如:您想设定一个2秒的延时,语句如下: User-agent: Slurp Crawl-delay: 2
备注:关于robots.txt 文件的详细信息介绍,点击此处进一步了解。 |




