<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>念宏的胡言乱语&#187; PR</title>
	<atom:link href="http://www.litanwei.com/tag/pr/feed" rel="self" type="application/rss+xml" />
	<link>http://www.litanwei.com</link>
	<description>讨论和学习互联网产品策划、用户体验、网站架构、网站运营、网络营销以及相关内容。</description>
	<lastBuildDate>Sat, 04 Feb 2012 14:45:25 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>推荐阅读：SEM团队研究系列—搜索引擎蜘蛛篇</title>
		<link>http://www.litanwei.com/sem-yanjiu-zhizh/22</link>
		<comments>http://www.litanwei.com/sem-yanjiu-zhizh/22#comments</comments>
		<pubDate>Thu, 15 May 2008 06:30:45 +0000</pubDate>
		<dc:creator>李谭伟</dc:creator>
				<category><![CDATA[搜索引擎营销]]></category>
		<category><![CDATA[GOOGLE]]></category>
		<category><![CDATA[PR]]></category>
		<category><![CDATA[SEM]]></category>
		<category><![CDATA[导入链接]]></category>
		<category><![CDATA[搜索引擎]]></category>
		<category><![CDATA[蜘蛛]]></category>
		<category><![CDATA[谷歌]]></category>

		<guid isPermaLink="false">http://192.168.0.16/?p=22</guid>
		<description><![CDATA[★ GOOGLE搜索引擎蜘蛛的等级：

首先先谈下GOOGLE蜘蛛起源：

当GOOGLE搜索引擎刚建立之初,就拥有这一个非常强大的的服务器,

<span class="readmore"><a href="http://www.litanwei.com/sem-yanjiu-zhizh/22" title="推荐阅读：SEM团队研究系列—搜索引擎蜘蛛篇">阅读全文——共1295字</a></span>]]></description>
			<content:encoded><![CDATA[<p>★ <span class='wp_keywordlink_affiliate'><a href="http://www.litanwei.com/tag/google" title="查看 GOOGLE 中的全部文章" target="_blank">GOOGLE</a></span><span class='wp_keywordlink_affiliate'><a href="http://www.litanwei.com/tag/%e6%90%9c%e7%b4%a2%e5%bc%95%e6%93%8e" title="查看 搜索引擎 中的全部文章" target="_blank">搜索引擎</a></span><span class='wp_keywordlink_affiliate'><a href="http://www.litanwei.com/tag/%e8%9c%98%e8%9b%9b" title="查看 蜘蛛 中的全部文章" target="_blank">蜘蛛</a></span>的等级：</p>
<p>首先先谈下<span class='wp_keywordlink_affiliate'><a href="http://www.litanwei.com/tag/google" title="查看 GOOGLE 中的全部文章" target="_blank">GOOGLE</a></span><span class='wp_keywordlink_affiliate'><a href="http://www.litanwei.com/tag/%e8%9c%98%e8%9b%9b" title="查看 蜘蛛 中的全部文章" target="_blank">蜘蛛</a></span>起源：</p>
<p>当GOOGLE<span class='wp_keywordlink_affiliate'><a href="http://www.litanwei.com/tag/%e6%90%9c%e7%b4%a2%e5%bc%95%e6%93%8e" title="查看 搜索引擎 中的全部文章" target="_blank">搜索引擎</a></span>刚建立之初,就拥有这一个非常强大的的服务器,</p>
<p>其每天放出大量的<span class='wp_keywordlink_affiliate'><a href="http://www.litanwei.com/tag/%e8%9c%98%e8%9b%9b" title="查看 蜘蛛 中的全部文章" target="_blank">蜘蛛</a></span>,我们称为1号蜘蛛,其抓取量抓取速度是非常的快,</p>
<p>对其整个互联网每天进行信息进行的采集,可见服务器的速度是多少快，其实最主要的是后期GOOGLE<span id="more-22"></span></p>
<p>将服务器延伸到了很多城市,所以现在你能发现GOOGLE的运算速率是超前的快.</p>
<p>服务器将采集的信息分类,整理.到庞大的数据库.</p>
<p>其中有个数据库都是用来存网站域名的.</p>
<p>域名只要被搜索引擎索引到,将自动存入此数据库.</p>
<p>此数据库是1号蜘蛛的核心.</p>
<p>其内部分为10个<span class='wp_keywordlink_affiliate'><a href="http://www.litanwei.com/tag/pr" title="查看 PR 中的全部文章" target="_blank">PR</a></span>各等级的小数据库，虽说小数据库，但也是大的可怕-。=！</p>
<p>10个等级的数据库 其周期也不同</p>
<p>基本上以一个<span class='wp_keywordlink_affiliate'><a href="http://www.litanwei.com/tag/pr" title="查看 PR 中的全部文章" target="_blank">PR</a></span>=4的网站来讲 1号蜘蛛爬行的概率也在7天一次.</p>
<p>所以基本你也会发现收录有大的幅度也是在7天内的某一天 .</p>
<p>细心的站长会发现其实有时候7天还是蛮准的,但只针对PR=4</p>
<p>越是PR高其周期越是短,越是PR低周期越长,</p>
<p>当然说到这很多站长有这样的疑惑.会觉得蜘蛛有时天天收录他的站</p>
<p>这里对其收录的也就是接下来要说的2号蜘蛛</p>
<p>2号蜘蛛往往是在1号蜘蛛爬行过程中放出去的，</p>
<p>主要针对于被1号蜘蛛爬过的网站的外部链接.</p>
<p>PS既然都说是2号蜘蛛 肯定其抓取力度要比1号小很多.</p>
<p>★ 当然不只是有2号,还有3号蜘蛛</p>
<p>所谓3号也就 A站1号蜘蛛爬行到B站,B站的2号蜘蛛爬行到C站</p>
<p>目前GOOGLE为了限制其无限的循环对于蜘蛛只分为这三个等级.并对其等级的抓取率有个很明确的标准</p>
<p>而且2号与3号蜘蛛有个抓取特点 基本以时间的先后顺序进行抓取</p>
<p>★ 比方讲：</p>
<p>A网站被1号蜘蛛爬行后的一篇文章最后时间为 2008-6-1</p>
<p>那当A网站被从别的网站过来的2号蜘蛛给爬行,首先有可能会对其收录的是</p>
<p>最近发表的几篇文章如： 2008-5-31等 2008-5-30等文章将会进行第2次,第3次的访问</p>
<p>之后再爬行2008-6-1以后的信息.如果你网站没有任何更新,它将对其近一个月内的更改内容进行2次爬行.</p>
<p>如果外部来的2号与3号蜘蛛越多,同一篇文章有可能会被爬上好几次.</p>
<p>以下为GOOGLE提供的官方数据<秘></p>
<p>★ 1号蜘蛛</p>
<p>基本抓取率在5%~10%</p>
<p>基于PR=0 没有任何<span class='wp_keywordlink_affiliate'><a href="http://www.litanwei.com/tag/%e5%af%bc%e5%85%a5%e9%93%be%e6%8e%a5" title="查看 导入链接 中的全部文章" target="_blank">导入链接</a></span>与提交时 有可能被抓取的周期在6个月~12个月不等</p>
<p>基于PR=1 没有任何<span class='wp_keywordlink_affiliate'><a href="http://www.litanwei.com/tag/%e5%af%bc%e5%85%a5%e9%93%be%e6%8e%a5" title="查看 导入链接 中的全部文章" target="_blank">导入链接</a></span>与提交时 有可能每次被抓取的周期在4个月~8个月不等</p>
<p>基于PR=2 没有任何导入链接与提交时 有可能被抓取的周期在2个月~4个月不等</p>
<p>基于PR=3 没有任何导入链接与提交时 有可能被抓取的周期在1个月~2个月不等</p>
<p>基于PR=4 没有任何导入链接与提交时 有可能被抓区的周期在1周~1个月不等</p>
<p>当然没有任何导入链接的网站无法做到PR=4</p>
<p>最高也只有PR=3</p>
<p>上述此数据只是GOOGLE官方提供的一个基数.</p>
<p>意思也就是1号蜘蛛主动爬取你网站的周期数.</p>
<p>对于2号或者3号蛛爬取你的网站,也就根据你的导入链接而定.</p>
<p>所以你会发现你的网站有时天天在被更新.</p>
<p>★ 2号蜘蛛</p>
<p>基本抓取率是2.5%~5%<基于1号蜘蛛爬行后的数据记录进行再次采集,对于最后次被采集日期的前后进行再次访问></p>
<p>★ 3号蜘蛛</p>
<p>基本抓取率为1.25%~2.5%<基于1号蜘蛛与2号蜘蛛爬行后的数据记录进行再次采集,对于最后次被采集日期的前后进行再次访问></p>
<p>GOOGLE目前蜘蛛的等级分为三种</p>
<p>当然蜘蛛有不同的蜘蛛</p>
<p>这里单单只的是网页蜘蛛.因为我只对这个感兴趣.</p>
<h2  class="related_post_title">或许这些文章您也喜欢：</h2><ul class="related_post"><li><a href="http://www.litanwei.com/google-gouwu-sousuo-tiyan/173" title="体验：谷歌购物搜索">体验：谷歌购物搜索</a> (0)</li><li><a href="http://www.litanwei.com/itjianghu-google-xiaosho/85" title="IT江湖聚会：向google学销售">IT江湖聚会：向google学销售</a> (0)</li><li><a href="http://www.litanwei.com/google-baidu-ue/55" title="从Google和Baidu的调查统计看网页布局对用户体验的影响 ">从Google和Baidu的调查统计看网页布局对用户体验的影响 </a> (0)</li><li><a href="http://www.litanwei.com/google-system-administrator/446" title="Google的系统工程师(SA)如何工作">Google的系统工程师(SA)如何工作</a> (2)</li><li><a href="http://www.litanwei.com/google-wave-yaoqing/208" title="Google Wave邀请试用感受">Google Wave邀请试用感受</a> (0)</li><li><a href="http://www.litanwei.com/taobao-seo-sousu/130" title="淘宝站内搜索引擎排名以及优化方法">淘宝站内搜索引擎排名以及优化方法</a> (0)</li></ul><h3>Related Posts</h3><ul><li><a href="http://www.litanwei.com/google-gouwu-sousuo-tiyan/173" title="体验：谷歌购物搜索 2009.05.27">体验：谷歌购物搜索</a>(0)</li>
<li><a href="http://www.litanwei.com/itjianghu-google-xiaosho/85" title="IT江湖聚会：向google学销售 2008.12.1">IT江湖聚会：向google学销售</a>(0)</li>
<li><a href="http://www.litanwei.com/google-baidu-ue/55" title="从Google和Baidu的调查统计看网页布局对用户体验的影响  2008.08.29">从Google和Baidu的调查统计看网页布局对用户体验的影响 </a>(0)</li>
<li><a href="http://www.litanwei.com/google-system-administrator/446" title="Google的系统工程师(SA)如何工作 2010.09.29">Google的系统工程师(SA)如何工作</a>(2)</li>
<li><a href="http://www.litanwei.com/google-wave-yaoqing/208" title="Google Wave邀请试用感受 2009.10.28">Google Wave邀请试用感受</a>(0)</li>
<li><a href="http://www.litanwei.com/taobao-seo-sousu/130" title="淘宝站内搜索引擎排名以及优化方法 2008.12.18">淘宝站内搜索引擎排名以及优化方法</a>(0)</li>
</ul><h3>Recent Comments</h3><ul></ul>]]></content:encoded>
			<wfw:commentRss>http://www.litanwei.com/sem-yanjiu-zhizh/22/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

