Google可贮存网页的快照,当网页服务器暂时中断时您仍可浏览到该网页的内容。若找不到服务器,则Google暂存的网页也可救急。从贮存网页快照中找寻资料要比常规链接快得多,尽管所获取的信息可能不是最新的。而且在很多情况下可免受“404 Not Found Error”(找不到网页的错误信息)之苦。
网站登陆:
Google经常在网上漫游,搜寻新资料。Google也可以让您提供新的网站信息。但Google会分析网站内容,所用时间长短不一,用以决定网站信息是否使用。首先输入网址,包括前缀http://,如http://www.google.com/。还可以加上网站简介,但此项说明仅供Google内部参考,并不影响Google对网页的编排。
如果您的网页提供多种汉字代码的用户界面,请选择一个您认为最应该向大家介绍的那一个。
注意:登录网址时,只须提交最上层的网页,其他各页由Googlebot自行查找。Google会定时自动检索并更新所有网站;对于失效网页则将其删除。
关于排名:
作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构。实质上,当从网页A链接到网页B时,Google就认为“网页A投了网页B一票”。Google根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外, Google还要分析为其投票的网页。"重要"网页所投之票自然份量较重,有助于增强其他网页的"重要性"。
重要的、高质量的网页可获得较高的网页级别,从而在搜索结果中可获较高的排位。这样,Google的重要性综合指标为网页级别,而不是根据某一个具体的查询。当然,这代表了该网页本身的特性,是由Google根据网络数据、采用评定链接结构的综合运算法则进行分析的结果。
当然,如果与查询项目不匹配,再重要的网页也毫无意义。因此,Google采用完善的正文匹配技术,为您查找既重要又准确的网页。例如,Google在分析一个网页时,还会同时参考指向此网页的链接描述。
与其他多数搜索引擎的区别在于:Google只显示相关的网页,其正文或指向它的链接包含您所输入的所有关键字,而无须再受其他无关结果的烦扰。
Google不仅搜索出包含所有关键字的结果,并且对网页关键字的接近度进行了分析。与其他多数搜索引擎的一大区别是:Google按照关键字的接近度区分搜索结果的优先次序,筛选与关键字较为接近的结果。
网站登陆Google的关键:网站外部链接
网友经常有这样的反映:我的网站提交Google很长时间了,怎么就是找不到我的网页呢?有些对搜索引擎工作原理不熟悉的人甚至认为,只需将网页做好,上传到网站空间,就会自动登陆搜索引擎。
对后一种情况可以打个比方,就好象一个人自生下来就成了孤儿,而且又一直独处,不跟任何人接触,突然有一天却愤愤不平地说,为什么谁都不认识我!?网站也是同样,你不进行宣传和推广,它就象茫茫网海中的一座孤岛,被人发现的机会几乎没有。
前一种情况稍好些,至少知道要将网站提交到Google,这种做法在几年前也许有效,但现在就不够了。可以这么说,网站链接是搜索引擎存在的基础。从全文搜索引擎工作原理中可以看出,搜索引擎是依靠跟踪各网站间的链接来找到网站和抓取网页信息的,如果网站都相互独立,搜索引擎的工作效率、所提供信息的广度和质量都会大打折扣。
对Google而言,链接可是它的“命根子”,也是它成功的关键。所以Google一有机会就向你灌输这样的观念:出去找链接吧,不然你的网站是不会被我们接受的。Google曾在一次搜索引擎学术会议上说明了收录网站的最低标准,即当你向Google提交网址时,至少要保证已有一个外部链接。实际上如果网站的外部导入链接足够多的话,你根本用不着直接将网址提交给Google(而且Google也不建议你这么做),这样反而会更快地被Google收录。
现在我们知道了链接在登陆Google时的作用,下面介绍一下获得外部链接的方法。在介绍之前,有必要先将有关链接的概念澄清一下:
外部链接: External Links。本网站外部的链接,一般是指其他网站连到本网站的链接。
内部链接: Internal Links。本网站内部网页之间的链接。
反向/导入链接: Backward Links或Incoming/Inbound Links。意义与“外部链接”接近,指其他网站连到本网站的链接。
导出链接: Outgoing/Outbound Links。指从本网站连到其他网站的链接。
■获得外部链接的方法
1、将网站提交到门户网站
获得外部链接最简单的方法是将网站提交到各大门户网站,目前搜狐、新浪、网易都提供收费网站登录服务,收费从几百到数千元不等。虽然需要一定的投入,但网站推广的角度说,这是必须付出的代价,而且大型门户上的链接会让你更快地登陆Google引擎,同时还可改善网站在Google上的排名。
2、与其他网站交换链接
前面说过网站的外部反向链接越多,被Google找到的可能性就越大,因此你可以向其他网站申请交换链接。
3、将网址提交到其他的类型网站
这方面与通常意义上的网站推广策略是相吻合的,为了提升网站的访问量,我们可以将网址加到行业门户站点、网上论坛,留言簿等等各种允许添加网址链接的地方,这样也会增加Google找到我们的机会。
■在寻找外部链接时应注意的问题
一般情况下,更多的网站外部导入链接会让你更快地登陆Google搜索引擎,但这并不意味着你可以不求策略地与任何网站建立连接,其中要遵循几个基本原则:
1、链接对象是否已被Google收录
在寻找连接网站时有一个基本原则,就是首先确认目标网站是否已被Google收录,主要是看该网站是否有PageRank得分,而且分值越高越好。
2、链接对象是否被Google惩罚
如果某个网站被Google惩罚,而你却与它建立链接的话,不仅无助于登陆Google,相反会被殃及池鱼,你的网站也可能被Google惩罚。
网站登录Google与网站设计
对网友来说,没有比Google将自己呕心沥血建好的网站拒之门外更让人郁闷的事了。的确,就目前Google所处的地位来说,将自己的网站登录Google搜索引擎成了站主们心中的头等大事。可有时就是天不随人愿,花好大代价建成的网站,谁见了都被迷得五迷三道,而让对面的Google看过来,它却不理不睬,搞得站主们心里直犯嘀咕:我到底哪儿得罪Google了?
其实在对待收录网站的问题上,Google还是相当宽容的,而且从扫描技术上说它也是最全面的,不过万一你的网站得不到Google的赏识,不仿从以下几个方面找找原因(请首先确认Google的确没收录你的网站):
■ 网站设计是否搜索引擎友好
1、纯Java网站
如果你的网站是用纯Java设计的,那么就要小心了,因为Google曾在一些场合明确表示过不会收录用纯Java技术制作的网站。
2、Flash网站
如果你的网站大量使用Flash,例如首页为一个Flash动画,并且链接内嵌在Flash中,对这种网站Google是不太感冒的,而且一些搜索引擎(Google、Fast/AllTheWeb等)虽然已能解读图象中的内嵌文字和链接,但并未正式使用在对内部网页的检索上。
3、纯图象首页
目前许多网站(尤其是企业网站)将首页设计成仅包含图象的形象页面(splash page),加上网站内容太少,因此常常造成无法成功登录Google。听听Google对此是怎么说的:“We want to point users to content pages,not to doorways or splash screens”。
4、网页框架(frameset)
Google可以检索使用网页框架结构的网站,但由于搜索引擎工作方式与一般的网页浏览器不同,因此会造成返回的结果与用户的需求不符,这是搜索引擎所极力要避免的,所以Google在收录网页框架结构的网站时还是有所保留的。如果你非用框架结构不可,可以将相关内容放在<noframes></noframes>标签中。
5、动态网页
Google是较早支持动态网页检索的搜索引擎之一,但有一定限度,Google的解释是:“because our web crawler can easily overwhelm and crash sites serving dynamic content, we limit the amount of dynamic pages we index”。
不过据我们观察,Google现在对动态网页的支持很好。但如果动态网页存在回路(loop),很容易将spider套住让它无法脱身,所以当你找不到其他无法登录Google的原因时,可以试着将动态网页改成静态html文件。
6、网站内部链接
网页之间的链接最好是文字链接,其次是图象链接。虽然Google已能跟踪和解析JavaScript和Flash中内嵌的链接,但从搜索引擎友好的角度讲还是不要大量采用JavaScript和Flash链接。
■ 网站/网页访问是否正常
1、网站访问速度
你也许想不到,网站访问速度太慢也是影响成功注册Google引擎的原因。这方面我们是有“血”的教训的。如果发现网站响应速度过慢,建议你赶快换一个主机。如果你对登录Google是认真的,多花些钱还是值得的。
2、网页大小
虽然网页大小不是最关键的因素,但从搜索引擎友好的角度说,下载越快的网页被成功收录的几率也就越大。至于网页字节数多少合适没有一个正式的标准,一般说法是不超过50K,不过有一点是肯定的,如果你做一个100多K的网页,无论对搜索引擎还是普通浏览者来说都不是件好事吧?
3、更改文件名
对网站进行调整时要注意,不要对网页文件名做过多地更改。当Google探测到用户点击的多数是无效连接时,会将你的网页从搜索结果中摘除。如果你必须大面积更改文件名,可以使用主机的301转发功能,将原来的链接指向新的文件(切记不要在原页面设置META Refresh转发)。
网站提交Google注册应注意的问题
Google对网站链接非常重视,这一点也反映在对导出链接(out-going/outbound links)的评估上。首先你要保证你的网站“properly linked to other sites”,也就是说如果你的网站只有外部反向链接而没有导出链接的话,即使不一定影响你成功注册Google搜索引擎,也会对你的网站在搜索结果中的表现带来负面影响。
当然网站中连一个导出链接都没有的情况非常罕见,除非你是刻意这么做。正常情况下大家都会自然地在网页中加上一些其他网站的链接,带领访问者去到我们认为重要或能够提供更多有价值信息的地方,这就是所谓的“搜索引擎第二定律”。
就在你将好不容易吸引来的访客拱手让给别人的时候,不仅是帮了Google一个忙,而且从信息检索总体来说,你也为其他搜索者做了件好事,因为你的链接会让包括Google在内的搜索引擎们能够更准确地判断哪些是对用户最有价值的信息。所以Google才会建议你“link to other sites”。
但请注意前面一修饰词:“properly”,就是说你连向其他网站没问题,不过不要随心所欲,不然Google会给你好看!那么怎样做才算是“properly”?
首先一点,也是最重要的一点,就是要将链接连向你认为访问者最感兴趣的东西。这方面大家自然会做到,无须赘言。
第二一点,不要在首页设置过多的导出链接。这倒不是Google有明确要求,而是我们从实践总结出来的经验。我们不只一次地见到首页几乎全部为导出链接的网站,其PageRank为灰色,很明显被Google定性为无收录价值的网站。
还有一点很容易被我们忽视,就是要检查现有的导出链接是否连向了被Google惩罚的网站,一旦发现要赶快将连接去掉,否则会被Google认为是“bad neighborhood”中的一员,惨遭被惩罚的厄运。