Google公司正在开发一套网页实时索引系统。未来小型网站在更新网页几秒钟之后,Google将会自动进行索引并让网民查询到。美国搜索行业专家丹尼苏利文(Danny Sullivan)表示这将让Google掀起新的篇章。
去年秋天,Google负责PubSubHubbub (PuSH)实时分发协议开发的工程师布雷特斯拉特金(Brett Slatkin)曾表示,希望有朝一日Google能够使用PuSH协议索引互联网网页,而不是目前已经使用了多年的顺藤摸瓜、抓取链接的方式。Google高级产品经理迪兰凯西(Dylan Casey)日前在加州由苏利文所在公司举办的搜素营销展会上表示,Google很快将发布一个标准,让网站管理员能够参加未来的实时索引计划。
PuSH是一套基于ATOM格式的内容分发系统,网站出版商对外界公开一个Hub,一旦网站网页有所更新,Hub将会即使发出通知。订阅者将会对Hub反馈:如果网站方发布新内容,请直接发送给我们。这样,订阅者无需像过去那样随时查看网站是否有更新,只需要坐等Hub的通知。整个过程只需要在几秒钟内即可完成。
一旦Google采用PuSH模式索引网页,该公司可能会要求所有的网站实施这项技术,并向Google告知网站Hub信息,就好象Google之前从网站那里获得的RSS源文件。这样,Google将可以快速知晓哪些网站的内容进行了更新。
媒体分析认为,PuSH模式不会完全取代传统的抓取,实际上Google需要依靠抓取过程发现PuSH文件,而这种实时索引将极大增强Google的网页数据库。
苏利文也指出,Google在实施这项技术之前还需要进行垃圾信息控制,不能让所有新发布的内容都被立刻索引到。
Google的斯拉特金表示,这种技术将给大量的小型网站带来改观。现在,Google针对小网站一般每周索引一次。而在PuSH技术下,小网站的内容将立刻被Google用户搜索到。
需要指出的是,PuSH带来的益处将被Google之外的所有搜索引擎享受到,它属于开放协议,网站的Hub除了Google之外,也能被雅虎或者必应等搜索看到。
|