Google数以亿计的爬虫们每天都在以光速索引着互联网上的信息,以便我们能通过Google搜索到最新的内容。最近Google的发言人告诉福布斯说他们的爬虫现在可以跟JavaScript做深入互动了,它们甚至可以理解JavaScript代码,这将使Google可以索引到更丰富的内容。
让一个程序理解JavaScript并不是一件简单的事,没有哪种算法可以应用到任何程序上,在任何点,告诉你这个程序是否可以继续无限循环下去,然而如果Google的爬虫可以处理JavaScript,他们就必须解决这种困难。
Google爬虫变得越来越快越来越聪明还要感谢新的Caffeine(咖啡因)系统,正是这个新系统使得Google爬虫具备了理解甚至处理代码的能力,以更好的解析富媒体。
|