我来我网
https://5come5.cn
 
您尚未 登录  注册 | 菠菜 | 软件站 | 音乐站 | 邮箱1 | 邮箱2 | 风格选择 | 更多 » 
 

本页主题: Google即将开始深度Web索引 显示签名 | 打印 | 加为IE收藏 | 收藏主题 | 上一主题 | 下一主题

xielinli



贝尔诺勋章
性别: 帅哥 状态: 该用户目前不在线
头衔: 有空回来看看~
等级: 荣誉会员
家族: 跳楼要在华为跳
发贴: 7518
威望: 4
浮云: 366
在线等级:
注册时间: 2007-07-21
最后登陆: 2016-06-19

5come5帮你背单词 [ jam /d3əæm/ n. 果酱,堵塞,阻塞;vt. 压紧,挤紧,突然用力推 ]


Google即将开始深度Web索引

来源: 供稿: 责任编辑:away 时间:2008-04-13 浏览:134 投递新闻

  Google 从来都不会停止对信息的追求, 去年共有100 Exabyte 的数据被 Google 消化(1Exabyte=1000000000Gigabyte)。据估计,仍有大量的在线数据是 Google 所无法获取的,如那些未被索引的网页,非文本内容,以及需要通过表单发布方可获取的动态内容,即所谓的深度Web。Google 近日在一篇博客文章中宣布,他们即将涉足这些深度Web数据。

  在这篇博客文章中,Google 的 Jayant Madhavan 与 Alon Halevy 说,对于那些文本框,我们会从所在页选择一些词汇填写,对于选择框与复选框,我们会从 HTML 中选择一些值,一旦填写好表单,我们会尝试发布这个表单并对返回的合法,有意义的内容进行索引。Google 同时强调,他们会一如既往地尊重 robots.txt 协议,任何在 robots.txt 被禁止的表单都不会被索引。据估计,深度 Web 的规模是常规的公开 Web 的数倍,尽管在网络中,有很多数据是 Google 不应涉足的,但表单可以让 Google 在网络中更进一步,Matt Cutts 指出,我们这样做主要不是为了那些通过表单发布而返回的搜索结果,更多是为了发现一些通过常规手段所没能发现的新链接。

  需要指出的是,Google 只索引那些使用 GET 协议的表单,而不会尝试去发布那些使用 POST协议 的表单,所以,你不必担心自己的在线反馈表单收到一堆来自 Google 的垃圾信息。
顶端 Posted: 2008-04-13 23:05 | [楼 主]
我来我网·5come5 Forum » 软件交流

Total 0.008093(s) query 4, Time now is:11-22 02:00, Gzip enabled
Powered by PHPWind v5.3, Localized by 5come5 Tech Team, 黔ICP备16009856号