论坛风格切换
正版合作和侵权请联系 sd173@foxmail.com
 
  • 帖子
  • 日志
  • 用户
  • 版块
  • 群组
帖子
购买邀请后未收到邀请联系sdbeta@qq.com
  • 2168阅读
  • 2回复

[硬件资讯]Google让蜘蛛自动填表提交 以抓取更多网页 [复制链接]

上一主题 下一主题
离线旋律
 
发帖
*
今日发帖
最后登录
1970-01-01
只看楼主 倒序阅读 使用道具 楼主  发表于: 2008-04-13 21:21:18
北京时间4月12日消息,据国外媒体报道:美国搜索巨头谷歌公司最近开始在网页抓取蜘蛛中实施一项新技术:他们可以让蜘蛛自动填写某些网页中的表格,并且自动提交到服务器上,对反馈页面进行抓取,从而获取更多有关这个网站的详细信息。 -rsbSt ?_  
HQP.7.w7 5  
  媒体分析认为,这将对网站的信息安全构成威胁。 G*N[tw  
YYn8!FIe  
  一般来说,表格(Form)是网站方面用来收集用户信息的一种方式。比如用户申请成为注册会员,需要提交相关的身份资料。表格将会把这些数据提交到服务器上,服务器上的网页将会给出下一步提示。 q|<B9Jk  
PN93.G(W  
  在过去,谷歌公司的蜘蛛机器人并不会填写表格,因为也无法知道下一步的提示网页内容。 N~=I))i  
$~6MR_Yq  
  最近,谷歌公司对抓取系统进行了升级。机器人将会根据表格中各个项目的名字,自动填写数据提交给服务器,这样,服务器的反馈页面也将被机器人所抓取,谷歌将会获得这个网站的更多信息。 CImp,k0  
^Ye(b7Gd  
  谷歌公司在一个博客中表示,他们会对这个功能采取谨慎态度。比如最开始,一些十分有用的网站才会采用自动填表的手段。另外,网站管理员可以在robots.txt文件中,对于是否允许谷歌提交表格作出规定,谷歌不会违反网站管理员的意愿。 ikc1,o  
,7j8+p|},  
  有搜索行业专家表示,谷歌公司的这一功能,将会对企业网站的信息安全构成威胁。
离线蓝颜知己
发帖
*
今日发帖
最后登录
1970-01-01
只看该作者 沙发  发表于: 2008-04-13 21:40:12
还是有点不懂哦。
离线goneby007
发帖
*
今日发帖
最后登录
1970-01-01
只看该作者 板凳  发表于: 2008-04-14 08:25:53
这涉及到个人隐私