版本1和2间的区别
于2008-05-19 16:34:22修订的的版本1
大小: 671
编辑: czk
备注:
于2008-05-19 16:34:48修订的的版本2
大小: 695
编辑: czk
备注:
删除的内容标记成这样。 加入的内容标记成这样。
行号 1: 行号 1:
*spider是搜索引擎的必须模块.spider数据的结果直接影响到搜索引擎的评价指标.
第一个spider程序由MIT的Matthew K Gray操刀该程序的目的是为了统计互联网中主机的数目

*
Spier定义(关于Spider的定义,有广义和狭义两种).

**
狭义:利用标准的http协议根据超链和web文档检索的方法遍历万维网信息空间的软件程序.
**广义:所有能利用http协议检索web文档的软件都称之为spider.
其中Protocol Gives Sites Way To Keep Out The ′Bots Jeremy Carl, Web Week, Volume 1, Issue 7, November 1995 是和spider息息相关的协议,大家有兴趣参考[http://robotstxt.org].
 1. spider是搜索引擎的必须模块.spider数据的结果直接影响到搜索引擎的评价指标.
     第一个spider程序由MIT的Matthew K Gray操刀该程序的目的是为了统计互联网中主机的数目
 1. Spier定义(关于Spider的定义,有广义和狭义两种).
   1. 狭义:利用标准的http协议根据超链和web文档检索的方法遍历万维网信息空间的软件程序.
   1. 广义:所有能利用http协议检索web文档的软件都称之为spider.
         其中Protocol Gives Sites Way To Keep Out The ′Bots Jeremy Carl, Web Week, Volume 1, Issue 7, November 1995 是和spider息息相关的协议,大家有兴趣参考[http://robotstxt.org].
  1. spider是搜索引擎的必须模块.spider数据的结果直接影响到搜索引擎的评价指标.
    • 第一个spider程序由MIT的Matthew K Gray操刀该程序的目的是为了统计互联网中主机的数目
  2. Spier定义(关于Spider的定义,有广义和狭义两种).
    1. 狭义:利用标准的http协议根据超链和web文档检索的方法遍历万维网信息空间的软件程序.
    2. 广义:所有能利用http协议检索web文档的软件都称之为spider.
      • 其中Protocol Gives Sites Way To Keep Out The ′Bots Jeremy Carl, Web Week, Volume 1, Issue 7, November 1995 是和spider息息相关的协议,大家有兴趣参考[http://robotstxt.org].

何为爬虫 (2008-06-01 21:26:32由czk编辑)

ch3n2k.com | Copyright (c) 2004-2020 czk.