信息检索发展历史

Posted 信息

篇首语:其实最美好的日子就是,我对你闹,你对我笑。本文由小常识网(cha138.com)小编为大家整理,主要介绍了信息检索发展历史相关的知识,希望对你有一定的参考价值。

信息检索发展历史

1.信息检索的发展历史

按照一定方式组织存贮信息,并根据用户需求查找出有关信息的过程。

又称信息存贮与检索、情报检索。信息的查找萌芽于图书馆的参考工作。

“信息检索”一词出现于20世纪50年代 。信息检索包括3个主要环节 :①信息内容分析与编码,产生信息记录及检索标识。

②组织存贮,将全部记录按文件、数据库等形式组成有序的信息集合。③用户提问处理和检索输出。

关键部分是信息提问与信息集合的匹配和选择,即对给定提问与集合中的记录进行相似性比较,根据一定的匹配标准选出有关信息。它按对象分为文献检索、数据检索和事实检索;按设备分为手工检索、机械检索和计算机检索。

由一定的设备和信息集合构成的服务设施称为信息检索系统,如穿孔卡片系统、联机检索系统、光盘检索系统、多媒体检索系统等。信息检索最初应用于图书馆和科技信息机构,后来逐渐扩大到其他领域,并与各种管理信息系统结合在一起。

与信息检索有关的理论、技术和服务构成了一个相对独立的知识领域,是信息学的一个重要分支,并与计算机应用技术相互交叉。一、计算机信息检索的发展阶段 计算机信息检索的发展过程是与计算机技术及其它现代科学技术的发展过程紧密相关的。

计算机用于信息检索始于50年代初,在40多年的发展历史中,计算机信息检索大体经历了三个发展阶段。 (一)脱机检索阶段 此阶段是从50年代中期到60年代中期。

自1946年2月世界上第一台电子计算机问世以来,人们一直设想利用计算机查找文献。进入50年代后,在计算机应用领域“穿孔卡片”和“穿孔纸带”数据录入技术及设备相继出现,以它们作为存贮文摘、检索词和查询提问式的媒介,使得计算机开始在文献检索领域中得到了应用。

1954年,美国海军兵器中心首先采用IBM-701型计算机建立了世界上第一个科技文献检索系统,实现了单元词组配检索,检索逻辑只采用“逻辑与”,检索结果只是文献号,1958年,美国通用电器公司将其加以改进,输出结果增加了题名、作者和文献摘要等项目。1964年,美国化学文摘服务社建立了文献处理自动化系统,使编制文摘的大部分工作实现了计算机化,以后又实现了计算机检索。

同年,美国国立医学图书馆建立了计算机数据库,即医学文献分析与检索系统,不仅可以进行逻辑“或”、“与”、“非”等种运算,而且还可以从多种途径检索文献。 这一阶段主要以脱机检索的方式开展检索服务,其特点是不对一个检索提问立即作出回答,而是集中大批提问后进行处理,且进行处理的时间较长,人机不能对话,因此,检索效率往往不够理想。

但是,脱机检索中的定题服务对于科技人员却非常有用,定题服务能根据用户的要求,先把用户的提问登记入档,存入计算机中形成一个提问档,每当新的数据进入数据库时,就对这批数据进行处理,将符合用户提问的最新文献提交给用户,可使用户随时了解课题的进展情况。 (二)联机检索阶段 此阶段是从60年代中期到70年代初。

由于计算机分时技术的发展,通信技术的改进,以及计算机网络的初步形成和检索软件包的建立,用户可以通过检索终端设备与检索系统中心计算机进行人机对话,从而实现对远距离之外的数据库进行检索的目的,即实现了联机信息检索。 这个时期,由于计算机处理功能的加强,数据存贮容量的扩大和磁盘机的应用,为建立大型的文献数据库创造了条件。

例如美国的DIALOG系统(DIALOG对话系统)、ORBIT系统(书目情报分析联机检索系统)、BRS系统(存贮和信息检索系统)、欧洲的ESA-IRS系统(欧洲航天局信息检索系统)等都是在此时期开始研制并逐步发展起来的,并且均在国内或组织范围内得到实际应用。 可以说,联机检索是科技信息工作、计算机、通讯技术三结合的产物,它标志着70年代计算机检索的水平。

(三)网络化联机检索阶段 此阶段是从70年代初到现在。由于电话网、电传网、公共数据通信网都可为情报检索传输数据。

特别是卫星通信技术的应用,使通信网络更加现代化,也使信息检索系统更加国际化,信息用户可借助国际通讯网络直接与检索系统联机,从而实现不受地域限制的国际联机信息检索。尤其是世界各大检索系统纷纷进入各种通信网络,每个系统的计算机成为网络上的节点,每个节点联接多个检索终端,各节点之间以通信线路彼此相连,网络上的任何一个终端都可联机检索所有数据库的数据。

这种联机信息系统网络的实现,使人们可以在很短的时间内查遍世界各国的信息资料,使信息资源共享成为可能。 可以说,联机网络和检索终端几乎遍及世界所有国家和地区,使得国际联机信息检索的发展达到了相当高的水平,开展商业性国际联机检索服务的大机构已达200余家,像美国的DIALOG信息公司已成为全世界最为著名的联机检索服务机构。

计算机信息检索的实现,大大方便和加速了信息资源的交流和利用,并对社会经济的发展和人们的科研方式产生了深刻的影响,从而也极大地促进了科技的进步。

2.信息检索的发展历史

按照一定方式组织存贮信息,并根据用户需求查找出有关信息的过程。

又称信息存贮与检索、情报检索。信息的查找萌芽于图书馆的参考工作。

“信息检索”一词出现于20世纪50年代 。信息检索包括3个主要环节 :①信息内容分析与编码,产生信息记录及检索标识。

②组织存贮,将全部记录按文件、数据库等形式组成有序的信息集合。③用户提问处理和检索输出。

关键部分是信息提问与信息集合的匹配和选择,即对给定提问与集合中的记录进行相似性比较,根据一定的匹配标准选出有关信息。它按对象分为文献检索、数据检索和事实检索;按设备分为手工检索、机械检索和计算机检索。

由一定的设备和信息集合构成的服务设施称为信息检索系统,如穿孔卡片系统、联机检索系统、光盘检索系统、多媒体检索系统等。信息检索最初应用于图书馆和科技信息机构,后来逐渐扩大到其他领域,并与各种管理信息系统结合在一起。

与信息检索有关的理论、技术和服务构成了一个相对独立的知识领域,是信息学的一个重要分支,并与计算机应用技术相互交叉。一、计算机信息检索的发展阶段 计算机信息检索的发展过程是与计算机技术及其它现代科学技术的发展过程紧密相关的。

计算机用于信息检索始于50年代初,在40多年的发展历史中,计算机信息检索大体经历了三个发展阶段。 (一)脱机检索阶段 此阶段是从50年代中期到60年代中期。

自1946年2月世界上第一台电子计算机问世以来,人们一直设想利用计算机查找文献。进入50年代后,在计算机应用领域“穿孔卡片”和“穿孔纸带”数据录入技术及设备相继出现,以它们作为存贮文摘、检索词和查询提问式的媒介,使得计算机开始在文献检索领域中得到了应用。

1954年,美国海军兵器中心首先采用IBM-701型计算机建立了世界上第一个科技文献检索系统,实现了单元词组配检索,检索逻辑只采用“逻辑与”,检索结果只是文献号,1958年,美国通用电器公司将其加以改进,输出结果增加了题名、作者和文献摘要等项目。1964年,美国化学文摘服务社建立了文献处理自动化系统,使编制文摘的大部分工作实现了计算机化,以后又实现了计算机检索。

同年,美国国立医学图书馆建立了计算机数据库,即医学文献分析与检索系统,不仅可以进行逻辑“或”、“与”、“非”等种运算,而且还可以从多种途径检索文献。 这一阶段主要以脱机检索的方式开展检索服务,其特点是不对一个检索提问立即作出回答,而是集中大批提问后进行处理,且进行处理的时间较长,人机不能对话,因此,检索效率往往不够理想。

但是,脱机检索中的定题服务对于科技人员却非常有用,定题服务能根据用户的要求,先把用户的提问登记入档,存入计算机中形成一个提问档,每当新的数据进入数据库时,就对这批数据进行处理,将符合用户提问的最新文献提交给用户,可使用户随时了解课题的进展情况。 (二)联机检索阶段 此阶段是从60年代中期到70年代初。

由于计算机分时技术的发展,通信技术的改进,以及计算机网络的初步形成和检索软件包的建立,用户可以通过检索终端设备与检索系统中心计算机进行人机对话,从而实现对远距离之外的数据库进行检索的目的,即实现了联机信息检索。 这个时期,由于计算机处理功能的加强,数据存贮容量的扩大和磁盘机的应用,为建立大型的文献数据库创造了条件。

例如美国的DIALOG系统(DIALOG对话系统)、ORBIT系统(书目情报分析联机检索系统)、BRS系统(存贮和信息检索系统)、欧洲的ESA-IRS系统(欧洲航天局信息检索系统)等都是在此时期开始研制并逐步发展起来的,并且均在国内或组织范围内得到实际应用。 可以说,联机检索是科技信息工作、计算机、通讯技术三结合的产物,它标志着70年代计算机检索的水平。

(三)网络化联机检索阶段 此阶段是从70年代初到现在。由于电话网、电传网、公共数据通信网都可为情报检索传输数据。

特别是卫星通信技术的应用,使通信网络更加现代化,也使信息检索系统更加国际化,信息用户可借助国际通讯网络直接与检索系统联机,从而实现不受地域限制的国际联机信息检索。尤其是世界各大检索系统纷纷进入各种通信网络,每个系统的计算机成为网络上的节点,每个节点联接多个检索终端,各节点之间以通信线路彼此相连,网络上的任何一个终端都可联机检索所有数据库的数据。

这种联机信息系统网络的实现,使人们可以在很短的时间内查遍世界各国的信息资料,使信息资源共享成为可能。 可以说,联机网络和检索终端几乎遍及世界所有国家和地区,使得国际联机信息检索的发展达到了相当高的水平,开展商业性国际联机检索服务的大机构已达200余家,像美国的DIALOG信息公司已成为全世界最为著名的联机检索服务机构。

计算机信息检索的实现,大大方便和加速了信息资源的交流和利用,并对社会经济的发展和人们的科研方式产生了深刻的影响,从而也极大地促进了科技的进步。

3.信息检索发展历史

从检索的对象性质来看,存在有三种类型的信息检索,即文献信息检索、数据信息检索和事实信息检索。

1)文献检索( Document Retrieval ) 即从一个文献集合中查找出专门包含所需信息内容的文献,是以文献为检索对象的信息检索类型。文献检索结果提供的是与用户的信息需求相关的文献的线索或原文。

2)数据检索( Data Retrieval ) 以特定数据为检索对象和检索目的的信息检索类型。包括数据图表,某物质材料成份、性能、图谱、市场行情、物质的物理与化学特性,设备的型号与规格等,是一种确定性检索。

3)事实检索( Fact Retrieval ) 是获取以事物的实际情况为基础而集合生成的新的分析结果的一类信息检索,是以从文献中抽取的事项为检索内容,包括事物的基本概念、基本情况,事物发生的时间、地点、相关事实与过程等。

4.信息检索的起源

信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索成已为图书馆独立的工具和用户服务项目。随着1946年世界上第一台电子计算机问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来;脱机批量情报检索系统、联机实时情报检索系统

相继研制成功并商业化,20世纪60年代到80年代,在信息处理技术、通讯技术、计算机和数据库技术的推动下,信息检索在教育、军事和商业等各领域高速发展,得到了广泛的应用。Dialog国际联机情报检索系统是这一时期的信息检索领域的代表,至今仍是世界上最著名的系统之一。

5.信息检索的发展趋势是什么

信息技术的发展趋势

1.高速、大容量。速度越来越高、容量越来越大,无论是通信还是计算机发展都是如此。

2.综合化。包括业务综合以及网络综合。

3.数字化。一是便于大规模生产。过去生产一台模拟设备需要花很多时间,模拟电路每一个单独部分都需要进行单独设计单独调测。而数字设备是单元式的,设计非常简单,便于大规模生产,可大大降低成本。二是有利于综合。每一个模拟电路其电路物理特性区别都非常大,而数字电路由二进制电路组成,非常便于综合,要达到一个复杂的性能用模拟方式往往综合不起来。现在数字化发展非常迅速,各种说法也很多,如数字化世界、数字化地球等。而搞数字化最主要的优点就是便于大规模生产和便于综合这两大方面。

4.个人化。即可移动性和全球性。一个人在世界任何一个地方都可以拥有同样的通信手段,可以利用同样的信息资源和信息加工处理的手段。

6.网络信息检索及其发展趋势

一、智能化

智能化是网络信息检索未来主要的发展方向。智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索。用户所需要做的仅仅是告诉计算机想做什么,至于怎样实现则无须人工干预,这意味着用户将彻底从繁琐的规则中解脱出来。近几年来,智能信息检索(intelligent information retrieval)作为人工智能(AI)的一个独立研究分支得到了迅速发展。在Inter技术迅速普及的今天,面向Inter的信息获取与精化技术已成为当代计算机科学与技术领域中迫切需要研究的课题,将人工智能技术应用于这一领域是人工智能走向应用的一种新的契机与突破口。

二、可视化

可视化(visualization)的历史可以追溯到2400多年前。哲学家柏拉图指出,我们通过看来识别物体。据统计,人获取信息有70%一80%靠视觉,20%靠听觉,10%靠触觉。用图像(visual)取代文字帮助人们检索的优点在于:图像的表达方式生动、形象、准确、效率更高,能从多角度揭示,而纯文字的表达方式是模糊、一维的。

三、简单化

未来家用电脑将朝着智能化、网络化、人性化和绿色环保的方向发展;操作系统的用户友好性将不断增强,如微软和苹果公司都在致力于操作系统网络化研究,以便使其中的任一应用程序都能“连接”进行“网络检索”,并与网络“交互”;各搜索引擎检索界面更加“傻瓜化”。使用户学习和进行网络信息检索更加容易;网上自动标引、自动文摘、自动跟踪、自动漫游、机器翻译、多媒体技术、动态链技术、数据挖掘和信息推拉等技术逐步发展、完善,会越来越方便用户及时准确地检索信息。这些硬件与软件技术的发展都有利于网络信息检索的简单化。

四、多样化

多样化首先表现在可以检索的信息形态多样化,如文本、声音、图像、动画。目前网络信息检索的主体是文本信息,基于内容的检索技术和语音识别技术的发展,将使多媒体信息的检索变得逐渐普遍。

多样化的第二个表现是检索工具向多国化、多语种化方向发展。网络的迅速发展,使得整个世界变成了地球村,世界各地上网人数的不断增多,使得英语已无法满足所有用户的需要,语言障碍越来越明显。

多样化的第三个表现是网上检索工具的服务多元化。网上检索工具已不仅仅是单纯的检索工具,正在向其他服务范畴扩展,提供站点评论、天气预报、新闻报道、股票点评、各种黄页(如电话号码)、航班和列车时刻表、地图等多种面向大众的信息服务、免费电子信箱,以多种形式满足用户的需要。无论是在国际上还是在国内,检索工具都在朝多元化方向发展,为用户提供全方位服务。

多样化还表现在网络信息检索可以间接地服务于其他行业。例如数据挖掘技

术可用于分析历史数据的变化趋势,预测未来发展方向,发现大量数据中潜在的模式规律,为投资、科研、项目评估等提供有力的依据;还可以系统地、定量地分析目前较为热门的研究发展领域及查询频繁更新的文献资料种类,可使信息中心、图书馆等信息服务机构不断调整文献资料及图书的订阅、收集工作,有的放矢,向以需求为驱动的方向发展,建立一套更为系统、科学的管理方式。

五、个性化

个性化指各网站注重内容的特色化和注重个性化的服务。

网络资源的指数级膨胀,使得用户在获得自己需要的信息资源时要花费大量的时间和精力。随着互联网的飞速发展,每个人的不同信息需求将凸现于标准化、单一的“大众需求”之上,并成为各个搜朋够或网站努力追求的对象。不同的打有消费者个人烙印的产品将成为某个消费者区别他人、感觉自我存在及独特的外在标志,个性化服务成功的实质在于提供了真正适应用户需要的产品,贯彻了以用户为中心的理念。

六、商业化

网络检索系统拥有全世界数量众多的用户,吸引了大量的广告,为电子信息的增值服务提供了广阔的空间。网络检索系统已成为新的投资热点。网络检索系统不再仅仅是一种检索工具,而且成为一项产业,它的商业利益成为推动系统完善和扩展的主要动力,网络信息的检索与利用由公用性转向商业化。美国著名的数字媒体评估公司Jupiter Media Metrix日前发布研究报告称,“搜索引擎公司推出的付费添加服务是一个正在兴起的、前景光明的因特网领域,相对于目前低迷的在线广告市场来说,它的发展潜力是非常巨大的。”

7.信息检索发展的过程

按照一定方式组织存贮信息,并根据用户需求查找出有关信息的过程。又称信息存贮与检索、情报检索。信息的查找萌芽于图书馆的参考工作。“信息检索”一词出现于20世纪50年代 。信息检索包括3个主要环节 :①信息内容分析与编码,产生信息记录及检索标识。②组织存贮,将全部记录按文件、数据库等形式组成有序的信息集合。③用户提问处理和检索输出。关键部分是信息提问与信息集合的匹配和选择,即对给定提问与集合中的记录进行相似性比较,根据一定的匹配标准选出有关信息。它按对象分为文献检索、数据检索和事实检索;按设备分为手工检索、机械检索和计算机检索。由一定的设备和信息集合构成的服务设施称为信息检索系统,如穿孔卡片系统、联机检索系统、光盘检索系统、多媒体检索系统等。信息检索最初应用于图书馆和科技信息机构,后来逐渐扩大到其他领域,并与各种管理信息系统结合在一起。与信息检索有关的理论、技术和服务构成了一个相对独立的知识领域,是信息学的一个重要分支,并与计算机应用技术相互交叉。

参考资料:中国大百科全书

8.中国信息发展史

信息技术:Information Technology(英文) 简称IT 凡是能扩展人的信息功能的技术,都是信息技术。

可以说,这就是信息技术的基本定义。它主要是指利用电子计算机和现代通信手段实现获取信息、传递信息、存储信息、处理信息、显示信息、分配信息等的相关技术。

具体来讲,信息技术主要包括以下几方面技术: 1.感测与识别技术 它的作用是扩展人获取信息的感觉器官功能。它包括信息识别、信息提取、信息检测等技术。

这类技术的总称是“传感技术”。它几乎可以扩展人类所有感觉器官的传感功能。

传感技术、测量技术与通信技术相结合而产生的遥感技术,更使人感知信息的能力得到进一步的加强。 信息识别包括文字识别、语音识别和图形识别等。

通常是采用一种叫做“模式识别”的方法。 2.信息传递技术 它的主要功能是实现信息快速、可靠、安全的转移。

各种通信技术都属于这个范畴。广播技术也是一种传递信息的技术。

由于存储、记录可以看成是从“现在”向“未来”或从“过去”向“现在”传递信息的一种活动,因而也可将它看作是信息传递技术的一种。 3.信息处理与再生技术 信息处理包括对信息的编码、压缩、加密等。

在对信息进行处理的基础上,还可形成一些新的更深层次的决策信息,这称为信息的“再生”。信息的处理与再生都有赖于现代电子计算机的超凡功能。

4.信息施用技术 是信息过程的最后环节。它包括控制技术、显示技术等。

由上可见,传感技术、通信技术、计算机技术和控制技术是信息技术的四大基本技术,其中现代计算机技术和通信技术是信息技术的两大支柱。 《江苏科技咨询网》 信息技术是指有关信息的收集、识别、提取、变换、存贮、传递、处理、检索、检测、分析和利用等的技术。

凡涉及到这些过程和技术的工作部门都可称作信息部门。 信息技术能够延长或扩展人的信息功能。

信息技术可能是机械的,也可能是激光的;可能是电子的,也可能是生物的。 信息技术主要包括传感技术,通信技术,计算机技术和缩微技术等。

传感技术的任务是延长人的感觉器官收集信息的功能;通信技术的任务是延长人的神经系统传递信息的功能;计算机技术则是延长人的思维器官处理信息和决策的功能;缩微技术是延长人的记忆器官存贮信息的功能。当然,这种划分只是相对的、大致的,没有截然的界限。

如传感系统里也有信息的处理和收集,而计算机系统里既有信息传递,也有信息收集的问题。 目前,传感技术已经发展了一大批敏感元件,除了普通的照相机能够收集可见光波的信息、微音器能够收集声波信息之外,现在已经有了红外、紫外等光波波段的敏感元件,帮助人们提取那些人眼所见不到重要信息。

还有超声和次声传感器,可以帮助人们获得那些人耳听不到的信息。不仅如此,人们还制造了各种嗅敏、味敏、光敏、热敏、磁敏、湿敏以及一些综合敏感元件。

这样,还可以把那些人类感觉器官收集不到的各种有用信息提取出来,从而延长和扩展人类收集信息的功能。 通信技术的发展速度之快是惊人的。

从传统的电话,电报,收音机,电视到如今的移动电话,传真,卫星通信,这些新的、人人可用的现代通信方式使数据和信息的传递效率得到很大的提高,从而使过去必须由专业的电信部门来完成的工作,可由行政、业务部门办公室的工作人员直接方便地来完成。通信技术成为办公自动化的支撑技术。

计算机技术与现代通信技术一起构成了信息技术的核心内容。计算机技术同样取得了飞速的发展,体积越来越小,功能越来越强。

从大型机,中型机,小型机到微型机,笔记本式计算机,便携式计算机等。从PC 机,286,386到486,586等,计算机的应用也取得了很大的发展。

例如,电子出版社系统的应用改变了的传统印刷、出版业;计算机文字处理系统的应用使作家改变了原来的写作方式,称作“换笔”革命;光盘的实用使人类的信息存储能力得到了很大程度的延伸,出现了电子图书这样的新一代电子出版物;多媒体技术的发展使音乐创作、动画制作等成为普通人可以涉足的领域。 国外的缩微技术发展很快,美国是缩微技术最发达的国家。

例如闻名世界的美国UMI 公司是一个收集、贮藏,以及提供文献检索的出版公司,其服务范围包括近一百五十万册历代书籍、期刊、博士论文、档案以及原件。它的产品不但包括印刷品、缩微平片,而且提供机读信息。

第二次世界大战期间,该公司利用所谓缩微技术,抢救了大英博物馆的许多珍贵文献。迄今为止,该公司存有自15世纪至今的10万种世界各地的绝版书。

9.简述:"搜索引擎发展历史"

搜索引擎的发展史 1990年以前,没有任何人能搜索互联网。

所有搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie(Archie FAQ)。虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。

Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。

由于Archie深受欢迎,受其启发,Nevada System puting Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来另一个Gopher搜索工具。

Robot(机器人)一词对编程者有特殊的意义。puter Robot是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。

由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider(Spider FAQ)程序。世界上第一个Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追踪互联网发展规模。

刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。 与Wanderer相对应,1993年10月Martijn Koster创建了ALIWEB(Martijn Koster Annouces the Availability of Aliweb),它相当于Archie的HTTP版本。

ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。 随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在Wanderer基础上,一些编程者将传统的Spider程序工作原理作了些改进。

其设想是,既然所有网页都可能有连向其他网站的链接,那么从一个网站开始,跟踪所有网页上的所有链接,就有可能检索整个互联网。到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland的JumpStation、Colorado 大学Oliver McBryan的The World Wide Web Worm(First Mention of McBryan\'s World Wide Web Worm)、NASA的Repository-Based Software Engineering (RBSE) spider。

JumpStation和WWW Worm只是以搜索工具在数据库中找到匹配信息的先后次序排列搜索结果,因此毫无信息关联度可言。而RBSE是第一个索引Html文件正文的搜索引擎,也是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎。

Excite 的历史可以上溯到1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993年中,这已是一个完全投资项目Architext,他们还发布了一个供webmasters在自己网站上使用的搜索软件版本,后来被叫做Excite for Web Servers。

(注:Excite后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile) 1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)上线。除了网站搜索,它还支持Gopher和Tel搜索。

1994年4月,Stanford University的两名博士生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo(Jerry Yang Alerts a Use group to the Yahoo Database ,1996年的Yahoo)。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。

因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Wanderer只抓取URL,但URL信息含量太小,很多信息难以单靠URL说清楚,搜索效率很低。

Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。(注:Yahoo以后陆续使用Altavista、Inktomi、Google提供搜索引擎服务;2002年10月9日,Yahoo放弃自己的网站目录默认搜索,改为默认Google的搜索结果,成为一个真正的搜索引擎。

并于2002年12月23日收购inktomi,于2003年7月14日收购包括Fast和Altavista在内的Overture) 1994年初,Washington大学CS学生Brian Pinkerton开始了他的小项目WebCrawler(Brian Pinkerton Announces the Availability of Webcrawler)。1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。

WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。(注:后来webcrawler陆续被AOL和Excite收购,现在和excite一样改用元搜索引擎Dogpile) Lycos(Carnegie Mellon University Center for Machine Translation Announces Lycos )是搜索引擎史上又一个重要的进步。

Carnegie Mellon University的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。1994年7月20日,数据量为54,000的。

相关参考

提取两项有关唐_宋历史变迁的信息

1.示例一:信息:汉代的州集中于黄河中下游地区,唐代的道南北分布大体平衡。说明:汉唐间南方社会经济有了很大的发展示例二:信息:汉代州名与唐代道名有很大不同。说明;唐代“道”的划分更注重山川地理形势。此

vsession历史信息

如何查询session执行的历史sql语句如何知道一个session都执行过哪些SQL语句?(查看当前比较容易,历史的呢?怎么复原sql的执行场景——事务关系、执行序列、单SQL还是存储过程)【方法一

中文拼音输入法的发展历史是怎样的

由于汉字有数以万计,电脑键盘不可能为每一个汉字而造一个按键。因此,人们需要替汉字编码(检索出汉字的代码),用数个键来输入一个汉字。中文输入法的发展过程,是“万码奔腾”的过程,在30年间出现了上千种编码

信息与通信发展历史

1.通信发展的历史世界移动通信发展史移动通信可以说从无线电通信发明之日就产生了。1897年,M·G·马可尼所完成的无线通信试验就是在固定站与一艘拖船之间进行的,距离为18海里。现代移动通信技术的发展始

怎么查看qq历史信息

一、怎么查看QQ的历史系统消息准备工具/材料:装有windows10的电脑一台,QQ软件。查看QQ的历史系统消息的办法如下:1、首先,我们双击电脑桌面上的QQ。2、在弹出界面中,我们输入账号和密码,然

与昆明相关的历史文化信息

一、谁有昆明的历史资料文化特征:悠久的历史和丰厚的文化积累,形成了当今昆明“历史悠久,古迹多;风景秀丽,名胜多;人文荟萃,名流多;资源丰富,物产多;开发较早,交往多”的鲜明特色。从战国楚将庄开滇,历经

京东历史收货人信息吗

京东登录不上去要历史收货人但是我不记得了怎么办什么申诉成功-百如果京东账号绑定了邮箱和手机,可以通过这两个找回试试。1、进入京东的登陆页面,选择页面中的忘记密码。2、进入密码找回页面,输入注册手机号,

如何在信息技术课堂教学中渗透德育

信息技术的快速发展,造就了网络时代的盛况,也诞生了众多的学生网民。学生在享受着信息技术带来方便快捷的同时,却没有考虑到它的负面因素。因此,信息技术课除了教学工作,还担负着对学生进行德育渗透的重任,不仅

天津电子信息职业技术学院的历史沿革

天津工业职业技术学院1987年,天津市第二机械局职工大学更名为天津电子仪表局职工大学;1995年,天津电子仪表局职工大学更名为天津市电子仪器公司职工大学;天津市电子仪器公司职工大学更名为天津职工电子仪

人面鱼纹陶盆和全形卜甲的历史信息

人面鱼纹盆,是出自仰韶文化最具有代表性的陕西西安半坡遗址,质地彩陶,用途作为瓮馆盖,瓮馆:瓮棺葬葬具,流行于仰韶文化-商晚期的一种葬俗,埋葬对象为夭折儿童,一般埋葬地点是当时住房的门槛下或是儿童集体墓