首页 | Email
本站检索  在此输入关键词
你的当前位置:首页 >> 深入研究搜索引擎 >> 主要英文搜索引擎探索 >> web_crawler

如何使用搜索引擎

搜索的基本数学规则
强化搜索条件命令
使用相关搜索
搜索结果重组
相近搜索结果
延伸搜索条件
巧用within功能
按日期排列
自动词组搜索
搜索引擎数据库

Internet搜索大典

如何登录搜索引擎

搜索引擎的历史
搜索引擎的工作原理
搜索引擎特征列表
搜索引擎与字母大写
检查URL
 
小结
 

深入研究搜索引擎

选择关键字
搜索引擎之Meta
搜索结果排名规则
深入Yahoo!
主要英文搜索引擎探索
主要中文搜索引擎浅析
 

搜索引擎大全

 

主要中文搜索引擎
繁体中文搜索引擎
主要英文搜索引擎
行业搜索引擎
2星级搜索引擎
3星级搜索引擎
4星级搜索引擎
儿童搜索引擎
多媒体搜索引擎
新闻搜索引擎
亚洲区搜索引擎
欧洲区搜索引擎
美洲区搜索引擎
大洋洲搜索引擎
非洲区搜索引擎
其它搜索引擎

 

本站服务内容

 
服务内容
搜索引擎论坛
实用工具

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


 
AltaVista | InfoSeek | Excite | HotBot | Lycos | Northern Light | WebCrawler

Web Crawler

数据库规模
Spider级别
Meta Tag 支持
帧页支持
图像地图支持
Alt 标签支持
HTML 声明支持
Url 搜索功能
嵌入目录

约1千万 Url

Yes 
No 
No 
No 
No 
Yes 
Yes
 

登录原理

Web Crawler 在搜索引擎中是很独特的,它是最老的也是最小的引擎,
虽然不久is 前与 Excite 进行了合并,但它仍保持独立的运作。

Web Crawler 对登录原则的说明如下: (see ref.)

 

提供网络搜索是我们的业务,而作弊行为使这一业务难以正常而准确的进行,为
了 使索引数据清洁而准确,如果你的网页过分重复关键字,标题,我们将删除
你的网 页文件。

Web Crawler 是第一个提出将多重标题视为作弊的搜索引擎。

Web Crawler 可能索引网页上的所有文本 (超过 1 m),不支持框架视图,
图像地图,及 alt 标签。

 

排名规则

Web Crawler 对其排名规则是这样叙述的: (see ref.)

 

1.使用高度概括的网页标题标签。标题中含"Homepage" 或"Home Page WWW" 的网页的排名不会很好。
2.确保主页是整个网站的概括。
 

请参考以下这两个例子:

Northern Webs - North Idaho's Premier Web Design Studio

Northern Webs, North Idaho's experienced Web Design studio. Similar Pages
http://www.northernwebs.com/
71%   
 

Idaho Department of Law Enforcement Home Page

Police Departments Sheriff Departments Other Departments Attention Patch
Collectors For an Idaho State Police Patch, please send a self-addressed,
stamped envelope (SASE) and $5.00 (U.S. currency) to: Idaho State Police
Association attn: Tom Wilson 3056 Elder St Boise, ID 83705 USA Please
allow 4-6 weeks for delivery Similar Pages
http://www.state.id.us/dle/dle.htm


搜索引擎之第三法则:
如果你不按他们的要求办事,搜索引擎也不会对你的网页客气。

 

总结

Web Crawler 的spider 是一个浅层搜索spider,因此有必要提交基本
的网页。

尽管 Web Crawler 相对较小且由 Excite提供支持,你在登录时仍不得
有半点马虎。