搜索引擎

这是我硕士论文的一部分,毕业不容易,求各位大神帮忙想想解决思路~~~
问题是:如何判别一个网站是不是包含农业供求信息的网站?
在一个农业网站里,供求信息只是一个版块(其他的版块还有农业资讯、新闻、农业企业名录、栽培技术等等),如何判别一个网站是不是包含农业供求信息的网站呢?
之前看了看有关网站分类的文献,都是在对整个网站的主题进行分类(比如判断一个网站是不是...

2014-02-27 •

要求如下:
1.页面美观,而且需要像豆瓣小组搜索一样
http://www.douban.com/group/search?cat=1013&group=60439&sort=relevance&q=%E4%B8%8A%E5%BA%8A
结果里还要显示发布时间 回复数 发布者等内容,可能按时间排序,

2.搜索结果要...

2014-02-19 •

作为SEOer,每天要管理很多网站的SEO,了解蜘蛛爬行是一个很重要的信息,但是通过日志来查太麻烦,而且像一般的非技术人员没这个能力去下载日志进行分析,所以就想问问大牛们,有没有什么方法,可以做成统计流量那种方式,直接在网站公共文件里添加一个JS引入就能统计搜索引擎蜘蛛爬行记录?求方案

2013-11-17 •

我的理解是爬虫是搜索引擎的一部分,负责信息的采集。
搜索引擎其他两个部分应该还包括语义分析和全文索引,不知道我这样的理解对不对?

还有请问下现有的开源搜索引擎包含了爬虫部分吗?

2013-10-21 •

搜索引擎的小白,有个问题想请教下各位,我想爬取网上还有特定关键字的网页,但是,我又不能确定要爬取的网站,请问下solr这样的搜索引擎能实现这样的功能吗?还有大家对于我这种爬取数据有什么建议啊?这样爬的效率是不是很低?

2013-10-21 •

这个搜索引擎从存有微博内容的数据库中搜出不同时间段内的微博数目,并且能按相关度、时间排序。微博内容经人工筛选后放入数据库中。按关键词搜索出相应的内容后,搜索系统要能给出相关推荐。
这是我们老师给我们布置的一个作业,还请大神给出一个大致的系统框架,谢谢。

2013-09-18 •

Hadoop集群中存储大量文件,怎么利用开源的搜索引擎如Nutch、Solr等对Hadoop集群中文件内容进行全文搜索,并建立索引;

2013-09-11 •

热点用户排行

话题状态

最近活动:很久很久以前
该话题下的问题共被浏览 6509 次