关于元搜索

04月 11th, 2008

又看到一份北京大学和百度中国联合发布的2007年中国人搜索行为研究报告。

这一段结论很有意思:
中文元搜索引擎的发展不是很顺利,新千年以来,虽然断断续续有几家出现,但功能有
限,速度较慢,使用者寥寥。近一两年出现了比比猫(bbmao.com)等采用聚类排序的中文
元搜索引擎,技术有了较大的进步,但在用户中的影响还不大。
由于主流中文搜索引擎之间搜索结果的重复率很低,每个引擎的差异很大,这为元搜索
引擎的发展提供了较大的发展空间。充分发挥专长于整合各个搜索引擎优势的特点,相信元
搜索引擎在搜索成功率(平均每次搜索带来的点击数)和结果相关性方面会有较好的表现。

呵呵,百度自然是不会轻易做主营搜索以外的meta search engine的。但是李彦宏的言论似乎和这份报告指出的有很大的不同。

报告将美国Google, ask, yahoo做了对比,发现中英文SERP中内容重复率都非常低,但援引:

在美国,元搜索引擎的发展历史有十多年了,已经为人们所接受和广泛应用。2007 年
秋季在一项主题为“哪个是你最喜欢的搜索引擎”的调查中,参加调查的 181 位北美被访者
评出了他们最喜欢的 10 大搜索引擎,Google没有悬念地名列第一,元搜索引擎Vivisimo和
Yahoo!并列第二有些出乎人们的意料,另一个元搜索引擎Dogpile位列第六。人们对这两个
元搜索引擎的评价是:对来自各大搜索引擎的搜索结果进行聚类排序很有吸引力,相关性较
高,是Google和Yahoo!之外的有效选择。

所以报告才指出,中文么meta search engine市场还有很大的发展空间。

http://www.baigoogledu.com/

星期天开party啦

04月 9th, 2008

这个星期天(13号)大家来我家happy下巴~~~

时间: 中午

内容:大家吃个小火锅

添头:

1.大家聊聊理想.

2.网站群;如何让大家同时都有工作;保健品网站的可行性.

之所以再提这事,和今天看到这篇博客有关王通:暴利行业的暴利小网站

讨论议程:

一 .我们的目标:

1. 我们这辈子关于财务关于事业上的目标,

2.我们聚在一起成立亿人的标目或者目的

大家思考5分钟+每人发言时间5分钟=20分钟-30分钟

二 . 我们现在处境,下一步该怎么走,重点还是团队应该在接下来的3个月内做些什么?

大家思考5分钟+每人发言时间5分钟=20分钟-30分钟

三 . 如何合理的分配团队成员的工作.如何实现在外面的网站集合.如果在制作八本书的同时,每个人利用八本书的空档时间,是否能再做一个难度较低的页面堆积型网站(如介绍营养品的网站) 

大家思考5分钟+每人发言时间5分钟=20分钟-30分钟

当当的采集程序基本完成

03月 31st, 2008

附件中是程序运行的一部分日志,基本上我们想要的元素都有了,大家看一看,有没有什么要增加采集的东西。如果有的话赶紧提出来,现在改还是比较方便的。有什么其他的问题或者建议的,也尽早提出来。

采集程序运行日志

接下去我会写个程序可以把这些结果自动的插入/更新到我们的数据库里面去。因为考虑到可能会重复采集同一本书,并且还有tag方面的东西,所以这个插入数据库可能需要考虑到比较多的东西。

建议在server上建一个svn服务器

03月 31st, 2008

原来那个coollittlething的要收费了。建议在我们自己的server上建一个,这样便于交流,并且有些view方面的东西,wtong也可以直接改,特别是css之类的改动,以免大家做很多的重复劳动。

滋补品,保健品.比价比质交流网

03月 30th, 2008

百度搜索了下滋补品,保健品,营养品,目前似乎还没有一个为使用者服务的网站.