优克斯youkes.com(推荐chrome浏览器) 该网站的定位:轻量级购书,在线影视搜索引擎。 目前状态:在线影视索引了 优酷 PPTV 爱奇艺 迅雷 搜狐,更多的正在进行中。 在线书籍购买索引了京东(书的价格有可能些须不一致,京东可能要调整价格),下一步将加入亚马逊的价格。 现在开始测试,欢迎大家充当测试者。 用到的技术有nodejs, solr,mongodb(数据备份). 本站选择nodejs的原因,nodejs虽然选择javascript作为其编程语言,但是其实它是个底层框架,编程操作其实很原始,本站采用的是类似于控制台输出方式,首先根据用户的输入或链接的点击转化为内部调用,然后再用类似jquery的nodejs插件cheerio操作html生成字符串,最后直接将字符串通过http协议输出给用户。这样服务器端也采用了类jquery的技术,保持了简单和快速。 采用了solr,solr是基于lucene的企业级搜索服务器,本人用过后感觉挺不错的,百万级的数量级的搜索速度是飞快,本人亲自测试过。 国外有大型搜索应用,据说数量级在10亿级以上。本站采用solr,感觉良好,尤其是facet功能,可以在数以百万级中的数据中快速筛选信息。 强烈推荐静态的搜索应用采用它,本站使用solr的过程,感觉其简单易用,推荐两本书(都是英文的) Apache.Solr.3.Enterprise.Search.Server和Apache.Solr.3.1.Cookbook. 其中第一本用于学习,第二本用于遇到问题查找,当然也可以到stackoverflow去查找. 界面采用的是 twitter bootstrap 文档默认界面,简单实用. 以下是一些搜索例子 搜索天涯明月刀 http://youkes.com/video?q=%E5%A4%A9%E6%B6%AF%E6%98%8E%E6%9C%88%E5%88%80
搜索演员周星驰 [http://youkes.com/video?q=%E5%91%A8%E6%98%9F%E9%A9%B0&site=%E4%BC%98%E9%85%B7][2]
合作演员搜索,如 周星驰 和 吴孟达 [http://youkes.com/videoactors=%E5%91%A8%E6%98%9F%E9%A9%B0%2C%E5%90%B4%E5%AD%9F%E8%BE%BE][3]
几个简单的例子就是如此了,更多的请到http://youkes.com/试试,输入关键词后,乱点一通,就会明白了。
@snoopy 能够,很简单,solr提供REST服务,只需按solr的规则用http GET(检索)或http POST(建立索引)就可以了,facet是一种功能,可以将含相同属性的检索结果归为同一组,典型用于分类搜索中,如我网站: http://youkes.com/book?q=google 其中出现的链接 类别: 计算机(37) 管理(14) 港台(4) 科技(3) 励志(2) 外语(2) 建筑(1) 法律(1)就是facet功能。它能找出含google关键字的书籍有哪些类别,并且各内别有多少个检索结果。