这是我的个人信息检索仓库
斯坦福大学的实验, 给定文档集合,使⽤BSBI算法实现倒排索引的构建,并使⽤可变⻓编码压缩保存到磁盘,然后实现联合查询。 最后额外选择实现⼀种编码⽅式(gamma或者delta编码)
对于给定的文本集实现对域的自由查询功能, 并利用向量空间模型进行返回文本的排序
信息检索领域庞⼤⽽有趣,有着诸多应⽤场景和背后⽀撑的理论⽅向。本次作业,我们将进⾏⼀次⼤胆的探索,对信息检索领域内的任意问题开展头脑⻛暴,并撰写功能设计文档。
设计文档格式:
- 背景与意义
- 现状分析
- 方案设计
- 技术路线
- 总结
- 参考文献
本次作业我们要求实现⼀个系统的Web搜索引擎(主题不限),为⽤户提供查询服务和个性化推荐。
本次作业中需要包含以下几个部分:
- 网页爬取;
- 文本索引;
- 链接分析;
- 查询服务: 为⽤户提供站内查询、短语查询、通配查询、查询⽇志、⽹⻚快照等⾼级搜索功能
- 个性化查询: 不同用户提供不同的内容查询
- Web界面
- 个性化推荐