信息检索
- 汉字编码问题合集–整理
- 哈工大分词java接口
- 如何读取Lucene索引数据1–整理中
- SIGIR PAPER LIST 2005,2006,2007
- 英美文学作品中的人名与寓意
- 自然语言理解技术及其应用探讨(转)
- Two Photos
- JAVA入门教程: 第 四 章 流 控 制
- 大学生应该脱口而出的100个精典英文句子
- 垂直搜索简单调研
- Java网络编程
- Java常用类库介绍
- Introduction to Google Search Quality
- Java常用类库介绍
- Java基础类库–集合类
- 网站迁移的最佳方法
- 文献管理工具Zotero(firefox插件)-体积小、更能还不错
- Bayesian inference到NLP方面的研究讨论(水木社区)
- 正则表达式–备忘
- LingPipe 3.5.0 Released
- file的getPath getAbsolutePath和getCanonicalPath的不同
- 世界各国域名后缀大全
- JAVA入门教程: 第 六 章 对 象、类、包和接口
- Google AdSense 高价关键词一览
- 搜索引擎技术普及 – 1,2,3,4
- Lucene 在线查询
- Web搜索引擎介绍–Web搜索引擎系列1
- 搜索引擎中自然语言理解技术及其应用探讨(下)
- 搜索引擎中自然语言理解技术及其应用探讨(中)
- 自然语言理解技术及其应用探讨(上)
- gate 文本处理引擎
- Indri中的动态文档索引技术(转)
- 天网新语料(2006)的分割程序
- java 数据压缩与解压,实例详解–备忘
- Java支持编码说明–备忘系列
- google的面试题
- 用Deflater压缩序列化对象–备忘
- Inside Lucene/超人气搜索引擎学习(2.0)-读取索引
- Lucene 2.3: 索引性能500%提升,一个有关机器学习的项目Mahout 将启动
- 自然语言处理与信息检索
- 信息检索研究–Google产品与使用技巧
- 推荐一网页加速器–Google开发的哦
- 信息检索研究–Google浪潮之巅系列
- Lucene 高亮 –不就行二次分词(zhuan)
- Java1.5泛型指南中文版(Java1.5 Generic Tutorial, zhuan)
- 提高lucene索引速度技巧汇总
- ACL2007一些统计数据
- java程序获取各大搜索引擎结果
- IJCNLP 2008 Accepted Papers – Main Conference
- 跨语言信息检索综述
- yahoo web seacher api 参数说明
- lucene HitCollector 的作用
- 机器学习介绍
- 学术报告-检索相关
- Lucene的使用与优化(转)–整理
- Lucene并发连接实现(zhuan)
- Inside Lucene/超人气搜索引擎学习(zhuan)
- 个人搜索引擎研究总结(转)–继续整理中
- A series of IR related blogs and tutorials
- TREC Billion Document Web Corpus 发布
- I.E., ETC., et al AND E.G. –Comparison, Difference
- 学英语用OXFORD Collocations dictionary for students of English词典(附下载和在线查询)
- BM系列(如Okapi BM25)Weighting 公式介绍及文献– BM family weighting scheme Introduction and important Literaturesuu
- Ullman set — A clever data struture
- EI收录介绍
- Lucene 2.4 in 60 seconds
- IBM Haifa Team 把Lucene Ranking系统打造成state-of-the-art ,TREC 2007 Million Queries Track – IBM Haifa Team
- Google Docs中插入数学公式和特殊字符
- Using DataInputStream and DataOutputStream –EOF
- Java Inner classes –So what are inner classes good for anyway?
- 看看IR(信息检索)领域的大牛们
- 机器学习与人工智能学习资源导引
- 工程索引(Engineering Index, Ei)数据库中被《Ei Compendex》收录与被《Ei Pageone》收录数据的区别和识辨(转)
- 入境英语-场景对话
- 常用机场英语词汇
- A Guide to Information Retrieval
- 关于修改/增加lucene排序算法的讨论
- 编辑距离Edit Distance In LingPipe
- 扩展Lucene的索引文件存储
- lucene 提高中文Highlight效率
- Java流程控制
- Java类封装、继承、多态性2
- Java中的流
- 英美人的称呼1
- 推荐一款博客离线发布插件–ScribeFire
- 推荐一款firefox正则表达式测试插件
- 计算语言学和自然语言信息处理研究和应用综述
- 最大期望算法(EM)相关的几篇文献下载
- EM算法学习
- About Averaged Kernel Perceptrons
- SAX_Parser_介绍_实 例_–学习笔记 (xml_解析)
- WebLech爬虫介绍(java 源码,开源)
- Indri 检索模型介绍–官方网站
- Inside Lucene/超人气搜索引擎学习(1)-查询机制
- Toolkits for IR/NLP/ML
- NekoHTML学习笔记(转
- 基于统计的语言模型概要(zhuan)–模型系列
- Nutch/Lucene的存取机制与结构分析(zhuan)
- 互联网搜索的未来(zhan)–雅虎
- 信息检索介绍–入门资料
- 如何把lucene索引放在内存中提供查询服务
- 修改Similarity(相似度计算zhuan)
- java 中排序方法(转)–备忘系列
- IR,NLP,ML机器学习,misc工具和资源