Information Retrieval Blog
- Linux commands
- Solr Error: A SPI class of type org.apache.lucene.index.codecs.Codec with name ‘Lucene40′ does not exist
- 汉字编码问题合集–整理
- java Map的访问方法备忘,Comparator例子
- 哈工大分词java接口
- 如何读取Lucene索引数据1–整理中
- java中的基本数值类型
- 房地产救市岂能不择手段?
- Microsoft Word文档中搜索替换时常用的特 殊符号
- 如何识别Compendex 数据库中的核心和非核心数据
- 见过不怕冷的,没见过不要命的
- 重温三国
- 漫谈三国之三国争雄系列– 望山亭
- 印象–初到Toronto
- 浪潮之巅
- SIGIR PAPER LIST 2005,2006,2007
- 武汉公交滴神话–搞笑版
- 英美文学作品中的人名与寓意
- private 变量继承问题
- 自然语言理解技术及其应用探讨(转)
- 子类构造方法执行过程
- 实用英语:食品名称中英文对照
- 也许逃避比较容易吧
- Two Photos
- 如何论文阅读
- 我来批《画皮》
- 经济的发展是没有任何意义
- 年轻
- 梯度、方向导数与切平面
- JAVA入门教程: 第 四 章 流 控 制
- 时差
- 与君游香山 –路上-北京
- 大学生应该脱口而出的100个精典英文句子
- 忙里偷闲旅游–路上-北京
- 居然中奖了
- 待机模式、休眠模式、睡眠模式之间的区别
- 谷歌十周年 系列
- JAVA入门教程: 第 三 章 运算符和表达式
- 三鹿被收购
- 电脑族眼睛保健总结
- 视频: 武汉女公交司机被暴打 — 该反省
- 百度的一道笔试题
- 牛奶 VS 豆浆
- bloging feed
- 英文电子邮件高频句式
- 垂直搜索简单调研
- 让你玩电脑眼睛很舒服
- 怎样做研究?–刘挺老师
- 让Google考官崩溃的面试
- Java网络编程
- What is Latent Class Analysis?
- Baidu 考试题
- Generative Model and Discrimitive Model
- 7.10日,《赤壁》值得期待
- Lucene同时进行查询和索引
- Java List转化为数组—备忘
- Java 2 引用类使用指南(转)
- 我太累了?
- java rmi 中一个常见异常
- Java常用类库介绍
- 2008欧洲杯赛程表
- 正则表达式之全部符号解释 –备忘
- 郁闷如金婚 — 中国 VS 卡塔尔
- Introduction to Google Search Quality
- Java数组与面向对象技术概述
- Java常用类库介绍
- Java基础类库–集合类
- Java多线程编程
- Java用户界面设计
- Java数据库编程中的几个常用技巧
- 今天办理护照
- 校内擅自删除个人日志
- 靴子落地 –CSC
- 加拿大大学排名
- 堰塞湖
- 手机短信捐款
- What is SVM?
- 四川汶川地震 各地伤亡汇总(实时更新)
- 通过谷歌地图查看:四川大地震震中汶川在中国的方位及周围地形
- 地震逃生十大法则 + 捐款办法
- 测试用XmlRpcClient 发博文
- 被Google惩罚了
- 专注、效率、自由
- 网站迁移的最佳方法
- 福特新嘉年华,值得期待
- 看电脑时间长眼睛老是痛、酸、干涩怎么办?
- PageRank up–纪念
- 社交的未来
- 文献管理工具Zotero(firefox插件)-体积小、更能还不错
- 圣火传递路线
- 圣火传递路线图–支持奥运,理性爱国
- Bekeley db 数据更新-备忘
- 常用的匹配正则表达式和实例-备忘
- Bayesian inference到NLP方面的研究讨论(水木社区)
- 正则表达式–备忘
- 改变一生的五句话
- LingPipe 3.5.0 Released
- 效率不高的7个原因
- Papers Written by Googlers
- 推荐一款功能完善的拼音汉字转化程序(pinyin4j—Java)
- 通过汉字取得拼音Java版
- Effective Java 46-57
- Effective Java 31-45
- Effective Java 27-30
- Effective Java 23-26
- Effective Java 14-22
- Effective Java 8-13
- Effective Java 6-7
- Effective Java 1-5
- file的getPath getAbsolutePath和getCanonicalPath的不同
- 世界各国域名后缀大全
- 知道”Family”这个单词的含义吗?
- Gmail过滤器的20个巧妙用途
- 电脑辐射—-每天用电脑4-6小时的人必看
- JAVA入门教程: 第 六 章 对 象、类、包和接口
- JAVA入门教程: 第 二 章 数 据 类 型
- JAVA入门教程: 第 一 章 Java概述
- 三大搜索引擎搜索代码所有参数详解
- Google AdSense 高价关键词一览
- 提高工作效率的时间管理方法
- People who win big in life
- 搜索引擎技术普及 – 1,2,3,4
- Endnote基本操作–Endnote系列
- 首先介绍几个Endnote中用到的概念
- Lucene 在线查询
- Fwd: Gmail中使用过滤器管理邮件
- Java中实现模拟鼠标点击-备忘
- 幸福男人的魔咒–中国足球
- ASCII码对照表
- Tomcat5. 5_下虚 拟主机设置
- 警惕腰肌劳损
- 为什么有这么多的人生精 华要分享?(zhuan)
- HTML特殊符号对照表
- Web搜索引擎介绍–Web搜索引擎系列1
- 如何在lucene检索结果中再检索?Java
- 芦荟养殖简单技巧
- 搜索引擎中自然语言理解技术及其应用探讨(下)
- 搜索引擎中自然语言理解技术及其应用探讨(中)
- 自然语言理解技术及其应用探讨(上)
- 看看你的博客值多少钱?顺便征集友情链接
- gate 文本处理引擎
- Indri中的动态文档索引技术(转)
- 怎样知道自己身体缺少哪些维生素?
- 天网新语料(2006)的分割程序
- Toolkits
- 运动解除电脑族的视疲劳
- 求职应聘:百度网上笔试题
- 不要睡觉太晚,看看身体器官的工作时间
- 什么是中文信息处理?(zhuan)
- java 数据压缩与解压,实例详解–备忘
- Java支持编码说明–备忘系列
- 中成药缓解视疲劳
- google的面试题
- 我眼中的闯关东–呼唤老独臂
- 我眼中的《闯关东》–四头朱
- 用Deflater压缩序列化对象–备忘
- lucene util PriorityQueue 实现一优先队列–搜索引擎算法系列
- Inside Lucene/超人气搜索引擎学习(2.0)-读取索引
- Lucene 2.3: 索引性能500%提升,一个有关机器学习的项目Mahout 将启动
- Google的疯狂面试题
- 自然语言处理与信息检索
- 网上搜集的5个学习笔记–Bash, Effective Java, HttpClient, NekoHtml, Python
- Nutch 相关总结
- Java优化编程总结 (1–5)
- wordpress模版修改–插入广告代码
- 信息检索研究–Google产品与使用技巧
- 推荐一网页加速器–Google开发的哦
- windows 快件键收集
- Berkeley DB 资源搜集
- 信息检索研究–Google浪潮之巅系列
- Google 阅读器键盘快捷键
- Lucene 高亮 –不就行二次分词(zhuan)
- Java1.5泛型指南中文版(Java1.5 Generic Tutorial, zhuan)
- Lucene HowTo(使用入门 官方网站链接)
- 提高lucene索引速度技巧汇总
- Resources about lucene from its official website
- 美国火箭很好、很强大,中国股市很绿、很养颜
- 提高工作效率–军规
- mp3搜索引擎题目讨论–招聘笔试
- 楼市同样面临解禁房抛售的冲击(zhuan)
- 港股暴跌后可策略性买入(zhuan)
- 幸福男人的最新标准–哈哈,你是吗?
- 没事叽歪一下,感觉还真不错
- Google数学之美系列链接
- ACL2007一些统计数据
- 来当显示可能被篡改,当心哦
- 2008抗击风雪 回家过年
- java程序获取各大搜索引擎结果
- 呜呼哀哉–当不起雷锋
- IJCNLP 2008 Accepted Papers – Main Conference
- 跨语言信息检索综述
- 上海一个月300元能活吗? (转载)
- Google如何检测无效点击(转)
- 梦在远方
- 淡淡的离愁
- 痛才能快乐
- 我中邪了
- 如何优化JAVA程序开发,提高JAVA性能?—整理中
- HMM(Hidden Markov Model) 隐马尔可夫的学习小结
- java JSP getParameterNames getParameterValues 整理备忘2007-12-04 19:11
- Google Talk中英文翻译机器人试用
- yahoo web seacher api 参数说明
- 5000万你会卖了你的女朋友吗?
- 从头再来
- java List 的三中访问–for循环
- 看韩剧的朋友注意了,小心变笨哦
- 说说我最恐怖的一次坐火车经历…
- lucene HitCollector 的作用
- 五胡录—关于魏晋南北朝历史的网络文学
- closed test, open test以及实用的分词系统(zhuan)
- 罗京也会千里自外
- 八面出击
- 中国第一批操盘手的真实下场(名单)
- 机器学习介绍
- 求职应聘:百度网上笔试题
- 加拿大驻华使馆受理学生签证申请材料要求
- 保护数码相机镜头要诀
- struts入门
- 学术报告-检索相关
- 执行Java程序
- Lucene的使用与优化(转)–整理
- Lucene并发连接实现(zhuan)
- Inside Lucene/超人气搜索引擎学习(zhuan)
- 搜索引擎网站登记入口
- java HashMap 如何简单地排序后输出–备忘
- 个人搜索引擎研究总结(转)–继续整理中
- SIGIR 2011 accepted full paper list
- SIGIR 2011 accepted full papers
- What is a (Mathematical) Model?
- Wilcoxon Signed-Rank Test for R
- my 2010
- 常用正则表达式
- Going to industry or stay in academia?
- How to efficiently use LOG4J?
- CIKM 2010 Paper list (IR Track)
- SCI投稿常用英语
- Twitter Weekly Updates for 2010-08-29
- Twitter Weekly Updates for 2010-08-22
- Computer Science Department Journal Rankings
- Twitter Weekly Updates for 2010-08-15
- pdflatex To Use US. Letter Size Paper
- Twitter Weekly Updates for 2010-08-08
- What is a (Mathematical) Model? (RT)
- Twitter Weekly Updates for 2010-08-01
- Twitter Weekly Updates for 2010-07-25
- Twitter Weekly Updates for 2010-07-04
- Twitter Weekly Updates for 2010-06-27
- Twitter Weekly Updates for 2010-06-20
- Twitter Weekly Updates for 2010-06-13
- Twitter Weekly Updates for 2010-06-06
- Twitter Weekly Updates for 2010-05-30
- Twitter Weekly Updates for 2010-05-02
- Twitter Weekly Updates for 2010-04-25
- Twitter Weekly Updates for 2010-04-18
- SIGIR 2010 Full Paper List
- Twitter Weekly Updates for 2010-04-11
- Twitter Weekly Updates for 2010-04-04
- Twitter Weekly Updates for 2010-03-28
- Twitter Weekly Updates for 2010-03-21
- Twitter Weekly Updates for 2010-03-14
- Twitter Weekly Updates for 2010-03-07
- Top Sites in China
- Twitter Weekly Updates for 2010-02-28
- Figure format conversion in Linux
- Taking full advantages of pdfLaTeX — eps figure solution
- 命令行解压&压缩 全集 –Linux
- latex 中文支持script & samples — memos
- backup and sync with lftp
- Java泛型中通配符使用
- Protected: SIGIR 史上最强投稿
- BibTeX & “undefined control sequence”
- 蒋介石对中华民族也有七大贡献
- A short philosophic story with different versions
- What’s Google doing in search? c10088bc
- vi/vim command summary
- Download Whole Website or Directories by using wget in Linux
- What_is_“Bayesian”_Statistical_Inference?
- Be care of RangeQuery in Lucene
- 中国军队当年消灭了多少日军?
- The internet at sort-of-40. How did we get here?
- The Ivory Toolkit with the SMRF Retrieval Engine (under Hadoop Framework)
- Structure the World
- How to prevent SSH terminal timeout
- SCP –copy among machines
- News of the day: Eclipse AppEngine Plugin, New Chome Beta, Lucene Payloads, …
- 11个非常有用的PDF制作、PDF编辑和PDF转 换工具及软件
- vi, vim 显示行号或行数
- Introducing a collection of favorite places from around the world
- 基础(三):拼读规则 – 常见元音的 拼写
- 基础(三):拼读规则 – 常见辅音的 拼写
- How to Improve your chances of getting your paper accepted (at least at KDD)
- Google accounts on Twitter
- KDD Best Paper Award: Modeling Temporal Dynamics, a key to winning the Netfl…
- 中国经济模式转型的挑战
- Trie-based approximate autocomplete implementation with support for ranks and synonyms
- Eclipse 无法自动编译
- 终于有team可以赢得100万美元Netflix Prize
- Lucene 新子项目OpenRelevance起航
- Google最近有点烦……
- ubuntu ftp server配置
- Online free book: Search User Interface
- 使用Java Tar Package读取*.tar 或*.tar.gz 文件
- First Hadoop Summit videos available
- lucene影响索引速度的因素-MergeFactor, MaxMergeDocs, RAMBufferSizeMB
- Lucene的检索优化(一)
- Lucene的检索优化(二)–Hits的改进
- lucene并行建索引解决方案–转载
- Lucene Hack之通过缩小搜索结果集来提升 性能 转载
- IR实验系统
- Ubuntu Server 安装图形界面
- Eclipse 快捷键设置-代码提示Content Assist
- Dirichlet prior for smoothing
- PyMat -c10088bc
- content based image retrieval (CBIR) toolkits and package
- Java Multiplication (Much) Faster than Division
- The 2008 google Founders’ Letter Posted by Sergey Brin
- Global Ranking
- 小心“被70码” --下一个“俯卧撑”
- Stanford Named Entity Recognizer
- Kile spell check doesn’t work
- Notes on BibTeX
- ubuntu kile下 解决中文问题-CJK{GBK}
- fix problems in ubuntu kile: multirow.sty’ not found
- CHINESE BILINGUAL WORDLISTS – a mechine readable dictionary from LDC
- Latex SPACE SAVING IDEAS — fox SIGIR Paper
- 信息检索领域主要期刊和会议
- 【转载】Weka入门教程
- SIGIR 2009 paper list
- linux下如何安装软件
- ubuntu linux下如何访问 网络共享
- 唠叨下最近
- Normalization Methods
- Hadoop on windows with Eclipse
- Java中通过classpath路径读取模型(通常是序列化的)或其它资源
- A series of IR related blogs and tutorials
- 博士与上厕所(扩展版,转)
- 英语词汇汇总:饮料、咖啡、酒、器具
- TREC Billion Document Web Corpus 发布
- Eclipse快捷键
- 经常要用到的英文短语
- 翻译到底考不靠谱?
- Live Lab released Image Preference Dataset
- 如何 Log4j 使用–备忘
- How To Think Logically
- 学会用GOOGLE做research
- Paper Writing skills: Problems that editors seem to encounter again and again
- I.E., ETC., et al AND E.G. –Comparison, Difference
- 学英语用OXFORD Collocations dictionary for students of English词典(附下载和在线查询)
- 推荐微软的英库—微软教你作英文
- BM系列(如Okapi BM25)Weighting 公式介绍及文献– BM family weighting scheme Introduction and important Literaturesuu
- 高房价挟持了爱情和理想
- Ullman set — A clever data struture
- EI收录介绍
- 牛刀:中国楼市不是不差钱而是不要脸
- Lucene 2.4 in 60 seconds
- IBM Haifa Team 把Lucene Ranking系统打造成state-of-the-art ,TREC 2007 Million Queries Track – IBM Haifa Team
- Google Docs中插入数学公式和特殊字符
- LaTeX首行缩进
- Latex字体属性设置
- 推荐一个免费下载audio book的网站
- 如何攻克英语听力的特效“处方”
- 如何在visio文本中插入上标或下标?
- Latex 辅助工具
- cygwin shell 中java 的classpath 如何写? Why can’t I get Java to recognize my CLASSPATH environment variable
- 为什么latex引用文献的地方出现的是问号,还有很多错误信息?
- LaTeX不能识别eps文件问题
- UltraEdit 如何取消自动备份保存
- Using DataInputStream and DataOutputStream –EOF
- Java Inner classes –So what are inner classes good for anyway?
- 看看IR(信息检索)领域的大牛们
- ieee Transaction, Journal, Letter 区别
- 机器学习与人工智能学习资源导引
- 工程索引(Engineering Index, Ei)数据库中被《Ei Compendex》收录与被《Ei Pageone》收录数据的区别和识辨(转)
- [转]最新流行美语60句
- 个人知识管理之Wiki篇
- 入境英语-场景对话
- 常用机场英语词汇
- 九句英语,教你耍赖
- 计算机族职业病 –眼睛不适
- Hadoop介绍、集群配置和使用技巧
- A Guide to Information Retrieval
- SCI、EI和ISTP收录号的查询方法
- 如何使用LingPipe计算词向量
- Coling 2008 paper list
- C:/Windows/PCHEALTH/ERRORREP/UserDumps到底是什么呀?
- 关于修改/增加lucene排序算法的讨论
- 编辑距离Edit Distance In LingPipe
- 扩展Lucene的索引文件存储
- lucene 提高中文Highlight效率
- Pattern Classification(模式分类) 下载地址
- Matlab 7 注册码–试过好用
- 互信息 公式 –备忘
- Java运算符和表达式
- Java流程控制
- Java类封装、继承、多态性1
- Java类封装、继承、多态性2
- Java异常处理部分
- Java中的流
- 英美人的称呼1
- Computing TF-IDF similarity using open source packages
- 申通快递 == 垃圾,强烈鄙视
- Karush-Kuhn-Tucker 最优化条件 (KKT 条件,SVM中需要到)–SVM学习1
- 对象反序列化时,出现local class incompatible 并有两个serialVersionUID的原因
- 从Cafferty在CNN说中国人流氓说起
- 推荐一款博客离线发布插件–ScribeFire
- Berkeley db迭代访问或获取多条记录是应注意的一个细节
- 推荐一款firefox正则表达式测试插件
- 安装Eclipse SVN plugin(Subclipse)
- Berkeley DB 性能测试
- 计算语言学和自然语言信息处理研究和应用综述
- SVM的分类原理
- 最大期望算法(EM)相关的几篇文献下载
- EM算法学习
- JAVA入门教程: 第 五 章 数 组
- About Averaged Kernel Perceptrons
- 常用文献管理软件简单比较
- 使用游标(berkeley db) 实现前缀查询–备忘
- Berkeley db 游标使用样例–备忘
- 老破车的Endnote教程(中)–Endnote系列
- 推荐一款参考文献管理工具
- SAX_Parser_介绍_实 例_–学习笔记 (xml_解析)
- WebLech爬虫介绍(java 源码,开源)
- 信息的搜集(爬虫,spider)–Web搜索引擎系列2
- 统计自然语言处理–电子书英文版下载
- 推荐Alias-i公司的LingPipe–自然语言分析软件包(支持中文)
- Indri 检索模型介绍–官方网站
- lucene In Action 中文版 下载链接
- 用Berkeley 数据库管理结构简单、但量非常大的数据
- 机器学习与数据挖掘 –国内大牛周志华的一篇介绍文章
- Inside Lucene/超人气搜索引擎学习(1)-查询机制
- Toolkits for IR/NLP/ML
- java数组,字符串操作–备忘系列
- 如何把一个对象序列化存入数据库–备忘系列
- NekoHTML学习笔记(转
- 基于统计的语言模型概要(zhuan)–模型系列
- Nutch/Lucene的存取机制与结构分析(zhuan)
- 互联网搜索的未来(zhan)–雅虎
- 信息检索介绍–入门资料
- 如何把lucene索引放在内存中提供查询服务
- 修改Similarity(相似度计算zhuan)
- java 中排序方法(转)–备忘系列
- IR,NLP,ML机器学习,misc工具和资源