<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Information Retrieval Blog &#187; 百度</title>
	<atom:link href="http://blog.zye.me/tag/%e7%99%be%e5%ba%a6/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.zye.me</link>
	<description>REAL TIME DATA PROCESSING, DISTRIBUTED COMPUTING, PATTERN DISCOVERY</description>
	<lastBuildDate>Tue, 31 Jan 2012 02:05:19 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>百度的一道笔试题</title>
		<link>http://blog.zye.me/2011/07/20532.html</link>
		<comments>http://blog.zye.me/2011/07/20532.html#comments</comments>
		<pubDate>Sun, 24 Jul 2011 02:27:57 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[百度]]></category>
		<category><![CDATA[笔试题]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/03/20532.html</guid>
		<description><![CDATA[是百度的一道题 寻找热门查询： 搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来，每个查询串 的长度为1-255字节。假设目前有一千万个记录， 这些查询串的重复度比较高，虽然总数是1千万，但如果除去重复后，不超过3百万个 。一个查询串的重复度越高，说明查询它的用户越多， 也就是越热门。请你统计最热门的10个查询串，要求使用的内存不能超过1G。 （1）请描述你解决这个问题的思路； （2）请给出主要的处理流程，算法，以及算法的复杂度。]]></description>
			<content:encoded><![CDATA[<p>是百度的一道题</p>
<p>寻找热门查询： <br />搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来，每个查询串 <br />的长度为1-255字节。假设目前有一千万个记录， <br />这些查询串的重复度比较高，虽然总数是1千万，但如果除去重复后，不超过3百万个 <br />。一个查询串的重复度越高，说明查询它的用户越多， <br />也就是越热门。请你统计最热门的10个查询串，要求使用的内存不能超过1G。 <br />（1）请描述你解决这个问题的思路； <br />（2）请给出主要的处理流程，算法，以及算法的复杂度。</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/07/20532.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>让Google考官崩溃的面试</title>
		<link>http://blog.zye.me/2011/07/38526.html</link>
		<comments>http://blog.zye.me/2011/07/38526.html#comments</comments>
		<pubDate>Wed, 20 Jul 2011 14:29:06 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[MISC]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[百度]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/07/38526.html</guid>
		<description><![CDATA[面试官：“请问这位同学你最早是怎么了解我们公司的？”　 　　同学：“偶然用百度搜到的。”　 　　面试官：“……”（汗）　 　　面试官：“这个，那你知道Google的核心竞争优势是什么吗？”　 　　同学：“中文搜索引擎啊！”　 　　面试官：“……”（狂汗）　 　　面试官：“好吧，那如果让你为Google想一句广告语，你会怎么说？”　 　　同学：“众里寻他千百度。”　 　　面试官直接吐血晕死……　 　　面试官：“最后说下你觉得Google的最大优点是什么？”　 　　同学 ：“很像百度，这一点做得很好！”]]></description>
			<content:encoded><![CDATA[<p>面试官：“请问这位同学你最早是怎么了解我们公司的？”　
<p>　　同学：“偶然用百度搜到的。”　</p>
<p>　　面试官：“……”（汗）　</p>
<p>　　面试官：“这个，那你知道Google的核心竞争优势是什么吗？”　</p>
<p>　　同学：“中文搜索引擎啊！”　</p>
<p>　　面试官：“……”（狂汗）　</p>
<p>　　面试官：“好吧，那如果让你为Google想一句广告语，你会怎么说？”　</p>
<p>　　同学：“众里寻他千百度。”　</p>
<p>　　面试官直接吐血晕死……　</p>
<p>　　面试官：“最后说下你觉得Google的最大优点是什么？”　</p>
<p>　　同学 ：“很像百度，这一点做得很好！”</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/07/38526.html/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>求职应聘:百度网上笔试题</title>
		<link>http://blog.zye.me/2011/06/18586.html</link>
		<comments>http://blog.zye.me/2011/06/18586.html#comments</comments>
		<pubDate>Thu, 02 Jun 2011 02:27:50 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[百度]]></category>
		<category><![CDATA[笔试题]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/03/18586.html</guid>
		<description><![CDATA[2006年04月24日 15:31:00 求职应聘:百度网上笔试题 　　1 编程： 　　用C语言实现一个revert函数，它的功能是将输入的字符串在原串上倒序后返回。 　　2 编程： 　　用C语言实现函数void * memmove(void *dest,const void *src,size_t n)。memmove 　　函数的功能是拷贝src所指的内存内容前n个字节 　　到dest所指的地址上。 　　3 英文拼写纠错： 　　在用户输入英文单词时，经常发生错误，我们需要对其进行纠错。假设已经有一个包 　　含了正确英文单词的词典，请你设计一个拼写纠错的程序。 　　(1)请描述你解决这个问题的思路； 　　(2)请给出主要的处理流程，算法，以及算法的复杂度； 　　(3)请描述可能的改进(改进的方向如效果，性能等等，这是一个开放问题)。 　　4 寻找热门查询： 　　搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来，每个查询串 　　的长度为1-255字节。假设目前有一千万个记录， 　　这些查询串的重复度比较高，虽然总数是1千万，但如果除去重复后，不超过3百万个 　　。一个查询串的重复度越高，说明查询它的用户越多， 　　也就是越热门。请你统计最热门的10个查询串，要求使用的内存不能超过1G。 　　(1)请描述你解决这个问题的思路； 　　(2)请给出主要的处理流程，算法，以及算法的复杂度。 　　5 集合合并： 　　给定一个字符串的集合，格式如： 　　{aaa bbb ccc}， {bbb ddd}，{eee fff}，{ggg}，{ddd hhh} 　　要求将其中交集不为空的集合合并，要求合并完成后的集合之间无交集，例如上例应 　　输出 　　{aaa bbb ccc ddd hhh}，{eee fff}， {ggg} 　　(1)请描述你解决这个问题的思路； 　　(2)请给出主要的处理流程，算法，以及算法的复杂度 　　(3)请描述可能的改进(改进的方向如效果，性能等等，这是一个开放问题)。 <a href='http://blog.zye.me/2011/06/18586.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>2006年04月24日 15:31:00</p>
<p class="postText">
<dl class="ReadArticle">
<dt>求职应聘:百度网上笔试题</dt>
<dd class="ArticleContent">
<p>　　1 编程：</p>
<p>　　用C语言实现一个revert函数，它的功能是将输入的字符串在原串上倒序后返回。</p>
<p>　　2 编程：</p>
<p>　　用C语言实现函数void * memmove(void *dest,const void *src,size_t n)。memmove</p>
<p>　　函数的功能是拷贝src所指的内存内容前n个字节</p>
<p>　　到dest所指的地址上。</p>
<p>　　3 英文拼写纠错：</p>
<p>　　在用户输入英文单词时，经常发生错误，我们需要对其进行纠错。假设已经有一个包</p>
<p>　　含了正确英文单词的词典，请你设计一个拼写纠错的程序。</p>
<p>　　(1)请描述你解决这个问题的思路；</p>
<p>　　(2)请给出主要的处理流程，算法，以及算法的复杂度；</p>
<p>　　(3)请描述可能的改进(改进的方向如效果，性能等等，这是一个开放问题)。</p>
<p>　　4 寻找热门查询：</p>
<p>　　搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来，每个查询串</p>
<p>　　的长度为1-255字节。假设目前有一千万个记录，</p>
<p>　　这些查询串的重复度比较高，虽然总数是1千万，但如果除去重复后，不超过3百万个</p>
<p>　　。一个查询串的重复度越高，说明查询它的用户越多，</p>
<p>　　也就是越热门。请你统计最热门的10个查询串，要求使用的内存不能超过1G。</p>
<p>　　(1)请描述你解决这个问题的思路；</p>
<p>　　(2)请给出主要的处理流程，算法，以及算法的复杂度。</p>
<p>　　5 集合合并：</p>
<p>　　给定一个字符串的集合，格式如：</p>
<p>　　{aaa bbb ccc}， {bbb ddd}，{eee fff}，{ggg}，{ddd hhh}</p>
<p>　　要求将其中交集不为空的集合合并，要求合并完成后的集合之间无交集，例如上例应</p>
<p>　　输出</p>
<p>　　{aaa bbb ccc ddd hhh}，{eee fff}， {ggg}</p>
<p>　　(1)请描述你解决这个问题的思路；</p>
<p>　　(2)请给出主要的处理流程，算法，以及算法的复杂度</p>
<p>　　(3)请描述可能的改进(改进的方向如效果，性能等等，这是一个开放问题)。</p>
</dd>
</dl>
<p id="TBPingURL">Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=675148</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/06/18586.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>求职应聘:百度网上笔试题</title>
		<link>http://blog.zye.me/2011/04/9249.html</link>
		<comments>http://blog.zye.me/2011/04/9249.html#comments</comments>
		<pubDate>Fri, 29 Apr 2011 14:28:28 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[MISC]]></category>
		<category><![CDATA[百度]]></category>
		<category><![CDATA[笔试题]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2007/11/9249.html</guid>
		<description><![CDATA[1 编程： 　　用C语言实现一个revert函数，它的功能是将输入的字符串在原串上倒序后返回。 　　2 编程： 　　用C语言实现函数void * memmove(void *dest,const void *src,size_t n)。memmove 　　函数的功能是拷贝src所指的内存内容前n个字节 　　到dest所指的地址上。 　　3 英文拼写纠错： 　　在用户输入英文单词时，经常发生错误，我们需要对其进行纠错。假设已经有一个包 　　含了正确英文单词的词典，请你设计一个拼写纠错的程序。 　　(1)请描述你解决这个问题的思路； 　　(2)请给出主要的处理流程，算法，以及算法的复杂度； 　　(3)请描述可能的改进(改进的方向如效果，性能等等，这是一个开放问题)。 　　4 寻找热门查询： 　　搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来，每个查询串 　　的长度为1-255字节。假设目前有一千万个记录， 　　这些查询串的重复度比较高，虽然总数是1千万，但如果除去重复后，不超过3百万个 　　。一个查询串的重复度越高，说明查询它的用户越多， 　　也就是越热门。请你统计最热门的10个查询串，要求使用的内存不能超过1G。 　　(1)请描述你解决这个问题的思路； 　　(2)请给出主要的处理流程，算法，以及算法的复杂度。 　　5 集合合并： 　　给定一个字符串的集合，格式如： 　　{aaa bbb ccc}， {bbb ddd}，{eee fff}，{ggg}，{ddd hhh} 　　要求将其中交集不为空的集合合并，要求合并完成后的集合之间无交集，例如上例应 　　输出 　　{aaa bbb ccc ddd hhh}，{eee fff}， {ggg} 　　(1)请描述你解决这个问题的思路； 　　(2)请给出主要的处理流程，算法，以及算法的复杂度 　　(3)请描述可能的改进(改进的方向如效果，性能等等，这是一个开放问题)。]]></description>
			<content:encoded><![CDATA[<div><span style="FONT-FAMILY: Verdana"><font size="2">1 编程：</font></span></div>
<div>
<p>　　用C语言实现一个revert函数，它的功能是将输入的字符串在原串上倒序后返回。</p>
<p>　　2 编程：</p>
<p>　　用C语言实现函数void * memmove(void *dest,const void *src,size_t n)。memmove</p>
<p>　　函数的功能是拷贝src所指的内存内容前n个字节</p>
<p>　　到dest所指的地址上。</p>
<p>　　3 英文拼写纠错：</p>
<p>　　在用户输入英文单词时，经常发生错误，我们需要对其进行纠错。假设已经有一个包</p>
<p>　　含了正确英文单词的词典，请你设计一个拼写纠错的程序。</p>
<p>　　(1)请描述你解决这个问题的思路；</p>
<p>　　(2)请给出主要的处理流程，算法，以及算法的复杂度；</p>
<p>　　(3)请描述可能的改进(改进的方向如效果，性能等等，这是一个开放问题)。</p>
<p>　　4 寻找热门查询：</p>
<p>　　搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来，每个查询串</p>
<p>　　的长度为1-255字节。假设目前有一千万个记录，</p>
<p>　　这些查询串的重复度比较高，虽然总数是1千万，但如果除去重复后，不超过3百万个</p>
<p>　　。一个查询串的重复度越高，说明查询它的用户越多，</p>
<p>　　也就是越热门。请你统计最热门的10个查询串，要求使用的内存不能超过1G。</p>
<p>　　(1)请描述你解决这个问题的思路；</p>
<p>　　(2)请给出主要的处理流程，算法，以及算法的复杂度。</p>
<p>　　5 集合合并：</p>
<p>　　给定一个字符串的集合，格式如：</p>
<p>　　{aaa bbb ccc}， {bbb ddd}，{eee fff}，{ggg}，{ddd hhh}</p>
<p>　　要求将其中交集不为空的集合合并，要求合并完成后的集合之间无交集，例如上例应</p>
<p>　　输出</p>
<p>　　{aaa bbb ccc ddd hhh}，{eee fff}， {ggg}</p>
<p>　　(1)请描述你解决这个问题的思路；</p>
<p>　　(2)请给出主要的处理流程，算法，以及算法的复杂度</p>
<p>　　(3)请描述可能的改进(改进的方向如效果，性能等等，这是一个开放问题)。</p>
</p></div>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/04/9249.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

