<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Information Retrieval Blog &#187; Research</title>
	<atom:link href="http://blog.zye.me/category/%e5%ad%a6%e6%9c%af%e7%a0%94%e7%a9%b6/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.zye.me</link>
	<description>REAL TIME DATA PROCESSING, DISTRIBUTED COMPUTING, PATTERN DISCOVERY</description>
	<lastBuildDate>Tue, 31 Jan 2012 02:05:19 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>哈工大分词java接口</title>
		<link>http://blog.zye.me/2011/09/3894.html</link>
		<comments>http://blog.zye.me/2011/09/3894.html#comments</comments>
		<pubDate>Mon, 12 Sep 2011 16:28:10 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Java]]></category>
		<category><![CDATA[NLP]]></category>
		<category><![CDATA[信息检索]]></category>
		<category><![CDATA[分词]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/articles/%e5%93%88%e5%b7%a5%e5%a4%a7%e5%88%86%e8%af%8djava%e6%8e%a5%e5%8f%a3.html</guid>
		<description><![CDATA[ package IRdll; import java.io.File; import java.io.Reader; import java.io.FileInputStream; import java.io.*; import java.util.Date; import java.util.HashSet;/** * &#60;p&#62;Title: Java中文分词接口&#60;/p&#62; * &#60;p&#62;Description: 本组件以哈工大分词系统为基础，在其基础之上开发 * 本组件仅供学习和研究用途，任何商业用途将自行承担法律后果，与组件编写人无关。&#60;/p&#62; * &#60;p&#62;Copyright: Copyright (c) 2006&#60;/p&#62; * &#60;p&#62;Company: dalian univercity of techology&#60;/p&#62; * @author ：yezheng * @version 1.0 */ public class IRSplit { private static IRSplit instance = null; //instance时类中一成员，所以可以访问其中被private修饰的变量或方法 private static StringBuffer stringb <a href='http://blog.zye.me/2011/09/3894.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p><span style="font-family: Verdana;"> package IRdll;</span></p>
<p><span style="font-family: Verdana;"><br />
import java.io.File;<br />
import java.io.Reader;<br />
import java.io.FileInputStream;<br />
import java.io.*;<br />
import java.util.Date;<br />
import java.util.HashSet;</span><span style="font-family: Verdana;">/**<br />
* &lt;p&gt;Title: Java中文分词接口&lt;/p&gt;<br />
* &lt;p&gt;Description: 本组件以哈工大分词系统为基础，在其基础之上开发<br />
* 本组件仅供学习和研究用途，任何商业用途将自行承担法律后果，与组件编写人无关。&lt;/p&gt;<br />
* &lt;p&gt;Copyright: Copyright (c) 2006&lt;/p&gt;<br />
* &lt;p&gt;Company: dalian univercity of techology&lt;/p&gt;<br />
* @author ：yezheng<br />
* @version 1.0<br />
*/</span></p>
<p>public class IRSplit {</p>
<p>private static IRSplit instance = null; //instance时类中一成员，所以可以访问其中被private修饰的变量或方法<br />
private static StringBuffer stringb = new StringBuffer(102400);<br />
private static StringBuffer longSentence = new StringBuffer(10240);</p>
<p>//私有构造方法<br />
private IRSplit() {<br />
System.out.println(&#8220;正在加载词典……&#8221;);<br />
this.LoadSegRes();<br />
System.out.println(&#8220;加载结束&#8221;);<br />
}</p>
<p>//获得一个实例<br />
public static IRSplit getInstance() {<br />
if (instance == null) {<br />
instance = new IRSplit();<br />
}<br />
return instance;<br />
}</p>
<p>//本地方法<br />
private native void LoadSegRes();</p>
<p>private native void ReleaseSegger();</p>
<p>private native String split(String sentence);</p>
<p>//对一句话分词<br />
public String splitSentence(String sentence) {<br />
if (sentence.length() &lt; 1 || sentence == null)<br />
return &#8220;&#8221;;<br />
else<br />
return split(sentence);<br />
}</p>
<p>public String splitLongSentence(String sentence) {<br />
if (sentence.length() &lt; 1 || sentence == null)<br />
return &#8220;&#8221;;<br />
else<br />
{<br />
this.longSentence.setLength(0);<br />
int start = 0 ; int  end = 0;<br />
for (int i = 0; i &lt; sentence.length(); i++)<br />
{<br />
char c = sentence.charAt(i);<br />
switch (Character.getType(c))<br />
{<br />
case 24:<br />
end++;<br />
//System.out.println(sentence.substring(start, end));<br />
this.longSentence.append(split(sentence.substring(start, end)));<br />
start = end;<br />
break;<br />
default:<br />
end++;<br />
break;<br />
}<br />
}<br />
if(start &lt; end)<br />
{<br />
longSentence.append(split(sentence.substring(start, end)));<br />
}<br />
return longSentence.toString();<br />
}<br />
}</p>
<p>public void ReleaseSeggers() {<br />
instance = null;<br />
ReleaseSegger();<br />
}</p>
<p>//对一个文件分词<br />
public void splitFile(File file, File outfile) {<br />
try {<br />
FileInputStream fis = new FileInputStream(file);<br />
BufferedReader br = new BufferedReader(new InputStreamReader(fis));<br />
this.stringb.setLength(0);<br />
String ts;<br />
while ( (ts = br.readLine()) != null) {<br />
if (ts.length() != 0) {<br />
stringb.append(splitLongSentence(ts) + &#8216;r&#8217; + &#8216;n&#8217;); //进行分词<br />
}<br />
else {<br />
stringb.append(&#8216;r&#8217;);<br />
stringb.append(&#8216;n&#8217;);<br />
}<br />
}<br />
br.close();<br />
fis.close();</p>
<p>FileWriter writer = new FileWriter(outfile);<br />
writer.write(stringb.toString());<br />
writer.close();<br />
}<br />
catch (FileNotFoundException ex) {<br />
System.out.println(file.toString() + &#8220;File not Found&#8221;);<br />
}<br />
catch (IOException ex1) {<br />
System.out.println(file.toString() + &#8220;IO errors&#8221;);<br />
}<br />
}</p>
<p>public void splitFile(String source, String destination) {<br />
File file = new File(source);<br />
File outfile = new File(destination);<br />
if (file.isFile()) {<br />
splitFile(file, outfile);<br />
}<br />
}</p>
<p>public Reader splitFile(Reader reader) {<br />
BufferedReader br = new BufferedReader(reader);<br />
StringBuffer stringb = new StringBuffer();</p>
<p>try {<br />
String ts;<br />
while ( (ts = br.readLine()) != null) {<br />
if (ts.length() != 0) {<br />
stringb.append(splitSentence(ts) + &#8216;r&#8217; + &#8216;n&#8217;); //进行分词<br />
}<br />
else {<br />
stringb.append(&#8216;r&#8217;);<br />
stringb.append(&#8216;n&#8217;);<br />
}<br />
}<br />
reader = new StringReader(stringb.toString());<br />
}<br />
catch (IOException ex) {<br />
}<br />
return reader;<br />
}</p>
<p>//处理一个目录下的所有文件<br />
public void splitFiles(String sourceDir, String destinationDir) { //参数：源文件目录和目标文件目录<br />
File directory = new File(sourceDir);<br />
File dirdes = new File(destinationDir);<br />
//FilenameFilter txtFilter = new myFilter(&#8220;txt&#8221;);<br />
File files[] = directory.listFiles();<br />
for (int i = 0; i &lt; files.length; i++) {<br />
if (files[i].isFile()) {<br />
File outfile = new File(destinationDir + &#8220;/&#8221; +<br />
files[i].getName());<br />
//System.out.println(directory.getName() + &#8220;:&#8221; + dirdes.getName());<br />
splitFile(files[i], outfile);<br />
}<br />
else if (files[i].isDirectory()) {</p>
<p>File tempdir = new File(destinationDir + &#8220;/&#8221; + files[i].getName());<br />
if (!tempdir.exists() || !tempdir.isDirectory()) {<br />
tempdir.mkdir();<br />
}<br />
splitFiles(sourceDir + &#8220;/&#8221; + files[i].getName(),<br />
tempdir.getAbsolutePath());<br />
}<br />
}<br />
}</p>
<p>static {<br />
System.loadLibrary(&#8220;IRdll&#8221;);<br />
}</p>
<p>public static void main(String[] args) {</p>
<p>IRSplit split = IRSplit.getInstance(); //其它类使用</p>
<p>long start = System.currentTimeMillis();<br />
Date startdate = new Date();</p>
<p>//split.splitFiles(&#8220;clean&#8221;, &#8220;out&#8221;);<br />
split.splitLongSentence(ss);</p>
<p>Date enddate = new Date();</p>
<p>System.out.println(startdate);<br />
System.out.println(enddate);<br />
System.out.println(enddate.getTime()- startdate.getTime());<br />
}</p>
<p>}</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/09/3894.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>如何读取Lucene索引数据1&#8211;整理中</title>
		<link>http://blog.zye.me/2011/09/3886.html</link>
		<comments>http://blog.zye.me/2011/09/3886.html#comments</comments>
		<pubDate>Sat, 10 Sep 2011 01:52:04 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[information Retrieval]]></category>
		<category><![CDATA[indexing]]></category>
		<category><![CDATA[lucene]]></category>
		<category><![CDATA[信息检索]]></category>
		<category><![CDATA[索引]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/articles/%e5%a6%82%e4%bd%95%e8%af%bb%e5%8f%96lucene%e7%b4%a2%e5%bc%95%e6%95%b0%e6%8d%ae1-%e6%95%b4%e7%90%86%e4%b8%ad.html</guid>
		<description><![CDATA[Lucene源码分析(1) &#8212; 如何读取Lucene索引数据 终于清楚如何用读Lucene的索引 。本文要介绍一下如何利用IndexReader获取信息。为什么要读索引呢？因为我需要实现这些功能： (1) 统计term在整个collection中的文档频度(document frequency, DF)； (2) 统计term在整个collection中出现的词次(term frequency in whole collection)； (3) 统计term在某个文档中出现的频度(term frequency, TF)； (4) 列出term在某文档中出现的位置(position)； (5) 整个collection中文档的个数； 那 么为什么要用到这些数据呢？这些数据是实现TR(Text Retrieval，文本检索)的必备的&#8221;原料&#8221;，而且是经过加工的。在检索之前，只有原始文本(raw data)；经过索引器(indexer)的处理之后，原始文本变成了一个一个的term(或者token)，然后被indexer纪录下来所在的位置、 出现的次数。有了这些数据，应用一些模型，就可以实现搜索引擎实现的功能――文本检索。 聪明的读 者您可能会说，这看起来似乎很好做，不过就是计数(count)么。不错，就是计数，或者说是统计。但是看似简单的过程，如果加上空间(内存容量)的限 制，就显得不那么简单了。假设如果每篇文档有100个term，每个term需要存储10字节信息，存1,000,000篇文档需要 10x100x10^6=10^9=2^30字节，也就是1GB。虽然现在1G内存不算什么，可是总不能把1GB的数据时时刻刻都放入内存吧。那么放入硬 盘好了，现在需要用数据的时候，再把1GB数据从硬盘搬到内存。OK，可以先去冲杯咖啡，回来在继续下面的操作。这是1,000,000的文档，如果更多 一点呢，现在没有任何辅助数据结构的方式，会导致很差的效率。 Lucene的索引会把数据分成 段，并且在需要的时候才读，不需要的时候就让数据乖乖地呆在硬盘上。Lucene本身是一个优秀的索引引擎，能够提供有效的索引和检索机制。文本的目的 是，介绍如用利用Lucene的API，如何从已经建好的索引的数据中读取需要的信息。至于Lucene如何使用，我会在后续的文章中逐渐介绍。 我们一步一步来看。这里建设已经有实现建好索引，存放在index目录下。好，要读索引，总得先生成一个读索引器(即Lucene中IndexReader的实例)。好，写下面的程序(程序为C#程序，本文使用DotLucene)。 IndexReader reader; 问 题出来了，IndexReader是一个abstract类，不能实例化。那好，换派生类试试看。找到IndexReader的两个孩子 ――SegmentReader和MultiReader。用哪个呢？无论是哪个都需要一大堆参数(我是颇费了周折才搞清楚它们的用途，后面再解释)，似 乎想用Lucene的索引数据不是那么容易啊。通过跟踪代码和查阅文档，我终于找到使用IndexReader的钥匙。原来IndexReader有一个 &#8220;工厂模式&#8221;的static interface――IndexReader.Open。定义如下： #0001 public static IndexReader Open(System.String path) #0002 public static <a href='http://blog.zye.me/2011/09/3886.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>Lucene源码分析(1) &#8212; 如何读取Lucene索引数据</p>
<p id="msgcns!3BB36966ED98D3E5!408" class="bvMsg"><font face="Verdana"></font><font size="2">终于清楚如何用读Lucene的索引 <img src='http://blog.zye.me/wp-includes/images/smilies/icon_smile.gif' alt=':-)' class='wp-smiley' /> 。本文要介绍一下如何利用IndexReader获取信息。为什么要读索引呢？因为我需要实现这些功能：<br />
(1) 统计term在整个collection中的文档频度(document frequency, DF)；<br />
(2) 统计term在整个collection中出现的词次(term frequency in whole collection)；<br />
(3) 统计term在某个文档中出现的频度(term frequency, TF)；<br />
(4) 列出term在某文档中出现的位置(position)；<br />
(5) 整个collection中文档的个数；</font></p>
<p><font face="Verdana"></font><font size="2">那 么为什么要用到这些数据呢？这些数据是实现TR(Text Retrieval，文本检索)的必备的&#8221;原料&#8221;，而且是经过加工的。在检索之前，只有原始文本(raw data)；经过索引器(indexer)的处理之后，原始文本变成了一个一个的term(或者token)，然后被indexer纪录下来所在的位置、 出现的次数。有了这些数据，应用一些模型，就可以实现搜索引擎实现的功能――文本检索。</font></p>
<p><font face="Verdana"></font><font size="2">聪明的读 者您可能会说，这看起来似乎很好做，不过就是计数(count)么。不错，就是计数，或者说是统计。但是看似简单的过程，如果加上空间(内存容量)的限 制，就显得不那么简单了。假设如果每篇文档有100个term，每个term需要存储10字节信息，存1,000,000篇文档需要 10x100x10^6=10^9=2^30字节，也就是1GB。虽然现在1G内存不算什么，可是总不能把1GB的数据时时刻刻都放入内存吧。那么放入硬 盘好了，现在需要用数据的时候，再把1GB数据从硬盘搬到内存。OK，可以先去冲杯咖啡，回来在继续下面的操作。这是1,000,000的文档，如果更多 一点呢，现在没有任何辅助数据结构的方式，会导致很差的效率。</font></p>
<p><font face="Verdana"></font><font size="2">Lucene的索引会把数据分成 段，并且在需要的时候才读，不需要的时候就让数据乖乖地呆在硬盘上。Lucene本身是一个优秀的索引引擎，能够提供有效的索引和检索机制。文本的目的 是，介绍如用利用Lucene的API，如何从已经建好的索引的数据中读取需要的信息。至于Lucene如何使用，我会在后续的文章中逐渐介绍。</font></p>
<p><font face="Verdana"></font><font size="2">我们一步一步来看。这里建设已经有实现建好索引，存放在index目录下。好，要读索引，总得先生成一个读索引器(即Lucene中IndexReader的实例)。好，写下面的程序(程序为C#程序，本文使用DotLucene)。<br />
IndexReader reader;<br />
问 题出来了，IndexReader是一个abstract类，不能实例化。那好，换派生类试试看。找到IndexReader的两个孩子 ――SegmentReader和MultiReader。用哪个呢？无论是哪个都需要一大堆参数(我是颇费了周折才搞清楚它们的用途，后面再解释)，似 乎想用Lucene的索引数据不是那么容易啊。通过跟踪代码和查阅文档，我终于找到使用IndexReader的钥匙。原来IndexReader有一个 &#8220;工厂模式&#8221;的static interface――IndexReader.Open。定义如下：<br />
#0001 public static IndexReader Open(System.String path)<br />
#0002 public static IndexReader Open(System.IO.FileInfo path)<br />
#0003 public static IndexReader Open(Directory directory)<br />
#0004 private static IndexReader Open(Directory directory, bool closeDirectory)<br />
其中有三个是public的接口，可供调用。打开一个索引，就是这么简单：<br />
#0001 IndexReader reader = IndexReader.Open(index);</font></p>
<p><font face="Verdana"></font><font size="2">实际上，这个打开索引经历了这样的一个过程：<br />
#0001 SegmentInfos infos = new SegmentInfos();<br />
#0002 Directory directory = FSDirectory.GetDirectory(index, false);<br />
#0003 infos.Read(directory);<br />
#0004 bool closeDirectory = false;<br />
#0005 if (infos.Count == 1)<br />
#0006 {<br />
#0007 // index is optimized<br />
#0008 return new SegmentReader(infos, infos.Info(0), closeDirectory);<br />
#0009 }<br />
#0010 else<br />
#0011 {<br />
#0012 IndexReader[] readers = new IndexReader[infos.Count];<br />
#0013 for (int i = 0; i &lt; infos.Count; i++)<br />
#0014 readers[i] = new SegmentReader(infos.Info(i));<br />
#0015 return new MultiReader(directory, infos, closeDirectory, readers);<br />
#0016 }</font></p>
<p><font face="Verdana"></font><font size="2">首 先要读入索引的段信息(segment information, #0001~#0003)，然后看一下有几个段：如果只有一个，那么可能是优化过的，直接读取这一个段就可以(#0008)；否则需要一次读入各个段 (#0013~#0014)，然后再拼成一个MultiReader(#0015)。打开索引文件的过程就是这样。</font></p>
<p><font face="Verdana"></font><font size="2">接下来我们要看看如何读取信息了。用下面这段代码来说明。<br />
#0001 public static void PrintIndex(IndexReader reader)<br />
#0002 {<br />
#0003 //显示有多少个document<br />
#0004 System.Console.WriteLine(reader + &#8220;tNumDocs = &#8221; + reader.NumDocs());<br />
#0005 for (int i = 0; i &lt; reader.NumDocs(); i++)<br />
#0006 {<br />
#0007 System.Console.WriteLine(reader.Document(i));<br />
#0008 }<br />
#0009<br />
#0010 //枚举term，获得&lt;document, term freq, position* &gt;信息<br />
#0011 TermEnum termEnum = reader.Terms();<br />
#0012 while (termEnum.Next())<br />
#0013 {<br />
#0014 System.Console.Write(termEnum.Term());<br />
#0015 System.Console.WriteLine(&#8220;tDocFreq=&#8221; + termEnum.DocFreq());<br />
#0016<br />
#0017 TermPositions termPositions = reader.TermPositions(termEnum.Term());<br />
#0018 int i = 0;<br />
#0019 int j = 0;<br />
#0020 while (termPositions.Next())<br />
#0021 {<br />
#0022 System.Console.WriteLine((i++) + &#8220;-&gt;&#8221; + &#8221; DocNo:&#8221; + termPositions.Doc() + &#8220;, Freq:&#8221; + termPositions.Freq());<br />
#0023 for (j = 0; j &lt; termPositions.Freq(); j++)<br />
#0024 System.Console.Write(&#8220;[" + termPositions.NextPosition() + "]&#8220;);<br />
#0025 System.Console.WriteLine();<br />
#0026 }<br />
#0027<br />
#0028 //直接获取 &lt;term freq, document&gt; 的信息<br />
#0029 TermDocs termDocs = reader.TermDocs(termEnum.Term());<br />
#0030 while (termDocs.Next())<br />
#0031 {<br />
#0032 System.Console.WriteLine((i++) + &#8220;-&gt;&#8221; + &#8221; DocNo:&#8221; + termDocs.Doc() + &#8220;, Freq:&#8221; + termDocs.Freq());<br />
#0033 }<br />
#0034 }<br />
#0035<br />
#0036 // FieldInfos fieldInfos = reader.fieldInfos;<br />
#0037 // FieldInfo pathFieldInfo = fieldInfos.FieldInfo(&#8220;path&#8221;);<br />
#0038<br />
#0039 //显示 term frequency vector<br />
#0040 for (int i = 0; i &lt; reader.NumDocs(); i++)<br />
#0041 {<br />
#0042 //对contents的token之后的term存于了TermFreqVector<br />
#0043 TermFreqVector termFreqVector = reader.GetTermFreqVector(i, &#8220;contents&#8221;);<br />
#0044<br />
#0045 if (termFreqVector == null)<br />
#0046 {<br />
#0047 System.Console.WriteLine(&#8220;termFreqVector is null.&#8221;);<br />
#0048 continue;<br />
#0049 }<br />
#0050<br />
#0051 String fieldName = termFreqVector.GetField();<br />
#0052 String[] terms = termFreqVector.GetTerms();<br />
#0053 int[] frequences = termFreqVector.GetTermFrequencies();<br />
#0054<br />
#0055 System.Console.Write(&#8220;FieldName:&#8221; + fieldName);<br />
#0056 for (int j = 0; j &lt; terms.Length; j++)<br />
#0057 {<br />
#0058 System.Console.Write(&#8220;[" + terms[j] + &#8220;:&#8221; + frequences[j] + &#8220;]&#8221;);<br />
#0059 }<br />
#0060 System.Console.WriteLine();<br />
#0061 }<br />
#0062 System.Console.WriteLine();<br />
#0063 }</font></p>
<p><font face="Verdana"></font><font size="2">#0004 计算document的个数<br />
#0012~#0034 枚举collection中所有的term<br />
其中#0017~#0026 枚举每个term在出现的document中的所有位置(第几个词，从1开始计数)；#0029~#0033 计算每个term出现在哪些文档和相应的出现频度(即DF和TF)。<br />
#0036~#0037在reader是SegmentReader类型的情况下有效。<br />
#0040~#0061可以快速的读取某篇文档中出现的term和相应的频度。但是这部分需要在建索引时，设置storeTermVector为true。比如<br />
doc.Add(Field.Text(&#8220;contents&#8221;, reader, true));<br />
其中的第三项即是。默认为false。</font></p>
<p><font face="Verdana"></font><font size="2">有了这些数据，就可以统计我需要的数据了。以后我会介绍如何建立索引，如何应用Lucene。</font></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/09/3886.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Microsoft Word文档中搜索替换时常用的特 殊符号</title>
		<link>http://blog.zye.me/2011/08/49206.html</link>
		<comments>http://blog.zye.me/2011/08/49206.html#comments</comments>
		<pubDate>Wed, 10 Aug 2011 14:27:47 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Research]]></category>
		<category><![CDATA[word]]></category>
		<category><![CDATA[特殊字符]]></category>

		<guid isPermaLink="false">http://blog.so8848.com/2009/02/49206.html</guid>
		<description><![CDATA[  Sent to you by jeffye via Google Reader: Microsoft Word文档中搜索替换时常用的特殊符号 via Pure Pleasure &#8211; Reborn by 李笑来 on 2/16/09 经常需要大量处理文本的读者，花一点时间学学MS Word中的“搜索替换通配符”是非常值得的。我经常看到身边的人因不懂这些基本“常识”而浪费大量时间，更有甚者，可能因为不懂这些而人为导致一些任务变成“不可完成、不可想象”的任务。 有些人（比如我）读写文档的时候，习惯于两个段落之间空一整行，因为这样可以方便阅读或者审阅。而遇到另外一些人编辑过的Word文档，其中的段落与段落紧挨着，由于习惯便觉得特别难以阅读，怎么办？只需要用CTRL+H呼出“查找和替换”对话框，搜索“^p”替换“^p^p”即可： 其中“^p”（不含引号）代表“段落标记”。 类似的特殊符号还有： “^l”代表“手动换行符”； “^m”代表“手动分页符”； “^s”代表“不间断空格”； “^+”代表“长划线”； “^=”代表“短划线”； “^~”代表“不间断连字符”； “^-”代表“可选连字符”； 如果你想把文章中所有的“全角空格”全部替换为“半角空格”，那么就要搜索“^u8195”替换“ ”： 如果你想把所有加重字体的文本全都换个颜色（比如蓝颜色），那么： CTRL+H呼出“查找和替换”对话框； 用鼠标在“查找内容（N）：”右边的输入框里点一下，而后按键盘“CTRL+b”； 用鼠标在“替换为（I）：”右边的输入框里点一下，而后按键盘“CTRL+b”； 点击“更多（M）”按钮； 点击“格式（O）”按钮，选择“字体”，呼出“替换字体”对话框；在“字体颜色（C）”下的下拉框中选择蓝色之后按“确定”按钮关掉对话框； 点击“查找和替换”对话框中的“替换（R）”或者“全部替换（A）”按钮…… 参照以下两张图片： 读者需要需要举一反三的话，那么就在MS Word的帮助文件里搜索“查找和替换”，读一读帮助文档就好。 Things you can do from here: Subscribe to Pure Pleasure &#8211; <a href='http://blog.zye.me/2011/08/49206.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>  Sent to you by jeffye via Google Reader:</p>
<h2><a href="http://www.xiaolai.net/index.php/archives/5649.html">Microsoft Word文档中搜索替换时常用的特殊符号</a></h2>
<p>via <a href="http://www.xiaolai.net">Pure Pleasure &#8211; Reborn</a> by 李笑来 on 2/16/09</p>
<p>经常需要大量处理文本的读者，花一点时间学学MS Word中的“搜索替换通配符”是非常值得的。我经常看到身边的人因不懂这些基本“常识”而浪费大量时间，更有甚者，可能因为不懂这些而人为导致一些任务变成“不可完成、不可想象”的任务。</p>
<p>有些人（比如我）读写文档的时候，习惯于两个段落之间空一整行，因为这样可以方便阅读或者审阅。而遇到另外一些人编辑过的Word文档，其中的段落与段落紧挨着，由于习惯便觉得特别难以阅读，怎么办？只需要用CTRL+H呼出“查找和替换”对话框，搜索“^p”替换“^p^p”即可：</p>
<p align="center"><img src="http://www.xiaolai.net/wp-content/uploads/2009/02/sr-pp.png" /></p>
<p>其中“^p”（不含引号）代表“段落标记”。</p>
<p>类似的特殊符号还有：</p>
<ul>
<li>“^l”代表“手动换行符”；</li>
<li>“^m”代表“手动分页符”；</li>
<li>“^s”代表“不间断空格”；</li>
<li>“^+”代表“长划线”；</li>
<li>“^=”代表“短划线”；</li>
<li>“^~”代表“不间断连字符”；</li>
<li>“^-”代表“可选连字符”；</li>
</ul>
<p>如果你想把文章中所有的“全角空格”全部替换为“半角空格”，那么就要搜索“^u8195”替换“ ”：</p>
<p align="center"><img src="http://www.xiaolai.net/wp-content/uploads/2009/02/sr-ss.png" /></p>
<p>如果你想把所有加重字体的文本全都换个颜色（比如蓝颜色），那么：</p>
<ol>
<li>CTRL+H呼出“查找和替换”对话框；</li>
<li>用鼠标在“查找内容（<u>N</u>）：”右边的输入框里点一下，而后按键盘“CTRL+b”；</li>
<li>用鼠标在“替换为（<u>I</u>）：”右边的输入框里点一下，而后按键盘“CTRL+b”；</li>
<li>点击“更多（<u>M</u>）”按钮；</li>
<li>点击“格式（<u>O</u>）”按钮，选择“字体”，呼出“替换字体”对话框；在“字体颜色（<u>C</u>）”下的下拉框中选择蓝色之后按“确定”按钮关掉对话框；</li>
<li>点击“查找和替换”对话框中的“替换（<u>R</u>）”或者“全部替换（<u>A</u>）”按钮……</li>
</ol>
<p>参照以下两张图片：</p>
<p align="center"><img src="http://www.xiaolai.net/wp-content/uploads/2009/02/sr-font.png" /></p>
<p align="center"><img src="http://www.xiaolai.net/wp-content/uploads/2009/02/sr-color.png" /></p>
<p>读者需要需要举一反三的话，那么就在MS Word的帮助文件里搜索“查找和替换”，读一读帮助文档就好。</p>
<h3>Things you can do from here:</h3>
<ul>
<li><a href="http://www.google.com/reader/view/feed%2Fhttp%3A%2F%2Fwww.xiaolai.net%2Findex.php%2Ffeed?source=email">Subscribe to Pure Pleasure &#8211; Reborn</a> using <strong>Google Reader</strong></li>
<li><a href="http://www.google.com/reader/?source=email">Get started using Google Reader</a> to easily keep up with <strong>all your favorite sites</strong></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/08/49206.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>如何识别Compendex 数据库中的核心和非核心数据</title>
		<link>http://blog.zye.me/2011/08/50221.html</link>
		<comments>http://blog.zye.me/2011/08/50221.html#comments</comments>
		<pubDate>Wed, 10 Aug 2011 02:28:02 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Research]]></category>
		<category><![CDATA[Compendex]]></category>
		<category><![CDATA[EI]]></category>
		<category><![CDATA[收录]]></category>
		<category><![CDATA[数据库]]></category>

		<guid isPermaLink="false">http://blog.so8848.com/?p=50221</guid>
		<description><![CDATA[如何识别Compendex 数据库中的核心和非核心数据 Ei Compendex数据库从2009年1月起，所收录的中国期刊数据不再分核心数据和非核心数据。检索2009年之前的数据，可参考以下的核心数据和非核心数据的区别： 1． Compendex 数据库中的核心数据：数据的内容全面，主要包括：论文标题（Title）；作者（Authors）；第一作者单位（First author affiliation）；英文文摘（Abstract）；论文所在期刊名称（Serial title）；卷（Volume）期（Issue）；论文页码（Pages）；分类码（Ei classification codes）；主题词（Ei main heading）；受控词（Ei controlled terms）；自由词（Uncontrolled terms） 等等。其中：分类码（Ei classification codes）；主题词（Ei main heading）；受控词（Ei controlled terms）；自由词（Uncontrolled terms）需要专业人员单独给出。2． Compendex 数据库中的非核心数据：数据内容主要包括：论文标题（Title）；作者（Authors）；论文所在期刊名称（Serial title）；卷（Volume）期（Issue）；论文页码（Pages）；部分数据带有英文文摘和第一作者单位（First author affiliation）。不需要任何专业人员再做工作。Compendex 数据库中的核心和非核心数据的主要区别在于：数据中是否有分类码（Ei classification codes）和主题词（Ei main heading）；有这两项内容的数据是核心数据，反之是非核心数据。 http://www.ei.org.cn/twice/roll_content_4.htm]]></description>
			<content:encoded><![CDATA[<table style="background-attachment: fixed; background-repeat: no-repeat; border-collapse: collapse; height: 100%;" border="1" cellspacing="0" cellpadding="0" width="462" align="center" bordercolor="#16A3F4">
<tbody>
<tr>
<td style="font-size: 12px" width="458" height="35" valign="top" bgcolor="#FFFFE8">
<p align="center">
<p style="font-family: Verdana, 宋体; text-indent: 2em; text-align: justify; line-height: normal"><strong>如何识别Compendex 数据库中的核心和非核心数据</strong></p>
<p style="font-family: Verdana, 宋体; text-indent: 2em; text-align: justify; line-height: normal">
</td>
</tr>
<tr>
<td style="font-size: 12px" height="258" valign="top">
<table class="p12-p28" style="font-size: 12px; line-height: 28px" border="0" cellspacing="0" cellpadding="0" width="90%" align="center">
<tbody>
<tr>
<td style="font-size: 12px">
<p class="p12-p20" style="font-family: Verdana, 宋体; text-indent: 2em; text-align: justify; font-size: 12px; line-height: 20px">Ei Compendex数据库从2009年1月起，所收录的中国期刊数据不再分核心数据和非核心数据。检索2009年之前的数据，可参考以下的核心数据和非核心数据的区别：</p>
</td>
</tr>
<tr>
<td style="font-size: 12px">
<p class="p12-p20" style="font-family: Verdana, 宋体; text-indent: 2em; text-align: justify; font-size: 12px; line-height: 20px">1． Compendex 数据库中的核心数据：数据的内容全面，主要包括：论文标题（Title）；作者（Authors）；第一作者单位（First author affiliation）；英文文摘（Abstract）；论文所在期刊名称（Serial title）；卷（Volume）期（Issue）；论文页码（Pages）；分类码（Ei classification codes）；主题词（Ei main heading）；受控词（Ei controlled terms）；自由词（Uncontrolled terms） 等等。其中：分类码（Ei classification codes）；主题词（Ei main heading）；受控词（Ei controlled terms）；自由词（Uncontrolled terms）需要专业人员单独给出。2． Compendex 数据库中的非核心数据：数据内容主要包括：论文标题（Title）；作者（Authors）；论文所在期刊名称（Serial title）；卷（Volume）期（Issue）；论文页码（Pages）；部分数据带有英文文摘和第一作者单位（First author affiliation）。不需要任何专业人员再做工作。Compendex 数据库中的核心和非核心数据的主要区别在于：数据中是否有分类码（Ei classification codes）和主题词（Ei main heading）；有这两项内容的数据是核心数据，反之是非核心数据。</p>
</td>
</tr>
</tbody>
</table>
</td>
</tr>
</tbody>
</table>
<p><a href="http://www.ei.org.cn/twice/roll_content_4.htm">http://www.ei.org.cn/twice/roll_content_4.htm</a></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/08/50221.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>如何论文阅读</title>
		<link>http://blog.zye.me/2011/08/44263.html</link>
		<comments>http://blog.zye.me/2011/08/44263.html#comments</comments>
		<pubDate>Mon, 01 Aug 2011 14:28:20 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Research]]></category>
		<category><![CDATA[论文阅读]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/11/44263.html</guid>
		<description><![CDATA[抓住论文的要害 读完一篇论文必须了解哪些关键内容呢？我觉得应该包括以下方面： 1). 作者为什么要做这项工作？ Motivation 2). 要解决的是一个什么问题？作者在解决问题时遇到了怎样的困难？ Problem and Challenge&#160; 3). 为了解决他的困难他提出了什么样的解决办法？ Method 4). 试验结果是否可能真的证明他的方法好，数据是否充分，有没有和别人的工作，别的方法进行对比？ Result , comparison and analysis 5). 你认为他的方法是 否新颖，你从中学到了什么？ Innovation? 6). 该方法有哪些不足，你是否立即有了新的改进方案？ Any improvement? 如果有立即记录下来。带着上述问题，抓住要点，做好记录，一篇长文就会像庖丁 解牛一样轰然倒下。 &#160; 反过来，我们在review别人论文时，可以从这些方面条毛病，当然这需要我们根据论文实际情况有所偏重。]]></description>
			<content:encoded><![CDATA[<p><b>抓住论文的要害</b>  </p>
<p>读完一篇论文必须了解哪些关键内容呢？我觉得应该包括以下方面：  </p>
<p>1). 作者为什么要做这项工作？ <strong>Motivation </strong> </p>
<p>2). 要解决的是一个什么问题？作者在解决问题时遇到了怎样的困难？ <strong>Problem and Challenge</strong>&nbsp; </p>
<p>3). 为了解决他的困难他提出了什么样的解决办法？ <strong>Method </strong> </p>
<p>4). 试验结果是否可能真的证明他的方法好，数据是否充分，有没有和别人的工作，别的方法进行对比？ <strong>Result , comparison and analysis</strong>  </p>
<p>5). 你认为他的方法是 否新颖，你从中学到了什么？ <strong>Innovation?</strong>  </p>
<p>6). 该方法有哪些不足，你是否立即有了新的改进方案？ <strong>Any improvement? </strong> </p>
<p>如果有立即记录下来。带着上述问题，抓住要点，做好记录，一篇长文就会像庖丁 解牛一样轰然倒下。  </p>
<p>&nbsp; </p>
<p>反过来，我们在<strong>review</strong>别人论文时，可以从这些方面条毛病，当然这需要我们根据论文实际情况有所偏重。</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/08/44263.html/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>梯度、方向导数与切平面</title>
		<link>http://blog.zye.me/2011/07/43230.html</link>
		<comments>http://blog.zye.me/2011/07/43230.html#comments</comments>
		<pubDate>Sat, 30 Jul 2011 14:27:33 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[machine learning]]></category>
		<category><![CDATA[方向导数]]></category>
		<category><![CDATA[梯度]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/10/43230.html</guid>
		<description><![CDATA[方向导数是用以推求曲面函数f 在某一特点方向的变化率，可以证明延梯度方向变化率是最大的 &#160; 梯度与方向导数]]></description>
			<content:encoded><![CDATA[<p><strong>方向导数是用以推求曲面函数f 在某一特点方向的变化率，可以证明延梯度方向变化率是最大的</strong></p>
<p><strong></strong>&nbsp;</p>
<p><strong>梯度与方向导数</strong></p>
<p><a href="http://www.5yiso.cn/wp-content/uploads/192/19263/2008/10/1.jpg"><img style="border-top-width: 0px; border-left-width: 0px; border-bottom-width: 0px; border-right-width: 0px" height="698" alt="1" src="http://www.5yiso.cn/wp-content/uploads/192/19263/2008/10/1-thumb.jpg" width="601" align="left" border="0"/></a></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/07/43230.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>电脑族眼睛保健总结</title>
		<link>http://blog.zye.me/2011/07/42195.html</link>
		<comments>http://blog.zye.me/2011/07/42195.html#comments</comments>
		<pubDate>Mon, 25 Jul 2011 02:27:28 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Research]]></category>
		<category><![CDATA[电脑族]]></category>
		<category><![CDATA[眼睛]]></category>
		<category><![CDATA[视疲劳]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/09/42195.html</guid>
		<description><![CDATA[经常对着电脑，相信你总会有眼睛疲惫的时候，甚至有事会让你感到工作力不从心，一定要好好保护我们的研究，有个好的用眼习惯，给眼睛多点营养。下面是我收集整理的一些爱护眼睛的方法，一定有适合你的！菊花茶是一种比较清香的茶饮，它的妙处就是在于，当你的眼睛很累的时候，用菊花茶的热气薰眼部，1分钟，眼睛马上感觉到很舒服，大家不妨试一试。 在内调问题上，平时要多吃一些帮助抗氧化的时候，比如含有维它命A、维它命C和维它命E的食物。飞扬经常会将A、C、E讲一起说。因为它们真的是超强的抗氧化组合！从各种蔬菜和水果中尤其是水果，都可以摄取到丰富的维它命C，因为它是水溶性的； 那A和E都是脂溶性的，尤其是维它命A，在各种黄颜色的蔬菜中啊都含有，建议用油炒来吃。尤其胡萝卜，但是我发现很多朋友都不喜欢吃它的。但其实胡萝卜含有丰富的胡萝卜素，也叫贝塔胡萝卜素，只有用油炒来吃，才能真正释放胡萝卜素，否则生吃吃的只是胡萝卜前质哦！ 胡萝卜素不仅可以帮助细化我们的皮肤，保湿啊，充盈水份，更可以帮助“天然控油”。平衡水油分泌，以及使我们的眼睛变得明亮。 大家都知道，面部皮肤有汗腺和皮脂腺两种，眼部周围的皮肤，只有汗腺，皮脂腺很少，这也是为什么眼部皮肤会比面部其它皮肤先变老的一个原因。那么多补充了维它命A，我们的水油会平衡，而且可以起到紧致皮肤的效果呢~ 再来说说维它命E吧，它又叫生育醇，有非常多的用途，针对于电脑皮肤的人士来讲，时常吃一些天然维它命E的东西，比如动物内脏啊，各种豆类等等，对帮助保护我们的细胞壁非常有效果哦。从而加强皮肤抗氧化。 平时注意多饮水每天最好是2500亳升，打个比方，1瓶矿泉水的量是550ML，大约要喝4瓶左右。保持每天1000亳升的排尿量。多吃蔬菜和水果这些弱碱性的食物，保持身体弱碱性状态，少吃酸性食物，这样皮肤就会慢慢改善过来。 对于普通人来说，最常见的还是视疲劳，觉得眼睛酸涩就要滴眼药水来缓解，但是这也要分原因，滴眼药水并不是万能的。 1．如果是近视眼，但是不戴眼镜，这样的情况疲劳发作比较频繁。可以用一些眼药水，但是从医生的角度来讲价值不大。主要是因为眼睛里面的肌肉痉挛导致眼睛的酸胀感和不舒服感，这时候最好让眼睛休息或者戴合适度数的眼镜看东西，让眼睛舒服一些，避免眼睛疲劳的症状。眼睛有屈光的情况，还是要注意眼睛的保健、休息并佩戴正确的眼镜，来减轻眼部不适的症状。 2．长时间处于荧光屏前，一方面有辐射的影响，另一方面由于眼睛盯着荧光屏，眨眼的次数减少，再加上大部分在电脑屏幕前工作的人都是处于空调房里，造成眼睛干涩，引起终端综合征。此时可以适当用一些湿润眼部的眼药水，可以在医院里开人工泪液，还有一些非处方性药水。人工泪液的好处在于它在眼睛表面存留的时间长，能够2至4个小时保持眼表湿润。而保健品类的眼药水滴到眼睛里5分钟左右就会流失。但是它里面的一些维生素成分也能适当缓解睫状肌痉挛导致的眼部不适的状况。因人而异，如果滴药后仍不舒服最好还是找医生诊治。 3．有些人眼部不舒服、干涩是因为眼睛本身有毛病。除了屈光之外，还有隐性的斜视，特别是隐性的外斜视。这样的病人看东西比正常人容易累，如果有斜视点眼药是不能解决问题的，建议去医院进行检查。慢性结膜炎是一些非致病性的细菌在眼部的繁殖等导致眼部的炎症反应。这类人要注意用眼卫生，养成用眼良好习惯。]]></description>
			<content:encoded><![CDATA[<p>经常对着电脑，相信你总会有眼睛疲惫的时候，甚至有事会让你感到工作力不从心，一定要好好保护我们的研究，有个好的用眼习惯，给眼睛多点营养。下面是我收集整理的一些爱护眼睛的方法，一定有适合你的！<br /><span id="more-42195"></span><br />菊花茶是一种比较清香的茶饮，它的妙处就是在于，当你的眼睛很累的时候，用菊花茶的热气薰眼部，1分钟，眼睛马上感觉到很舒服，大家不妨试一试。</p>
<p>在内调问题上，平时要多吃一些帮助抗氧化的时候，比如含有维它命A、维它命C和维它命E的食物。飞扬经常会将A、C、E讲一起说。因为它们真的是超强的抗氧化组合！从各种蔬菜和水果中尤其是水果，都可以摄取到丰富的维它命C，因为它是水溶性的；</p>
<p>那A和E都是脂溶性的，尤其是维它命A，在各种黄颜色的蔬菜中啊都含有，建议用油炒来吃。尤其胡萝卜，但是我发现很多朋友都不喜欢吃它的。但其实胡萝卜含有丰富的胡萝卜素，也叫贝塔胡萝卜素，只有用油炒来吃，才能真正释放胡萝卜素，否则生吃吃的只是胡萝卜前质哦！</p>
<p>胡萝卜素不仅可以帮助细化我们的皮肤，保湿啊，充盈水份，更可以帮助“天然控油”。平衡水油分泌，以及使我们的眼睛变得明亮。</p>
<p>大家都知道，面部皮肤有汗腺和皮脂腺两种，眼部周围的皮肤，只有汗腺，皮脂腺很少，这也是为什么眼部皮肤会比面部其它皮肤先变老的一个原因。那么多补充了维它命A，我们的水油会平衡，而且可以起到紧致皮肤的效果呢~</p>
<p>再来说说维它命E吧，它又叫生育醇，有非常多的用途，针对于电脑皮肤的人士来讲，时常吃一些天然维它命E的东西，比如动物内脏啊，各种豆类等等，对帮助保护我们的细胞壁非常有效果哦。从而加强皮肤抗氧化。</p>
<p>平时注意多饮水每天最好是2500亳升，打个比方，1瓶矿泉水的量是550ML，大约要喝4瓶左右。保持每天1000亳升的排尿量。多吃蔬菜和水果这些弱碱性的食物，保持身体弱碱性状态，少吃酸性食物，这样皮肤就会慢慢改善过来。</p>
<p>对于普通人来说，最常见的还是视疲劳，觉得眼睛酸涩就要滴眼药水来缓解，但是这也要分原因，滴眼药水并不是万能的。 </p>
<p>1．如果是近视眼，但是不戴眼镜，这样的情况疲劳发作比较频繁。可以用一些眼药水，但是从医生的角度来讲价值不大。主要是因为眼睛里面的肌肉痉挛导致眼睛的酸胀感和不舒服感，这时候最好让眼睛休息或者戴合适度数的眼镜看东西，让眼睛舒服一些，避免眼睛疲劳的症状。眼睛有屈光的情况，还是要注意眼睛的保健、休息并佩戴正确的眼镜，来减轻眼部不适的症状。 </p>
<p>2．长时间处于荧光屏前，一方面有辐射的影响，另一方面由于眼睛盯着荧光屏，眨眼的次数减少，再加上大部分在电脑屏幕前工作的人都是处于空调房里，造成眼睛干涩，引起终端综合征。此时可以适当用一些湿润眼部的眼药水，可以在医院里开人工泪液，还有一些非处方性药水。人工泪液的好处在于它在眼睛表面存留的时间长，能够2至4个小时保持眼表湿润。而保健品类的眼药水滴到眼睛里5分钟左右就会流失。但是它里面的一些维生素成分也能适当缓解睫状肌痉挛导致的眼部不适的状况。因人而异，如果滴药后仍不舒服最好还是找医生诊治。 </p>
<p>3．有些人眼部不舒服、干涩是因为眼睛本身有毛病。除了屈光之外，还有隐性的斜视，特别是隐性的外斜视。这样的病人看东西比正常人容易累，如果有斜视点眼药是不能解决问题的，建议去医院进行检查。慢性结膜炎是一些非致病性的细菌在眼部的繁殖等导致眼部的炎症反应。这类人要注意用眼卫生，养成用眼良好习惯。 </p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/07/42195.html/feed</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>牛奶 VS 豆浆</title>
		<link>http://blog.zye.me/2011/07/41965.html</link>
		<comments>http://blog.zye.me/2011/07/41965.html#comments</comments>
		<pubDate>Sat, 23 Jul 2011 14:27:42 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Research]]></category>
		<category><![CDATA[牛奶]]></category>
		<category><![CDATA[豆浆]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/09/41965.html</guid>
		<description><![CDATA[牛奶和豆浆的营养成分比较 脂肪：牛奶一般3.1%，豆浆0.4%蛋白：牛奶2.9% ，豆浆2.7% 乳糖：牛奶4.5 ，豆浆2.4%以上是主要成分，从这你可以看出，牛奶的干物质含量比豆浆的多，脂肪含量也多，气矿物质和维生素其实差不多，不太好说。 下 面介绍一下豆浆的功效：常食豆浆补血益气 ，现代人经常因为紧张的工作或营养结构失衡而忽视了自身的保健，导致食欲不振、体质下降、贫血。特别是缺铁性贫血，已成为危害人们健康的大敌。青少年在这 方面尤为明显。据全国营养调查结果显示：7岁以上的少年儿童，缺铁性贫血患病率高达10%至20%。人们在千方百计寻找补铁方法的时候发现：在我们传统的 饮品豆浆中就富含铁、锌、钙等多种矿物质，特别是铁的含量，是牛奶的2倍。 豆浆性平味甘，能全面地均衡人体营养结构，补充人体所缺的铁，在滋养的同时，消除缺铁性贫血的隐患，为人体新陈代谢创造良好的环境，有效克制缺铁性贫血病症的发生，从而增强机体免疫力，使人精气旺盛，尽情享受轻松生活。 常食优质豆浆，既能增进营养，又能调理人体气血，起到保健作用。 牛奶呢,好处也很多，根据国内外营养专家多年研究证实，牛奶是我们身边“最接近完善的食品”,每天喝牛奶对人体至少有12个好处： 1、牛奶中的钾可使动脉血管在高压时保持稳定，减少中风风险。 2、 牛奶可住阻止人体吸收食物中有毒的金属铅和镉。 3、牛奶中酉含氨酸能促进血清素大量增长。 4、牛奶中的铁铜和卵磷脂能大大提高大脑的工作效率。 5、牛奶中的钙能增加骨骼和牙齿，减少骨骼萎缩病的发生。 6、牛奶中的镁能使心脏耐疲劳。 7、牛奶中的锌能使伤口更快愈合。 8、牛奶中的维生素B能提高视力。 9、常喝牛奶能预防动脉硬化。 　　 10、牛奶含钙量高，吸收好。 　　 11、睡前喝牛奶能帮助睡眠。 　　 12、牛奶中的纯蛋白含量高，常喝牛奶可美容。]]></description>
			<content:encoded><![CDATA[<p><b>牛奶和豆浆的营养成分比较</p>
<p></b>脂肪：牛奶一般3.1%，豆浆0.4%<br />蛋白：牛奶2.9%    ，豆浆2.7%  <br />乳糖：牛奶4.5     ，豆浆2.4%<br />以上是主要成分，从这你可以看出，牛奶的干物质含量比豆浆的多，脂肪含量也多，气矿物质和维生素其实差不多，不太好说。</p>
<p>下<br />
面介绍一下<b>豆浆的功效</b>：<br />常食豆浆补血益气<br />
，现代人经常因为紧张的工作或营养结构失衡而忽视了自身的保健，导致食欲不振、体质下降、贫血。特别是缺铁性贫血，已成为危害人们健康的大敌。青少年在这<br />
方面尤为明显。据全国营养调查结果显示：7岁以上的少年儿童，缺铁性贫血患病率高达10%至20%。人们在千方百计寻找补铁方法的时候发现：在我们传统的<br />
饮品豆浆中就富含铁、锌、钙等多种矿物质，特别是铁的含量，是牛奶的2倍。 <br />  豆浆性平味甘，能全面地均衡人体营养结构，补充人体所缺的铁，在滋养的同时，消除缺铁性贫血的隐患，为人体新陈代谢创造良好的环境，有效克制缺铁性贫血病症的发生，从而增强机体免疫力，使人精气旺盛，尽情享受轻松生活。 <br />   常食优质豆浆，既能增进营养，又能调理人体气血，起到保健作用。
<p><b>牛奶呢,好处也很多</b>，根据国内外营养专家多年研究证实，牛奶是我们身边“最接近完善的食品”,每天喝牛奶对人体至少有12个好处：  </p>
<p>1、牛奶中的钾可使动脉血管在高压时保持稳定，减少中风风险。  </p>
<p>2、 牛奶可住阻止人体吸收食物中有毒的金属铅和镉。  </p>
<p>3、牛奶中酉含氨酸能促进血清素大量增长。  </p>
<p>4、牛奶中的铁铜和卵磷脂能大大提高大脑的工作效率。  </p>
<p>5、牛奶中的钙能增加骨骼和牙齿，减少骨骼萎缩病的发生。  </p>
<p>6、牛奶中的镁能使心脏耐疲劳。  </p>
<p>7、牛奶中的锌能使伤口更快愈合。  </p>
<p>8、牛奶中的维生素B能提高视力。  </p>
<p>9、常喝牛奶能预防动脉硬化。 　　  </p>
<p>10、牛奶含钙量高，吸收好。 　　  </p>
<p>11、睡前喝牛奶能帮助睡眠。 　　  </p>
<p>12、牛奶中的纯蛋白含量高，常喝牛奶可美容。</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/07/41965.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>怎样做研究？&#8211;刘挺老师</title>
		<link>http://blog.zye.me/2011/07/38778.html</link>
		<comments>http://blog.zye.me/2011/07/38778.html#comments</comments>
		<pubDate>Thu, 21 Jul 2011 02:27:39 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Research]]></category>
		<category><![CDATA[刘挺]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/07/38778.html</guid>
		<description><![CDATA[转刘挺老师的怎样做研究 挺大气、挺宏观感觉不错，贴上以后有空再回顾下。 ppt下载：怎样做研究 原文地址：http://blog.sina.com.cn/s/blog_4cbec5e9010007pm.html]]></description>
			<content:encoded><![CDATA[<p>转刘挺老师的怎样做研究<br />
挺大气、挺宏观感觉不错，贴上以后有空再回顾下。</p>
<p>ppt下载：<a href="http://www.5yiso.cn/wp-content/uploads/192/19263/2008/07/xn-cyqr69ac8ff6qfzc.pdf" title="怎样做研究" rel="enclosure" target="_blank">怎样做研究</a></p>
<p>原文地址：<a href="http://blog.sina.com.cn/s/blog_4cbec5e9010007pm.html">http://blog.sina.com.cn/s/blog_4cbec5e9010007pm.html</a></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/07/38778.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>What is Latent Class Analysis?</title>
		<link>http://blog.zye.me/2011/07/37440.html</link>
		<comments>http://blog.zye.me/2011/07/37440.html#comments</comments>
		<pubDate>Tue, 19 Jul 2011 14:28:03 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[machine learning]]></category>
		<category><![CDATA[LCA]]></category>
		<category><![CDATA[LCM]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/07/37440.html</guid>
		<description><![CDATA[Some valuable links for LCA. http://ourworld.compuserve.com/homepages/jsuebersax/faq.htm http://en.wikipedia.org/wiki/Latent_class_model http://en.wikipedia.org/wiki/Latent_variable_model]]></description>
			<content:encoded><![CDATA[<p>Some valuable links for LCA.</p>
<p><a href="http://ourworld.compuserve.com/homepages/jsuebersax/faq.htm" target="_blank">http://ourworld.compuserve.com/homepages/jsuebersax/faq.htm</a></p>
<p><a href="http://en.wikipedia.org/wiki/Latent_class_model" target="_blank">http://en.wikipedia.org/wiki/Latent_class_model</a></p>
<p><a href="http://en.wikipedia.org/wiki/Latent_variable_model" target="_blank">http://en.wikipedia.org/wiki/Latent_variable_model</a></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/07/37440.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

