<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Information Retrieval Blog &#187; 英语</title>
	<atom:link href="http://blog.zye.me/tag/%e8%8b%b1%e8%af%ad/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.zye.me</link>
	<description>REAL TIME DATA PROCESSING, DISTRIBUTED COMPUTING, PATTERN DISCOVERY</description>
	<lastBuildDate>Tue, 31 Jan 2012 02:05:19 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>英美文学作品中的人名与寓意</title>
		<link>http://blog.zye.me/2011/08/32769.html</link>
		<comments>http://blog.zye.me/2011/08/32769.html#comments</comments>
		<pubDate>Fri, 05 Aug 2011 02:27:43 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Canada Related]]></category>
		<category><![CDATA[人名]]></category>
		<category><![CDATA[信息检索]]></category>
		<category><![CDATA[寓意]]></category>
		<category><![CDATA[英文]]></category>
		<category><![CDATA[英语]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/05/32769.html</guid>
		<description><![CDATA[英美文学作品中的人名与寓意 英美人名有不少源自英美文学作品，其喻义在英美等国已是家喻户晓，即使没有读过该作品的人们，也会明白这些人名的喻义。其用法在写作与日常生活中也屡见不鲜，本文举例如下： 1．James Bond詹母斯·邦德；（喻）神通广大的人 源自英国著名悬念小说作家伊恩·弗莱明（Ian Fleming, 1908-1964）的长篇侦探小说。弗莱明以塑代号007的英国间谍詹母斯·邦德（James Bond）而蜚声全球，以邦德为主人公的长篇小说共13部，每一部都充满惊险、恐怖和国际间谍的阴谋。小说中的詹母斯·邦德机智英勇，武艺高超，神通广大，无所不能。任何大案、难案他都能一一破获。James Bond现喻指“神通广大的人”。如： (1) During the war he was sent on dangerous secret missions abroad. Very exciting! He was a sort of James Bond.战争期间他被派往国外执行危险而秘密的任务。真令人兴奋！他就像是个詹姆斯·邦德。 (2)Most of the applicants were weeded out early, including one 13-year-old aspiring James Bond.多数申请人早已被筛掉，其中包括一位年仅13岁雄心勃勃的神童。 2．Jekyll and Hyde哲基尔和海德；（喻）有善恶双重人格者 源自英国著名冒险故事和散文作家斯蒂文森（Robert Louis Stevenson, 1850-1894）所著的道德寓意深刻的中篇小说《化身博士》（The Strange Case of Dr. <a href='http://blog.zye.me/2011/08/32769.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<div align="center"><big><b>英美文学作品中的人名与寓意</b></big></div>
<p>英美人名有不少源自英美文学作品，其喻义在英美等国已是家喻户晓，即使没有读过该作品的人们，也会明白这些人名的喻义。其用法在写作与日常生活中也屡见不鲜，本文举例如下：</p>
<p><b>1．James Bond詹母斯·邦德；（喻）神通广大的人</b></p>
<p>源自英国著名悬念小说作家伊恩·弗莱明（Ian Fleming, 1908-1964）的长篇侦探小说。弗莱明以塑代号007的英国间谍詹母斯·邦德（James Bond）而蜚声全球，以邦德为主人公的长篇小说共13部，每一部都充满惊险、恐怖和国际间谍的阴谋。小说中的詹母斯·邦德机智英勇，武艺高超，神通广大，无所不能。任何大案、难案他都能一一破获。James Bond现喻指“神通广大的人”。如：</p>
<p>(1) During the war he was sent on dangerous secret missions abroad. Very exciting! He was a sort of James Bond.战争期间他被派往国外执行危险而秘密的任务。真令人兴奋！他就像是个詹姆斯·邦德。</p>
<p>(2)Most of the applicants were weeded out early, including one 13-year-old aspiring James Bond.多数申请人早已被筛掉，其中包括一位年仅13岁雄心勃勃的神童。</p>
<p><b>2．Jekyll and Hyde哲基尔和海德；（喻）有善恶双重人格者</b></p>
<p>源自英国著名冒险故事和散文作家斯蒂文森（Robert Louis Stevenson, 1850-1894）所著的道德寓意深刻的中篇小说《化身博士》（The Strange Case of Dr. Jekyll and Mr. Hyde）。哲基尔和海德（Jekyll and Hyde）为该小说中的主人公，服用自配药物可使自己在原来善良绅士Jekyll与凶残暴的Hyde之间往复蜕变。Jekyll and Hyde现喻指“有善恶双重人格者”。如：</p>
<p>（1）I’d never have expected him to behave like that; he’s a real Jekyll and Hyde.我从来没有想到他会那样，他确实有善恶双重人格。</p>
<p>（2）He’s a strange chap. Usually he’s very pleasant and reasonable, but there are times when he gets very bad-tempered and almost violent. He’s got a Jekyll and Hyed personality.他这个家伙很怪。平常他十分友善讲理，但有时脾气很坏甚至粗暴。他具有善恶双重人格的个性。</p>
<p><b>3．Man Friday星期五来的人；（喻）忠实的仆人；得力的助手</b></p>
<p>源自英国小说家笛福（Daniel Defoe, 1669-1731）所著的长篇小说《鲁滨逊漂流记》（The Adventures of Robinson Grusoe）。由于船在海上失事，该小说的主人公鲁滨逊一个人在荒岛上度过了20多个春秋。在一个星期五，他救了一个土人俘虏，并收留他为佣人，取名为“星期五”。此后，土人星期五成了鲁滨逊的忠实仆人和助手。Man Friday现喻指“忠仆”。如：</p>
<p>（1）He’s very practical. What he needs is someone to look after him and do everything for him. He needs a Man Friday.他很讲实用。他就是需要人照顾他，并且为他做一切。他需要一个忠实的仆人。</p>
<p>（2）I could never have started this business if my friend John had not been willing to act as my Man Friday. 如果没有我的朋友约翰心甘情愿地做我的忠实帮手，这个商店我是办不起来的。<br /><b><br />4．Mrs Grundy格伦迪太太；（喻）苛求、挑剔之人</b></p>
<p>源自英国剧作家托马斯·莫顿（Thomas Morton, 1764-1838）所著的喜剧《加快耕耘》（Speed the Plough）。格伦迪太太（Mrs Grundy）是虚构的人物，在剧中从未出过场，但其邻居阿希斐尔德（Ash field）太太经常念叨，事事怕她挑剔，现喻指“拘泥世俗、事事挑剔他人的人”。如：</p>
<p>（1）What will Mrs Grundy say?人家会怎么说呢？</p>
<p>（2）He decided to carry on his plan in spite of what Mrs Grundy will say.他不管人家会说什么，他决意按自己的计划干。<br /><b><br />5．Paul pry保罗·普赖；（喻）非常爱打听别人隐私的人</b></p>
<p>源自英国作家约翰·蒲尔（John Poole, 1786-1872）所作的同名喜剧《保罗·普赖》（Paul pry）。剧中主人公保罗·普赖（Paul pryk）没有职业，整日无所事事，游手好闲，好管闲事，尤其爱打听别人的隐私。英语中Pry—词常含贬义，意为“打听、探听（他人的私事）”。Paul Pry现喻指“非常爱打听别人隐私的人”。如：</p>
<p>（1）They don’t want any Paul Prys.他们不要任何“包打听”。</p>
<p>（2）Don’t say too much in the club about your affairs, there are one or two of the Paul Pry type here.在俱乐部里对自己的事别说得太多，因为这里有那么一、两个好干涉他人私事的保罗·普赖式的人物。</p>
<p><b>6．Peter Pan彼得·潘；（喻）不肯长大的男孩；天真而幼稚的成年人</b></p>
<p>源自英国剧作家和小说家巴里（James M. Barrie, 1860-1937）所著的同名剧《彼得·潘》（Peter Pan）。剧中主人公彼得·潘（Peter Pan）是一个跑人了人迹罕至的仙境而永不长大的少年，又称“一个永远长不大的孩子”，他是不能适应成人世界的人。Peter Pan现喻指“不肯长大的男孩”或“天真无邪的成人”。如：</p>
<p>（1）He still has very youthful enthusiasms, and he’s as slim and fit as he was 20 years ago. He’s a Peter Pan indeed.他仍然具有年轻人的热情，并且像20年前一样身材修长而结实。他真是个永远长不大的男孩。</p>
<p>（2）You’re married to a Peter Pan who absolutely will refuse to escape from the comfortable irresponsible stage of childhood.你和一个彼得·潘式的人物结了婚，他将坚决拒绝脱离无忧无虑、不承担责任的童年时代。</p>
<p><b>7．Pip Van Winkle瑞普·凡·温克尔；（喻）落后、守旧的人；嗜睡的人</b></p>
<p>源自美国作家华盛顿·欧文（Washington Lrving, 1783-1859）所著的同名小说《瑞普·凡·温克尔》（Rip Van Winkle）。主人公瑞普·凡·温克尔（Rip Van Winkle）。主人公瑞普·凡·温克尔（Rip Van Winkle）为避开性格凶焊的妻子藏身在卡茨基尔（Catskill）山中，一睡就是20年，醒来后却发现一切面目全非，妻子已故，住屋成为废墟。Rip Van Winkle现喻指“落后、守旧的人”或“嗜睡的人”。如：</p>
<p>（1）This is the opinion of some Rip van Winkle.这是一些不识时务者的意见。</p>
<p>（2）Come on, Rip Van Winkle, wake up! It’s nearly lunch-time.快点，瑞普·凡·温克尔，醒醒吧！几乎是吃午饭的时间了。</p>
<p><b>8．Robin Hood罗宾汉；（喻）急公好义者</b></p>
<p>源自英国中世纪的民间传说。罗宾汉（Robin Hood）盘踞森林，以抑强扶弱及清除贪污吏为宗旨。他对穷苦人和被压迫者及妇女能以礼相待，见义勇为，是个扶危救困、劫富济贫的绿林好汉。Robin Hook现喻指“急公好义者”。如：</p>
<p>（1）Well, yes, he was a criminal and he stole a lot of money, but he helped a lot of people with it. He was a bit of a Robin Hood.暖，是的，他是个罪犯，偷了很多钱。但是他用那些钱帮助了不少人。他多少像个罗宾汉。</p>
<p>（2）But don’t conclude from this that OPEC has become an international Robin Hood, robbing the wealthy in New York, Paris and Tokyo so that hungry nations may eat.但不要由此得出结论，认为石油输出国组织已变成国际罗宾汉，抢掳纽约、巴黎和东京的富者，好让饥饿的国家吃个饱。</p>
<p><b>9．Robinson Crusce鲁滨逊；（喻）离群索居的人</b></p>
<p>源自英国小说家笛福（Daniel Defoe, 1669-1731）所著的长篇小说《鲁滨逊漂流记》（The Adventures of Robinson Crusoe）。小说中的主人公鲁滨逊（Robinson Crusoe）厌恶平庸的生活，到海外去冒险闯荡而遇险</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/08/32769.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>自然语言理解技术及其应用探讨（转）</title>
		<link>http://blog.zye.me/2011/08/18582.html</link>
		<comments>http://blog.zye.me/2011/08/18582.html#comments</comments>
		<pubDate>Thu, 04 Aug 2011 02:27:22 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[NLP]]></category>
		<category><![CDATA[信息检索]]></category>
		<category><![CDATA[自然语言理解]]></category>
		<category><![CDATA[英语]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/03/18582.html</guid>
		<description><![CDATA[2005年12月12日 21:01:00 自然语言理解技术及其应用探讨随着社会的日益信息化，人们越来越强烈地希望用自然语言同计算机交流。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的课题。从计算机科学特别是从人工智能的观点看，自然语言理解的任务是建立一种计算机模型，这种计算机模型能够给出象人那样理解、分析并回答自然语言（即人们日常使用的各种通俗语言）的结果。 现在的计算机的智能还远远没有达到能够象人一样理解自然语言的水平，而且在可预见的将来也达不到这样的水平。因此，关于计算机对自然语言的理解一般是从实用的角度进行评判的。如果计算机实现了人机会话，或机器翻译，或自动文摘等语言信息处理功能，则认为计算机具备了自然语言理解的能力。 第一部分 了解自然语言理解技术 自然语言处理就是研究如何能让计算机理解并生成人们日常所使用的(如汉语、英语)语言，使得计算机懂得自然语言的含义，并对人给计算机提出的问题，通过对话的方式，用自然语言进行回答。目的在于建立起一种人与机器之间的密切而友好的关系，使之能进行高度的信息传递与认知活动。自然语言理解系统可以用作专家系统、知识工程、情报检索、办公室自动化的自然语言人机接口，有很大的实用价值。 自然语言处理研究在电子计算机问世之初就开始了，并于 50年代初开展了机器翻译试验。当时的研究方法还不能称作带有&#8221;智能&#8221;。到了60年代乔姆斯基的转换生成语法得到广泛的认可，生成语法的核心是短语结构规则，分析句子结构的过程就是利用规则自顶向下或自底向上的句法树生成过程。 由于认识到生成语法缺少表示语义知识的手段，在70年代随着认知科学的兴盛，研究者又相继提出了语义网络、CD理论、格框架等语义表示理论。这些语法和语义理论经过各自的发展，逐渐开始趋于相互结合。到80年代一批新的语法理论脱颖而出，具有代表性的有词汇功能语法(LFG)、功能合一语法(FUG)和广义短语结构语法(GPSG) 等。 这些基于规则的分析方法可以称之为自然语言处理中的&#8221;理性主义&#8221;。现有的手段虽然基本上掌握了单个句子的分析技术，但是还很难覆盖全面的语言现象，特别是对于整个段落或篇章的理解还无从下手。 与&#8221;理性主义&#8221;相对的是&#8221;经验主义&#8221;的研究思路，主要是指针对大规模语料库的研究。语料库是大量文本的集合。计算机出现后，语料可以被方便地存贮起来，利用计算机查找也很容易。随着电子出版物的出现，采集语料也不再成为困难。最早于60年代编制的Brown和LOB两个计算机语料库，分别具有100万词次的规模。进入90 年代可以轻易列举出的语料库有几十个之多，象DCI、ECI、ICAME、BNC、LDC、 CLR等，其规模最高达到109数量级。 对语料库的研究分成3个方面：工具软件的开发、语料库的标注、基于语料库的语言分析方法。采集到以后未经处理的生语料不能直接提供有关语言的各种知识，只有通过词法、句法、语义等多层次的加工才能使知识获取成为可能。加工的方式就是在语料中标注各种记号，标注的内容包括每个词的词性、语义项、短语结构、句型和句间关系等。随着标注程度的加深语料库逐渐熟化，成为一个分布的、统计意义上的知识源。利用这个知识源可以进行许多语言分析工作，如根据从已标注语料中总结出的频度规律可以给新文本逐词标注词性，划分句子成分等。 语料库提供的知识是用统计强度表示的，而不是确定性的，随着规模的扩大，旨在覆盖全面的语言现象。但是对于语言中基本的确定性的规则仍然用统计强度的大小去判断，这与人们的常识相违背。这种&#8221;经验主义&#8221;研究中的不足要靠&#8221;理性主义&#8221; 的方法来弥补。两类方法的融合也正是当前自然语言处理发展的趋势。 自然语言理解系统的发展阶段 自然语言理解系统的发展可以分为第一代系统和第二代系统两个阶段。第一代系统建立在对词类和词序分析的基础之上，分析中经常使用统计方法；第二代系统则开始引进语义甚至语用和语境的因素，几乎完全抛开了统计技术。 第一代自然语言理解系统又可分为四种类型： （1）特殊格式系统 早期的自然语言理解系统大多数是特殊格式系统，根据人机对话内容的特点，采用特殊的格式来进行人机对话。1963年，林德赛（R.Lindsay）在美国卡内基技术学院用IPL－V表处理语言设计了SAD－SAM系统，就采用了特殊格式来进行关于亲属关系方面的人机对话，系统内建立了一个关于亲属关系的数据库，可接收关于亲属关系方面的问题的英语句子提问，用英语作出回答。1968年，波布洛（D.Bobrow）在美国麻省理工学院设计了STUDENT系统，这个系统把高中代数应用题中的英语句子归纳为一些基本模式，由计算机来理解这些应用题中的英语句子，列出方程求解，并给出答案。六十年代初期，格林（B.Green）在美国林肯实验室建立了BASEBALL系统，也使用IPL－V表处理语言，系统的数据库中存贮了关于美国1959年联邦棒球赛得分记录的数据，可回答有关棒球赛的一些问题。该系统的句法分析能力较差，输入句子十分简单，没有连接词，也没有比较级形式的形容词和副词，主要靠一部机器词典来进行单词的识别，使用了14个词类范畴，所有的问题都采用一种特殊的规范表达式回答。 （2）以文本为基础的系统 某些研究者不满意在特殊格式系统中的种种格式限制，因为就一个专门领域来说，最方便的还是使用不受特殊格式结构限制的系统来进行人机对话，这就出现了以文本为基础的系统，1966年西蒙（R.F.Simmons）、布尔格（J.F. Burger）和龙格（R.E. Long）设计的PROTOSYNTHEX－I系统，就是以文本信息的存贮和检索方式工作的。 （3）有限逻辑系统 有限逻辑系统进一步改进了以文本为基础的系统。在这种系统中，自然语言的句子以某种更加形式化的记号来替代，这些记号自成一个有限逻辑系统，可以进行某些推理。1968年，拉菲尔（B.Raphael）在美国麻省理工学院用LI SP语言建立了SIR系统，针对英语提出了24个匹配模式，把输入的英语句子与这些模式相匹配，从而识别输入句子的结构，在从存贮知识的数据库到回答问题的过程中，可以处理人们对话中常用的一些概念，如集合的包含关系、空间关系等等，并可进行简单逻辑推理，机器并能在对话中进行学习，记住已学过的知识，从事一些初步的智能活动。1965年，斯莱格勒（J.R. Slagle）建立了DEDUCOM系统，可在情报检索中进行演绎推理。1966年，桑普逊（F.B.Thompson）建立了DEACON系统，通过英语来管理一个虚构的军用数据库，设计中使用了环结构和近似英语的概念来进行推理。1968年，凯罗格（C.Kellog）在IBM360/67计算机上，建立了CONVERSE系统，该系统能根据关于美国120个城市的1000个事实的文件来进行推理。 （4）一般演绎系统 一般演绎系统使用某些标准数学符号（如谓词演算符号）来表达信息。逻辑学家们在定理证明工作上取得的全部成就，就可以用来作为建立有效的演绎系统的根据，从而能够把任何一个问题用定理证明的方式表达出来，并实际地演绎出所需要的信息，用自然语言作出回答。一般演绎系统可以表达那些在有限逻辑系统中不容易表达出来的复杂信息，从而进一步提高了自然语言理解系统的能力。1968－1969年，格林和拉菲尔建立的的QA2,QA3系统，采用谓词演算的方式和格式化的数据（formated data）来进行演绎推理，解答问题，并用英语作出回答，这是一般演绎系统的典型代表。 1970年以来，出现了一定数量的第二代自然语言理解系统，这些系统绝大多数是程序演绎系统，大量地进行语义、语境以至语用的分析。其中比较有名的系统是LUNAR 系统、SHRDLU系统、MARGIE系统、SAM系统、PAM系统。 LUNAR系统是伍兹（W.Woods）于1972年设计的一个自然语言情报检索系统。这个系统采用形式提问语言（formal query language）来表示所提问的语义，从而对提问的句子作出语义解释，最后把形式提问语言执行于数据库，产生出对问题的回答。 SHRDLU系统是维诺格拉德（T.Winograd）于1972年在美国麻省理工学院建立了一个用自然语言指挥机器人动作的系统。该系统把句法分析、语义分析、逻辑推理结合起来，大大地增强了系统在语言分析方面的功能。该系统对话的对象是一个具有简单的 &#8220;手&#8221;和&#8221;眼&#8221;的玩具机器人，它可以操作放在桌子上的具有不同颜色、尺寸和形状的玩具积木，如立方体、棱锥体、盒子等，机器人能够根据操作人员的命令把这些积木捡起来，移动它们去搭成新的积木结构，在人机对话过程中，操作人员能获得他发给机器人的各种视觉反馈，实时地观察机器人理解语言、执行命令的情况。在电视屏幕上还可以显示出这个机器人的模拟形象以及它同一个真正的活人在电传机上自由地用英语对话的生动情景。 MARGIE系统是杉克（R.Schank）于1975年在美国斯袒福人工智能实验室研制出来的。该系统的目的在于提供一个自然语言理解的直观模型。系统首先把英语句子转换为概念依存表达式，然后根据系统中有关信息进行推理，从概念依存表达式中推演出大量的事实。由于人们在理解句子时，总要牵涉到比句子的外部表达多得多的内容，因此，该系统的推理有16种类型，如原因、效应、说明、功能等等，最后，把推理的结果转换成英语输出。 SAM系统是阿贝尔森（R.Abelson）于1975年在美国耶鲁大学建立的。这个系统采用&#8221;脚本&#8221;（script）的办法来理解自然语言写的故事。所谓脚本，就是用来描述人们活动（如上饭馆、看病）的一种标准化的事件系列。 PAM系统是威林斯基（R.Wilensky）于1978年在美国耶鲁大学建立的另一个理解故事的系统。PAM系统也能解释故事情节，回答问题，进行推论，作出摘要。它除了 &#8220;脚本&#8221;中的事件序列之外，还提出了&#8221;计划&#8221;（plan）作为理解故事的基础。所谓&#8221; 计划&#8221;，就是故事中的人物为实现其目的所要采取的手段。如果要通过&#8221;计划&#8221;来理解故事，就要找出人物的目的以及为完成这个目的所采取的行动。系统中设有一个&#8221;计划库&#8221;（plan box），存贮着有关各种目的的信息以及各种手段的信息。这样，在理解故事时，只要求出故事中有关情节与计划库中存贮的信息相重合的部分，就可以理解到这个故事的目的是什么。当把一个一个的故事情节与脚本匹配出现障碍时，由于&#8221;计划库&#8221;中可提供关于一般目的的信息，就不致造成故事理解的失败。例如，营救一个被暴徒抢走的人，在&#8221;营救&#8221;这个总目的项下列若干个子目的，包括到达暴徒的巢穴以及杀死暴徒的各种方法，就可以预期下一步的行为。同时能根据主题来推论目的。例如，输入故事：&#8221;约翰爱玛丽。玛丽被暴徒抢走了。&#8221;PAM 系统即可预期约翰要采取行动营救玛丽。故事中虽然没有这样的内容， 但是， 根据计划库中的&#8221;爱情主题&#8221;，可以推出 &#8220;约翰要采取行动营救玛丽&#8221;的情节。 上述的系统都是书面的自然语言理解系统，输入输出都是用书面文字。口头的自然语言理解系统，还牵涉到语音识别、语音合成等复杂的技术，显然是更加困难的课题，口头自然语言理解系统的研究近年来也有进展。 我国的发展状况 我国自然语言理解的研究起步较晚，比国外晚了17年。国外在1963年就建成了早期的自然语言理解系统，而我国直到1980年才建成了两个汉语自然语言理解模型，都以人机对话的方式来实现。 八十年代中期，在国际新一代计算机激烈竞争的影响下，自然语言理解的研究在国内得到了更多的重视，&#8221;自然语言理解和人机接口&#8221;列入了新一代计算机的研制规划，研究单位增多了，研究队伍也壮大了。 <a href='http://blog.zye.me/2011/08/18582.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>2005年12月12日 21:01:00</p>
<p class="postText">
<table width="100%" cellPadding="0" cellSpacing="0" style="table-layout: fixed">
<tr>
<td width="32" vAlign="top"></td>
<td style="left: 0px; width: 100%; word-wrap: break-word">
<table width="100%" cellPadding="0" cellSpacing="0" height="120" style="table-layout: fixed">
<tr vAlign="top">
<td style="left: 0px; width: 100%; word-wrap: break-word"><font color="#000000">自然语言理解技术及其应用探讨随着社会的日益信息化，人们越来越强烈地希望用自然语言同计算机交流。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的课题。从计算机科学特别是从人工智能的观点看，自然语言理解的任务是建立一种计算机模型，这种计算机模型能够给出象人那样理解、分析并回答自然语言（即人们日常使用的各种通俗语言）的结果。</p>
<p>现在的计算机的智能还远远没有达到能够象人一样理解自然语言的水平，而且在可预见的将来也达不到这样的水平。因此，关于计算机对自然语言的理解一般是从实用的角度进行评判的。如果计算机实现了人机会话，或机器翻译，或自动文摘等语言信息处理功能，则认为计算机具备了自然语言理解的能力。</p>
<p>第一部分 了解自然语言理解技术<br />
自然语言处理就是研究如何能让计算机理解并生成人们日常所使用的(如汉语、英语)语言，使得计算机懂得自然语言的含义，并对人给计算机提出的问题，通过对话的方式，用自然语言进行回答。目的在于建立起一种人与机器之间的密切而友好的关系，使之能进行高度的信息传递与认知活动。自然语言理解系统可以用作专家系统、知识工程、情报检索、办公室自动化的自然语言人机接口，有很大的实用价值。</p>
<p>自然语言处理研究在电子计算机问世之初就开始了，并于 50年代初开展了机器翻译试验。当时的研究方法还不能称作带有&#8221;智能&#8221;。到了60年代乔姆斯基的转换生成语法得到广泛的认可，生成语法的核心是短语结构规则，分析句子结构的过程就是利用规则自顶向下或自底向上的句法树生成过程。</p>
<p>由于认识到生成语法缺少表示语义知识的手段，在70年代随着认知科学的兴盛，研究者又相继提出了语义网络、CD理论、格框架等语义表示理论。这些语法和语义理论经过各自的发展，逐渐开始趋于相互结合。到80年代一批新的语法理论脱颖而出，具有代表性的有词汇功能语法(LFG)、功能合一语法(FUG)和广义短语结构语法(GPSG) 等。</p>
<p>这些基于规则的分析方法可以称之为自然语言处理中的&#8221;理性主义&#8221;。现有的手段虽然基本上掌握了单个句子的分析技术，但是还很难覆盖全面的语言现象，特别是对于整个段落或篇章的理解还无从下手。</p>
<p>与&#8221;理性主义&#8221;相对的是&#8221;经验主义&#8221;的研究思路，主要是指针对大规模语料库的研究。语料库是大量文本的集合。计算机出现后，语料可以被方便地存贮起来，利用计算机查找也很容易。随着电子出版物的出现，采集语料也不再成为困难。最早于60年代编制的Brown和LOB两个计算机语料库，分别具有100万词次的规模。进入90 年代可以轻易列举出的语料库有几十个之多，象DCI、ECI、ICAME、BNC、LDC、 CLR等，其规模最高达到109数量级。</p>
<p>对语料库的研究分成3个方面：工具软件的开发、语料库的标注、基于语料库的语言分析方法。采集到以后未经处理的生语料不能直接提供有关语言的各种知识，只有通过词法、句法、语义等多层次的加工才能使知识获取成为可能。加工的方式就是在语料中标注各种记号，标注的内容包括每个词的词性、语义项、短语结构、句型和句间关系等。随着标注程度的加深语料库逐渐熟化，成为一个分布的、统计意义上的知识源。利用这个知识源可以进行许多语言分析工作，如根据从已标注语料中总结出的频度规律可以给新文本逐词标注词性，划分句子成分等。</p>
<p>语料库提供的知识是用统计强度表示的，而不是确定性的，随着规模的扩大，旨在覆盖全面的语言现象。但是对于语言中基本的确定性的规则仍然用统计强度的大小去判断，这与人们的常识相违背。这种&#8221;经验主义&#8221;研究中的不足要靠&#8221;理性主义&#8221; 的方法来弥补。两类方法的融合也正是当前自然语言处理发展的趋势。</p>
<p>自然语言理解系统的发展阶段<br />
自然语言理解系统的发展可以分为第一代系统和第二代系统两个阶段。第一代系统建立在对词类和词序分析的基础之上，分析中经常使用统计方法；第二代系统则开始引进语义甚至语用和语境的因素，几乎完全抛开了统计技术。</p>
<p>第一代自然语言理解系统又可分为四种类型：</p>
<p>（1）特殊格式系统<br />
早期的自然语言理解系统大多数是特殊格式系统，根据人机对话内容的特点，采用特殊的格式来进行人机对话。1963年，林德赛（R.Lindsay）在美国卡内基技术学院用IPL－V表处理语言设计了SAD－SAM系统，就采用了特殊格式来进行关于亲属关系方面的人机对话，系统内建立了一个关于亲属关系的数据库，可接收关于亲属关系方面的问题的英语句子提问，用英语作出回答。1968年，波布洛（D.Bobrow）在美国麻省理工学院设计了STUDENT系统，这个系统把高中代数应用题中的英语句子归纳为一些基本模式，由计算机来理解这些应用题中的英语句子，列出方程求解，并给出答案。六十年代初期，格林（B.Green）在美国林肯实验室建立了BASEBALL系统，也使用IPL－V表处理语言，系统的数据库中存贮了关于美国1959年联邦棒球赛得分记录的数据，可回答有关棒球赛的一些问题。该系统的句法分析能力较差，输入句子十分简单，没有连接词，也没有比较级形式的形容词和副词，主要靠一部机器词典来进行单词的识别，使用了14个词类范畴，所有的问题都采用一种特殊的规范表达式回答。</p>
<p>（2）以文本为基础的系统<br />
某些研究者不满意在特殊格式系统中的种种格式限制，因为就一个专门领域来说，最方便的还是使用不受特殊格式结构限制的系统来进行人机对话，这就出现了以文本为基础的系统，1966年西蒙（R.F.Simmons）、布尔格（J.F. Burger）和龙格（R.E. Long）设计的PROTOSYNTHEX－I系统，就是以文本信息的存贮和检索方式工作的。</p>
<p>（3）有限逻辑系统<br />
有限逻辑系统进一步改进了以文本为基础的系统。在这种系统中，自然语言的句子以某种更加形式化的记号来替代，这些记号自成一个有限逻辑系统，可以进行某些推理。1968年，拉菲尔（B.Raphael）在美国麻省理工学院用LI SP语言建立了SIR系统，针对英语提出了24个匹配模式，把输入的英语句子与这些模式相匹配，从而识别输入句子的结构，在从存贮知识的数据库到回答问题的过程中，可以处理人们对话中常用的一些概念，如集合的包含关系、空间关系等等，并可进行简单逻辑推理，机器并能在对话中进行学习，记住已学过的知识，从事一些初步的智能活动。1965年，斯莱格勒（J.R. Slagle）建立了DEDUCOM系统，可在情报检索中进行演绎推理。1966年，桑普逊（F.B.Thompson）建立了DEACON系统，通过英语来管理一个虚构的军用数据库，设计中使用了环结构和近似英语的概念来进行推理。1968年，凯罗格（C.Kellog）在IBM360/67计算机上，建立了CONVERSE系统，该系统能根据关于美国120个城市的1000个事实的文件来进行推理。</p>
<p>（4）一般演绎系统<br />
一般演绎系统使用某些标准数学符号（如谓词演算符号）来表达信息。逻辑学家们在定理证明工作上取得的全部成就，就可以用来作为建立有效的演绎系统的根据，从而能够把任何一个问题用定理证明的方式表达出来，并实际地演绎出所需要的信息，用自然语言作出回答。一般演绎系统可以表达那些在有限逻辑系统中不容易表达出来的复杂信息，从而进一步提高了自然语言理解系统的能力。1968－1969年，格林和拉菲尔建立的的QA2,QA3系统，采用谓词演算的方式和格式化的数据（formated data）来进行演绎推理，解答问题，并用英语作出回答，这是一般演绎系统的典型代表。</p>
<p>1970年以来，出现了一定数量的第二代自然语言理解系统，这些系统绝大多数是程序演绎系统，大量地进行语义、语境以至语用的分析。其中比较有名的系统是LUNAR 系统、SHRDLU系统、MARGIE系统、SAM系统、PAM系统。</p>
<p>LUNAR系统是伍兹（W.Woods）于1972年设计的一个自然语言情报检索系统。这个系统采用形式提问语言（formal query language）来表示所提问的语义，从而对提问的句子作出语义解释，最后把形式提问语言执行于数据库，产生出对问题的回答。</p>
<p>SHRDLU系统是维诺格拉德（T.Winograd）于1972年在美国麻省理工学院建立了一个用自然语言指挥机器人动作的系统。该系统把句法分析、语义分析、逻辑推理结合起来，大大地增强了系统在语言分析方面的功能。该系统对话的对象是一个具有简单的 &#8220;手&#8221;和&#8221;眼&#8221;的玩具机器人，它可以操作放在桌子上的具有不同颜色、尺寸和形状的玩具积木，如立方体、棱锥体、盒子等，机器人能够根据操作人员的命令把这些积木捡起来，移动它们去搭成新的积木结构，在人机对话过程中，操作人员能获得他发给机器人的各种视觉反馈，实时地观察机器人理解语言、执行命令的情况。在电视屏幕上还可以显示出这个机器人的模拟形象以及它同一个真正的活人在电传机上自由地用英语对话的生动情景。</p>
<p>MARGIE系统是杉克（R.Schank）于1975年在美国斯袒福人工智能实验室研制出来的。该系统的目的在于提供一个自然语言理解的直观模型。系统首先把英语句子转换为概念依存表达式，然后根据系统中有关信息进行推理，从概念依存表达式中推演出大量的事实。由于人们在理解句子时，总要牵涉到比句子的外部表达多得多的内容，因此，该系统的推理有16种类型，如原因、效应、说明、功能等等，最后，把推理的结果转换成英语输出。</p>
<p>SAM系统是阿贝尔森（R.Abelson）于1975年在美国耶鲁大学建立的。这个系统采用&#8221;脚本&#8221;（script）的办法来理解自然语言写的故事。所谓脚本，就是用来描述人们活动（如上饭馆、看病）的一种标准化的事件系列。</p>
<p>PAM系统是威林斯基（R.Wilensky）于1978年在美国耶鲁大学建立的另一个理解故事的系统。PAM系统也能解释故事情节，回答问题，进行推论，作出摘要。它除了 &#8220;脚本&#8221;中的事件序列之外，还提出了&#8221;计划&#8221;（plan）作为理解故事的基础。所谓&#8221; 计划&#8221;，就是故事中的人物为实现其目的所要采取的手段。如果要通过&#8221;计划&#8221;来理解故事，就要找出人物的目的以及为完成这个目的所采取的行动。系统中设有一个&#8221;计划库&#8221;（plan box），存贮着有关各种目的的信息以及各种手段的信息。这样，在理解故事时，只要求出故事中有关情节与计划库中存贮的信息相重合的部分，就可以理解到这个故事的目的是什么。当把一个一个的故事情节与脚本匹配出现障碍时，由于&#8221;计划库&#8221;中可提供关于一般目的的信息，就不致造成故事理解的失败。例如，营救一个被暴徒抢走的人，在&#8221;营救&#8221;这个总目的项下列若干个子目的，包括到达暴徒的巢穴以及杀死暴徒的各种方法，就可以预期下一步的行为。同时能根据主题来推论目的。例如，输入故事：&#8221;约翰爱玛丽。玛丽被暴徒抢走了。&#8221;PAM 系统即可预期约翰要采取行动营救玛丽。故事中虽然没有这样的内容， 但是， 根据计划库中的&#8221;爱情主题&#8221;，可以推出 &#8220;约翰要采取行动营救玛丽&#8221;的情节。</p>
<p>上述的系统都是书面的自然语言理解系统，输入输出都是用书面文字。口头的自然语言理解系统，还牵涉到语音识别、语音合成等复杂的技术，显然是更加困难的课题，口头自然语言理解系统的研究近年来也有进展。</p>
<p>我国的发展状况<br />
我国自然语言理解的研究起步较晚，比国外晚了17年。国外在1963年就建成了早期的自然语言理解系统，而我国直到1980年才建成了两个汉语自然语言理解模型，都以人机对话的方式来实现。</p>
<p>八十年代中期，在国际新一代计算机激烈竞争的影响下，自然语言理解的研究在国内得到了更多的重视，&#8221;自然语言理解和人机接口&#8221;列入了新一代计算机的研制规划，研究单位增多了，研究队伍也壮大了。</p>
<p>关于HNC理论<br />
HNC理论是&#8221;Hierarchical Network of Concepts（概念层次网络）&#8221;的简称，是关于自然语言理解处理的一个理论体系。它以概念化、层次化、网络化的语义表达为基础，所以称它为概念层次网络理论。HNC理论把人脑认知结构分为局部和全局两类联想脉络，认为对联想脉络的表达是语言深层（即语言的语义层面）的根本问题。</p>
<p>HNC理论的中心目标是建立自然语言的表述和处理模式，使计算机能够模拟人脑的语言感知功能。该理论使自然语言理解获得了突破性的进展，它所蕴涵的精深丰富的思想对人工智能、语言学、计算机科学和认知科学等都具有重要的理论和应用价值，对中文信息处理和汉语研究尤其具有实际意义。</p>
<p>HNC理论完全摆脱了我国现有的这套语法学的束缚，而从语言的深层入手，以语义表达为基础，为汉语理解开辟了一条新路。HNC理论提出了可供工程实现的完整的自然语言理解的理论框架，它是一个面向整个自然语言理解的强大而完备的语义描述体系，包括语句处理、句群处理、篇章处理、短时记忆向长时记忆扩展处理、文本自动学习处理。HNC理论的出发点就是运用两类联想脉络来&#8221;帮助&#8221;计算机理解自然语言。自然语言的词汇是用来表达概念的，因此，HNC建立的词汇层面的局部联想脉络体现为一个概念表达体系。概念分为抽象概念与具体概念。HNC理论的概念表达体系侧重于抽象概念的表达。对具体概念采取挂靠近似表达方法。HNC理论认为应该从多元性表现和内涵两个方面来描述概念。<br />
它创立了五元组用来表达抽象概念的多元性表现，对抽象概念的内涵采用网络层次符号来表达。其网络层次符号包含三大语义网络：基元概念语义网络、基本概念语义网络和逻辑概念语义网络。HNC的五元组符号和三大语义网络的层次符号组合起来就可完成对抽象概念的完整表达，从而为计算机理解自然语言的语义提供了有力的手段。</p>
<p>自然语言理解技术大致可分为机器翻译、语义理解及人机会话技术几个方面。其中机器翻译(machine translation)，又称机译(MT)，是利用计算机把一种自然语言转变成另一种自然语言的过程。智能搜索引擎在这一领域的研究将使得用户可以使用母语搜索非母语的网页，并以母语浏览搜索结果。语义理解通过将语言学的研究成果和计算机技术结合在一起，实现了对词语在语义层次上的理解。人机会话技术可以为计算机提供下一代的人机交互接口，实现从文字接口、图形接口到自然语言接口的革命，同时在家用电器的人性化设计方面有着广泛的应用前景，其技术内涵主要包括语音识别、语音合成两个核心部分。</p>
<p>在语义理解的整个过程中，智能分词技术是最初的一个环节，它将组成语句的核心词提炼出来供语义分析模块使用。在分词的过程中，如何能够恰当地提供足够的词来供分析程序处理，并且过滤掉冗余的信息，这是后期语义分析的质量和速度的重要前提。尤里卡的智能分词避免了传统分词技术在拆分时产生的歧义组合。从而为语义理解的处理提供了良好的原始材料。同时，在分词的过程中，知识库当中的同义词会被逐个匹配并同时提交给语义理解模块使用，这样处理过的句子，不仅提供了原始的句型，还同时搭载了语句的概念部分。</p>
<p>第二部分 在搜索技术中的应用<br />
众所周知，随着互联网的迅速发展和广泛普及而导致网上信息爆炸性增长。如何在庞大的互联网上获得有价值的信息已成为网民日益关注的问题。这种以一定的策略在互联网中搜集、发现信息，对信息进行理解、提取、组织和处理，并为用户提供检索服务，从而起到信息导航的目的的搜索技术的出现为网民快速找到所需信息带来了福音。</p>
<p>但是，2001年，Roper Starch的调查指出，36%的互联网用户一个星期花了超过2个小时时间在网上搜索；71%的用户在使用搜索引擎的时候遇到过麻烦；平均搜索12分钟以后发现搜索受挫；搜索受挫中46%都是因为链接错误；绝大部分(86%)的互联网用户感到应当出现更有效的、准确的信息搜索技术。另一项由Keen所做的调查显示，人们平均每天有四个问题需要从外界获取答案；其中31%的人使用搜索引擎寻找答案；平均每周花费8.75个小时找寻答案；53.3%时间花在从旁人那里获得答案，29%的时间花在亲戚朋友身上，24.3%的是时间花在销售商那里；网上查找答案的，半数以上都不成功；他们每周将花费14.5美元以上，以获取正确的信息。</p>
<p>从这些调查数据中不难看出，尽管搜索服务提供者在研发搜索技术方面已经花费了大量的时间和精力，但是目前的搜索引擎仍然存在不少的局限性，比如信息丢失、返回信息太多、信息无关，这使得网民对于现有的搜索技术仍然不满，期盼更完美的搜索技术的出现。</p>
<p>由于自然语言理解技术的三方面功能，即机器翻译、语义理解及人机会话技术能够赋予搜索技术更具人性化、方便易用的特点。因此，近年来在搜索界得到了广泛的应用。无论是国内外的搜索引擎，都可以寻觅到语义理解、机器翻译的踪迹。</p>
<p>目前在搜索引擎方面主要应用的自然语言理解技术是机器翻译与语义理解技术。应用了这些技术的搜索引擎我们称之为智能搜索引擎。由于它将信息检索从目前基于关键词层面提高到基于知识（或概念）层面，对知识有一定的理解与处理能力，因而具有信息服务的智能化、人性化特征。它允许网民采用自然语言进行信息的检索，为他们提供更方便、更确切的搜索服务。</p>
<p>与传统的目录查询、关键词查询模式相比，自然语言查询的优势体现在：一是使网络交流更加人性化；二是使信息查询变得更加方便、快速和准确。现在，已经有越来越多的搜索引擎宣布支持自然语言搜索特性。比如国外的搜索引擎Google,，AskJeeves；国内的搜索引擎网易、尤里卡、问一问、21世纪互联、孙悟空、悠游等。在这里我们将重点介绍应用语义理解技术的中文智能搜索引擎。</p>
<p>首先以尤里卡搜索引擎为例简要说明一下这种智能搜索的过程。</p>
<p>实现智能搜索的过程主要分三部分：语义理解、知识管理和知识检索。其中，知识库是实现智能搜索的基础和核心。知识库提供的是语义理解中最终将要提供给用户的结果，同互联网的状况相同，人类的知识结构和容量都在飞速膨胀，所以知识库也需要有良好的适应能力。在语义理解的整个过程中，智能分词技术是最初的一个环节，它将组成语句的核心词提炼出来供语义分析模块使用。在分词的过程中，如何能够恰当地提供足够的词来供分析程序处理，并且过滤掉冗余的信息，这是后期语义分析的质量和速度的重要前提。</p>
<p>加入了知识库处理技术的智能分词能够避免了传统分词技术在拆分时产生的歧义组合。从而为语义理解的处理提供了良好的原始材料。知识检索可以利用语义分析的结果，对知识库进行概念级的检索，对用户提出问题给出准确度最高、相关度最强的检索结果。比如：&#8221;我想在北京找工作？&#8221;。首先进行语义理解，在知识库中&#8221;找工作&#8221;属于求知招聘的范畴，所以分析出用户想查询&#8221;在北京求职&#8221;。然后利用&#8221;在北京求职&#8221;这个概念查询知识库，得出答案。</p>
<p>下面我们再来看看各家宣称应用了自然语言理解的搜索技术有哪些特点。</p>
<p>问一问（www.weniwen.com）自然语言检索<br />
问一问是由闻易网科技有限公司（Weniwen Technologies, Inc.）开发的智能搜索引擎。它允许用户以自然的、整句的方式、以汉语或英语发出查询请求。易于快速地、以比较经济的方式扩展到不同的语言。 并可以同时从两种语言中识别出词汇。使用自然语言处理（NLP）技术，与传统的、基于关键词匹配的搜索技术相比，NLP技术可使问一问&#8221;理解&#8221;请求中的上下文和含义。通过使用NLP技术，问一问可以更准确地检索出适当的信息。尤其适用于旅游/休闲、金融以及消费品工业的、正在寻求可增强消费者通过Internet来访问其信息或进行自动交易的途径的大企业或门户。</p>
<p>21ilink（www.21ilink.com）中文智能搜索引擎<br />
世纪讯联公司开发的基于自然语言处理和人工神经网络的智能互动技术解决了传统信息分类中的一些语意交叉词汇抽象概念、边缘类别的信息查询问题实现了模糊查询。查询过程突出了个性化、人性化。采用了自然语言的语句单元，还可设定地方语言特色。界面更加友好，能够满足不同层次，不同查询目的客户的特殊需求。并能引导查询者快速准确地找到所需要的信息。此项智能搜索技术采用国内独创的中文问答方式，并兼容了其他传统的搜索引擎的查询方式。支持基于概念的信息搜索、行业化、专业化的智能搜索、客户定制的商务模型，还可完成管理、追踪、支付等一系列的供应链的分析、行业研究等咨询项目。实现了多方协作,业务拓展的无缝结合。</p>
<p>此项智能搜索系统是将现代智能计算技术、交换技术、网络技术、数据库技术融为一体，而建成的一个面向客户的，全方位高质量的服务体系。采用了独有的Smart Hit（智能语义）、和Kengine（知识引擎）。开放性、先进性和超前性均大大领先于同类系统。全套系统拥有完整的智能网络接入服务功能，支持各网络平台的语音文字、数据及图像，是一种智能多媒体平台。平台无中断，支持宽频网络，满足对数据库全内容覆盖要求。支持概念检索、动态页面检索。</p>
<p>孙悟空（search.chinaren.com）搜索引擎<br />
孙悟空搜索引擎是ChinaRen开发并拥有自主版权的产品,能按照用户的需求，搜索大陆和港澳台的中文网页。孙悟空搜索不仅可用传统的关键词搜索方式，更是在所有中文搜索引擎里率先采用了提问式搜索，这是ChinaRen研究并实现的一种智能中文处理技术。通过该技术，您可以直接通过提出问题的方式搜索您想要找的内容，这样不仅更符合我们平时的习惯，而且准确率更高。孙悟空搜索引擎拥有强大的搜索能力，提高搜索的智能性和准确性；智能的评价体系，保证检索结果高度相关。</p>
<p>悠游（www.goyoyo.com.cn）中文智能搜索引擎<br />
北京悠游科技开发有限公司（Beijing Goyoyo）成立于1998年10月，是一个以中文自然语言处理技术为基础建立的互联网信息咨询及技术服务网站（www.goyoyo.com）。悠游中文智能搜索引擎通过www.goyoyo.com 提供主要服务。为了更贴近用户的语言使用习惯，凭借先进的自然语言处理技术，悠游中文智能搜索引擎充分考虑到中文语句的表达结构以及丰富多样的词语表达形式，通过&#8221;口语化的提问，智能化的结果&#8221; ，让用户在查询时只需用口语化的表达方式输入欲查询的关键词、自然语句甚至输入中英文混合语句，选择要查询的网站或网页，单击&#8221;搜索&#8221;按纽，悠游中文智能搜索引擎就会根据您的查询请求自动分析语句，并且提炼主题，找到满意的答案，满足了广大用户的各种查询需求，使您能够悠闲自得的在网上畅游。</p>
<p>下面举例说明应用了语义理解技术的搜索引擎与传统搜索引擎相比的优势。</p>
<p>1、更高的搜索的易用性<br />
由于智能搜索引擎具有智能分词功能，因此使得查询变得更为简单、易于操作。以网易为例说明：需要搜索&#8221;刘德华的最新个人专辑&#8221;，只需要将整个搜索内容全部输入到搜索框中就可以找到相关的内容；而在传统的搜索引擎中则必须遵守搜索的基本数学规则，输入&#8221;刘德华 最新 个人专辑&#8221;才能够找到搜索的内容。显然在搜索的易用性方面智能搜索引擎具有明显的优势。</p>
<p>2、搜索结果的范围定位准确<br />
由于采用知识（概念）检索技术，明确和缩小的搜索范围，减少对无用信息的搜索。以尤里卡为例说明：要查找&#8221;北京的天气&#8221;只需要输入&#8221;北京天气&#8221;就可以找到相关程度甚高的北京的天气预报，同时还会给出相关的天气的内容。而在传统搜索引擎的查询结果中不但有北京天气的内容，还会给出所有与北京天气字样有关的各种内容，增大了用户查找搜索结果的难度。</p>
<p>3、搜索结果的智能性<br />
由于智能搜索引擎有综合知识库为背景，使得信息检索与导航服务更具有智能性。知识库中的知识有助于解决表达差异的问题。所谓表达差异就是用户使用不同的词表达同一概念。而知识库中关于同义词的定义正好可以消除这种表达差异带来的检索困难。</p>
<p>从上面的示例及比较不难看出运用了先进的自然语言理解技术后，搜索引擎可以识别并回答用户的问题，使用户摆脱了传统搜索引擎基于关键字的束缚，指引用户更有效更快捷地寻找到所需的资料，同时为用户提供相关的有参考价值的其他内容。由于这些特点，使得智能搜索技术能够在互联网信息检索的各个方面得到广泛的应有。它可以为大型综合搜索引擎提供后台支持，使之具有人性化、交互性的特点。它能够方便的实现垂直搜索引擎的专业类别内搜索。当然它也可以为信息门户网站提供方便快捷的站内信息搜索服务。</p>
<p></font></td>
</tr>
</table>
</td>
</tr>
</table>
<p id="TBPingURL">Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=550607</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/08/18582.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>实用英语:食品名称中英文对照</title>
		<link>http://blog.zye.me/2011/08/45081.html</link>
		<comments>http://blog.zye.me/2011/08/45081.html#comments</comments>
		<pubDate>Wed, 03 Aug 2011 02:28:38 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Canada Related]]></category>
		<category><![CDATA[英语]]></category>
		<category><![CDATA[食品]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/12/45081.html</guid>
		<description><![CDATA[在海外，食品可在超级市场、传统摊位市场、杂货店购买到。而在大型超级市场更是主要的采购地点。海外的大型超市里商品分类清楚,很容易辨认。分类牌大多置于货架上方,或者两端。顾客可以非常方便的找到所要寻找的商品。 　　一般商品分类： 　　Biscuits饼干类 　　Snacks零嘴 　　Crisps各式薯片 　　Confectionery糖果类 　　PetFood宠物食品 Toiletries厕所用品 　　Cereals谷类食品 　　Poultry家禽类 　　Pickles各式腌菜 　　以下将常用的食品的中英对照作整理,以方便大家采购: 　　A.肉类(鸡,猪,牛) 　　1）鸡肉类： 　　FreshGradeLegs新鲜大鸡腿 　　FreshGradeBreast新鲜鸡胸肉 　　ChickenDrumsticks鸡腿 　　ChickenWings鸡翅膀 　　ChickenLiver鸡肝 　　其它部位及内藏，英国人都不吃，或给猫、狗吃的。 　　2）猪肉类： 　　MincedSteak肉馅 　　Pig’sLiver猪肝 　　Pig’sfeet猪脚 　　Pig’sKidney猪腰 　　Pig’sHearts猪心 　　PorkSteak无骨猪排 　　PorkChops带骨猪排 　　RolledPorkloin卷好的腰部瘦肉 　　RolledPorkBelly卷好的带皮猪腩 　　Porksausagemeat做香肠的绞肉 　　SmokedBacon醺肉 　　PorkFillet里肌肉 　　SpareRibPorkchops带肉猪小排 　　SpareRibofPork小排骨肉 　　Porkribs肋骨（可煮汤用） 　　BlackPudding黑香肠 　　PorkBurgers汉堡肉 　　Pork-pieces猪肉块 　　PorkDripping猪油滴 　　Lard猪油 　　Hock蹄膀 　　CasserolePork带骨的腿肉 　　Joint肘子 　　3）牛肉 　　StewingBeef小块的瘦肉 　　Steak&#38;Kidney牛排肉加牛腰 　　Fryingsteak牛排 　　MincedBeef牛肉馅 　　RumpSteak牛后腿肉 　　LegBeef牛腱肉 　　OXTail牛尾 　　OXheart牛心 　　OXTongues牛舌 　　BarnsleyChops带骨的腿肉 <a href='http://blog.zye.me/2011/08/45081.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p> 在海外，食品可在超级市场、传统摊位市场、杂货店购买到。而在大型超级市场更是主要的采购地点。海外的大型超市里商品分类清楚,很容易辨认。分类牌大多置于货架上方,或者两端。顾客可以非常方便的找到所要寻找的商品。 </p>
<p>　　一般商品分类： </p>
<p>　　Biscuits饼干类 </p>
<p>　　Snacks零嘴 </p>
<p>　　Crisps各式薯片 </p>
<p>　　Confectionery糖果类 </p>
<p>　　PetFood宠物食品 </p>
<p> Toiletries厕所用品 </p>
<p>　　Cereals谷类食品 </p>
<p>　　Poultry家禽类 </p>
<p>　　Pickles各式腌菜 </p>
<p>　　以下将常用的食品的中英对照作整理,以方便大家采购: </p>
<p>　　A.肉类(鸡,猪,牛) </p>
<p>　　1）鸡肉类： </p>
<p>　　FreshGradeLegs新鲜大鸡腿 </p>
<p>　　FreshGradeBreast新鲜鸡胸肉 </p>
<p>　　ChickenDrumsticks鸡腿 </p>
<p>　　ChickenWings鸡翅膀 </p>
<p>　　ChickenLiver鸡肝 </p>
<p>　　其它部位及内藏，英国人都不吃，或给猫、狗吃的。 </p>
<p>　　2）猪肉类： </p>
<p>　　MincedSteak肉馅 </p>
<p>　　Pig’sLiver猪肝 </p>
<p>　　Pig’sfeet猪脚 </p>
<p>　　Pig’sKidney猪腰 </p>
<p>　　Pig’sHearts猪心 </p>
<p>　　PorkSteak无骨猪排 </p>
<p>　　PorkChops带骨猪排 </p>
<p>　　RolledPorkloin卷好的腰部瘦肉 </p>
<p>　　RolledPorkBelly卷好的带皮猪腩 </p>
<p>　　Porksausagemeat做香肠的绞肉 </p>
<p>　　SmokedBacon醺肉 </p>
<p>　　PorkFillet里肌肉 </p>
<p>　　SpareRibPorkchops带肉猪小排 </p>
<p>　　SpareRibofPork小排骨肉 </p>
<p>　　Porkribs肋骨（可煮汤用） </p>
<p>　　BlackPudding黑香肠 </p>
<p>　　PorkBurgers汉堡肉 </p>
<p>　　Pork-pieces猪肉块 </p>
<p>　　PorkDripping猪油滴 </p>
<p>　　Lard猪油 </p>
<p>　　Hock蹄膀 </p>
<p>　　CasserolePork带骨的腿肉 </p>
<p>　　Joint肘子 </p>
<p>　　3）牛肉 </p>
<p>　　StewingBeef小块的瘦肉 </p>
<p>　　Steak&amp;Kidney牛排肉加牛腰 </p>
<p>　　Fryingsteak牛排 </p>
<p>　　MincedBeef牛肉馅 </p>
<p>　　RumpSteak牛后腿肉 </p>
<p>　　LegBeef牛腱肉 </p>
<p>　　OXTail牛尾 </p>
<p>　　OXheart牛心 </p>
<p>　　OXTongues牛舌 </p>
<p>　　BarnsleyChops带骨的腿肉 </p>
<p>　　ShoulderChops肩肉 </p>
<p>　　PorterHouseSteak腰上的牛排肉 </p>
<p>　　ChuckSteak牛肩胛肉（筋、油较多） </p>
<p>　　TenderisedSteak拍打过的牛排 </p>
<p>　　[注]牛杂类在传统摊位市场才可买到，超级市场则不贩卖。有： </p>
<p>　　Roll牛肠 </p>
<p>　　Cowhells牛筋 </p>
<p>　　Pigbag猪肚 </p>
<p>　　HoneycomeTripe蜂窝牛肚 </p>
<p>　　TripePieces牛肚块 </p>
<p>　　Bestthickseam白牛肚 </p>
<p>　　B.海产类 </p>
<p>　　1）鱼类： </p>
<p>　　Herring鲱鱼（青鱼） </p>
<p>　　Salmon鲑鱼（大马哈鱼） </p>
<p>　　Cod鳕鱼 </p>
<p>　　Tuna鲔鱼（金枪鱼） </p>
<p>　　Plaice比目鱼 </p>
<p>　　Octopus章鱼 </p>
<p>　　Squid乌贼（鱿鱼） </p>
<p>　　Dressedsquid花枝 </p>
<p>　　Mackerel鲭鱼 </p>
<p>　　Haddock黑线鳕鱼 </p>
<p>　　Trout鲑鱼（适合清蒸） </p>
<p>　　Carp鲤鱼 </p>
<p>　　CodFillets鳕鱼块（可做鱼羹，或做成酥鱼片都很好吃） </p>
<p>　　Conger(Eel)海鳗 </p>
<p>　　SeaBream海鲤 </p>
<p>　　Hake鳕鱼类 </p>
<p>　　RedMullet红鲣（胭脂鱼。可煎或红烧） </p>
<p>　　SmokedSalmon熏鲑鱼* </p>
<p>　　Smokedmackerelwithcrushedpeppercorn带有黑胡椒粒的熏鲭* </p>
<p>　　Herringroes鲱鱼子 </p>
<p>　　BoiledCodroes鳕鱼子 </p>
<p>　　（*以上两种鱼一般是用来烤着吃的。烤好后加柠檬汁十分美味：）） </p>
<p>　　2）海鲜类： </p>
<p>　　Oyster牡蛎 </p>
<p>　　Mussel蚌类（黑色、椭圆形。没壳的即为淡菜） </p>
<p>　　Crab螃蟹 </p>
<p>　　Prawn虾 </p>
<p>　　Crabstick蟹肉条 </p>
<p>　　PeeledPrawns虾仁 </p>
<p>　　KingPrawns大虾 </p>
<p>　　Winkles田螺 </p>
<p>　　WhelksTops小螺肉 </p>
<p>　　Shrimps小虾米 </p>
<p>　　Cockles小贝肉 </p>
<p>　　Lobster龙虾 </p>
<p>　　C.蔬果类 </p>
<p>　　Potato马铃薯（土豆），Carrot红萝卜 </p>
<p>　　Onion洋葱，Aubergine茄子 </p>
<p>　　Celery芹菜，WhiteCabbage包心菜 </p>
<p>　　Redcabbage紫色包心菜，Cucumber黄瓜 </p>
<p>　　Tomato蕃茄，Radish小红萝卜 </p>
<p>　　Mooli白萝卜，Watercress西洋菜 </p>
<p>　　Babycorn玉米尖，Sweetcorn玉米 </p>
<p>　　Cauliflower菜花，Springonions小葱 </p>
<p>　　Garlic大蒜，Ginger姜 </p>
<p> Chineseleaves大白菜（绍菜。国内有些地方也称津白），Leeks大葱 </p>
<p>　　Mustardcress芥菜苗，GreenPepper青椒 </p>
<p>　　Redpepper红椒，Yellowpepper黄椒 </p>
<p>　　Mushroom圆菇，Broccoli西兰花菜（椰菜花） </p>
<p>　　Courgettes小胡瓜（荀瓜，西葫芦），Coriander香菜（芫荽） </p>
<p>　　DwarfBean四季豆（豇豆），FlatBeans豌豆角 </p>
<p>　　Iceberg生菜，Lettuce生菜 </p>
<p>　　SwedeorTurnip芜菁（甘蓝）Okra秋葵（东南亚菜系常见的用菜） </p>
<p>　　Chilli辣椒，Eddoes小芋头 </p>
<p>　　Taro芋头，Sweetpotato蕃薯 </p>
<p>　　Spinach菠菜，Beansprots绿豆芽 </p>
<p>　　Peas碗豆，Corn玉米粒 </p>
<p>　　Sprout高丽小菜心 </p>
<p>　　D水果类： </p>
<p>　　Lemon柠檬,Pear梨 </p>
<p>　　Banana香蕉,Grape葡萄 </p>
<p>　　Goldenapple黄绿苹果、脆甜,Grannysmith绿苹果、较酸 </p>
<p>　　Bramleys可煮食的苹果,Peach桃子 </p>
<p>　　Orange橙子，Strawberry草莓 </p>
<p>　　Mango芒果，Pineapple菠萝 </p>
<p>　　Kiwi猕猴桃（奇异果），Starfruit杨桃 </p>
<p>　　Honeydew-melon蜜瓜，Cherry樱桃 </p>
<p>　　Date枣，Lychee荔枝 </p>
<p> Grapefruit葡萄柚,Coconut椰子 </p>
<p>　　Fig无花果 </p>
<p>　　E.其它: </p>
<p>　　1)米： </p>
<p>　　Longrice长米(较硬，煮前先泡一个小时)Puddingriceorshortrice短米 </p>
<p>　　Brownrice高粱米 </p>
<p>　　THAIFragrantrice泰国香米*，Glutinousrice糯米* </p>
<p>　　*可在中国商店买到。 </p>
<p>　　2)面粉: </p>
<p>　　Strongflour高筋面粉,Plainflour中筋面粉 </p>
<p>　　Self-raisingflour自发粉，Wholemealflour小麦面粉 </p>
<p>　　3）糖： </p>
<p>　　Brownsugar红砂糖,DarkBrownSugar红糖（感冒时可煮姜汤时用） </p>
<p>　　Custersugar白砂糖,IcingSugar糖粉（可用在打鲜奶油及装饰蛋糕外层） </p>
<p>　　RockSugar冰糖 </p>
<p>　　F:关于中国超市 </p>
<p>　　海外许对大中城市均有中国城，货品相当繁多，下列只是平时较常用的材料。 </p>
<p>　　无忧雅思网助我越重洋！ </p>
<p>　　Noodles面条，Instantnoodles方便面 </p>
<p>　　Soysauce酱油：(分LightSoySauce生抽,及DarkSoySauce老抽两种),Vinger醋 </p>
<p>　　Cornstarch太白粉(生粉，淀粉)，Maltose麦芽糖 </p>
<p>　　SesameSeeds芝麻，Sesameoil麻油 </p>
<p>　　Oystersauce濠油，Pepper花椒 </p>
<p>　　Redchillipowder辣椒粉，Sesamepaste芝麻酱 </p>
<p>　　Beancurdsheet腐竹皮，Tofu豆腐 </p>
<p>　　Sago西米，CreamedCoconut椰膏 </p>
<p>　　Monosidumglutanate味精，Chineseredpepper花椒 </p>
<p>　　Saltblackbean豆鼓，Driedfish鱼干 </p>
<p>　　SeavegetableorSeaweed海带，Greenbean绿豆 </p>
<p>　　RedBean红豆，Blackbean黑豆 </p>
<p>　　Redkidneybean大红豆，Driedblackmushroom冬菇 </p>
<p>　　Pickledmustard-green酸菜，Silknoodles粉丝 </p>
<p>　　Agar-agar燕菜，Rice-noodle米粉 </p>
<p>　　Bambooshoots竹笋罐头，Staranise八角 </p>
<p>　　Wantunskin馄饨皮，Driedchestuts干粟子 </p>
<p>　　Tigerlilybuds金针菇，Reddate红枣 </p>
<p>　　Waterchestnuts荸荠罐头，Mu-er木耳 </p>
<p>　　Driedshrimps海米，Cashewnuts腰果</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/08/45081.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>大学生应该脱口而出的100个精典英文句子</title>
		<link>http://blog.zye.me/2011/07/43080.html</link>
		<comments>http://blog.zye.me/2011/07/43080.html#comments</comments>
		<pubDate>Thu, 28 Jul 2011 14:29:10 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Canada Related]]></category>
		<category><![CDATA[信息检索]]></category>
		<category><![CDATA[口语]]></category>
		<category><![CDATA[英语]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/10/43080.html</guid>
		<description><![CDATA[      Any day will do？哪一天都可以？ 　　Any messages for me？有我的留言吗？ 　　Are you by yourself？你一个人来吗？ 　　All right with you？你没有问题吧？ 　　Are you free tomorrow？明天有空吗？ 　　Are you kidding me？你在跟我开玩笑吧？ 　　As soon as possible！尽可能快！ 　　Back in a moment！马上回来！ 　　Believe it or not！信不信由你！ 　　Better luck next time！下次会更好！ 　　Boy will be boys本性难移！ 　　Come to the point！有话直说！ 　　Do you accept plastic？收不收行用卡？ 　　Does it <a href='http://blog.zye.me/2011/07/43080.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p class="text-article"><font size="4" color="#3366ff"><br />
     <strong> <big>Any day will do？</big></strong>哪一天都可以？ </font><font size="4" color="#3366ff">　　Any messages for me？有我的留言吗？</font></p>
<p><font size="4" color="#3366ff">　　<big><strong>Are you by yourself？</strong></big>你一个人来吗？</font></p>
<p><font size="4" color="#3366ff">　　<big><strong>All right with you？</strong></big>你没有问题吧？</font></p>
<p><font size="4" color="#3366ff">　　Are you free tomorrow？明天有空吗？</font></p>
<p><font size="4" color="#3366ff">　　Are you kidding me？你在跟我开玩笑吧？</font></p>
<p><font size="4" color="#3366ff">　　As soon as possible！尽可能快！</font></p>
<p><font size="4" color="#3366ff">　　<big><strong>Back in a moment</strong></big>！马上回来！</font></p>
<p><font size="4" color="#3366ff">　　<big><strong>Believe it or not！</strong></big>信不信由你！</font></p>
<p><font size="4" color="#3366ff">　　Better luck next time！下次会更好！</font></p>
<p><font size="4" color="#3366ff">　　<big><strong>Boy will be boys</strong></big>本性难移！</font></p>
<p><font size="4" color="#3366ff">　　<big><strong>Come to the point</strong></big>！有话直说！</font></p>
<p><font size="4" color="#3366ff">　　Do you accept plastic？收不收行用卡？</font></p>
<p><font size="4" color="#3366ff">　　<strong><big>Does it keep long？</big></strong>可以保存吗？</font></p>
<p><font size="4" color="#3366ff">　　Don&#8217;t be so fussy！别挑剔了！</font></p>
<p><font size="4" color="#3366ff">　　Don&#8217;t count to me！别指望我！</font></p>
<p><font size="4" color="#3366ff">　　Don&#8217;t fall for it！不要上当！</font></p>
<p><font size="4" color="#3366ff">　　<strong>Don&#8217;t get me wrong！你搞错了！</strong></font></p>
<p><strong><font size="4" color="#3366ff">　　Don&#8217;t give me that！少来这套！</font></strong></p>
<p><font size="4" color="#3366ff">　　<big><strong>Don&#8217;t let me down！</strong></big>别让我失望！</font></p>
<p><font size="4" color="#3366ff">　　<strong>Don&#8217;t lose your head！</strong>别乐昏了头！</font></p>
<p><font size="4" color="#3366ff">　　<strong>Don&#8217;t over do it！</strong>别做过头了！</font></p>
<p><font size="4" color="#3366ff">　　Don&#8217;t sit there daydreaming！别闲着做白日梦！</font></p>
<p><font size="4" color="#3366ff">　　Don&#8217;t stand on ceremony！别太拘束！</font></p>
<p><font size="4" color="#3366ff">　　Drop me a line！要写信给我！</font></p>
<p><font size="4" color="#3366ff">　　Easy come easy go！来得容易去得也快！</font></p>
<p><font size="4" color="#3366ff">　　First come first served！先到先得！</font></p>
<p><font size="4" color="#3366ff">　　Get a move on！快点吧！</font></p>
<p><font size="4" color="#3366ff">　　Get off my back！不要嘲笑我！</font></p>
<p><font size="4" color="#3366ff">　　Give him the works！给他点教训！</font></p>
<p><font size="4" color="#3366ff">　　Give me a break！饶了我吧！</font></p>
<p><font size="4" color="#3366ff">　　Give me a hand！帮我一个忙！</font></p>
<p><font size="4" color="#3366ff">　　Great minds think alike！英雄所见略同！</font></p>
<p><font size="4" color="#3366ff">　　I&#8217;ll treat you to lunch.午餐我请你！</font></p>
<p><font size="4" color="#3366ff">　　In one ear，out the other ear.一耳进，一耳出！</font></p>
<p><font size="4" color="#3366ff">　　I&#8217;m spaced-out！我开小差了！</font></p>
<p><font size="4" color="#3366ff">　　I beg your pardon！请你再说一遍！</font></p>
<p><font size="4" color="#3366ff">　　I can&#8217;t afford that！我付不起！</font></p>
<p><font size="4" color="#3366ff">　　I can&#8217;t follow you！我不懂你说的！</font></p>
<p><font size="4" color="#3366ff">　　I can&#8217;t help it！我情不自禁！</font></p>
<p><font size="4" color="#3366ff">　　I couldn&#8217;t reach him！我联络不上他！</font></p>
<p><font size="4" color="#3366ff">　　I cross my heart！我发誓是真的！</font></p>
<p><font size="4" color="#3366ff">    </font><font size="4" color="#3366ff">I don&#8217;t mean it！我不是故意的！ </font></p>
<p><font size="4" color="#3366ff">　　I feel very miserable！我好沮丧！</font></p>
<p><font size="4" color="#3366ff">　　I have no choice！我别无选择了！</font></p>
<p><font size="4" color="#3366ff">　　I watch my money！视财如命！</font></p>
<p><font size="4" color="#3366ff">　　I&#8217;ll be in touch！保持联络！</font></p>
<p><font size="4" color="#3366ff">　　I&#8217;ll check it out！我去看看！</font></p>
<p><font size="4" color="#3366ff">　　I&#8217;ll show you around！我带你四处逛逛！</font></p>
<p><font size="4" color="#3366ff">　　I&#8217;ll see to it！我会留意的！</font></p>
<p><font size="4" color="#3366ff">　　I&#8217;m crazy for you！我为你疯狂！</font></p>
<p><font size="4" color="#3366ff">　　You make me jump！你下了我一跳！</font></p>
<p><font size="4" color="#3366ff">　　Make up your mind.作个决定吧！</font></p>
<p><font size="4" color="#3366ff">　　Make yourself at home！就当在家一样！</font></p>
<p><font size="4" color="#3366ff">　　My mouth is watering！我要流口水了！</font></p>
<p><font size="4" color="#3366ff">　　Never heard of it！没听说过！</font></p>
<p><font size="4" color="#3366ff">　　Nice talking to you！很高兴和你聊天！</font></p>
<p><font size="4" color="#3366ff">　　No doubt about it！勿庸置疑！</font></p>
<p><font size="4" color="#3366ff">　　No pain no gain！不经一事，不长一智！</font></p>
<p><font size="4" color="#3366ff">　　None of your business！要你管？</font></p>
<p><font size="4" color="#3366ff">　　There is nothing on your business！这没你的事！</font></p>
<p><font size="4" color="#3366ff">　　Now you are really talking！说得对！</font></p>
<p><font size="4" color="#3366ff">　　Please don&#8217;t rush me！请不要吹促我！</font></p>
<p><font size="4" color="#3366ff">　　Please keep me informed！请一定要通知我！</font></p>
<p><font size="4" color="#3366ff">　　She looks blue today.她今天很忧郁！</font></p>
<p><font size="4" color="#3366ff">　　She is under the weather.她心情不好！</font></p>
<p><font size="4" color="#3366ff">　　So far，so good.过得去。</font></p>
<p><font size="4" color="#3366ff">　　Speaking of the devil！一说曹操，曹操就到！</font></p>
<p><font size="4" color="#3366ff">　　Stay away from me！离我远一点！</font></p>
<p><font size="4" color="#3366ff">　　Stay on the ball！集中注意力！</font></p>
<p><font size="4" color="#3366ff">　　That makes no difference.不都一样吗？</font></p>
<p><font size="4" color="#3366ff">　　That&#8217;s a touchy issue！这是个辣手得问题！</font></p>
<p><font size="4" color="#3366ff">　　That&#8217;s always the case！习以为常！</font></p>
<p><font size="4" color="#3366ff">　　That&#8217;s going too far！这太离谱了！</font></p>
<p><font size="4" color="#3366ff">　　That&#8217;s more like that！这才象话嘛！</font></p>
<p><font size="4" color="#3366ff">　　The answer is zero！白忙了！</font></p>
<p><font size="4" color="#3366ff">　　The dice is cast！已成定局了！</font></p>
<p><font size="4" color="#3366ff">　　The same as usual！一如既往！</font></p>
<p><font size="4" color="#3366ff">　　The walls have ears！隔墙有耳！</font></p>
<p><font size="4" color="#3366ff">　　There you go again！你又来了！</font></p>
<p><font size="4" color="#3366ff">　　Time is running out！没有时间了！</font></p>
<p><font size="4" color="#3366ff">　　We better get going！最好马上就走</font></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/07/43080.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>知道&#8221;Family&#8221;这个单词的含义吗？</title>
		<link>http://blog.zye.me/2011/06/27572.html</link>
		<comments>http://blog.zye.me/2011/06/27572.html#comments</comments>
		<pubDate>Sun, 19 Jun 2011 02:29:18 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[MISC]]></category>
		<category><![CDATA[joks]]></category>
		<category><![CDATA[英语]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/04/27572.html</guid>
		<description><![CDATA[知道&#8221;Family&#8221;这个单词的含义吗？ 爸 F ather和 A nd妈 M other我 I爱 L ove你 Y ou爸妈我爱你=家庭]]></description>
			<content:encoded><![CDATA[<p>知道&#8221;Family&#8221;这个单词的含义吗？ <br />爸 F ather<br />和 A nd<br />妈 M other<br />我 I<br />爱 L ove<br />你 Y ou<br />爸妈我爱你=家庭</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/06/27572.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>搜索引擎中自然语言理解技术及其应用探讨(下)</title>
		<link>http://blog.zye.me/2011/06/19947.html</link>
		<comments>http://blog.zye.me/2011/06/19947.html#comments</comments>
		<pubDate>Mon, 06 Jun 2011 14:27:39 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[NLP]]></category>
		<category><![CDATA[信息检索]]></category>
		<category><![CDATA[自然语言理解]]></category>
		<category><![CDATA[英语]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/03/19947.html</guid>
		<description><![CDATA[搜索引擎中自然语言理解技术及其应用探讨(下) （　2001年11月14日 15:03） 第二部分 在搜索技术中的应用 众所周知，随着互联网的迅速发展和广泛普及而导致网上信息爆炸性增长。如何在庞大的互联网上获得有价值的信息已成为网民日益关注的问题。这种以一定的策略在互联网中搜集、发现信息，对信息进行理解、提取、组织和处理，并为用户提供检索服务，从而起到信息导航的目的的搜索技术的出现为网民快速找到所需信息带来了福音。 但是，2001年，Roper Starch的调查指出，36%的互联网用户一个星期花了超过2个小时时间在网上搜索；71%的用户在使用搜索引擎的时候遇到过麻烦；平均搜索12分钟以后发现搜索受挫；搜索受挫中46%都是因为链接错误；绝大部分(86%)的互联网用户感到应当出现更有效的、准确的信息搜索技术。另一项由Keen所做的调查显示，人们平均每天有四个问题需要从外界获取答案；其中31%的人使用搜索引擎寻找答案；平均每周花费8.75个小时找寻答案；53.3%时间花在从旁人那里获得答案，29%的时间花在亲戚朋友身上，24.3%的是时间花在销售商那里；网上查找答案的，半数以上都不成功；他们每周将花费14.5美元以上，以获取正确的信息。 从这些调查数据中不难看出，尽管搜索服务提供者在研发搜索技术方面已经花费了大量的时间和精力，但是目前的搜索引擎仍然存在不少的局限性，比如信息丢失、返回信息太多、信息无关，这使得网民对于现有的搜索技术仍然不满，期盼更完美的搜索技术的出现。 由于自然语言理解技术的三方面功能，即机器翻译、语义理解及人机会话技术能够赋予搜索技术更具人性化、方便易用的特点。因此，近年来在搜索界得到了广泛的应用。无论是国内外的搜索引擎，都可以寻觅到语义理解、机器翻译的踪迹。 目前在搜索引擎方面主要应用的自然语言理解技术是机器翻译与语义理解技术。应用了这些技术的搜索引擎我们称之为智能搜索引擎。由于它将信息检索从目前基于关键词层面提高到基于知识（或概念）层面，对知识有一定的理解与处理能力，因而具有信息服务的智能化、人性化特征。它允许网民采用自然语言进行信息的检索，为他们提供更方便、更确切的搜索服务。 与传统的目录查询、关键词查询模式相比，自然语言查询的优势体现在：一是使网络交流更加人性化；二是使信息查询变得更加方便、快速和准确。现在，已经有越来越多的搜索引擎宣布支持自然语言搜索特性。比如国外的搜索引擎Google,，AskJeeves；国内的搜索引擎网易、尤里卡、问一问、21世纪互联、孙悟空、悠游等。在这里我们将重点介绍应用语义理解技术的中文智能搜索引擎。 首先以尤里卡搜索引擎为例简要说明一下这种智能搜索的过程。 实现智能搜索的过程主要分三部分：语义理解、知识管理和知识检索。其中，知识库是实现智能搜索的基础和核心。知识库提供的是语义理解中最终将要提供给用户的结果，同互联网的状况相同，人类的知识结构和容量都在飞速膨胀，所以知识库也需要有良好的适应能力。在语义理解的整个过程中，智能分词技术是最初的一个环节，它将组成语句的核心词提炼出来供语义分析模块使用。在分词的过程中，如何能够恰当地提供足够的词来供分析程序处理，并且过滤掉冗余的信息，这是后期语义分析的质量和速度的重要前提。 加入了知识库处理技术的智能分词能够避免了传统分词技术在拆分时产生的歧义组合。从而为语义理解的处理提供了良好的原始材料。知识检索可以利用语义分析的结果，对知识库进行概念级的检索，对用户提出问题给出准确度最高、相关度最强的检索结果。比如：&#8221;我想在北京找工作？&#8221;。首先进行语义理解，在知识库中&#8221;找工作&#8221;属于求知招聘的范畴，所以分析出用户想查询&#8221;在北京求职&#8221;。然后利用&#8221;在北京求职&#8221;这个概念查询知识库，得出答案。 下面我们再来看看各家宣称应用了自然语言理解的搜索技术有哪些特点。 问一问（www.weniwen.com）自然语言检索 问一问是由闻易网科技有限公司（Weniwen Technologies, Inc.）开发的智能搜索引擎。它允许用户以自然的、整句的方式、以汉语或英语发出查询请求。易于快速地、以比较经济的方式扩展到不同的语言。 并可以同时从两种语言中识别出词汇。使用自然语言处理（NLP）技术，与传统的、基于关键词匹配的搜索技术相比，NLP技术可使问一问&#8221;理解&#8221;请求中的上下文和含义。通过使用NLP技术，问一问可以更准确地检索出适当的信息。尤其适用于旅游/休闲、金融以及消费品工业的、正在寻求可增强消费者通过Internet来访问其信息或进行自动交易的途径的大企业或门户。 21ilink（www.21ilink.com）中文智能搜索引擎 世纪讯联公司开发的基于自然语言处理和人工神经网络的智能互动技术解决了传统信息分类中的一些语意交叉词汇抽象概念、边缘类别的信息查询问题实现了模糊查询。查询过程突出了个性化、人性化。采用了自然语言的语句单元，还可设定地方语言特色。界面更加友好，能够满足不同层次，不同查询目的客户的特殊需求。并能引导查询者快速准确地找到所需要的信息。此项智能搜索技术采用国内独创的中文问答方式，并兼容了其他传统的搜索引擎的查询方式。支持基于概念的信息搜索、行业化、专业化的智能搜索、客户定制的商务模型，还可完成管理、追踪、支付等一系列的供应链的分析、行业研究等咨询项目。实现了多方协作,业务拓展的无缝结合。 此项智能搜索系统是将现代智能计算技术、交换技术、网络技术、数据库技术融为一体，而建成的一个面向客户的，全方位高质量的服务体系。采用了独有的Smart Hit（智能语义）、和Kengine（知识引擎）。开放性、先进性和超前性均大大领先于同类系统。全套系统拥有完整的智能网络接入服务功能，支持各网络平台的语音文字、数据及图像，是一种智能多媒体平台。平台无中断，支持宽频网络，满足对数据库全内容覆盖要求。支持概念检索、动态页面检索。 孙悟空（search.chinaren.com）搜索引擎 孙悟空搜索引擎是ChinaRen开发并拥有自主版权的产品,能按照用户的需求，搜索大陆和港澳台的中文网页。孙悟空搜索不仅可用传统的关键词搜索方式，更是在所有中文搜索引擎里率先采用了提问式搜索，这是ChinaRen研究并实现的一种智能中文处理技术。通过该技术，您可以直接通过提出问题的方式搜索您想要找的内容，这样不仅更符合我们平时的习惯，而且准确率更高。孙悟空搜索引擎拥有强大的搜索能力，提高搜索的智能性和准确性；智能的评价体系，保证检索结果高度相关。 悠游（www.goyoyo.com.cn）中文智能搜索引擎 北京悠游科技开发有限公司（Beijing Goyoyo）成立于1998年10月，是一个以中文自然语言处理技术为基础建立的互联网信息咨询及技术服务]]></description>
			<content:encoded><![CDATA[<p>搜索引擎中自然语言理解技术及其应用探讨(下) <br /><span><span>（　2001年11月14日 15:03）</span> </p>
<p></span></p>
<p style="TEXT-ALIGN: left" class="content"><strong>第二部分 在搜索技术中的应用</strong> <br />众所周知，随着互联网的迅速发展和广泛普及而导致网上信息爆炸性增长。如何在庞大的互联网上获得有价值的信息已成为网民日益关注的问题。这种以一定的策略在互联网中搜集、发现信息，对信息进行理解、提取、组织和处理，并为用户提供检索服务，从而起到信息导航的目的的搜索技术的出现为网民快速找到所需信息带来了福音。 </p>
<p>但是，2001年，Roper Starch的调查指出，36%的互联网用户一个星期花了超过2个小时时间在网上搜索；71%的用户在使用搜索引擎的时候遇到过麻烦；平均搜索12分钟以后发现搜索受挫；搜索受挫中46%都是因为链接错误；绝大部分(86%)的互联网用户感到应当出现更有效的、准确的信息搜索技术。另一项由Keen所做的调查显示，人们平均每天有四个问题需要从外界获取答案；其中31%的人使用搜索引擎寻找答案；平均每周花费8.75个小时找寻答案；53.3%时间花在从旁人那里获得答案，29%的时间花在亲戚朋友身上，24.3%的是时间花在销售商那里；网上查找答案的，半数以上都不成功；他们每周将花费14.5美元以上，以获取正确的信息。 </p>
<p>从这些调查数据中不难看出，尽管搜索服务提供者在研发搜索技术方面已经花费了大量的时间和精力，但是目前的搜索引擎仍然存在不少的局限性，比如信息丢失、返回信息太多、信息无关，这使得网民对于现有的搜索技术仍然不满，期盼更完美的搜索技术的出现。 </p>
<p>由于自然语言理解技术的三方面功能，即机器翻译、语义理解及人机会话技术能够赋予搜索技术更具人性化、方便易用的特点。因此，近年来在搜索界得到了广泛的应用。无论是国内外的搜索引擎，都可以寻觅到语义理解、机器翻译的踪迹。 </p>
<p>目前在搜索引擎方面主要应用的自然语言理解技术是机器翻译与语义理解技术。应用了这些技术的搜索引擎我们称之为智能搜索引擎。由于它将信息检索从目前基于关键词层面提高到基于知识（或概念）层面，对知识有一定的理解与处理能力，因而具有信息服务的智能化、人性化特征。它允许网民采用自然语言进行信息的检索，为他们提供更方便、更确切的搜索服务。 </p>
<p>与传统的目录查询、关键词查询模式相比，自然语言查询的优势体现在：一是使网络交流更加人性化；二是使信息查询变得更加方便、快速和准确。现在，已经有越来越多的搜索引擎宣布支持自然语言搜索特性。比如国外的搜索引擎Google,，AskJeeves；国内的搜索引擎网易、尤里卡、问一问、21世纪互联、孙悟空、悠游等。在这里我们将重点介绍应用语义理解技术的中文智能搜索引擎。 </p>
<p>首先以尤里卡搜索引擎为例简要说明一下这种智能搜索的过程。 </p>
<p>实现智能搜索的过程主要分三部分：语义理解、知识管理和知识检索。其中，知识库是实现智能搜索的基础和核心。知识库提供的是语义理解中最终将要提供给用户的结果，同互联网的状况相同，人类的知识结构和容量都在飞速膨胀，所以知识库也需要有良好的适应能力。在语义理解的整个过程中，智能分词技术是最初的一个环节，它将组成语句的核心词提炼出来供语义分析模块使用。在分词的过程中，如何能够恰当地提供足够的词来供分析程序处理，并且过滤掉冗余的信息，这是后期语义分析的质量和速度的重要前提。 </p>
<p>加入了知识库处理技术的智能分词能够避免了传统分词技术在拆分时产生的歧义组合。从而为语义理解的处理提供了良好的原始材料。知识检索可以利用语义分析的结果，对知识库进行概念级的检索，对用户提出问题给出准确度最高、相关度最强的检索结果。比如：&#8221;我想在北京找工作？&#8221;。首先进行语义理解，在知识库中&#8221;找工作&#8221;属于求知招聘的范畴，所以分析出用户想查询&#8221;在北京求职&#8221;。然后利用&#8221;在北京求职&#8221;这个概念查询知识库，得出答案。 </p>
<p>下面我们再来看看各家宣称应用了自然语言理解的搜索技术有哪些特点。 </p>
<p><strong>问一问（www.weniwen.com）自然语言检索</strong> <br />问一问是由闻易网科技有限公司（Weniwen Technologies, Inc.）开发的智能搜索引擎。它允许用户以自然的、整句的方式、以汉语或英语发出查询请求。易于快速地、以比较经济的方式扩展到不同的语言。 并可以同时从两种语言中识别出词汇。使用自然语言处理（NLP）技术，与传统的、基于关键词匹配的搜索技术相比，NLP技术可使问一问&#8221;理解&#8221;请求中的上下文和含义。通过使用NLP技术，问一问可以更准确地检索出适当的信息。尤其适用于旅游/休闲、金融以及消费品工业的、正在寻求可增强消费者通过Internet来访问其信息或进行自动交易的途径的大企业或门户。 </p>
<p><strong>21ilink（www.21ilink.com）中文智能搜索引擎</strong> <br />世纪讯联公司开发的基于自然语言处理和人工神经网络的智能互动技术解决了传统信息分类中的一些语意交叉词汇抽象概念、边缘类别的信息查询问题实现了模糊查询。查询过程突出了个性化、人性化。采用了自然语言的语句单元，还可设定地方语言特色。界面更加友好，能够满足不同层次，不同查询目的客户的特殊需求。并能引导查询者快速准确地找到所需要的信息。此项智能搜索技术采用国内独创的中文问答方式，并兼容了其他传统的搜索引擎的查询方式。支持基于概念的信息搜索、行业化、专业化的智能搜索、客户定制的商务模型，还可完成管理、追踪、支付等一系列的供应链的分析、行业研究等咨询项目。实现了多方协作,业务拓展的无缝结合。 </p>
<p>此项智能搜索系统是将现代智能计算技术、交换技术、网络技术、数据库技术融为一体，而建成的一个面向客户的，全方位高质量的服务体系。采用了独有的Smart Hit（智能语义）、和Kengine（知识引擎）。开放性、先进性和超前性均大大领先于同类系统。全套系统拥有完整的智能网络接入服务功能，支持各网络平台的语音文字、数据及图像，是一种智能多媒体平台。平台无中断，支持宽频网络，满足对数据库全内容覆盖要求。支持概念检索、动态页面检索。 </p>
<p><strong>孙悟空（search.chinaren.com）搜索引擎</strong> <br />孙悟空搜索引擎是ChinaRen开发并拥有自主版权的产品,能按照用户的需求，搜索大陆和港澳台的中文网页。孙悟空搜索不仅可用传统的关键词搜索方式，更是在所有中文搜索引擎里率先采用了提问式搜索，这是ChinaRen研究并实现的一种智能中文处理技术。通过该技术，您可以直接通过提出问题的方式搜索您想要找的内容，这样不仅更符合我们平时的习惯，而且准确率更高。孙悟空搜索引擎拥有强大的搜索能力，提高搜索的智能性和准确性；智能的评价体系，保证检索结果高度相关。 </p>
<p><strong>悠游（www.goyoyo.com.cn）中文智能搜索引擎</strong> <br />北京悠游科技开发有限公司（Beijing Goyoyo）成立于1998年10月，是一个以中文自然语言处理技术为基础建立的互联网信息咨询及技术服务</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/06/19947.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>搜索引擎中自然语言理解技术及其应用探讨(中)</title>
		<link>http://blog.zye.me/2011/06/19946.html</link>
		<comments>http://blog.zye.me/2011/06/19946.html#comments</comments>
		<pubDate>Mon, 06 Jun 2011 02:28:55 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[NLP]]></category>
		<category><![CDATA[信息检索]]></category>
		<category><![CDATA[自然语言理解]]></category>
		<category><![CDATA[英语]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/03/19946.html</guid>
		<description><![CDATA[搜索引擎中自然语言理解技术及其应用探讨(中) 2004-11-26 12:21 关于HNC理论 　　HNC理论是&#8221;Hierarchical Network of Concepts（概念层次网络）&#8221;的简称，是关于自然语言理解处理的一个理论体系。它以概念化、层次化、网络化的语义表达为基础，所以称它为概念层次网络理论。HNC理论把人脑认知结构分为局部和全局两类联想脉络，认为对联想脉络的表达是语言深层（即语言的语义层面）的根本问题。 　　HNC理论的中心目标是建立自然语言的表述和处理模式，使计算机能够模拟人脑的语言感知功能。该理论使自然语言理解获得了突破性的进展，它所蕴涵的精深丰富的思想对人工智能、语言学、计算机科学和认知科学等都具有重要的理论和应用价值，对中文信息处理和汉语研究尤其具有实际意义。 　　HNC理论完全摆脱了我国现有的这套语法学的束缚，而从语言的深层入手，以语义表达为基础，为汉语理解开辟了一条新路。HNC理论提出了可供工程实现的完整的自然语言理解的理论框架，它是一个面向整个自然语言理解的强大而完备的语义描述体系，包括语句处理、句群处理、篇章处理、短时记忆向长时记忆扩展处理、文本自动学习处理。HNC理论的出发点就是运用两类联想脉络来&#8221;帮助&#8221;计算机理解自然语言。自然语言的词汇是用来表达概念的，因此，HNC建立的词汇层面的局部联想脉络体现为一个概念表达体系。概念分为抽象概念与具体概念。HNC理论的概念表达体系侧重于抽象概念的表达。对具体概念采取挂靠近似表达方法。HNC理论认为应该从多元性表现和内涵两个方面来描述概念。 它创立了五元组用来表达抽象概念的多元性表现，对抽象概念的内涵采用网络层次符号来表达。其网络层次符号包含三大语义网络：基元概念语义网络、基本概念语义网络和逻辑概念语义网络。HNC的五元组符号和三大语义网络的层次符号组合起来就可完成对抽象概念的完整表达，从而为计算机理解自然语言的语义提供了有力的手段。 　　自然语言理解技术大致可分为机器翻译、语义理解及人机会话技术几个方面。其中机器翻译(machine translation)，又称机译(MT)，是利用计算机把一种自然语言转变成另一种自然语言的过程。智能搜索引擎在这一领域的研究将使得用户可以使用母语搜索非母语的网页，并以母语浏览搜索结果。语义理解通过将语言学的研究成果和计算机技术结合在一起，实现了对词语在语义层次上的理解。人机会话技术可以为计算机提供下一代的人机交互接口，实现从文字接口、图形接口到自然语言接口的革命，同时在家用电器的人性化设计方面有着广泛的应用前景，其技术内涵主要包括语音识别、语音合成两个核心部分。 　　在语义理解的整个过程中，智能分词技术是最初的一个环节，它将组成语句的核心词提炼出来供语义分析模块使用。在分词的过程中，如何能够恰当地提供足够的词来供分析程序处理，并且过滤掉冗余的信息，这是后期语义分析的质量和速度的重要前提。尤里卡的智能分词避免了传统分词技术在拆分时产生的歧义组合。从而为语义理解的处理提供了良好的原始材料。同时，在分词的过程中，知识库当中的同义词会被逐个匹配并同时提交给语义理解模块使用，这样处理过的句子，不仅提供了原始的句型，还同时搭载了语句的概念部分。 第二部分 在搜索技术中的应用 众所周知，随着互联网的迅速发展和广泛普及而导致网上信息爆炸性增长。如何在庞大的互联网上获得有价值的信息已成为网民日益关注的问题。这种以一定的策略在互联网中搜集、发现信息，对信息进行理解、提取、组织和处理，并为用户提供检索服务，从而起到信息导航的目的的搜索技术的出现为网民快速找到所需信息带来了福音。 　　但是，2001年，Roper Starch的调查指出，36%的互联网用户一个星期花了超过2个小时时间在网上搜索；71%的用户在使用搜索引擎的时候遇到过麻烦；平均搜索12分钟以后发现搜索受挫；搜索受挫中46%都是因为链接错误；绝大部分(86%)的互联网用户感到应当出现更有效的、准确的信息搜索技术。另一项由Keen所做的调查显示，人们平均每天有四个问题需要从外界获取答案；其中31%的人使用搜索引擎寻找答案；平均每周花费8.75个小时找寻答案；53.3%时间花在从旁人那里获得答案，29%的时间花在亲戚朋友身上，24.3%的是时间花在销售商那里；网上查找答案的，半数以上都不成功；他们每周将花费14.5美元以上，以获取正确的信息。 　　从这些调查数据中不难看出，尽管搜索服务提供者在研发搜索技术方面已经花费了大量的时间和精力，但是目前的搜索引擎仍然存在不少的局限性，比如信息丢失、返回信息太多、信息无关，这使得网民对于现有的搜索技术仍然不满，期盼更完美的搜索技术的出现。 　　由于自然语言理解技术的三方面功能，即机器翻译、语义理解及人机会话技术能够赋予搜索技术更具人性化、方便易用的特点。因此，近年来在搜索界得到了广泛的应用。无论是国内外的搜索引擎，都可以寻觅到语义理解、机器翻译的踪迹。 　　目前在搜索引擎方面主要应用的自然语言理解技术是机器翻译与语义理解技术。应用了这些技术的搜索引擎我们称之为智能搜索引擎。由于它将信息检索从目前基于关键词层面提高到基于知识（或概念）层面，对知识有一定的理解与处理能力，因而具有信息服务的智能化、人性化特征。它允许网民采用自然语言进行信息的检索，为他们提供更方便、更确切的搜索服务。 　　与传统的目录查询、关键词查询模式相比，自然语言查询的优势体现在：一是使网络交流更加人性化；二是使信息查询变得更加方便、快速和准确。现在，已经有越来越多的搜索引擎宣布支持自然语言搜索特性。比如国外的搜索引擎Google,，AskJeeves；国内的搜索引擎网易、尤里卡、问一问、21世纪互联、孙悟空、悠游等。在这里我们将重点介绍应用语义理解技术的中文智能搜索引擎。 　　首先以尤里卡搜索引擎为例简要说明一下这种智能搜索的过程。 　　实现智能搜索的过程主要分三部分：语义理解、知识管理和知识检索。其中，知识库是实现智能搜索的基础和核心。知识库提供的是语义理解中最终将要提供给用户的结 果，同互联网的状况相同，人类的知识结构和容量都在飞速膨胀，所以知识库也需要有良好的适应能力。在语义理解的整个过程中，智能分词技术是最初的一个环节，它将组成语句的核心词提炼出来供语义分析模块使用。在分词的过程中，如何能够恰当地提供足够的词来供分析程序处理，并且过滤掉冗余的信息，这是后期语义分析的质量和速度的重要前提。 　　加入了知识库处理技术的智能分词能够避免了传统分词技术在拆分时产生的歧义组合。从而为语义理解的处理提供了良好的原始材料。知识检索可以利用语义分析的结果，对知识库进行概念级的检索，对用户提出问题给出准确度最高、相关度最强的检索结果。比如：&#8221;我想在北京找工作？&#8221;。首先进行语义理解，在知识库中&#8221;找工作&#8221;属于求知招聘的范畴，所以分析出用户想查询&#8221;在北京求职&#8221;。然后利用&#8221;在北京求职&#8221;这个概念查询知识库，得出答案。 　　下面我们再来看看各家宣称应用了自然语言理解的搜索技术有哪些特点。 　　问一问（www.weniwen.com）自然语言检索 　　问一问是由闻易网科技有限公司（Weniwen Technologies, Inc.）开发的智能搜索引擎。它允许用户以自然的、整句的方式、以汉语或英语发出查询请求。易于快速地、以比较经济的方式扩展到不同的语言。 并可以同时从两种语言中识别出词汇。使用自然语言处理（NLP）技术，与传统的、基于关键词匹配的搜索技术相比，NLP技术可使问一问&#8221;理解&#8221;请求中的上下文和含义。通过使用NLP技术，问一问可以更准确地检索出适当的信息。尤其适用于旅游/休闲、金融以及消费品工业的、正在寻求可增强消费者通过Internet来访问其信息或进行自动交易的途径的大企业或门户。]]></description>
			<content:encoded><![CDATA[<table cellpadding="0" width="90%" align="center" cellspacing="0" border="0">
<tbody>
<tr>
<td colspan="2" align="middle">
<h2>搜索引擎中自然语言理解技术及其应用探讨(中)</h2>
<p> <span style="COLOR: #003300">2004-11-26 12:21</span></td>
</tr>
<tr>
<td colspan="2" height="1">
<hr noshade="noshade" size="1"/></td>
</tr>
<tr>
<td colspan="2" class="alw18"><!-- htmlencode2( ) -->关于HNC理论 </p>
<p>　　HNC理论是&#8221;Hierarchical Network of Concepts（概念层次网络）&#8221;的简称，是关于自然语言理解处理的一个理论体系。它以概念化、层次化、网络化的语义表达为基础，所以称它为概念层次网络理论。HNC理论把人脑认知结构分为局部和全局两类联想脉络，认为对联想脉络的表达是语言深层（即语言的语义层面）的根本问题。 </p>
<p>　　HNC理论的中心目标是建立自然语言的表述和处理模式，使计算机能够模拟人脑的语言感知功能。该理论使自然语言理解获得了突破性的进展，它所蕴涵的精深丰富的思想对人工智能、语言学、计算机科学和认知科学等都具有重要的理论和应用价值，对中文信息处理和汉语研究尤其具有实际意义。 </p>
<p>　　HNC理论完全摆脱了我国现有的这套语法学的束缚，而从语言的深层入手，以语义表达为基础，为汉语理解开辟了一条新路。HNC理论提出了可供工程实现的完整的自然语言理解的理论框架，它是一个面向整个自然语言理解的强大而完备的语义描述体系，包括语句处理、句群处理、篇章处理、短时记忆向长时记忆扩展处理、文本自动学习处理。HNC理论的出发点就是运用两类联想脉络来&#8221;帮助&#8221;计算机理解自然语言。自然语言的词汇是用来表达概念的，因此，HNC建立的词汇层面的局部联想脉络体现为一个概念表达体系。概念分为抽象概念与具体概念。HNC理论的概念表达体系侧重于抽象概念的表达。对具体概念采取挂靠近似表达方法。HNC理论认为应该从多元性表现和内涵两个方面来描述概念。 <br />它创立了五元组用来表达抽象概念的多元性表现，对抽象概念的内涵采用网络层次符号来表达。其网络层次符号包含三大语义网络：基元概念语义网络、基本概念语义网络和逻辑概念语义网络。HNC的五元组符号和三大语义网络的层次符号组合起来就可完成对抽象概念的完整表达，从而为计算机理解自然语言的语义提供了有力的手段。 </p>
<p>　　自然语言理解技术大致可分为机器翻译、语义理解及人机会话技术几个方面。其中机器翻译(machine translation)，又称机译(MT)，是利用计算机把一种自然语言转变成另一种自然语言的过程。智能<span style="COLOR: #0000ff">搜索引擎</span>在这一领域的研究将使得用户可以使用母语搜索非母语的网页，并以母语浏览搜索结果。语义理解通过将语言学的研究成果和计算机技术结合在一起，实现了对词语在语义层次上的理解。人机会话技术可以为计算机提供下一代的人机交互接口，实现从文字接口、图形接口到自然语言接口的革命，同时在家用电器的人性化设计方面有着广泛的应用前景，其技术内涵主要包括语音识别、语音合成两个核心部分。 </p>
<p>　　在语义理解的整个过程中，智能分词技术是最初的一个环节，它将组成语句的核心词提炼出来供语义分析模块使用。在分词的过程中，如何能够恰当地提供足够的词来供分析程序处理，并且过滤掉冗余的信息，这是后期语义分析的质量和速度的重要前提。尤里卡的智能分词避免了传统分词技术在拆分时产生的歧义组合。从而为语义理解的处理提供了良好的原始材料。同时，在分词的过程中，知识库当中的同义词会被逐个匹配并同时提交给语义理解模块使用，这样处理过的句子，不仅提供了原始的句型，还同时搭载了语句的概念部分。 </p>
<p>第二部分 在<span style="COLOR: #0000ff">搜索</span>技术中的应用 <br />众所周知，随着互联网的迅速发展和广泛普及而导致网上信息爆炸性增长。如何在庞大的互联网上获得有价值的信息已成为网民日益关注的问题。这种以一定的策略在互联网中搜集、发现信息，对信息进行理解、提取、组织和处理，并为用户提供检索服务，从而起到信息导航的目的的搜索技术的出现为网民快速找到所需信息带来了福音。 </p>
<p>　　但是，2001年，Roper Starch的调查指出，36%的互联网用户一个星期花了超过2个小时时间在网上搜索；71%的用户在使用<span style="COLOR: #0000ff">搜索引擎</span>的时候遇到过麻烦；平均搜索12分钟以后发现搜索受挫；搜索受挫中46%都是因为链接错误；绝大部分(86%)的互联网用户感到应当出现更有效的、准确的信息搜索技术。另一项由Keen所做的调查显示，人们平均每天有四个问题需要从外界获取答案；其中31%的人使用搜索引擎寻找答案；平均每周花费8.75个小时找寻答案；53.3%时间花在从旁人那里获得答案，29%的时间花在亲戚朋友身上，24.3%的是时间花在销售商那里；网上查找答案的，半数以上都不成功；他们每周将花费14.5美元以上，以获取正确的信息。 </p>
<p>　　从这些调查数据中不难看出，尽管搜索服务提供者在研发搜索技术方面已经花费了大量的时间和精力，但是目前的搜索引擎仍然存在不少的局限性，比如信息丢失、返回信息太多、信息无关，这使得网民对于现有的<span style="COLOR: #0000ff">搜索</span>技术仍然不满，期盼更完美的搜索技术的出现。 </p>
<p>　　由于自然语言理解技术的三方面功能，即机器翻译、语义理解及人机会话技术能够赋予<span style="COLOR: #0000ff">搜索</span>技术更具人性化、方便易用的特点。因此，近年来在搜索界得到了广泛的应用。无论是国内外的搜索引擎，都可以寻觅到语义理解、机器翻译的踪迹。 </p>
<p>　　目前在搜索引擎方面主要应用的自然语言理解技术是机器翻译与语义理解技术。应用了这些技术的搜索引擎我们称之为智能<span style="COLOR: #0000ff">搜索引擎</span>。由于它将信息检索从目前基于关键词层面提高到基于知识（或概念）层面，对知识有一定的理解与处理能力，因而具有信息服务的智能化、人性化特征。它允许网民采用自然语言进行信息的检索，为他们提供更方便、更确切的搜索服务。 </p>
<p>　　与传统的目录查询、关键词查询模式相比，自然语言查询的优势体现在：一是使网络交流更加人性化；二是使信息查询变得更加方便、快速和准确。现在，已经有越来越多的<a href="http://www.canco-soft.com/include/ShowDetail.asp?series_id=347"><span style="COLOR: #0000ff">搜索引擎</span></a>宣布支持自然语言搜索特性。比如国外的搜索引擎Google,，AskJeeves；国内的搜索引擎网易、尤里卡、问一问、21世纪互联、孙悟空、悠游等。在这里我们将重点介绍应用语义理解技术的中文智能搜索引擎。 </p>
<p>　　首先以尤里卡搜索引擎为例简要说明一下这种智能<a href="http://www.canco-soft.com/include/ShowDetail.asp?series_id=346"><span style="COLOR: #0000ff">搜索</span></a>的过程。 </p>
<p>　　实现智能搜索的过程主要分三部分：语义理解、知识管理和知识检索。其中，知识库是实现智能<a href="http://www.canco-soft.com/include/ShowDetail.asp?series_id=345"><span style="COLOR: #0000ff">搜索</span></a>的基础和核心。知识库提供的是语义理解中最终将要提供给用户的结<br />
果，同互联网的状况相同，人类的知识结构和容量都在飞速膨胀，所以知识库也需要有良好的适应能力。在语义理解的整个过程中，智能分词技术是最初的一个环节，它将组成语句的核心词提炼出来供语义分析模块使用。在分词的过程中，如何能够恰当地提供足够的词来供分析程序处理，并且过滤掉冗余的信息，这是后期语义分析的质量和速度的重要前提。 </p>
<p>　　加入了知识库处理技术的智能分词能够避免了传统分词技术在拆分时产生的歧义组合。从而为语义理解的处理提供了良好的原始材料。知识检索可以利用语义分析的结果，对知识库进行概念级的检索，对用户提出问题给出准确度最高、相关度最强的检索结果。比如：&#8221;我想在北京找工作？&#8221;。首先进行语义理解，在知识库中&#8221;找工作&#8221;属于求知招聘的范畴，所以分析出用户想查询&#8221;在北京求职&#8221;。然后利用&#8221;在北京求职&#8221;这个概念查询知识库，得出答案。 </p>
<p>　　下面我们再来看看各家宣称应用了自然语言理解的搜索技术有哪些特点。 </p>
<p>　　问一问（www.weniwen.com）自然语言检索 </p>
<p>　　问一问是由闻易网科技有限公司（Weniwen Technologies, Inc.）开发的智能<a href="http://www.canco-soft.com/include/ShowDetail.asp?series_id=339"><span style="COLOR: #0000ff">搜索引擎</span></a>。它允许用户以自然的、整句的方式、以汉语或英语发出查询请求。易于快速地、以比较经济的方式扩展到不同的语言。 并可以同时从两种语言中识别出词汇。使用自然语言处理（NLP）技术，与传统的、基于关键词匹配的搜索技术相比，NLP技术可使问一问&#8221;理解&#8221;请求中的上下文和含义。通过使用NLP技术，问一问可以更准确地检索出适当的信息。尤其适用于旅游/休闲、金融以及消费品工业的、正在寻求可增强消费者通过Internet来访问其信息或进行自动交易的途径的大企业或门户。 </td>
</tr>
</tbody>
</table>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/06/19946.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>自然语言理解技术及其应用探讨(上)</title>
		<link>http://blog.zye.me/2011/06/19945.html</link>
		<comments>http://blog.zye.me/2011/06/19945.html#comments</comments>
		<pubDate>Sun, 05 Jun 2011 14:28:11 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[NLP]]></category>
		<category><![CDATA[信息检索]]></category>
		<category><![CDATA[自然语言理解]]></category>
		<category><![CDATA[英语]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/03/19945.html</guid>
		<description><![CDATA[摘自互联网&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; 搜索引擎 自然语言理解技术及其应用探讨(上) （　2001年11月14日 15:03） 随着社会的日益信息化，人们越来越强烈地希望用自然语言同计算机交流。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的课题。从计算机科学特别是从人工智能的观点看，自然语言理解的任务是建立一种计算机模型，这种计算机模型能够给出象人那样理解、分析并回答自然语言（即人们日常使用的各种通俗语言）的结果。 现在的计算机的智能还远远没有达到能够象人一样理解自然语言的水平，而且在可预见的将来也达不到这样的水平。因此，关于计算机对自然语言的理解一般是从实用的角度进行评判的。如果计算机实现了人机会话，或机器翻译，或自动文摘等语言信息处理功能，则认为计算机具备了自然语言理解的能力。 第一部分 了解自然语言理解技术 自然语言处理就是研究如何能让计算机理解并生成人们日常所使用的(如汉语、英语)语言，使得计算机懂得自然语言的含义，并对人给计算机提出的问题，通过对话的方式，用自然语言进行回答。目的在于建立起一种人与机器之间的密切而友好的关系，使之能进行高度的信息传递与认知活动。自然语言理解系统可以用作专家系统、知识工程、情报检索、办公室自动化的自然语言人机接口，有很大的实用价值。 自然语言处理研究在电子计算机问世之初就开始了，并于 50年代初开展了机器翻译试验。当时的研究方法还不能称作带有&#8221;智能&#8221;。到了60年代乔姆斯基的转换生成语法得到广泛的认可，生成语法的核心是短语结构规则，分析句子结构的过程就是利用规则自顶向下或自底向上的句法树生成过程。 由于认识到生成语法缺少表示语义知识的手段，在70年代随着认知科学的兴盛，研究者又相继提出了语义网络、CD理论、格框架等语义表示理论。这些语法和语义理论经过各自的发展，逐渐开始趋于相互结合。到80年代一批新的语法理论脱颖而出，具有代表性的有词汇功能语法(LFG)、功能合一语法(FUG)和广义短语结构语法(GPSG) 等。 这些基于规则的分析方法可以称之为自然语言处理中的&#8221;理性主义&#8221;。现有的手段虽然基本上掌握了单个句子的分析技术，但是还很难覆盖全面的语言现象，特别是对于整个段落或篇章的理解还无从下手。 与&#8221;理性主义&#8221;相对的是&#8221;经验主义&#8221;的研究思路，主要是指针对大规模语料库的研究。语料库是大量文本的集合。计算机出现后，语料可以被方便地存贮起来，利用计算机查找也很容易。随着电子出版物的出现，采集语料也不再成为困难。最早于60年代编制的Brown和LOB两个计算机语料库，分别具有100万词次的规模。进入90 年代可以轻易列举出的语料库有几十个之多，象DCI、ECI、ICAME、BNC、LDC、 CLR等，其规模最高达到109数量级。 对语料库的研究分成3个方面：工具软件的开发、语料库的标注、基于语料库的语言分析方法。采集到以后未经处理的生语料不能直接提供有关语言的各种知识，只有通过词法、句法、语义等多层次的加工才能使知识获取成为可能。加工的方式就是在语料中标注各种记号，标注的内容包括每个词的词性、语义项、短语结构、句型和句间关系等。随着标注程度的加深语料库逐渐熟化，成为一个分布的、统计意义上的知识源。利用这个知识源可以进行许多语言分析工作，如根据从已标注语料中总结出的频度规律可以给新文本逐词标注词性，划分句子成分等。 语料库提供的知识是用统计强度表示的，而不是确定性的，随着规模的扩大，旨在覆盖全面的语言现象。但是对于语言中基本的确定性的规则仍然用统计强度的大小去判断，这与人们的常识相违背。这种&#8221;经验主义&#8221;研究中的不足要靠&#8221;理性主义&#8221; 的方法来弥补。两类方法的融合也正是当前自然语言处理发展的趋势。 自然语言理解系统的发展阶段 自然语言理解系统的发展可以分为第一代系统和第二代系统两个阶段。第一代系统建立在对词类和词序分析的基础之上，分析中经常使用统计方法；第二代系统则开始引进语义甚至语用和语境的因素，几乎完全抛开了统计技术。 第一代自然语言理解系统又可分为四种类型： （1）特殊格式系统 早期的自然语言理解系统大多数是特殊格式系统，根据人机对话内容的特点，采用特殊的格式来进行人机对话。1963年，林德赛（R.Lindsay）在美国卡内基技术学院用IPL－V表处理语言设计了SAD－SAM系统，就采用了特殊格式来进行关于亲属关系方面的人机对话，系统内建立了一个关于亲属关系的数据库，可接收关于亲属关系方面的问题的英语句子提问，用英语作出回答。1968年，波布洛（D.Bobrow）在美国麻省理工学院设计了STUDENT系统，这个系统把高中代数应用题中的英语句子归纳为一些基本模式，由计算机来理解这些应用题中的英语句子，列出方程求解，并给出答案。六十年代初期，格林（B.Green）在美国林肯实验室建立了BASEBALL系统，也使用IPL－V表处理语言，系统的数据库中存贮了关于美国1959年联邦棒球赛得分记录的数据，可回答有关棒球赛的一些问题。该系统的句法分析能力较差，输入句子十分简单，没有连接词，也没有比较级形式的形容词和副词，主要靠一部机器词典来进行单词的识别，使用了14个词类范畴，所有的问题都采用一种特殊的规范表达式回答。 （2）以文本为基础的系统 某些研究者不满意在特殊格式系统中的种种格式限制，因为就一个专门领域来说，最方便的还是使用不受特殊格式结构限制的系统来进行人机对话，这就出现了以文本为基础的系统，1966年西蒙（R.F.Simmons）、布尔格（J.F. Burger）和龙格（R.E. Long）设计的PROTOSYNTHEX－I系统，就是以文本信息的存贮和检索方式工作的。 （3）有限逻辑系统 有限逻辑系统进一步改进了以文本为基础的系统。在这种系统中，自然语言的句子以某种更加形式化的记号来替代，这些记号自成一个有限逻辑系统，可以进行某些推理。1968年，拉菲尔（B.Raphael）在美国麻省理工学院用LI SP语言建立了SIR系统，针对英语提出了24个匹配模式，把输入的英语句子与这些模式相匹配，从而识别输入句子的结构，在从存贮知识的数据库到回答问题的过程中，可以处理人们对话中常用的一些概念，如集合的包含关系、空间关系等等，并可进行简单逻辑推理，机器并能在对话中进行学习，记住已学过的知识，从事一些初步的智能活动。1965年，斯莱格勒（J.R. Slagle）建立了DEDUCOM系统，可在情报检索中进行演绎推理。1966年，桑普逊（F.B.Thompson）建立了DEACON系统，通过英语来管理一个虚构的军用数据库，设计中使用了环结构和近似英语的概念来进行推理。1968年，凯罗格（C.Kellog）在IBM360/67计算机上，建]]></description>
			<content:encoded><![CDATA[<p>摘自互联网&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;</p>
<p>搜索引擎 自然语言理解技术及其应用探讨(上) <br /><span><span>（　2001年11月14日 15:03）</span></span></p>
<p style="TEXT-ALIGN: left"><span class="content">随着社会的日益信息化，人们越来越强烈地希望用自然语言同计算机交流。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的课题。从计算机科学特别是从人工智能的观点看，自然语言理解的任务是建立一种计算机模型，这种计算机模型能够给出象人那样理解、分析并回答自然语言（即人们日常使用的各种通俗语言）的结果。 </p>
<p>现在的计算机的智能还远远没有达到能够象人一样理解自然语言的水平，而且在可预见的将来也达不到这样的水平。因此，关于计算机对自然语言的理解一般是从实用的角度进行评判的。如果计算机实现了人机会话，或机器翻译，或自动文摘等语言信息处理功能，则认为计算机具备了自然语言理解的能力。 </p>
<p><strong>第一部分 了解自然语言理解技术</strong> <br />自然语言处理就是研究如何能让计算机理解并生成人们日常所使用的(如汉语、英语)语言，使得计算机懂得自然语言的含义，并对人给计算机提出的问题，通过对话的方式，用自然语言进行回答。目的在于建立起一种人与机器之间的密切而友好的关系，使之能进行高度的信息传递与认知活动。自然语言理解系统可以用作专家系统、知识工程、情报检索、办公室自动化的自然语言人机接口，有很大的实用价值。 </p>
<p>自然语言处理研究在电子计算机问世之初就开始了，并于 50年代初开展了机器翻译试验。当时的研究方法还不能称作带有&#8221;智能&#8221;。到了60年代乔姆斯基的转换生成语法得到广泛的认可，生成语法的核心是短语结构规则，分析句子结构的过程就是利用规则自顶向下或自底向上的句法树生成过程。 </p>
<p>由于认识到生成语法缺少表示语义知识的手段，在70年代随着认知科学的兴盛，研究者又相继提出了语义网络、CD理论、格框架等语义表示理论。这些语法和语义理论经过各自的发展，逐渐开始趋于相互结合。到80年代一批新的语法理论脱颖而出，具有代表性的有词汇功能语法(LFG)、功能合一语法(FUG)和广义短语结构语法(GPSG) 等。 </p>
<p>这些基于规则的分析方法可以称之为自然语言处理中的&#8221;理性主义&#8221;。现有的手段虽然基本上掌握了单个句子的分析技术，但是还很难覆盖全面的语言现象，特别是对于整个段落或篇章的理解还无从下手。 </p>
<p>与&#8221;理性主义&#8221;相对的是&#8221;经验主义&#8221;的研究思路，主要是指针对大规模语料库的研究。语料库是大量文本的集合。计算机出现后，语料可以被方便地存贮起来，利用计算机查找也很容易。随着电子出版物的出现，采集语料也不再成为困难。最早于60年代编制的Brown和LOB两个计算机语料库，分别具有100万词次的规模。进入90 年代可以轻易列举出的语料库有几十个之多，象DCI、ECI、ICAME、BNC、LDC、 CLR等，其规模最高达到109数量级。 </p>
<p>对语料库的研究分成3个方面：工具软件的开发、语料库的标注、基于语料库的语言分析方法。采集到以后未经处理的生语料不能直接提供有关语言的各种知识，只有通过词法、句法、语义等多层次的加工才能使知识获取成为可能。加工的方式就是在语料中标注各种记号，标注的内容包括每个词的词性、语义项、短语结构、句型和句间关系等。随着标注程度的加深语料库逐渐熟化，成为一个分布的、统计意义上的知识源。利用这个知识源可以进行许多语言分析工作，如根据从已标注语料中总结出的频度规律可以给新文本逐词标注词性，划分句子成分等。 </p>
<p>语料库提供的知识是用统计强度表示的，而不是确定性的，随着规模的扩大，旨在覆盖全面的语言现象。但是对于语言中基本的确定性的规则仍然用统计强度的大小去判断，这与人们的常识相违背。这种&#8221;经验主义&#8221;研究中的不足要靠&#8221;理性主义&#8221; 的方法来弥补。两类方法的融合也正是当前自然语言处理发展的趋势。 </p>
<p><strong>自然语言理解系统的发展阶段</strong> <br />自然语言理解系统的发展可以分为第一代系统和第二代系统两个阶段。第一代系统建立在对词类和词序分析的基础之上，分析中经常使用统计方法；第二代系统则开始引进语义甚至语用和语境的因素，几乎完全抛开了统计技术。 </p>
<p>第一代自然语言理解系统又可分为四种类型： </p>
<p><span style="COLOR: #0000ff">（1）特殊格式系统</span> <br />早期的自然语言理解系统大多数是特殊格式系统，根据人机对话内容的特点，采用特殊的格式来进行人机对话。1963年，林德赛（R.Lindsay）在美国卡内基技术学院用IPL－V表处理语言设计了SAD－SAM系统，就采用了特殊格式来进行关于亲属关系方面的人机对话，系统内建立了一个关于亲属关系的数据库，可接收关于亲属关系方面的问题的英语句子提问，用英语作出回答。1968年，波布洛（D.Bobrow）在美国麻省理工学院设计了STUDENT系统，这个系统把高中代数应用题中的英语句子归纳为一些基本模式，由计算机来理解这些应用题中的英语句子，列出方程求解，并给出答案。六十年代初期，格林（B.Green）在美国林肯实验室建立了BASEBALL系统，也使用IPL－V表处理语言，系统的数据库中存贮了关于美国1959年联邦棒球赛得分记录的数据，可回答有关棒球赛的一些问题。该系统的句法分析能力较差，输入句子十分简单，没有连接词，也没有比较级形式的形容词和副词，主要靠一部机器词典来进行单词的识别，使用了14个词类范畴，所有的问题都采用一种特殊的规范表达式回答。</span></p>
<p><span class="content"><span style="COLOR: #0000ff">（2）以文本为基础的系统</span> <br />某些研究者不满意在特殊格式系统中的种种格式限制，因为就一个专门领域来说，最方便的还是使用不受特殊格式结构限制的系统来进行人机对话，这就出现了以文本为基础的系统，1966年西蒙（R.F.Simmons）、布尔格（J.F. Burger）和龙格（R.E. Long）设计的PROTOSYNTHEX－I系统，就是以文本信息的存贮和检索方式工作的。</span></p>
<p><span class="content"><span style="COLOR: #0000ff">（3）有限逻辑系统</span> <br />有限逻辑系统进一步改进了以文本为基础的系统。在这种系统中，自然语言的句子以某种更加形式化的记号来替代，这些记号自成一个有限逻辑系统，可以进行某些推理。1968年，拉菲尔（B.Raphael）在美国麻省理工学院用LI SP语言建立了SIR系统，针对英语提出了24个匹配模式，把输入的英语句子与这些模式相匹配，从而识别输入句子的结构，在从存贮知识的数据库到回答问题的过程中，可以处理人们对话中常用的一些概念，如集合的包含关系、空间关系等等，并可进行简单逻辑推理，机器并能在对话中进行学习，记住已学过的知识，从事一些初步的智能活动。1965年，斯莱格勒（J.R. Slagle）建立了DEDUCOM系统，可在情报检索中进行演绎推理。1966年，桑普逊（F.B.Thompson）建立了DEACON系统，通过英语来管理一个虚构的军用数据库，设计中使用了环结构和近似英语的概念来进行推理。1968年，凯罗格（C.Kellog）在IBM360/67计算机上，建</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/06/19945.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>没事叽歪一下，感觉还真不错</title>
		<link>http://blog.zye.me/2011/05/5955.html</link>
		<comments>http://blog.zye.me/2011/05/5955.html#comments</comments>
		<pubDate>Sun, 15 May 2011 02:27:23 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[MISC]]></category>
		<category><![CDATA[英语]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/02/5955.html</guid>
		<description><![CDATA[没事叽歪一下，感觉还真不错。知道叽歪吗？简单介绍下，也可以自己点击上面链接看。叽歪其实也是个博客，不过只能发长短的文章，140个字符，呵呵，两条手机短信，也只能发个牢骚。 让我感觉不错的，主要是其发布方式多样，不仅仅是网页上发布，手机，IM（如QQ，msn）发消息等都可以，你能有的他都能支持，连QQ的个性签名都可以直接发布上去，而且还可以把你的叽歪创口贴到别的网页，看看我博客右上方的走马灯就是，不错吧。随时随地，随便叽歪一下你身边的破事和你的心情。我现在在练英语口语和写作，所以主要把看到的好的英语句型叽歪一下，用MSN挺方便的。]]></description>
			<content:encoded><![CDATA[<p>没事叽歪一下，感觉还真不错。知道<a href="http://jiwai.de/" target="_blank">叽歪</a>吗？简单介绍下，也可以自己点击上面链接看。叽歪其实也是个博客，不过只能发长短的文章，140个字符，呵呵，两条手机短信，也只能发个牢骚。</p>
<p>让我感觉不错的，主要是其发布方式多样，不仅仅是网页上发布，手机，IM（如QQ，msn）发消息等都可以，你能有的他都能支持，连QQ的个性签名都可以直接发布上去，而且还可以把你的叽歪创口贴到别的网页，看看我博客右上方的走马灯就是，不错吧。随时随地，随便叽歪一下你身边的破事和你的心情。我现在在练英语口语和写作，所以主要把看到的好的英语句型叽歪一下，用MSN挺方便的。</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2011/05/5955.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>I.E., ETC., et al AND E.G. &#8211;Comparison, Difference</title>
		<link>http://blog.zye.me/2009/03/49978.html</link>
		<comments>http://blog.zye.me/2009/03/49978.html#comments</comments>
		<pubDate>Thu, 05 Mar 2009 17:30:32 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Canada Related]]></category>
		<category><![CDATA[English Learning]]></category>
		<category><![CDATA[English]]></category>
		<category><![CDATA[信息检索]]></category>
		<category><![CDATA[英语]]></category>

		<guid isPermaLink="false">http://blog.so8848.com/2009/03/49978.html</guid>
		<description><![CDATA[是不是也我我一样为这几个拉丁缩写用法而烦，看看下面解释和比较分析，就知道它们有什么不同区别，  i.e. - that is (stands for id est from Latin). You can also use it to substitute, “in other words.” etc. - and so on, and the rest (abbreviation for etcetera). e.g. - for instance, for example (abbreviation for exempli gratia in Latin). Remember e.g. by thinking of it as “example given” and then follow it with a <a href='http://blog.zye.me/2009/03/49978.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p><span style="font-size: 13px" class="Apple-style-span">是不是也我我一样为这几个拉丁缩写用法而烦，看看下面解释和比较分析，就知道它们有什么不同区别， </span></p>
<p><font size="2"><span class="Apple-style-span" style="color: #ff0000"><span class="Apple-style-span" style="font-weight: bold">i.e.</span></span><br />
- that is (stands for <em>id<br />
est</em> from Latin). You can also<br />
use it to substitute, “in other words.”</font></p>
<p><font size="2"><span class="Apple-style-span" style="color: #ff0000"><span class="Apple-style-span" style="font-weight: bold">etc.</span></span><br />
- and so on, and the rest (abbreviation for etcetera).</font></p>
<p><font size="2"><span class="Apple-style-span" style="font-weight: bold"><span class="Apple-style-span" style="color: #ff0000">e.g.</span></span><br />
- for instance, for example (abbreviation for <em>exempli gratia</em> in Latin). Remember e.g. by thinking of<br />
it as “example given” and then follow it with a few examples. e.g. apples,<br />
oranges, bananas.</font></p>
<p><font size="2"><span class="Apple-style-span" style="font-family: verdana; line-height: normal; -webkit-border-horizontal-spacing: 1px; -webkit-border-vertical-spacing: 1px"><span class="Apple-style-span" style="font-weight: bold"><span class="Apple-style-span" style="color: #ff0000">et al </span></span>means roughly &#8220;and others&#8221;. It is written at the end of a list of names to indicate that others are related to the same subject. In legal terms, it probalby means that the one who signs is not the only responsible for whatever he&#8217;s signing, but there are others with the same/related responsibility.</span><span class="Apple-style-span" style="font-family: verdana; line-height: normal; -webkit-border-horizontal-spacing: 1px; -webkit-border-vertical-spacing: 1px">&#8220;The investigation was carried out by Estell Lynch, James K, John Doe et al.&#8221; means John Doe and some others (could be partners, collaborators, relatives, heirs, etc.).</span>  </p>
<p><span style="font-weight: bold" class="Apple-style-span">Rule #1:</span> Don’t use e.g. and<br />
etc. together because you wouldn’t use for instance (meaning as an example) and<br />
then use and so on (meaning others); both phrases imply the names you named were<br />
just a part of a group. For example, “e.g. apple, oranges, etc.”</p>
<p><span class="Apple-style-span" style="font-family: verdana; line-height: normal; -webkit-border-horizontal-spacing: 1px; -webkit-border-vertical-spacing: 1px"><br />
</span>Technically,<br />
you can probably use “i.e. apples, oranges, etc.” since it’s says “that is,<br />
apples, oranges, and so on.”</p>
<p><span style="font-weight: bold" class="Apple-style-span">Rule#2: </span>Use periods as they’re abbreviations.</p>
<p>Easier<br />
workaround: instead of using the abbreviation, use “for example” or “that is”<br />
and you can rarely do wrong.</p>
<p>Since <em>et</em> means <em>and</em>, avoid using <em>and</em> with <em>etc</em>. <em>ect</em> is not the same thing.</p>
<p> </p>
<p></font> </p>
]]></content:encoded>
			<wfw:commentRss>http://blog.zye.me/2009/03/49978.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

