按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
西湖边上“秀”对联
我们的对联非常荣幸地在三次二十一世纪计算大会上由我进行了演示。第一次2005年在杭州,第二次2006年在清华大学,第三次2007年在南京。据我所知,在所有的二十一世纪计算大会上,微软对联系统是唯一一个三次演示的系统。确实令人骄傲。微软对联还被认为是基于数据和基于实施(deployment driven research)的研究战略的经典。我这里再给大家讲一讲在演示时发生的故事。
第一次是2005年,在杭州大会堂。我们住在西湖苏堤春晓旁边的香格里拉饭店。沈向洋要求我演示微软对联。我心里非常焦急,因为当时的系统非常脆弱,基本上还不敢随便让别人试,只能演示自己试验过的例子。可是到了杭州,一定要有几个跟杭州有关的例子。我吃过晚饭,就心思沉重地在西湖边上漫步。大有唐代诗人贾岛月下苦思 “僧敲月下门”和”僧推月下门”孰好的架势。我不经意地抬头看到路边暮色里苏堤春晓的指示牌,知道到了苏堤春晓。于是马上想到苏堤春晓,配上个“秀”字不正好是一个上联吗?马上回旅馆打开系统试验,还真是对出来个“平湖秋月明、平湖秋月新、平湖秋月寒、平湖秋月香,还有曲院风荷清、曲院风荷新、曲院风荷美之类的。接着又发现了几个另外跟西湖有关的不错的例子。第二天在沈向洋的讲座里,他邀请我上台演示微软对联。这是该系统第一次在公众面前演示 。第二天,很多报纸就相继报道了微软对联系统,其中杭州《东方早报》的记者刘文钊的报道写得绕有趣味 。
微软对联背后的故事 周明(3)
我印象最深的是在2007年南京举行的二十一世纪的计算大会。这是微软对联第三次在这样的大会上演示。沈向洋在演讲时,要求我演示微软对联 。为了入乡随俗,当时在做对联演示的时候,我想到了朱自清的一篇著名的散文《桨声灯影里的秦淮河》,于是我将“秦淮河桨声灯影”用做上联,系统马上生成了很多各具风格的下联,在随意选择了其中一条“松花江水色月光”作为其下联。接着,我们进一步选择了横批,于是一个“万民同庆”非常贴切地印入眼帘。
接着,我给系统出了一个“千江有水千江月”的上联,这里面有两个字是重复的,一个“千”,一个“江”,对联系统则巧妙地对出了“万里无云万里星”作为下联,然后以一句“纵横天下”作为横批结束。
其实这个对联是我在此之前送给沈向洋的。因为他当时即将奉调回微软总部担任全球搜索技术开发的副总裁。他是南京人,对南京怀有深厚的家乡情谊。这次他在南京的二十一世纪计算大会上的演讲,流露出回到家乡又要别离家乡的感觉,所以,我于是特意演示了这个对联,表达对他的深深的尊敬和祝福。
此外,在这次大会上,我们还展示了两个比较绝的对联:
对联一:
上联:凤凰台上凤凰游(选自李白诗)
下联:蝴蝶泉边蝴蝶梦
横批:麟趾呈祥
对联二:
上联:此木为柴山山出(拆字联)
下联:白水做泉日日昌
横批:景色怡人
快乐对联快乐心
微软对联完成之后,给我和很多人带来了许多快乐。我们在聚会时候胡诌一些上联,看看产生什么下联和横批,因此产生很多热烈的探讨。有的同事离开北京到其他地方去生活,我也会生成一个对联赠送给他。有人调侃说,这是世界上最便宜的却又是最有纪念意义的礼物了。
来自总部的印度朋友Raman Chandra,他参与马可波罗计划到微软亚洲研究院访问五个月。他的太太Koty Jane后来也来到北京。他们伉俪在北京度过了难忘的时光。
在此期间,我和我太太还有女儿星美曾经在一起有过交流,吃饭,聊天,很投机。在他们离开中国之际,我感觉恋恋不舍,于是就用微软对联把他和他太太的名字输入,对出一个横批,作为离别礼物赠送给他们。
上联:陈睿蒙
下联:简凯迪
横批:展翼鹏程
我还记得张亚勤曾欲送即将退休的微软雷德蒙研究院前院长凌大任一个礼物。他的秘书要求我写几句古雅的中文以表心意,供亚勤参考。我绞尽脑汁,写不出来。于是求助微软对联。我把凌大任名字嵌入到上联里,输入 “纵横意气凌大任”, 结果系统对出“上下春风倚青云”,横批是“锦绣江山”。
在微软深圳移动部门和微软MSN部门同事的支持下,我们的系统很快实现了手机版本。通过短信或者彩信方式可以获得下联和横批。2006年末,经理们到香港参加中文大学举行的第一届微软亚洲研究院联合实验室会议。回来之后在珠海短暂停留两日继续讨论公司业务。我因为要去探望我在深圳工作的哥哥,就又逗留了一日。李世鹏因为要去台湾做一个特邀报告,因此也逗留了数日。晚上的时候,我和李世鹏在蛇口的一家酒吧喝啤酒。酒吧在一个轮船上,坐在船上可看到一轮明月高高地挂在天际。水光澹澹,微风习习。远处的香港如同海市蜃楼一般漂浮在海月之间。李世鹏诗兴大发。出上联:远看香港朦胧灯景。他把上联发用手机发短信给对联的服务器,马上收到了系统回复的一个短信:“看看您的大作吧,上联:远看香港朦胧灯景,下联:遥望神州寂寞月光。还满意吧,回复88看更多内容。回复8+文字,重新出上联。”世鹏又出上联:“春花秋月何时了”。系统回复 “暮雨朝云去不还”。这样一唱一和,不觉夜色已深了。真有“不觉碧山暮,秋云暗几重”之境。
电脑对联成功决
我经常在想,为什么这么一个听起来有点天方夜谭的项目居然获得了如此大的成功?到底有哪些地方值得今后的工作借鉴呢?
首先我认为,得益于沈向洋的匠心独运的选题。在此之前,重庆大学陈廷槐教授曾经给我写过一封信,寻求在计算机自动生成诗词曲联领域的合作。当时为此事跟沈向洋请教过。沈向洋认为这个题目太难了,最关键的一点就是生成的诗词的意境和表达形式可能是发散的。很难说什么是对的,什么不对的,因此不能有效地评价,而能够进行自动评价是关系到系统可持续发展的关键。我们认为对联需要首先输入上联,然后输出下联。两者已经要么相对,要么相合。在形式上,上联、下联要符合平仄,字数、词数要相当,而且上下联文字使用的规律要一致。譬如上联出现了叠字则下联一定要出现叠字,上联出现了叠音则下联一定要出现叠音。因此在形式上也有衡量的标准。而且,从机器学习的角度来讲,输入是上联和输出则是下联,结构非常清晰,便于学习。
我们也讨论了项目的重要性。对联的研究,看似小题目,却牵扯大问题。首先,依靠互联网和人工智能技术帮助振兴和普及数千年中华文化,于国于民都是大事。在学术研究上,因为涉及到自然语言处理,人工智能、机器翻译的重要算法的研究,对推动以上学科领域的发展也大有价值。
第二,我认为本项目的成功,得益于微软亚洲研究院的创新文化。微软研究院历来鼓励创新,不怕失败。因此,这样一个大胆的项目得到了沈向洋院长和继任的洪小文院长的大力支持,
第三,这个项目涉及到自然语言处理、网络挖掘、网络服务、界面设计。需要上述种种领域的人才通力配合。微软研究院各个方面的人才济济,而且大家配合默契。良好的组织管理和团队精神,保证了这个项目的有条不紊地顺利进行。同时这个系统也是许多来自不同学校的实习同学一起努力的结果。在此,特别向参加本项目的所有同事和同学表示诚挚的谢意。
许多人问我下一步的计划。我在想,利用微软对联技术,应该可以试一试绝句和律诗的自动生成了。但愿能够做出来,把中华文明发扬光大。
作者介绍:
周明,从2001年至今,担任微软亚洲研究院自然语言处理组主任。从事自然语言处理有23年历史。在1999年加入微软之前,曾任清华大学计算机系自然语言处理研究组的负责人。他是中国第一个中英机器翻译系统CEMT…1的研制者,在日本连续10年 (1998…2008) 市占率超60%的中—日、日—中机器翻译产品 “J…Beijing”的发明人。他领导的自然语言组在中文分词、跨语言检索,机器翻译等国际竞争中均获得第一名的佳绩。目前他