发信人: FDUCat(FDUCat), 信区: SJTUNews
标 题: 复旦牛人创立英文注音系统 或成为美国万世师表
发信站: 饮水思源 (2013年12月31日08:47:49 星期二)

(2013 年 12 月 25 日复旦校友供稿)近日,笔者欣闻好友兼复旦同学 Yao 开发的一套
“英文注音”软件在国际上屡获好评,甚至有望彻底改变美国儿童的识字方式,成为美国
的“万世师表”,笔者深感这真是我旦的光荣,复旦成为世界一流大学近在咫尺了。以下
是笔者对 Yao 的专访。

导读
一、看到英文单词即知道发音,托福听力口语不再愁
二、媒体报道,专家好评,参加美国国家教育博览会
三、研究起步自复旦时光,复旦人的自豪感鼓舞探索
四、常州蕴育五位拼音设计者,江南文明激发自豪感
五、中国人或成为美国万世师表?当是全中国的光荣
六、更打造外语学习的战略武器,志在统一人类语言

一、看到英文单词即知道发音,托福听力口语不再愁

Speak, break, bread, idea, reality, create, ocean. 这些看似杂乱无章的单词有什么
共同点?聪明的你可能很快会发现,它们都有“ea”,而且“ea”的发音各不相同。这反
映了英语的一个特点:单词拼写和发音并不完全对应,不像汉语拼音那样,看到拼写就一
定知道发音,听到发音也一定能知道拼写。

英语的这个问题给两类人带来了不便。一是把英语当作外语来学习的人,比如中国学生,
这些人接触得比较多的是单词的拼写,因此他们读、写单词可能问题不大,但一遇到英语
听力和口语考试,或者看原声英语电影时,可能就远不如读写时流利了。另一类人是英语
国家学识字的儿童,他们的情况正好相反:他们已经能听、说流利的英语口语,但同样由
于上面提到的问题,他们看到书本上的英文单词时并不能立即知道这是口语中的哪个词,
他们在写作时也不能无师自通地“我手写我口”。

而 Yao 同学开发的“英文注音”软件,则正好能同时解决以上这两种人遇到的问题。该软
件名为 PIE(全称 Phonetically Intuitive English,即“能直观反映出发音的英语”)
,是一款免费、开放源代码的 Chrome 浏览器插件,可以从 Chrome 网上应用店(Chrome
Web Store)免费安装(搜索关键字为 pie international)。另外也可以从 http://code.google.com/p/pie-transformer/downloads/detail?name=pie_international.crx
下载。

screen.width - 200){this.width = screen.width - 200}">


从图中可以看到,该软件能自动向网页上的英文单词添加类似汉语拼音声调记号的小记号
。这些小记号的作用是把单词发音明确化,例如在字母下方画一点表示单词重音在该处,
而在元音字母上方画一横表示该字母发字母本身的音(如 take 的 a)。该软件还提供了
三种注音模式——完整模式、简化模式和超级简化模式,来适应不同水平的学习者的需要
,例如图中所示的其实是“简化模式”,这种模式会省略常见单词(如 of)和常见词缀(
如 -tion)的注音。更可喜的是,除了自动为全文注音,Yao 还开发了一个配套软件来显
示鼠标所指单词的意思(图中黑框处),这样就为浏览英文网页的用户同时提供了发音和
释义的协助。

而要懂得这套注音记号,用户只需学会一张一页纸的“PIE 注音方案”(下图为该方案的
缩略图)。Yao 坦言,虽然 PIE 的创意是自己独立想到的,但之前已经有类似的方案,但
他认为这些方案的设计不够合理,再加上缺少方便的全文注音系统,所以他设计了自己的
PIE 方案和注音软件。PIE 方案充分借用了国际音标符号,即使某些符号不能借用国际音
标,也都设计了合理的记忆方法,因此整套方案的学习成本是很小的。

screen.width - 200){this.width = screen.width - 200}">


更令人欣喜的是,PIE 不仅能促进单词发音的学习,而且还能间接促进单词拼写的学习。
Yao 解释道:“根据我多年的研究,单词拼写的记忆只有两种真正有效的方法:‘通过发
音来记忆’和‘通过词根 + 联想来记忆’,其中又以‘通过发音来记忆’更为本质。比如
说记忆 dictionary 这个词,如果你一个字母一个字母去记,那其实就是在记一串 10 个
音节的序列:/diː/ /aɪ/ /siː/ /tiː/ /aɪ/ /əʊ
/ /ɛn/ /eɪ/ /ɑː/ /waɪ/,记忆难度相当于记一串 10 位数字的电
话号码;而如果你先记 dictionary 的发音,就只要记一串 4 个音节的序列:/dɪk
/ /ʃən/ /nə/ /ri/,记忆难度大大降低,然后根据这个发音再去记具体
的拼写就容易多了。再比如一个中国家长教小孩说话,在马路边看到一辆汽车,他只需用
‘qì chē’两个音节即可教小孩这个词,他绝不会化简为繁地用‘Q - I - C - H - E’
来教,这样小孩也必然一头雾水。再者,英语母语者学英语单词也是先学发音(口语),
后学拼写(书面语),这也说明发音是学习拼写的最有效、最自然的方法。”

除了在浏览器中实时提供单词发音和释义,PIE 也提供了两个工具箱,来制作两种崭新类
型的图书。对于英语学习者(如中国学生),可以制作中英对照、PIE 式注音的文学名著
,如下图所示《爱丽丝漫游奇境》的开篇(中文译者赵元任),为读者提供音、形、义俱
全的英语学习体验:

screen.width - 200){this.width = screen.width - 200}">


而对于英语国家的识字儿童,可以制作纯英文加 PIE 式注音的识字读物,如下图所示《爱
丽丝漫游奇境》的开篇:

screen.width - 200){this.width = screen.width - 200}">


二、媒体报道,专家好评,参加美国国家教育博览会

PIE 刚一推出即被美国最大的电脑杂志 PCWorld 以及其他一系列各国媒体报道:

* “PIE: A Chrome Extension That Can Help With Reading and Pronunciation”——
PCWorld(英语)
* “PIE: Google Chrome me metodë të re për leximin dhe shqiptim
in e anglishtes”——PCWorld(阿尔巴尼亚语)
* “Phonetically Intuitive English (PIE)”——IDG(保加利亚语)
* “Phonetically Intuitive English, una extensión de Chrome para mejorar nues
tro inglés”——Bitelia(西班牙语)
* “Izzy as Pie”——Speculative Grammarian(讽刺语言学杂志,英语)
* “Phonetically Intuitive English, extensión de Chrome para mejorar tu inglé
s”——AM PM(西班牙语)
* “Phonetically Intuitive English, una extensió de Chrome per millorar el no
stre anglès”——WikiNoticia(西班牙语)
* “Aprender pronunciación del inglés de manera intuitiva”——Woratek(西班
牙语)
* “PIE: Chrome Extension Helps in Reading and Pronunciation”——Software Hea
dline(英语)
* “PIE: Chrome ekstenzija za lakše čitanje i izgovor riječi”—
—Prva Vijest(克罗地亚语)
* “PIE: 用辨音符号给英语单词注音”——Solidot(汉语)
* “Phonetically Intuitive English”——Wikipedia(英语)

PIE 也得到了来自机构、专家和用户的好评:

* 美国教育部中小学教育司对 PIE 发表了亲切鼓励,认为 PIE 是“创新”的识字工具,
美国教育部鼓励一切有助于提高学生水平的工具,但教育部无权决定各学校的具体教材和
教法,因此建议将 PIE 直接发给各学区(相当于市教育局)供它们考虑是否采用。
* 美国教育协会(NEA)举办的美国国家教育博览会 2013(暨美国教育协会第 150 届年会
)主动邀请 PIE 参展。PIE 应邀参展并得到来自全美的教育官员的一致好评。
* 美国第 7 大的学区 Broward County Public Schools(学生人数 262,813,2008 年数
据)正式签发了一张教材合格证,批准 PIE 可以提供给该学区的各学校用于教学实践。
* 美国第 9 大的学区 Hillsborough County Public Schools(学生人数 193,517,2008
年数据)的语文组组长表示该学区将讨论把 PIE 整合到教学活动中。
* 美国识字教育界和英语作为第二语言教育界的多位专家(Caitlin McMunn Dooley、Don
na Brian、Paul Rogers、Christine Haverington、Paul New)都对 PIE 作出了肯定的评
论。
* 职业社交网络 LinkedIn 上的相关论坛有更多专家对 PIE 的宣告按下了“赞”。200 多
位 LinkedIn 上的美国识字教师成为 PIE(识字版)的用户。
* 多位用户也给 PIE 留下了肯定的评论。

欲了解各国媒体报道和各方好评的详情,请查看 PIE 软件中的“Media Coverage and Po
sitive Feedback”。

三、研究起步自复旦时光,复旦人的自豪感鼓舞探索

和很多人一样,Yao 最初是因为喜欢编小游戏而进一步学习了编程,更参加过澳门和天津
举行的两届全国计算机决赛,并以全国第 21 名的成绩保送复旦计算机系。同时,他在高
中一年级就编了个小共享软件放在网上卖,顾客大多是美国人,取得了对一个高中生而言
不错的经济收入。在已经被保送的高三阶段,Yao 认为要有更大的作为就必须做一些更根
本的创新,而且有感于良好的英语能力对他的共享软件小生意帮助很大,他的研究兴趣定
位在计算机如何辅助人更好地学外语、用外语上。

“复旦给我最大的帮助倒不在于它教了我某一门课,而在于它自由悠闲的生活气氛和作为
复旦人的无比自豪感,”Yao 说。

“上海滩有自由的洋场遗风,复旦更是‘自由而无用’的伊甸园,‘上海宝贝’的摇篮。
我在上海的研究生活过得很自在,经常在网上看电影,计算机水平没有长进,人文素质倒
因此丰富了不少。南区(学生生活区)也是我常去的地方,在那里我无拘无束地吃喝,游
荡,思考。现在回想起来,这真是张爱玲一般的日子。复旦大学包罗万象,复旦学生物华
天宝,郎才女貌,无不给我留下了深刻的印象。”

“复旦给我的另一个礼物是作为复旦人的自豪感和认同感,这尤其能激发人立大志、做大
事。就以同为复旦计算机系的学弟郭泽宇为例吧,2009 年初他爆出一个大新闻,证明了一
个数学猜想,叫‘最小曼哈顿网络问题’。郭泽宇也是通过计算机竞赛保送复旦,他的这
个研究是在复旦本科生学术研究资助计划“莙政学者”的框架下进行的。对于他的这个研
究申请,某院士的批语是难度太大,建议找个难度低的问题研究。然而他仍然自告奋勇坚
持了这个研究,最后竟取得了成功。这就是复旦人的自豪感使人立大志、做大事的很好例
子嘛。”Yao 分析说,“尤其是在探索新知识、创造新事物上,课本上的旧知识、博学的
导师能提供的参考并不是一切,此时起关键作用的正是‘复旦人’的自豪感和自信心带来
的探索未知的志气和勇气。”

四、常州蕴育五位拼音设计者,江南文明激发自豪感

Yao 祖籍上海,在常州长大。Yao 说:“常州是吴语圈最西边的城市,它虽然不是苏州、
无锡那样全国闻名的旅游胜地,却也是个人杰地灵的地方,明清两代状元、进士最多的城
市第一名是苏州,第二名是杭州,第三名便是常州。而且,在拼音设计这个领域,常州似
乎得天独厚,已经出过四位拼音设计者。”

吴稚晖(注音符号,民国的法定拼音方案)
赵元任(国语罗马字,民国的第二套法定拼音方案)
瞿秋白(拉丁化新文字,北方苏区曾经用过的法定拼音方案)
周有光(汉语拼音,现在华语地区通用、国际公认的拼音方案)

如今,为世界普通话——英语设计出注音系统的 Yao 害羞地说:“真是沾了常州的光,一
不小心成了常州第五个,在这些伟大的前辈面前我还是个小学生。”

“其实,何只是常州,整个锦绣江南自古都是那么富贵风流,山明水秀,才子佳人,人杰
地灵。2013 年全国经济百强县前 10 名,江浙占 8 个。明清状元、两院院士、华人诺奖
得主,江浙都要占起码过半。美国有一个“总统自由奖章”(Presidential Medal of Fr
eedom),是奖给各行各业有杰出成就人士的最高荣誉,至今只有三个华人获得,他们都来
自江南:贝聿铭(建筑师,苏州人),马友友(大提琴家,祖籍浙江宁波),王安(电脑
科学家和企业家,昆山人,生于上海)。”Yao 说,“我玩过苏州和无锡很多地方,特别
喜欢从不同地点观看太湖,它的博大、恬静、明媚能给人带来内心的宁静。苏州的小调如
《大九连环》《小九连环》《紫竹调》非常优雅,一口全国最甜美方言的苏州姑娘更是自
古便享有‘吴娃’的美誉,被白居易等文官诗人一致认为是女中极品。上海徐汇区原法租
界林立的近现代名人故居,更印证了那歌里唱的:‘绝色,超凡,只会出现在上海滩……
’”

“作为江南人的自豪感、认同感和归属感对事业很有帮助。事业上顺利时,尽可以到世界
上建功立业;事业上一时失意时,江南的归属感则是一张安全网,让你可以躲到苏州的小
桥流水去过过精致慢生活,或者到乾隆感叹‘惟惠山幽雅闲静’的无锡惠山散散心。得意
时,可以去江南;失意时,也可以去江南。”

五、中国人或成为美国万世师表?当是全中国的光荣

Yao 说:“我们前面说过,PIE 这个东西不光对学英语的人有用,对英语国家儿童学识字
也有用。目前美国教儿童识字用的是所谓“拼读法”(phonics),就是教一些发音规则,
比如我们熟知的‘元辅e’。但我们前面也讲过,英语也有很多时候是没有发音规律的,比
如 speak, break, bread, idea, reality, create, ocean 这些词中的 ea。当没有规律
可循时,其实像 PIE 这样直接把发音注在单词上,或者叫‘注音法’,才是最科学的。中
国教儿童识汉字其实就是用注音法——把拼音注在每个汉字上方。中国 50 多年来的汉语
拼音识字,再加上民国几十年的注音字母识字,都证明了注音法的有效性。美国目前没有
注音法,他们儿童遇到没有明确发音规律的单词时只能靠猜。因此,向美国等英语国家引
进注音法识字,才是历史发展的正确方向。”

“PIE 开发出来以后我就联系过美国教育部。没想到美国并没有毛主席那样的人物能一声
令下就全国采用拼音识字,美国教育部根本没有实权。我也联系过 50 个州的教育厅,情
况也是如此。真正有权决定学校用什么教材、教法的是学区这一级(相当于市教育局),
他们通常定期举行教材采购的招标,从图书市场上选择价廉物美的教材,采购给本学区的
所有学校使用。因此美国教育归根结底是市场驱动的,要引入一种新的教材教法就必须先
在美国的图书市场出版你的教材(如前面提到的 PIE 式注音的儿童识字读本),然后各学
区作为大客户才可能考虑采购。所以 PIE 这个项目的下一步就是尝试出版 PIE 式识字读
本。当然,对于各国的英语学习市场,也可以出版 PIE 式双语读本。”

“美国有个历史人物叫韦伯斯特(Noah Webster)。我们现在知道他最多的是他编过一本
《韦伯斯特词典》,开创了美式英语词典的先河,至今仍是美国最大牌的词典。他的另一
项不那么广为人知的工作是编写过识字课本,‘教会了整整五代美国人如何读写’。因为
他对美国基础教育的这些贡献呢,美国人很敬佩他,英文维基百科关于 Noah Webster 的
条目里有一张插图,是一张 1886 年的海报,称他为‘共和国的校长’(Schoolmaster o
f the Republic),就跟咱们中国人称孔子为‘万世师表’一个意思。假如 PIE 真的把美
国识字教育带进‘注音时代’,中国人当他们美国的下一任‘共和国校长’也不是不可能
嘛。”

笔者汗颜。中国人民勤劳智慧,改革开放蒸蒸日上,如今中国人又有望做美国人民的万世
师表,中华民族更加扬眉吐气于世界。

六、更打造外语学习的战略武器,志在统一人类语言

笔者更欣闻这位复旦同学另有一个更为重大的研究成果,也是关于计算机辅助外语学习的


Yao 说:“前面我们说过,PIE 这个东西对于英语学习者有两个用处:教单词发音,和间
接促进单词拼写的学习。如果把一个外语单词看做是一个敌人个体,那么 PIE 就是消灭这
个敌人个体的‘战术武器’。我的另一个研究项目叫 ATLAS,是外语学习的‘战略武器’
,它解决的不是具体怎么记忆一个单词的问题,而是一个更宏观的问题:如何主动创造外
语学习的机会。或者说,如何制造与敌军接触的机会。如果连敌军都看不到,那么就谈不
上用 PIE 这样的战术武器去消灭敌军的个体了。”

“比如一个中国学生,除了上英语课,还有生活中遇到的零星的英文商标,他在生活中其
实没有真正接触、使用英语的机会。那么怎么主动创造机会呢?有一个思想,就是当一个
人在浏览一篇母语写成的网页时,电脑顺势在这个网页里插入一块“广告”,广告内容是
一小段外语教学内容。比如,用户在看一篇中文写成的篮球新闻,电脑发现这个网页出现
了“篮球”这个中文词,或者因为这个网页的话题总体上是篮球,于是电脑朝这网页里插
入一个“广告栏”,里面说:‘篮球是 basketball。’”

“这个总体思想是对的,因为人在阅读母语网页时,处于一种非常放松的状态,特别是看
网络文学这种闲书时;那么在这种放松的时候,偶尔插入一小段外语学习内容,就比较容
易被人接受。反之,如果一上来就让一个词汇量不多的人去看全英文的网页,他必然会反
感。也就是说,接触英语的量,既不能一上来就是 100%,也不能永远都是 0%,而应该在
一个舒适的低百分比,就好像把一粒苦药片放在一大口糖水里喝下去,比较容易被人接受
。”

“近年出现了一些浏览器插件,也反映了这个思想,但它们的实现方法不对。它们在母语
网页里挑出某些母语单词,调用 Google Translate 这样的机器翻译服务,把这些单词翻
译成外语,然后把翻译结果去替换网页上原来的母语单词。这样做的问题就在于机器翻译
是不能保证正确的。比如母语网页上原来有一句话:“他是一个好同志。”计算机如果决
定教“同志”的英语,是教 comrade 呢,还是 homosexual 呢?机器翻译给出的结果是不
确定的。”

“既然用机器翻译来实现这种系统是不恰当的,那么有什么别的实现思路呢?我介绍一个
更好的思路:事先准备大量的中英双语例句(这种数据的获取比较容易,比如电影、美剧
的多语言字幕文件就包含每一句对白的英文原句和中文译句),然后根据母语网页上出现
的某个母语单词,找一句包含该母语单词的双语例句投放到网页里作为外语教学内容。比
如母语网页上出现“学生”这个词,电脑可能投放这样一个双语例句:

他是一个好学生。
He is a good student.

这个基于双语例句的思路还有一个潜在的优点,就是它可以根据网页上下文和例句上下文
里出现的其它单词,来评估一条双语例句跟网页话题的相关性。比如,如果网页上有这么
一句话:“列宁同志是伟大领袖。”而“同志”这个词本质上是多义词,所以我们最好是
在双语例句库里找这样一条例句——它不光包含“同志”、而且包含“列宁”、“伟大”
或者“领袖”这样的网页上下文单词,因为这样表明这条例句在“同志”的词义上更加符
合网页上下文。”

“总而言之,ATLAS 就是当用户在浏览一篇母语网页时,计算机像投放 AdSense 广告一样
,投放一则跟该网页内容相关的双语例句来教外语。我认为这是一种划时代的外语学习系
统模型;它跟统计式机器翻译在理论上堪称一对姐妹花,不同之处在于统计式机器翻译是
用大量双语例句来教计算机做翻译,而 ATLAS 是用大量双语例句来教人做翻译(换言之就
是教人学外语)。ATLAS 是我给这个方法起的名字,全称 Active Target Language Acqu
isition System(主动目标语言习取系统)。“主动”是指这种系统能主动向母语网页插
入外语学习内容,“目标语言”即要学的外语,“语言习取”是“语言学习”的比较专业
的说法。另外,ATLAS 的思想甚至还跟 Noam Chomsky、Stephen Krashen(当代二语习得
理论创立者)和 Robbins Burling(1960 年代首创“在母语故事中渐渐掺入外语内容来教
外语”)的思想相一致。”

Yao 说:“ATLAS 目前只是个创意。我曾经向国际计算语言学界公布过这个创意,也告知
过微软、Google 和 IBM 这三家运作统计式机器翻译系统的公司。也欢迎感兴趣的社会各
界一起来推动这种下一代外语学习方法早日成为现实。”

笔者不禁想到了伟大的毛主席。当年他通过汉语拼音让全国人民(特别是南方各省)学会
了一种统一的汉语口语——普通话,又通过简化汉字大大提高了识字率,使全国真正有了
一种统一的汉语书面语——简体字。而 Yao 同学的 PIE 和 ATLAS,令笔者觉得全人类真
正有一种统一的语言也是可以做到的了,这真是人类文明的进步。

--

※ 来源:·饮水思源 bbs.sjtu.edu.cn·[FROM: 180.115.41.71]

※ 修改:·FDUCat 于 2013年12月31日08:48:58 修改本文·[FROM: 180.115.41.71]