输入一个汉字需要敲多少个键我来我网·5come5 Forum

本页主题: 输入一个汉字需要敲多少个键	显示签名 \| 打印 \| 加为IE收藏 \| 收藏主题 \| 上一主题 \| 下一主题

几山

∷ 性别:

∷ 状态:

∷ 等级: 品行端正

∷ 家族: 变形金刚

∷ 发贴: 301

∷ 威望: 0

∷ 浮云: 1141

∷ 在线等级:

∷ 注册时间: 2007-11-29

∷ 最后登陆: 2009-10-05

【复制此帖地址只看此人回复】

5come5帮你背单词 [ dish /di∫/ n. 碟盘，菜肴，一道菜 ]

输入一个汉字需要敲多少个键

2007年12月3日上午 10:05:00

发表者：Google（谷歌）研究员吴军

今天各种汉字输入法已经很成熟了，随便挑出一种主要的输入法比十几[屏蔽]最好的输入法都要快、要准。现在抛开具体的输入法，从理论上分析一下，输入汉字到底能有多快。

我们假定常用的汉字在二级国标里面，一共有 6700 个作用的汉字。如果不考虑汉字频率的分布，用键盘上的 26 个字母对汉字编码，两个字母的组合只能对 676 个汉字编码，对 6700 个汉字编码需要用三个字母的组合，即编码长度为三。当然，聪明的读者马上发现了我们可以对常见的字用较短的编码对不常见的字用较长的编码，这样平均起来每个汉字的编码长度可以缩短。我们假定每一个汉字的频率是
p1, p2, p3, ..., p6700
它们编码的长度是
L1, L2, L3, ..., L6700
那么，平均编码长度是
p1×L1 + p2×L2 + ... + p6700×L6700

香农第一定理指出：这个编码的长度的最小值是汉字的信息熵，也就是说任何输入方面不可能突破信息熵给定的极限。当然，香农第一定理是针对所有编码的，不但是汉字输入编码的。这里需要指出的是，如果我们将输入法的字库从二级国标扩展到更大的字库 GBK，由于后面不常见的字频率较短，平均编码长度比针对国标的大不了多少。让我们回忆一下汉字的信息熵（见 http://www.googlechinablog.com/2006/04/4.html），
H = -p1 * log p1 - ... - p6700 log p6700。
我们如果对每一个字进行统计，而且不考虑上下文相关性，大致可以估算出它的值在十比特以内，当然这取决于用什么语料库来做估计。如果我们假定输入法只能用 26 个字母输入，那么每个字母可以代表 log26=
4.7 比特的信息，也就是说，输入一个汉字平均需要敲 10/4.7= 2.1 次键。

聪明的读者也许一经发现，如果我们把汉字组成词，再以词为单位统计信息熵，那么，每个汉字的平均信息熵将会减少。这样，平均输入一个字可以少敲零点几次键盘。不考虑词的上下文相关性，以词为单位统计，汉字的信息熵大约是8比特作用，也就是说，以词为单位输入一个汉字平均只需要敲 8/4.7=1.7 次键。这就是现在所有输入法都是基于词输入的内在原因。当然，如果我们再考虑上下文的相关性，对汉语建立一个基于词的统计语言模型（见http://www.googlechinablog.com/2006/04/blog-post.html），我们可以将每个汉字的信息熵降到 6 比特作用，这时，输入一个汉字只要敲 6/4.7=1.3 次键。如果一种输入方法能做到这一点，那么汉字的输入已经比英文快的多了。

但是，事实上没有一种输入方法接近这个效率。这里面主要有两个原因。首先，要接近信息论给的这个极限，就要对汉字的词组根据其词频进行特殊编码。事实上像王码这类的输入方法就是这么做到，只不过它们第一没有对词组统一编码，第二没有有效的语言模型。这种编码方法理论上讲有效，实际上不实用。原因有两个，第一，很难学；第二，从认知科学的角度上讲，人一心无二用，人们在没有稿子边想边写的情况下不太可能在回忆每个词复杂的编码的同时又不中断思维。我们过去在研究语言识别时做过很多用户测试，发现使用各种复杂编码输入法的人在脱稿打字时的速度只有他在看稿打字时的一半到四分之一。因此，虽然每个字平均敲键次数少，但是打键盘的速度也慢了很多，总的并不快。这也就是为什么基于拼音的简单输入法占统治地位的原因。事实上，汉语全拼的平均长度为 2.98，只要基于拼音的输入法能利用上下文彻底解决一音多字的问题，平均每个汉字输入的敲键次数应该在三次左右，每分钟输入 100 个字完全有可能达到。

另外一个不容易达到信息论极限的输入速度的原因在于，这个理论值是根据一个很多的语言模型计算出来的。在产品中，我们不可能占有用户太多的内存空间，因此各种输入方法提供给用户的是一个压缩的很厉害的语音模型，而有的输入方法为了减小内存占用，根本没有语言模型。拼音输入法的好坏关键在准确而有效的语言模型。

本帖最近评分记录：

浮云:5(dessert) 优秀转贴

Posted: 2007-12-28 19:40 | [楼主]

邓平原

∷ 性别:

∷ 状态:

∷ 头衔: 工程师

∷ 等级: 字幕组

∷ 家族: 萌菌物语

∷ 发贴: 13635

∷ 威望: 4

∷ 浮云: 1289

∷ 在线等级:

∷ 注册时间: 2005-10-24

∷ 最后登陆: 2009-07-08

【复制此帖地址只看此人回复】

5come5帮你背单词 [ hi /hai/ int. 喂嘿 ]

由于本人用智能,平均一个字至少要一次

Posted: 2007-12-28 19:43 | [1 楼]

firefox2004

∷ 性别:

∷ 状态:

∷ 头衔: 凤凰在磐涅中得到永生！

∷ 等级: 荣誉会员

∷ 家族: 梦魇图腾

∷ 发贴: 20839

∷ 威望: 3

∷ 浮云: 360

∷ 在线等级:

∷ 注册时间: 2007-09-07

∷ 最后登陆: 2013-04-13

【复制此帖地址只看此人回复】

5come5帮你背单词 [ external /eks'tə:nl/ a. 外部的，表面上的，外来的，(药物)外用的 ]

很强大,最多四下!嘿嘿,五笔现在慢下来了!

Posted: 2007-12-28 19:47 | [2 楼]

princess_cs

∷ 性别:

∷ 状态:

∷ 等级: 栋梁之材

∷ 发贴: 814

∷ 威望: 0

∷ 浮云: 1106

∷ 在线等级:

∷ 注册时间: 2007-10-13

∷ 最后登陆: 2008-06-29

【复制此帖地址只看此人回复】

5come5帮你背单词 [ mock /mok/ v. 嘲弄，嘲笑 ]

太强了，这个都研究

Posted: 2007-12-28 19:48 | [3 楼]

宝宝龙

∷ 性别:

∷ 状态:

∷ 头衔: 祸皇

∷ 等级: 荣誉会员

∷ 家族: 掌握文武半边天

∷ 发贴: 2295

∷ 威望: 2

∷ 浮云: 363

∷ 在线等级:

∷ 注册时间: 2006-04-27

∷ 最后登陆: 2019-01-15

【复制此帖地址只看此人回复】

5come5帮你背单词 [ strategy /'strætid₃əi/ n. 战略(学)，策略，计谋 ]

我又看到了那几个怎么学都不会的词
编码、香浓、熵

Posted: 2007-12-28 19:49 | [4 楼]

ershao

∷ 性别:

∷ 状态:

∷ 头衔: 此人已死

∷ 等级: 人见人爱

∷ 发贴: 2233

∷ 威望: 0

∷ 浮云: 1113

∷ 在线等级:

∷ 注册时间: 2007-01-01

∷ 最后登陆: 2009-03-17

【复制此帖地址只看此人回复】

5come5帮你背单词 [ perfume /'pə:fju:m, pə:'fju:m/ n. 香味，香料；vt. 使发出香味 ]

用ABC感觉比较慢

Posted: 2007-12-28 19:53 | [5 楼]

废才

∷ 性别:

∷ 状态:

∷ 等级: 品行端正

∷ 家族: 单身贵族

∷ 发贴: 443

∷ 威望: 0

∷ 浮云: 1143

∷ 在线等级:

∷ 注册时间: 2007-06-24

∷ 最后登陆: 2010-06-30

【复制此帖地址只看此人回复】

5come5帮你背单词 [ await /ə'weit/ vt. 等待，等候 ]

香农是个强人!~LZ是个牛人~!~

Posted: 2007-12-28 19:54 | [6 楼]

天宇魔羯

∷ 性别:

∷ 状态:

∷ 等级: 人见人爱

∷ 发贴: 4600

∷ 威望: 0

∷ 浮云: 1189

∷ 在线等级:

∷ 注册时间: 2007-05-16

∷ 最后登陆: 2010-04-16

【复制此帖地址只看此人回复】

5come5帮你背单词 [ vehicle /'vi:ikl/ n. 交通工具，车辆，工具，手段 ]

这个就太专业了

Posted: 2007-12-28 20:46 | [7 楼]

hattie

∷ 性别:

∷ 状态:

∷ 等级: 鹤立鸡群

∷ 发贴: 1153

∷ 威望: 0

∷ 浮云: 1142

∷ 在线等级:

∷ 注册时间: 2007-10-09

∷ 最后登陆: 2010-06-03

【复制此帖地址只看此人回复】

5come5帮你背单词 [ occupy /'okjupəai/ vt. 占，占用，占领，使忙碌 ]

从没研究过

Posted: 2007-12-28 23:34 | [8 楼]

tanzeng

∷ 性别:

∷ 状态:

∷ 等级: 鹤立鸡群

∷ 发贴: 1233

∷ 威望: 0

∷ 浮云: 1105

∷ 在线等级:

∷ 注册时间: 2007-09-16

∷ 最后登陆: 2009-06-06

【复制此帖地址只看此人回复】

5come5帮你背单词 [ humiliate /hju(:)'milieit/ vt. 羞辱，使丢脸 ]

用sougou比较好

Posted: 2007-12-29 10:17 | [9 楼]

aspire5572

∷ 性别:

∷ 状态:

∷ 头衔: 无情大灾彰显无疆大爱

∷ 等级: 优秀会员

∷ 家族: 菠韬汹勇

∷ 发贴: 6336

∷ 威望: 1

∷ 浮云: 224

∷ 在线等级:

∷ 注册时间: 2007-03-11

∷ 最后登陆: 2010-02-23

【复制此帖地址只看此人回复】

5come5帮你背单词 [ thick /θik/ a. 厚的，粗的，浓的，浓密的，茂密的，看不清的，茂密的；ad. 厚厚地，浓地，密集地 ]

当然是有可能的，速记员不就是吃这gate饭的吗？人家平均的打字速度都是240字/秒

Posted: 2007-12-29 15:04 | [10 楼]

zihua

∷ 性别: 保密 ∷ 状态: 该用户目前不在线

∷ 等级: 人见人爱

∷ 发贴: 4900

∷ 威望: 0

∷ 浮云: 1105

∷ 在线等级:

∷ 注册时间: 2006-03-06

∷ 最后登陆: 2008-06-29

【复制此帖地址只看此人回复】

5come5帮你背单词 [ stifle /'sfaifl/ vi. 闷死，窒息；vt. 抑制，压制，使窒息 ]

Quote:

引用第10楼aspire5572于2007-12-29 15:04发表的 :
当然是有可能的，速记员不就是吃这gate饭的吗？人家平均的打字速度都是240字/秒

这个很牛B啊

Posted: 2007-12-29 15:07 | [11 楼]

大隐隐于川

∷ 性别:

∷ 状态:

∷ 等级: 品行端正

∷ 发贴: 276

∷ 威望: 0

∷ 浮云: 1103

∷ 在线等级:

∷ 注册时间: 2007-12-29

∷ 最后登陆: 2008-03-02

【复制此帖地址只看此人回复】

5come5帮你背单词 [ whose /hu:z/ pron. 谁的，哪个(人)的，哪些(人)的 ]

我觉得五笔挺快的！

Posted: 2007-12-29 22:18 | [12 楼]

天空の城

∷ 性别:

∷ 状态:

∷ 等级: 人见人爱

∷ 家族: YD一族

∷ 发贴: 3155

∷ 威望: 0

∷ 浮云: 1128

∷ 在线等级:

∷ 注册时间: 2007-03-09

∷ 最后登陆: 2021-05-26

【复制此帖地址只看此人回复】

5come5帮你背单词 [ chairman /'t∫/əmən/ n. 主席，(委员会，部门等的)领导人 ]

Quote:

引用第0楼几山于2007-12-28 19:40发表的输入一个汉字需要敲多少个键 :
2007年12月3日上午 10:05:00

发表者：Google（谷歌）研究员吴军

今天各种汉字输入法已经很成熟了，随便挑出一种主要的输入法比十几[屏蔽]最好的输入法都要快、要准。现在抛开具体的输入法，从理论上分析一下，输入汉字到底能有多快。
.......

请转完...
这是说Google在输入法上走错了方向

Posted: 2007-12-30 17:09 | [13 楼]

legion211

∷ 性别:

∷ 状态:

∷ 等级: 希望之光

∷ 发贴: 1845

∷ 威望: 0

∷ 浮云: 1190

∷ 在线等级:

∷ 注册时间: 2007-09-09

∷ 最后登陆: 2011-05-09

【复制此帖地址只看此人回复】

5come5帮你背单词 [ scrape /skreip/ v. & n. 擦，刮 ]

习惯了用紫光，比较爽！

Posted: 2007-12-30 18:55 | [14 楼]

5come5帮你背单词 [ dish /di∫/ n. 碟盘，菜肴，一道菜 ] 输入一个汉字需要敲多少个键

5come5帮你背单词 [ hi /hai/ int. 喂嘿 ]

5come5帮你背单词 [ external /eks'tə:nl/ a. 外部的，表面上的，外来的，(药物)外用的 ]

5come5帮你背单词 [ mock /mok/ v. 嘲弄，嘲笑 ]

5come5帮你背单词 [ strategy /'strætid3əi/ n. 战略(学)，策略，计谋 ]

5come5帮你背单词 [ perfume /'pə:fju:m, pə:'fju:m/ n. 香味，香料；vt. 使发出香味 ]

5come5帮你背单词 [ await /ə'weit/ vt. 等待，等候 ]

5come5帮你背单词 [ vehicle /'vi:ikl/ n. 交通工具，车辆，工具，手段 ]

5come5帮你背单词 [ occupy /'okjupəai/ vt. 占，占用，占领，使忙碌 ]

5come5帮你背单词 [ humiliate /hju(:)'milieit/ vt. 羞辱，使丢脸 ]

5come5帮你背单词 [ thick /θik/ a. 厚的，粗的，浓的，浓密的，茂密的，看不清的，茂密的；ad. 厚厚地，浓地，密集地 ]

5come5帮你背单词 [ stifle /'sfaifl/ vi. 闷死，窒息；vt. 抑制，压制，使窒息 ]

Quote:

5come5帮你背单词 [ whose /hu:z/ pron. 谁的，哪个(人)的，哪些(人)的 ]

5come5帮你背单词 [ chairman /'t∫/əmən/ n. 主席，(委员会，部门等的)领导人 ]

Quote:

5come5帮你背单词 [ scrape /skreip/ v. & n. 擦，刮 ]

5come5帮你背单词 [ dish /di∫/ n. 碟盘，菜肴，一道菜 ]

输入一个汉字需要敲多少个键

5come5帮你背单词 [ strategy /'strætid₃əi/ n. 战略(学)，策略，计谋 ]