我来我网
https://5come5.cn
 
您尚未 登录  注册 | 菠菜 | 软件站 | 音乐站 | 邮箱1 | 邮箱2 | 风格选择 | 更多 » 
 

«456 7 891011» Pages: ( 7/11 total )
本页主题: 与程序设计有关的毕业设计的讨论楼~【可以问问题、炫耀,但是不能找[屏蔽]】讨论出来的毕设Perfect! 显示签名 | 打印 | 加为IE收藏 | 收藏主题 | 上一主题 | 下一主题

zc1984





性别: 帅哥 状态: 该用户目前不在线
头衔: 上帝模式
等级: 荣誉会员
家族: 战略研究所
发贴: 10096
威望: 5
浮云: 0
在线等级:
注册时间: 2004-08-24
最后登陆: 2017-06-08

5come5帮你背单词 [ focus /'fəukəs/ v. (使)聚焦,(使)集中;n. 焦点,(注意力、活动、兴趣等的)中心 ]


看到Google.cn的自动提示关键字的功能,也自己做了一个~~哇咔咔~~
准备整合到原来的搜索引擎中~~


[ 此贴被zc1984在2007-04-06 23:35重新编辑 ]
远程图片:Snap2.jpg
顶端 Posted: 2007-04-06 23:20 | [90 楼]
jiju84



性别: 帅哥 状态: 该用户目前不在线
头衔: 【做人要低调!!】
等级: 前途无量
家族: J&S
发贴: 6455
威望: 0
浮云: 1253
在线等级:
注册时间: 2005-03-07
最后登陆: 2010-03-18

5come5帮你背单词 [ deduce /di'dju:s/ v. 演绎,推断 ]


Quote:
引用第90楼zc1984于04-06-2007 23:20发表的:
看到Google.cn的自动提示关键字的功能,也自己做了一个~~哇咔咔~~
准备整合到原来的搜索引擎中~~



有词库
应该不难实现吧?
顶端 Posted: 2007-04-15 22:49 | [91 楼]
zc1984





性别: 帅哥 状态: 该用户目前不在线
头衔: 上帝模式
等级: 荣誉会员
家族: 战略研究所
发贴: 10096
威望: 5
浮云: 0
在线等级:
注册时间: 2004-08-24
最后登陆: 2017-06-08

5come5帮你背单词 [ edition /i'diən/ n. 版,版本 ]


Quote:
引用第91楼jiju84于2007-04-15 22:49发表的:



有词库
应该不难实现吧?


不难哈~~
就是进行XML的异步通讯+多策略选词排序+缓冲机制+多浏览器兼容性保证~~

现在写论文都到接近100页了~~哇咔咔~去吓唬导师~~
顶端 Posted: 2007-04-16 10:04 | [92 楼]
tj.g



年度之星奖 特殊贡献奖 社区建设奖
性别: 帅哥 状态: 该用户目前不在线
头衔: 明媚的忧伤。。
等级: 幕后精英
家族: 水族馆
发贴: 19483
威望: 13
浮云: 318
在线等级:
注册时间: 2005-10-01
最后登陆: 2022-10-12

5come5帮你背单词 [ deadly /'dedli/ a. 致命的,危险的,极有害的;ad. 死一样地,非常,很 ]


Quote:
引用第90楼zc1984于2007-04-06 23:20发表的:
看到Google.cn的自动提示关键字的功能,也自己做了一个~~哇咔咔~~
准备整合到原来的搜索引擎中~~

具体功能是什么?自动提示关键字的功能?是怎样的?介绍下?
顶端 Posted: 2007-04-16 10:06 | [93 楼]
zc1984





性别: 帅哥 状态: 该用户目前不在线
头衔: 上帝模式
等级: 荣誉会员
家族: 战略研究所
发贴: 10096
威望: 5
浮云: 0
在线等级:
注册时间: 2004-08-24
最后登陆: 2017-06-08

5come5帮你背单词 [ scripture /'skriptə/ n. 圣经,经文,经典 ]


Quote:
引用第93楼tj.g于2007-04-16 10:06发表的:

具体功能是什么?自动提示关键字的功能?是怎样的?介绍下?


就是自动提示用户输入的关键字啊(有点类似于我们敲代码时候的自动提示和自动完成)~~

加入我输入“成都”,系统可能就会返回和“成都”具有最高相关和最高关注度的其他10个关键词提供给用户选择,避免用户花费时间进行输入~~

而候选集合简单地说就是经过建立词库、记录词频、记录用户关注度(也就是搜索的次数)进行的。目前包含110万中文词汇、短语,50万英文词汇、短语~~

p.s.貌似上面有贴图的啊~
顶端 Posted: 2007-04-16 10:56 | [94 楼]
tj.g



年度之星奖 特殊贡献奖 社区建设奖
性别: 帅哥 状态: 该用户目前不在线
头衔: 明媚的忧伤。。
等级: 幕后精英
家族: 水族馆
发贴: 19483
威望: 13
浮云: 318
在线等级:
注册时间: 2005-10-01
最后登陆: 2022-10-12

5come5帮你背单词 [ consitstent // a. 一致的,符合的,坚持的,相容的 ]


Quote:
引用第94楼zc1984于2007-04-16 10:56发表的:


就是自动提示用户输入的关键字啊(有点类似于我们敲代码时候的自动提示和自动完成)~~

加入我输入“成都”,系统可能就会返回和“成都”具有最高相关和最高关注度的其他10个关键词提供给用户选择,避免用户花费时间进行输入~~
.......

哦~明白了..谢谢

呵呵~

虽然有贴图...但是反应不过来~
顶端 Posted: 2007-04-16 11:59 | [95 楼]
25522



性别: 帅哥 状态: 该用户目前不在线
等级: 人见人爱
家族: 唯war独尊
发贴: 2802
威望: 0
浮云: 1130
在线等级:
注册时间: 2006-04-19
最后登陆: 2007-06-26

5come5帮你背单词 [ oblige /ə'blaid3ə/ vt. 迫使,施恩于,使满足,使感激 ]


楼主的中文分词是怎么实现的?用的是什么算法,如果只是收集的语库的话,那就没有意思了。
顶端 Posted: 2007-04-21 12:02 | [96 楼]
kangtalc



性别: 帅哥 状态: 该用户目前不在线
头衔: 揍敌客·奇犽
等级: 希望之光
家族: 万人坑恋影部落
发贴: 1723
威望: 5
浮云: 1113
在线等级:
注册时间: 2005-09-21
最后登陆: 2008-06-29

5come5帮你背单词 [ extensive /iks'tensiv/ a. 广泛的,广阔的,广大的 ]


Quote:
引用第96楼25522于2007-04-21 12:02发表的:
楼主的中文分词是怎么实现的?用的是什么算法,如果只是收集的语库的话,那就没有意思了。


应该用的词库~~
顶端 Posted: 2007-04-21 14:36 | [97 楼]
zc1984





性别: 帅哥 状态: 该用户目前不在线
头衔: 上帝模式
等级: 荣誉会员
家族: 战略研究所
发贴: 10096
威望: 5
浮云: 0
在线等级:
注册时间: 2004-08-24
最后登陆: 2017-06-08

5come5帮你背单词 [ eastwards // ad. & a. 向东方(的),朝东(的);东部 ]


Quote:
引用第97楼kangtalc于2007-04-21 14:36发表的:


应该用的词库~~


不是词库~~~
准确的说是HMM和基于词库的统计两种方法,然后加权计算~~
单纯的词库不能适应新出现的东西,在大规模应用上也存在维护成本过高的劣势~
而HMM等基于算法的方法,可以适应一些新东西,有一定的智能性,但是实现起来比较麻烦,而且也是不能百分百确保特例的完美解决~
因此就需要把两种方式放在一起~取长补短~~
顶端 Posted: 2007-04-21 15:33 | [98 楼]
25522



性别: 帅哥 状态: 该用户目前不在线
等级: 人见人爱
家族: 唯war独尊
发贴: 2802
威望: 0
浮云: 1130
在线等级:
注册时间: 2006-04-19
最后登陆: 2007-06-26

5come5帮你背单词 [ cosmic /'kozmik/ a. 宇宙的 ]


那你用的是什么算法实现机器学习的?
顶端 Posted: 2007-04-21 23:36 | [99 楼]
25522



性别: 帅哥 状态: 该用户目前不在线
等级: 人见人爱
家族: 唯war独尊
发贴: 2802
威望: 0
浮云: 1130
在线等级:
注册时间: 2006-04-19
最后登陆: 2007-06-26

5come5帮你背单词 [ originate /ə'rid3əineit/ v. 发源,发生 ]


zc1984=张成?
顶端 Posted: 2007-04-21 23:37 | [100 楼]
kangtalc



性别: 帅哥 状态: 该用户目前不在线
头衔: 揍敌客·奇犽
等级: 希望之光
家族: 万人坑恋影部落
发贴: 1723
威望: 5
浮云: 1113
在线等级:
注册时间: 2005-09-21
最后登陆: 2008-06-29

5come5帮你背单词 [ cruelty /'kruəlti/ n. 残酷,残忍,痛苦;残酷行为 ]


Quote:
引用第98楼zc1984于2007-04-21 15:33发表的:


不是词库~~~
准确的说是HMM和基于词库的统计两种方法,然后加权计算~~
单纯的词库不能适应新出现的东西,在大规模应用上也存在维护成本过高的劣势~
.......


受教了~
顶端 Posted: 2007-04-21 23:50 | [101 楼]
25522



性别: 帅哥 状态: 该用户目前不在线
等级: 人见人爱
家族: 唯war独尊
发贴: 2802
威望: 0
浮云: 1130
在线等级:
注册时间: 2006-04-19
最后登陆: 2007-06-26

5come5帮你背单词 [ rehearse /rih'ə:s/ v. 排练,排演 ]


还有你的中文分词如果不是语库的话,如何切分中文?机器又是如何训练的?
顶端 Posted: 2007-04-21 23:51 | [102 楼]
zc1984





性别: 帅哥 状态: 该用户目前不在线
头衔: 上帝模式
等级: 荣誉会员
家族: 战略研究所
发贴: 10096
威望: 5
浮云: 0
在线等级:
注册时间: 2004-08-24
最后登陆: 2017-06-08

5come5帮你背单词 [ freight /freit/ n. 货运(费);vt. 运输,装货于 ]


Quote:
引用第102楼25522于2007-04-21 23:51发表的:
还有你的中文分词如果不是语库的话,如何切分中文?机器又是如何训练的?


见98楼~~
顶端 Posted: 2007-04-21 23:53 | [103 楼]
jiju84



性别: 帅哥 状态: 该用户目前不在线
头衔: 【做人要低调!!】
等级: 前途无量
家族: J&S
发贴: 6455
威望: 0
浮云: 1253
在线等级:
注册时间: 2005-03-07
最后登陆: 2010-03-18

5come5帮你背单词 [ merry /'meri/ a. 愉快的,欢乐的 ]


Quote:
引用第98楼zc1984于04-21-2007 15:33发表的:


不是词库~~~
准确的说是HMM和基于词库的统计两种方法,然后加权计算~~
单纯的词库不能适应新出现的东西,在大规模应用上也存在维护成本过高的劣势~
.......



我觉得zc不用搞这gate复杂...........

你在这面输入,那边在高速的运算?
用户输入完毕,结果还没有运算出来

我感觉只要给那个edit写过onchange事件就可以了

然后就是从数据库或者文本里面找like '成都%'的词语

一方面,不必要做得很精细,歧义页没有关系,你推荐10个中有用户需要的一个就已经相当不错了


如果用HMM是为了识别未登录词,那不如你就利用你的文本做一个词库算了
顶端 Posted: 2007-04-22 19:24 | [104 楼]
«456 7 891011» Pages: ( 7/11 total )
我来我网·5come5 Forum » 程序员之家

Total 0.015365(s) query 5, Time now is:11-23 12:32, Gzip enabled
Powered by PHPWind v5.3, Localized by 5come5 Tech Team, 黔ICP备16009856号