我来我网
https://5come5.cn
 
您尚未 登录  注册 | 菠菜 | 软件站 | 音乐站 | 邮箱1 | 邮箱2 | 风格选择 | 更多 » 
 

«456 7 891011» Pages: ( 7/11 total )
本页主题: 与程序设计有关的毕业设计的讨论楼~【可以问问题、炫耀,但是不能找[屏蔽]】讨论出来的毕设Perfect! 隐藏签名 | 打印 | 加为IE收藏 | 收藏主题 | 上一主题 | 下一主题

zc1984





性别: 帅哥 状态: 该用户目前不在线
头衔: 上帝模式
等级: 荣誉会员
家族: 战略研究所
发贴: 10096
威望: 5
浮云: 0
在线等级:
注册时间: 2004-08-24
最后登陆: 2017-06-08

5come5帮你背单词 [ congress /'koŋgres/ n. (代表)大会,国会,议会 ]


看到Google.cn的自动提示关键字的功能,也自己做了一个~~哇咔咔~~
准备整合到原来的搜索引擎中~~


[ 此贴被zc1984在2007-04-06 23:35重新编辑 ]
远程图片:Snap2.jpg
在北京,做飞信,也在创业,我的微博:https://weibo.com/herozhang
顶端 Posted: 2007-04-06 23:20 | [90 楼]
jiju84



性别: 帅哥 状态: 该用户目前不在线
头衔: 【做人要低调!!】
等级: 前途无量
家族: J&S
发贴: 6455
威望: 0
浮云: 1253
在线等级:
注册时间: 2005-03-07
最后登陆: 2010-03-18

5come5帮你背单词 [ cane /kein/ n. (藤、竹等的)茎,藤料,竹料,手杖,甘蔗 ]


Quote:
引用第90楼zc1984于04-06-2007 23:20发表的:
看到Google.cn的自动提示关键字的功能,也自己做了一个~~哇咔咔~~
准备整合到原来的搜索引擎中~~



有词库
应该不难实现吧?
Fighting Copyright© Super_Jiju

//--------------------------------------------------
https://super-jiju.spaces.live.com
顶端 Posted: 2007-04-15 22:49 | [91 楼]
zc1984





性别: 帅哥 状态: 该用户目前不在线
头衔: 上帝模式
等级: 荣誉会员
家族: 战略研究所
发贴: 10096
威望: 5
浮云: 0
在线等级:
注册时间: 2004-08-24
最后登陆: 2017-06-08

5come5帮你背单词 [ risk /risk/ n. & vt. (冒)风险 ]


Quote:
引用第91楼jiju84于2007-04-15 22:49发表的:



有词库
应该不难实现吧?


不难哈~~
就是进行XML的异步通讯+多策略选词排序+缓冲机制+多浏览器兼容性保证~~

现在写论文都到接近100页了~~哇咔咔~去吓唬导师~~
在北京,做飞信,也在创业,我的微博:https://weibo.com/herozhang
顶端 Posted: 2007-04-16 10:04 | [92 楼]
tj.g



年度之星奖 特殊贡献奖 社区建设奖
性别: 帅哥 状态: 该用户目前不在线
头衔: 明媚的忧伤。。
等级: 幕后精英
家族: 水族馆
发贴: 19483
威望: 13
浮云: 318
在线等级:
注册时间: 2005-10-01
最后登陆: 2022-10-12

5come5帮你背单词 [ value /'vælju:/ n. 重要性,用途,用处,价值,评价;vt. 给…估价,看重,珍视 ]


Quote:
引用第90楼zc1984于2007-04-06 23:20发表的:
看到Google.cn的自动提示关键字的功能,也自己做了一个~~哇咔咔~~
准备整合到原来的搜索引擎中~~

具体功能是什么?自动提示关键字的功能?是怎样的?介绍下?
┌──╯─╮┌──┬─┐ ┐├─┬┐┌┬──┬╯┌────┐  ──┐ 
│    │   │  ┌╯│ ││││  │      │┌┐│ │ 
│┌──╮│   │  ││╯ │┘││ ╮│    ╭─╯│││ │ 
┌───┴┐└──┼─┘││┌ │┐││ ││    │  ││└──┐
     │   │  │││ ││││ ││    │  ││───│
└────╯└──╯─┘ ┘╰ ┘╯╯└╯└╰┘ ╰─┘  └╯└──╯
顶端 Posted: 2007-04-16 10:06 | [93 楼]
zc1984





性别: 帅哥 状态: 该用户目前不在线
头衔: 上帝模式
等级: 荣誉会员
家族: 战略研究所
发贴: 10096
威望: 5
浮云: 0
在线等级:
注册时间: 2004-08-24
最后登陆: 2017-06-08

5come5帮你背单词 [ inorganic /ino:'gænik/ a. 无机的,无生物的 ]


Quote:
引用第93楼tj.g于2007-04-16 10:06发表的:

具体功能是什么?自动提示关键字的功能?是怎样的?介绍下?


就是自动提示用户输入的关键字啊(有点类似于我们敲代码时候的自动提示和自动完成)~~

加入我输入“成都”,系统可能就会返回和“成都”具有最高相关和最高关注度的其他10个关键词提供给用户选择,避免用户花费时间进行输入~~

而候选集合简单地说就是经过建立词库、记录词频、记录用户关注度(也就是搜索的次数)进行的。目前包含110万中文词汇、短语,50万英文词汇、短语~~

p.s.貌似上面有贴图的啊~
在北京,做飞信,也在创业,我的微博:https://weibo.com/herozhang
顶端 Posted: 2007-04-16 10:56 | [94 楼]
tj.g



年度之星奖 特殊贡献奖 社区建设奖
性别: 帅哥 状态: 该用户目前不在线
头衔: 明媚的忧伤。。
等级: 幕后精英
家族: 水族馆
发贴: 19483
威望: 13
浮云: 318
在线等级:
注册时间: 2005-10-01
最后登陆: 2022-10-12

5come5帮你背单词 [ radio /'reidiəu/ n. 收音机,无线电 ]


Quote:
引用第94楼zc1984于2007-04-16 10:56发表的:


就是自动提示用户输入的关键字啊(有点类似于我们敲代码时候的自动提示和自动完成)~~

加入我输入“成都”,系统可能就会返回和“成都”具有最高相关和最高关注度的其他10个关键词提供给用户选择,避免用户花费时间进行输入~~
.......

哦~明白了..谢谢

呵呵~

虽然有贴图...但是反应不过来~
┌──╯─╮┌──┬─┐ ┐├─┬┐┌┬──┬╯┌────┐  ──┐ 
│    │   │  ┌╯│ ││││  │      │┌┐│ │ 
│┌──╮│   │  ││╯ │┘││ ╮│    ╭─╯│││ │ 
┌───┴┐└──┼─┘││┌ │┐││ ││    │  ││└──┐
     │   │  │││ ││││ ││    │  ││───│
└────╯└──╯─┘ ┘╰ ┘╯╯└╯└╰┘ ╰─┘  └╯└──╯
顶端 Posted: 2007-04-16 11:59 | [95 楼]
25522



性别: 帅哥 状态: 该用户目前不在线
等级: 人见人爱
家族: 唯war独尊
发贴: 2802
威望: 0
浮云: 1130
在线等级:
注册时间: 2006-04-19
最后登陆: 2007-06-26

5come5帮你背单词 [ tramp /træmp/ n. 流浪汉,长途跋涉,重步声,脚步声;vt. 用沉重的脚行走,跋涉 ]


楼主的中文分词是怎么实现的?用的是什么算法,如果只是收集的语库的话,那就没有意思了。
顶端 Posted: 2007-04-21 12:02 | [96 楼]
kangtalc



性别: 帅哥 状态: 该用户目前不在线
头衔: 揍敌客·奇犽
等级: 希望之光
家族: 万人坑恋影部落
发贴: 1723
威望: 5
浮云: 1113
在线等级:
注册时间: 2005-09-21
最后登陆: 2008-06-29

5come5帮你背单词 [ profession /prə'feən/ n. 专业,职业 ]


Quote:
引用第96楼25522于2007-04-21 12:02发表的:
楼主的中文分词是怎么实现的?用的是什么算法,如果只是收集的语库的话,那就没有意思了。


应该用的词库~~

天上太陽  地上綠樹
我們的身體在大地誕生
我們的靈魂來自於天上
陽光及月光照耀我們的四肢

綠地滋潤我們的身體
將此身交給吹過大地的風
感謝上天賜與奇蹟與窟廬塔土地
願我們的心靈能永保安康

我願能與所有同胞分享喜樂
願能與他們分擔悲傷
請你永遠讚美窟廬塔族的人民
讓我們以紅色的火紅眼為證

顶端 Posted: 2007-04-21 14:36 | [97 楼]
zc1984





性别: 帅哥 状态: 该用户目前不在线
头衔: 上帝模式
等级: 荣誉会员
家族: 战略研究所
发贴: 10096
威望: 5
浮云: 0
在线等级:
注册时间: 2004-08-24
最后登陆: 2017-06-08

5come5帮你背单词 [ lend /lend/ vt. 把…借给,贷给,出借 ]


Quote:
引用第97楼kangtalc于2007-04-21 14:36发表的:


应该用的词库~~


不是词库~~~
准确的说是HMM和基于词库的统计两种方法,然后加权计算~~
单纯的词库不能适应新出现的东西,在大规模应用上也存在维护成本过高的劣势~
而HMM等基于算法的方法,可以适应一些新东西,有一定的智能性,但是实现起来比较麻烦,而且也是不能百分百确保特例的完美解决~
因此就需要把两种方式放在一起~取长补短~~
在北京,做飞信,也在创业,我的微博:https://weibo.com/herozhang
顶端 Posted: 2007-04-21 15:33 | [98 楼]
25522



性别: 帅哥 状态: 该用户目前不在线
等级: 人见人爱
家族: 唯war独尊
发贴: 2802
威望: 0
浮云: 1130
在线等级:
注册时间: 2006-04-19
最后登陆: 2007-06-26

5come5帮你背单词 [ thin /θin/ a. 细的,薄的,瘦的,稀薄的,淡薄的;v. (使)变薄,(使)变细,(使)变稀 ]


那你用的是什么算法实现机器学习的?
顶端 Posted: 2007-04-21 23:36 | [99 楼]
25522



性别: 帅哥 状态: 该用户目前不在线
等级: 人见人爱
家族: 唯war独尊
发贴: 2802
威望: 0
浮云: 1130
在线等级:
注册时间: 2006-04-19
最后登陆: 2007-06-26

5come5帮你背单词 [ opportunity /opə'tju:niti/ n. 机会,时机 ]


zc1984=张成?
顶端 Posted: 2007-04-21 23:37 | [100 楼]
kangtalc



性别: 帅哥 状态: 该用户目前不在线
头衔: 揍敌客·奇犽
等级: 希望之光
家族: 万人坑恋影部落
发贴: 1723
威望: 5
浮云: 1113
在线等级:
注册时间: 2005-09-21
最后登陆: 2008-06-29

5come5帮你背单词 [ compliment /'komplimənt/ n. 赞扬,恭维 ]


Quote:
引用第98楼zc1984于2007-04-21 15:33发表的:


不是词库~~~
准确的说是HMM和基于词库的统计两种方法,然后加权计算~~
单纯的词库不能适应新出现的东西,在大规模应用上也存在维护成本过高的劣势~
.......


受教了~

天上太陽  地上綠樹
我們的身體在大地誕生
我們的靈魂來自於天上
陽光及月光照耀我們的四肢

綠地滋潤我們的身體
將此身交給吹過大地的風
感謝上天賜與奇蹟與窟廬塔土地
願我們的心靈能永保安康

我願能與所有同胞分享喜樂
願能與他們分擔悲傷
請你永遠讚美窟廬塔族的人民
讓我們以紅色的火紅眼為證

顶端 Posted: 2007-04-21 23:50 | [101 楼]
25522



性别: 帅哥 状态: 该用户目前不在线
等级: 人见人爱
家族: 唯war独尊
发贴: 2802
威望: 0
浮云: 1130
在线等级:
注册时间: 2006-04-19
最后登陆: 2007-06-26

5come5帮你背单词 [ stripe /straip/ n. 条纹,斑纹 ]


还有你的中文分词如果不是语库的话,如何切分中文?机器又是如何训练的?
顶端 Posted: 2007-04-21 23:51 | [102 楼]
zc1984





性别: 帅哥 状态: 该用户目前不在线
头衔: 上帝模式
等级: 荣誉会员
家族: 战略研究所
发贴: 10096
威望: 5
浮云: 0
在线等级:
注册时间: 2004-08-24
最后登陆: 2017-06-08

5come5帮你背单词 [ sacred /'seikrid/ a. 神圣的,宗教的,严肃的,郑重的 ]


Quote:
引用第102楼25522于2007-04-21 23:51发表的:
还有你的中文分词如果不是语库的话,如何切分中文?机器又是如何训练的?


见98楼~~
在北京,做飞信,也在创业,我的微博:https://weibo.com/herozhang
顶端 Posted: 2007-04-21 23:53 | [103 楼]
jiju84



性别: 帅哥 状态: 该用户目前不在线
头衔: 【做人要低调!!】
等级: 前途无量
家族: J&S
发贴: 6455
威望: 0
浮云: 1253
在线等级:
注册时间: 2005-03-07
最后登陆: 2010-03-18

5come5帮你背单词 [ seam /si:m/ n. 接合线(缝);vt. 接合,缝合,焊合 ]


Quote:
引用第98楼zc1984于04-21-2007 15:33发表的:


不是词库~~~
准确的说是HMM和基于词库的统计两种方法,然后加权计算~~
单纯的词库不能适应新出现的东西,在大规模应用上也存在维护成本过高的劣势~
.......



我觉得zc不用搞这gate复杂...........

你在这面输入,那边在高速的运算?
用户输入完毕,结果还没有运算出来

我感觉只要给那个edit写过onchange事件就可以了

然后就是从数据库或者文本里面找like '成都%'的词语

一方面,不必要做得很精细,歧义页没有关系,你推荐10个中有用户需要的一个就已经相当不错了


如果用HMM是为了识别未登录词,那不如你就利用你的文本做一个词库算了
Fighting Copyright© Super_Jiju

//--------------------------------------------------
https://super-jiju.spaces.live.com
顶端 Posted: 2007-04-22 19:24 | [104 楼]
«456 7 891011» Pages: ( 7/11 total )
我来我网·5come5 Forum » 程序员之家

Total 0.011803(s) query 5, Time now is:11-23 15:27, Gzip enabled
Powered by PHPWind v5.3, Localized by 5come5 Tech Team, 黔ICP备16009856号