我来我网
https://5come5.cn
 
您尚未 登录  注册 | 菠菜 | 软件站 | 音乐站 | 邮箱1 | 邮箱2 | 风格选择 | 更多 » 
 

本页主题: 与程序设计有关的毕业设计的讨论楼~【可以问问题、炫耀,但是不能找[屏蔽]】讨论出来的毕设Perfect! 显示签名 | 打印 | 加为IE收藏 | 收藏主题 | 上一主题 | 下一主题

zc1984





性别: 帅哥 状态: 该用户目前不在线
头衔: 上帝模式
等级: 荣誉会员
家族: 战略研究所
发贴: 10096
威望: 5
浮云: 0
在线等级:
注册时间: 2004-08-24
最后登陆: 2017-06-08

5come5帮你背单词 [ dormitory /'do:mitri/ n. (集体)宿舍 ]


与程序设计有关的毕业设计的讨论楼~【可以问问题、炫耀,但是不能找[屏蔽]】讨论出来的毕设Perfect!

大家可以把自己的毕业设计的题目和具体要求帖出来哈。
大家互相讨论着进行貌似会比较好一点,也算是一种互助,大家也可以在这个过程中学习到东西。

重要声明:
在本楼可以发帖问问题寻求解答,可以炫耀自己的毕业设计的程序,
甚至可以BS别人的软件设计水平(没有建设性的BS会被扣FYh哈),
但是绝对不允许有寻求毕业设计之[屏蔽]的行为或者其他徇私舞弊的情况发生~


[ 此贴被zc1984在2007-03-24 20:49重新编辑 ]
本帖最近评分记录:
  • 浮云:20 (by 独飞の孤心) | 理由: 蝈蝈总是那么有想法。。。
  • 顶端 Posted: 2007-03-24 19:25 | [楼 主]
    debuger





    性别: 保密 状态: 该用户目前不在线
    等级: 品行端正
    发贴: 410
    威望: 0
    浮云: 1227
    在线等级:
    注册时间: 2004-12-25
    最后登陆: 2007-04-10

    5come5帮你背单词 [ license /'laisəns/ n. 执照,许可证,许可,特许;vt. 批准,发给…执照 ]


    Quote:
    引用第20楼zc1984于2007-03-24 20:26发表的:
    补充一点:
    这就类似于传统的数据库或者传统的文本搜索引擎中的处理方式——建立索引和快照~
    首先搜索的是索引,这样速度最快~然后进行乱七八糟的处理,最终返回结果~~
    不知道现在Google的服务器是什么配置了,反正2001年的时候就已经是单机6GB内存了~

    2001年……
    这是哪里传来的混淆视听的消息……

    google的核心竞争力在于分布式和并行计算(当然,这个各有个的说法),但是无庸置疑的是,他们的根本还是pc server,所谓的这种6g的机器并非主导

    不过还是很感兴趣于zc同学的构架,最好能透露一点
    顶端 Posted: 2007-03-26 17:53 | [1 楼]
    debuger





    性别: 保密 状态: 该用户目前不在线
    等级: 品行端正
    发贴: 410
    威望: 0
    浮云: 1227
    在线等级:
    注册时间: 2004-12-25
    最后登陆: 2007-04-10

    5come5帮你背单词 [ usual /'ju:3əuəl/ n. 使用者,用户 ]


    Re:Re:与程序设计有关的毕业设计的讨论楼~【可以问问题、炫耀,但是不能找枪手】讨论出来的毕设

    Quote:
    引用第29楼jiju84于2007-03-25 12:59发表的Re:与程序设计有关的毕业设计的讨论楼~【可以问问题、炫耀,但是不能找[屏蔽]】讨论出来的毕设:
    都是牛人

    偶做统计语言模型

    研究HMM但参数估计优化 EM算法,数据平滑
    .......

    这个很有意思啊,但是不懂的说,版主怎么不加分
    顶端 Posted: 2007-03-26 17:56 | [2 楼]
    debuger





    性别: 保密 状态: 该用户目前不在线
    等级: 品行端正
    发贴: 410
    威望: 0
    浮云: 1227
    在线等级:
    注册时间: 2004-12-25
    最后登陆: 2007-04-10

    5come5帮你背单词 [ peanut /'pi:nΛt/ n. 花生 ]


    Quote:
    引用第34楼zc1984于2007-03-26 18:15发表的:


    Google Paper里面说的~~~
    可以到Google Paper的站点上面下载那篇论文哈~~
    Google自己声称自己最核心的东西其实是GFS——Google File System~~
    .......

    我也只是灌水,当然,gfs也相当nb啦

    但是根据在google和包括baidu在内的工作的朋友说的,他们自己的系统都是以pc server为主的,尤其是google,可以保证在接入一台新pc的情况下,把这台pc并入他们庞大的分布式体系,这种难度,现在美国只有2个公司可以做到,google是其中之一

    另据某些所谓行内人士透露,google的机器已经超过10w,6g那种内存的机器,数量微乎其微
    顶端 Posted: 2007-03-26 18:21 | [3 楼]
    debuger





    性别: 保密 状态: 该用户目前不在线
    等级: 品行端正
    发贴: 410
    威望: 0
    浮云: 1227
    在线等级:
    注册时间: 2004-12-25
    最后登陆: 2007-04-10

    5come5帮你背单词 [ employer /im'ploiə/ n. 雇用者,雇主 ]


    Re:Re:Re:与程序设计有关的毕业设计的讨论楼~【可以问问题、炫耀,但是不能找枪手】讨论出来的毕设

    Quote:
    引用第35楼zc1984于2007-03-26 18:17发表的Re:Re:与程序设计有关的毕业设计的讨论楼~【可以问问题、炫耀,但是不能找[屏蔽]】讨论出来的毕设:


    我这里有语料库~~
    纯文本:1141MB~~~压缩后大约522MB~~~

    .......

    这么大,后台怎么搞才能刚的起哦……

    ms在sogou上有精简的
    顶端 Posted: 2007-03-26 18:23 | [4 楼]
    debuger





    性别: 保密 状态: 该用户目前不在线
    等级: 品行端正
    发贴: 410
    威望: 0
    浮云: 1227
    在线等级:
    注册时间: 2004-12-25
    最后登陆: 2007-04-10

    5come5帮你背单词 [ scant /skænt/ a. 不足的,欠缺的 ]


    Quote:
    引用第39楼zc1984于2007-03-26 18:28发表的:


    大规模的计算机集群可以有效的利用大数定律来平抑风险~~~
    另外他们在加利福尼亚建立计算中心和数据中心也是选择了避开地震带,这是很明智的做法~~

    .......

    继续灌灌

    他们的数据中心多了去了……

    大陆的访问一般都是到了hk

    另外,ibm和sun这些,在我提到的2家公司的努力里面,他们的分布式是可以基本忽律的,这个是可以肯定的,ms就可以认为成完全没有了……

    你快说多久拿你的构架出来吧,我要吃饭去了
    顶端 Posted: 2007-03-26 18:32 | [5 楼]
    debuger





    性别: 保密 状态: 该用户目前不在线
    等级: 品行端正
    发贴: 410
    威望: 0
    浮云: 1227
    在线等级:
    注册时间: 2004-12-25
    最后登陆: 2007-04-10

    5come5帮你背单词 [ induction /in'dΛkən/ n. 归纳(法) ]


    Quote:
    引用第39楼zc1984于2007-03-26 18:28发表的:


    现在有种说法:Google已经把人类积累下来的一点点并行和分布式的知识用完了~现在都只有硬着头皮和理论界一起探究了~

    .......

    这种说法很正确吧,至少我理解中是这样的

    事实上,google一直在做理论研究,而所谓的理论界,在诸如分布式、搜索、模式识别(比如视频搜索),这些方面,工业界取得的成就远远大于理论界

    理论界没有那样的资源、财力、人力来做这方面的东西,更不要提数据量这种连msra都一直在抱怨不够的资源了,能做这些的,只有这种巨头,有大量的闲钱来搞这些
    顶端 Posted: 2007-03-26 18:37 | [6 楼]
    debuger





    性别: 保密 状态: 该用户目前不在线
    等级: 品行端正
    发贴: 410
    威望: 0
    浮云: 1227
    在线等级:
    注册时间: 2004-12-25
    最后登陆: 2007-04-10

    5come5帮你背单词 [ direct /di'rekt/ a. & ad. 直接的(地),直率的(地)针对,把…对准,指示,指引,导演,指挥 ]


    Quote:
    引用第43楼zc1984于2007-03-26 18:37发表的:


    现在的设计天天都在修改~~
    刚开始啊~~
    等什么时候稳定了,可以见人了再拿出来献丑~~

    呵呵,zc同学谦虚了

    你现在对比如你的demo图片里面的搜索(“system.out”这个字符串),是如何实现的?

    数据量大了不上分布式不行啊……
    顶端 Posted: 2007-03-26 18:39 | [7 楼]
    debuger





    性别: 保密 状态: 该用户目前不在线
    等级: 品行端正
    发贴: 410
    威望: 0
    浮云: 1227
    在线等级:
    注册时间: 2004-12-25
    最后登陆: 2007-04-10

    5come5帮你背单词 [ victory /'viktəri/ n. 胜利,获胜 ]


    Quote:
    引用第44楼zc1984于2007-03-26 18:39发表的:
    现在感觉Google有点飘飘然,做的事情也就开始失去方向了~~
    Maybe我的理解有问题~~

    公司运作需要钱,华尔街也盯着钱~~
    如果没有好的盈利模式,只有一些新奇的小玩意儿,市场不会买单的——by WallStreet 某XX


    后半段完全同意

    至于google现在做的事情其实还是很多的,这在我认识的google员工身上得到一定体现,可能是由于‘谷歌’的原因,导致我们对google的认识容易一叶障目,换句话说,‘谷歌’目前的很多方面,确实做的不足
    顶端 Posted: 2007-03-26 18:43 | [8 楼]
    debuger





    性别: 保密 状态: 该用户目前不在线
    等级: 品行端正
    发贴: 410
    威望: 0
    浮云: 1227
    在线等级:
    注册时间: 2004-12-25
    最后登陆: 2007-04-10

    5come5帮你背单词 [ southern /'sΛðən/ a. 南方的,南部的 ]


    Quote:
    引用第47楼zc1984于2007-03-26 18:44发表的:


    相反,我个人认为在理论上还是理论界目前领先与产业界~~
    如果要说数据的话,欧洲高能研究所的每秒800GB的数据应该足够了吧~~
    一次高能物理实验就能产生6PB左右的数据~~
    .......

    这个可能受限于我的个人了解

    但是生成的这些数据怎么用?不是我们常规理解的拿来做应用的数据啊
    顶端 Posted: 2007-03-26 18:52 | [9 楼]
    debuger





    性别: 保密 状态: 该用户目前不在线
    等级: 品行端正
    发贴: 410
    威望: 0
    浮云: 1227
    在线等级:
    注册时间: 2004-12-25
    最后登陆: 2007-04-10

    5come5帮你背单词 [ innovate /'inəuveit/ vi. 革新,变革 ]


    Quote:
    引用第48楼zc1984于2007-03-26 18:51发表的:


    简单一点说就是建立一个索引,
    索引的内容是单词(或者中文分词出来的词),记录一个单词被哪些文档所包含,同时记录单词在该文档中的位置。

    .......

    呵呵,还是等你把系统做完了给我们大家研究一下吧,我现在做的毕设也涉及到这方面的东西,海量的数据,需要手工完成大量索引,我现在需要了解很多高效实现的具体细节,基本的方案早就有了,但是一直以来,我还不认为我的实现能够刚的起千万量级上0.1秒搜索出结果的可能
    顶端 Posted: 2007-03-26 18:56 | [10 楼]
    我来我网·5come5 Forum » 程序员之家

    Total 0.014928(s) query 6, Time now is:11-23 12:29, Gzip enabled
    Powered by PHPWind v5.3, Localized by 5come5 Tech Team, 黔ICP备16009856号