我来我网
https://5come5.cn
 
您尚未 登录  注册 | 菠菜 | 软件站 | 音乐站 | 邮箱1 | 邮箱2 | 风格选择 | 更多 » 
 

本页主题: zc和在行的进来一下有好玩的 -- 搜索引擎对文件内容的识别 隐藏签名 | 打印 | 加为IE收藏 | 收藏主题 | 上一主题 | 下一主题

sinopatic



性别: 保密 状态: 该用户目前不在线
等级: 初出茅庐
发贴: 95
威望: 0
浮云: 1293
在线等级:
注册时间: 2006-10-09
最后登陆: 2007-08-20

5come5帮你背单词 [ pause /po:z/ n. & vi. 中止,暂停 ]


zc和在行的进来一下有好玩的 -- 搜索引擎对文件内容的识别

如:在Baidu Photo中输入"中国常德",你看到前面的很多图片都是含有不良内容图片的
引擎只识别了文件名而没有识别文件内容
如何将这些不良内容过滤掉
zc你以前那个瓜的"三大gate户网页过滤器"管用吗
有兴趣+能力+时间就好好研究一下吧(签了约啦?可喜~还有几个月,不要偷懒哦)
www.sinopatic.com
顶端 Posted: 2006-11-11 23:07 | [楼 主]
sinopatic



性别: 保密 状态: 该用户目前不在线
等级: 初出茅庐
发贴: 95
威望: 0
浮云: 1293
在线等级:
注册时间: 2006-10-09
最后登陆: 2007-08-20

5come5帮你背单词 [ occupation /okju'peiənl/ n. 职业,工作,占用,占领,消遣 ]


希望baidu以后不要带给我们这类惊喜了...
www.sinopatic.com
顶端 Posted: 2006-11-11 23:09 | [1 楼]
独飞の孤心



性别: 帅哥 状态: 该用户目前不在线
头衔: 孽缘!
等级: 荣誉会员
家族: 单身贵族
发贴: 4484
威望: 3
浮云: 496
在线等级:
注册时间: 2005-10-12
最后登陆: 2011-09-23

5come5帮你背单词 [ error /'erə/ n. 差错,误差 ]


有事找google


无处安放的青春II -- 该把爱放哪儿才安全

顶端 Posted: 2006-11-11 23:19 | [2 楼]
zc1984





性别: 帅哥 状态: 该用户目前不在线
头衔: 上帝模式
等级: 荣誉会员
家族: 战略研究所
发贴: 10096
威望: 5
浮云: 0
在线等级:
注册时间: 2004-08-24
最后登陆: 2017-06-08

5come5帮你背单词 [ same /seim/ a. 相同的,一样的;pron. 同样的人或事 ]


从目前的情况来说,要让图片的内容被搜索引擎理解还存在很多障碍,实现难度比较大~~~

也许有另辟蹊径的方法~~~
思考中……(虽然我很希望所有的信息都是公开可获取得,并不经过任何的过滤~~~呵呵)

p.s.我的3大gate户的新闻提取不是做这个的哈,只是过滤页面噪音,将新闻的标题和正文识别出来而已哈~~
在北京,做飞信,也在创业,我的微博:https://weibo.com/herozhang
顶端 Posted: 2006-11-11 23:27 | [3 楼]
老子不怕您



性别: 帅哥 状态: 该用户目前不在线
等级: 栋梁之材
发贴: 623
威望: 0
浮云: 1333
在线等级:
注册时间: 2004-09-09
最后登陆: 2008-03-08

5come5帮你背单词 [ attempt /ə'tempt/ n. & vt. 企图,试图 ]


search the content?
以前有篇在学业有成的帖子,说的是余弦定理在判定两个文章(向量)相关性(夹角)中的应用,十分有趣,可以参考。
One criterion of an optimizer is that it could eventually attained to wisdom.
顶端 Posted: 2006-11-12 14:58 | [4 楼]
zc1984





性别: 帅哥 状态: 该用户目前不在线
头衔: 上帝模式
等级: 荣誉会员
家族: 战略研究所
发贴: 10096
威望: 5
浮云: 0
在线等级:
注册时间: 2004-08-24
最后登陆: 2017-06-08

5come5帮你背单词 [ pierce /piəs/ v. 刺穿,看穿,洞察 ]


Quote:
引用第4楼老子不怕您于2006-11-12 14:58发表的:
search the content?
以前有篇在学业有成的帖子,说的是余弦定理在判定两个文章(向量)相关性(夹角)中的应用,十分有趣,可以参考。


首先分词
然后把分出来的词作为[屏蔽]同分布的分量~~
然后利用扩展的余弦定理进行计算~~~

这个比较有趣
但是对于长篇大论的文章可能不那么适用~~~
毕竟分量太多了~~
比得上数学物理了~~呵呵
在北京,做飞信,也在创业,我的微博:https://weibo.com/herozhang
顶端 Posted: 2006-11-12 15:29 | [5 楼]
sinopatic



性别: 保密 状态: 该用户目前不在线
等级: 初出茅庐
发贴: 95
威望: 0
浮云: 1293
在线等级:
注册时间: 2006-10-09
最后登陆: 2007-08-20

5come5帮你背单词 [ orderly /'o:dəli/ a. 整齐的,有条理的 ]


我昨天google了一篇稍微相关的arithmetic
到今天还没看懂~
哎..算法没学好
www.sinopatic.com
顶端 Posted: 2006-11-12 17:55 | [6 楼]
est





性别: 帅哥 状态: 该用户目前不在线
等级: 荣誉会员
发贴: 6578
威望: 3
浮云: 431
在线等级:
注册时间: 2006-10-14
最后登陆: 2018-07-05

5come5帮你背单词 [ scripture /'skriptə/ n. 圣经,经文,经典 ]


据说微软亚洲研究院里的牛人们实现了视频资料的根据内容分类。例如 上篮 就会返回篮球比赛里关于上篮的片段
顶端 Posted: 2006-11-13 10:57 | [7 楼]
我来我网·5come5 Forum » 程序员之家

Total 0.009446(s) query 5, Time now is:11-24 00:46, Gzip enabled
Powered by PHPWind v5.3, Localized by 5come5 Tech Team, 黔ICP备16009856号