您当前的位置:长城网>>建站频道>>热点文章

百度机器海选:机器如何认出“姐妹花”

http://www.hebei.com.cn 2013-04-07 08:44 长城网
【字号: | | 【背景色 杏仁黄 秋叶褐 胭脂红 芥末绿 天蓝 雪青 灰 银河白(默认色)

  娱乐界往往是新技术的“尝鲜者”,因新技术引入促成“重要事件”的不乏先例,以卡梅隆在电影中大量采用3D技术最为典型。在今后一段时期,“机器海选”可能会成为娱乐界会特别关注的技术方案。

  4月1日,由百度发起的“机器海选”活动迅速蹿红。“用机器代替评委,以算法决定评判标准,用手机拍照就能参与”,这种新玩法吸引了众多网友关注。一天之内,APP下载使用量近2万次,微活动相关话题达到了7万多条。

  对网友们来说,APP客户端本身是个娱乐软件,上传照片就能测出与自己与明星相似的程度,但这仅仅是表象。如果判断无误的话,背后其实是百度为海量视觉搜索系统做的一次beta测试,人脸不过是切入点之一(百度开发的全球首个全网人脸识别产品于去年底上线,今年百度APP iOS版推出狗、图书、海报等细分图像搜索)。究其技术本身而言,这是百度在“人脸识别”技术和“海量数据分析处理”的一次合练。

  对于人类来说,因为大脑的精密性,认识一张图片并不难。而对机器来说,要先从图片中识别出是否有人脸,再确定出人脸的特征到底是怎样的?后面还要与海量的人脸图片相对比。其技术难度超过大多数人的想象。为什么百度的识人技术能做到准确呢?背后到底是哪些技术做支撑呢?不妨把我们自己的行为和机器行为做个对比。

  先来说说人脸识别,要将真实世界的图像转化为机器能识别处理的数据,必须要“见多识广”,以海量数据学习做支撑,起步工作是将几千万人脸数据让机器学习出来,识别人的特质,把物理世界的脸变成机器可以理解的脸,以前有指纹库、DNA库,现在相当于也有了人脸库。作为搜索引擎公司,百度能够索引互联网上数以百亿计的图片资源,而且业务本身就决定了它要拥有海量数据的高性能处理平台,这样的优势是学术界经常使用几千个研究样本难以比拟的。

  为什么人能看出两张人脸的差异和相似处呢?因为每张人脸都是有特征的,有些人类可以快速看出来,比如肤色、纹理、轮廓、五官距离、几何造型等等。还有一些认识的层次更深一些,观察力不强的人很难快速说出来,比如颧骨高低、鼻子挺拔程度等等。我们现在的要求是,机器必须能像人一样认识这些特征,这样才能从不同照片中准确认出一个人。

  从方法上说,百度的人脸识别其实是将人脸快速用几万个维度表示出来,同时要克服光照、姿态、表情、角度等有可能影响提取特征的环境因素,把人脸改造成一张机器参数表示的面孔,再通过开发的极其精密的算法将维度缩减为一定数量的特征。这个过程很类似于大脑的思考,甄选出独一无二的信息来。方法实现的核心在于算法,这是百度视觉技术的核心,投入优势资源打造的重武器。而依靠搜索技术长期建立的大数据处理能力,机器算法可以在很短时间内并行分析处理完成。

  值得期待的是,机器学习领域的前沿技术——“深度学习”已被应用于视觉和语音等多媒体技术中,系统会通过神经网络的方法,不停自动学习特征和组合,它能让系统辨识发生飞跃,未来前景是让机器像正常人一样学习,拥有人脑的分析能力,智能分辨图片中的每个物体。

  今年年初,百度对外宣布成立百度研究院,初期就重点聚焦于“深度学习”技术,这说明百度其实已经从前期投入中尝到了甜头,并坚信继续加大的技术投入将给百度的基础核心技术带来回报。种种迹象表明,机器大脑时代渐近了!

关键词:百度,机器海选,姐妹花

分享到:
打印 收藏本页
稿源:中国新闻网
责任编辑:赵文强
普及型:100M空间 60M邮箱空间 仅适用小型企业用户
350元/年    详细信息>>
基础型:200M空间 60M邮箱空间 仅适合小型企业用户
500元/年   详细信息>>
论坛型:300M空间 60M商务型邮箱空间 100M
MSSQL数据库 650元/年      详细信息>>
商务型:500M空间 100M商务型邮箱空间 中型企业用户使用 950元/年    详细信息>>