|
而在自动驾驶上,我们也做了大量研究,六大类别的技术,有 30 多个细分核心技术。我在这里面就简单举几个例子做演示。比如车的检测、行人检测、路道线的检测、实时的场景分割 …… 我们也做了前端,用前端的芯片做实时的效果。 在这些数据中,从这些自然语言里面我们可以抽出不同的词,用词来描述不同的人,其信息量巨大,搜索准确率也大幅度提高。这是具体的监控方面应用的结果。用自然语言做人的搜索。大家可以想像一下在医疗上的应用,如在多模态的医疗诊断上。一个是医疗的图像,一个是医生的文字诊断,可以实时地识别出来,进行自然语言的分析,把两个进行结合再进行诊断。 2016 年的时候,推特跟谷歌密集发表了几篇关于超分辨率的文章,其核心就是深度学习。而我们早于他们,就已经做了大量先期研究。我们在 2014 年发表了全球第一个用深度学习研究超分辨率的论文,在 2015 年又发表了一篇相关文章,2016 年发表了两篇,取得了更大的突破,而在 2017 年紧接着发表了三篇。我们的 Cavan 教授团队是第一个做的,也是目前做的最好的。目前超分辨率已经走向实时以及效果实用化的阶段,利用这项技术在某些实时监控,公安监控摄像头可以把人看的比较清晰了。最后,在 2016 年,还是谷歌最厉害,每年 120 亿美金的研发投入没有白投,下了一盘棋叫 AlphaGo,这盘棋下完之后人工智能就不需要我们解释了,大家忽然都明白了,人工智能原来是这么回事儿,就是下棋。 我们还有一项工作是超分辨率,就是把很小的图像放大,最大化还原细节。这是好莱坞电影的图像,视频抓到一个很模糊的嫌疑罪犯的图像,然后把它实时的放大变得很清晰。这只是谍影重重电影上演的效果,还是很震撼的。上面这个工作是去年做的,根据一张照片里两个人的姿势,可以自动判断两个人之间的情感,是友好的还是敌对的,同时可以根据两个人的表情也可以判断两个人的关系。所以,以后如果你把你的照片上传到互联网上,实际上我们可以判断出来跟你一起照相的这个人和你具体是什么关系。上面这个也是一项新的研究工作,根据这个 Video,识别内容,判断剧情属性。以泰坦尼克号电影为例,你可以看到那两个曲线,现在是浪漫的场景,代表浪漫的线就上来了,如果是灾难,那个灾难的绿线就上来了,实时根据这个内容判断剧情,这也是去年的工作。第一,要坚持,要花时间把基础打好; 语音识别取得了巨大成功以后,深度学习紧接着在视觉方面又取得了重大突破。2012 年时,Hinton 在 ImageNet 上将图像识别一下子提高了十几个点,以前我们都一年一个点在推,他一年就推了十年的进步,在学术界引起了很大的轰动。2014 年我们团队做人脸识别,通过深度学习,做到算法首次超过人眼的成绩。 这是视频结构化,把视频里面的人、机动车、非机动车及其特性都检测出来了,并且自动标注出来了,这样整个视频就变成了文档,可以进行文档性的搜索。深度学习的突破 我们训练出来这样一个大脑,可以把它应用到各个方向,在很多不同的领域做出的不同技术。在人脸方面,我们做了人脸检测、人脸关键点定位、身份证对比、聚类以及人脸属性、活体检测等等。智能监控方面,做了人、机动车、非机动车视频结构化研究。人体的属性,我们定义了大约 70 种,人群定义了 90 多种属性。下面这些是衣服的搜索、物体的检测、场景的分类和车型的检测,车型检测我们标注了几千种车型的分类。在文字方面,小票的识别、信用卡的识别、车牌的识别,这些都是由深度学习的算法来做的。同时在图像的处理方面,在去雾、超分辨率、去抖动、去模糊,HDR、各种智能滤镜的设计都是用深度学习的算法,我们基本上用一套大脑做很多的任务。雷锋网对演讲全文做了不改变原意的整理: 汤晓鸥:香港中文大学信息工程系主任。博士毕业于麻省理工学院,曾任微软亚洲研究院视觉计算组负责人,2009 年当选 IEEE Fellow,ICCV09 程序委员会主席,ICC19 大会主席。2009 年获计算机视觉顶级会议 CVPR 最佳论文奖。2014 年其团队研发的人脸识别算法全球首次超过人眼识别能力。在谈到 " 在中国创业是怎样一种感受 " 时,汤教授称," 创业的困难是一定存在的,年轻人要不要创业?尽管路上的坑比较多,但还是可以试一试。" 显然,汤教授对年轻人创业持鼓励态度,至于用谁的资金创业,汤教授表示,不要用父母的钱,要用投资人的钱。因为," 劫富济贫,人人有责。" 第二,要做创新。要做新的东西,不要老是跟在别人后面走; 利用深度学习做计算机视觉 最近这几年深度学习确实在学术界、工业界取得了重大的突破。第一个突破是在语音识别上。Hinton 和微软的邓力老师,在 2011 年用深度学习在语音识别上取得了巨大的成功。昨天可能大家的微信也被刷屏了,我们中国科大毕业的师兄邓力老师从微软出来到顶级对冲基金工作。我的理解这也是一个 A to B 的 mapping 的过程:把邓老师的深度学习的经验等内容都输入到对冲基金的算法里,这个对冲基金的钱就自动 Map 到了邓老师口袋里。首先,什么是人工智能?这个概念现在已经非常难定义了,大家几乎把所有的事情都往人工智能上靠。从我的理解来讲,人工智能真正落地的部分就是深度学习。因为以前的人工智能确实是在很多情况下用不起来,人手设计的智能来做某一件事情还是比较难超越人。而有了深度学习之后,我们可以把这个过程变成一个数据驱动的过程:当做某一件特定事情时,数据量及参数量大到一定程度之后,机器就可能在做这件事情上超过人类。很多现实中落地的产品化的东西,都是深度学习做出来的。深度学习做的东西,成功的案例比较多,一方面是在语音识别领域,另外可能更多的是视觉这方面,所以大家可以看到很多计算机视觉方面新的成果。我今天给在座讲的人工智能其实也就是计算机视觉,用深度学习去做计算机视觉,就变得更窄了。 (责任编辑:admin) |
| Tags: 遮天之登仙路 这浪漫一千年有几回 浙江阔少刘子超 真锅卡奥丽 郑洁胸围 知音漫客277 职来职往 赵雪 职业价值观拍卖法 直捣花芯 中国达人秀杨地地 中国男足主教练付博 中国至宪党成立通告 |
- 上一篇:从创意到创业 程思祺如何让益涂书写墙赢得五百强青睐
- 下一篇:如何筹集创业启动资金?

谈谈您对该文章的看