最近有一家中国公司以黑马之姿在自动驾驶领域异军突起。图森科技宣布,该公司在自动驾驶算法公开排行榜KITTI和Cityscapes评测数据集上获得了九个世界第一。 这是KITTI和Cityscapes评测数据集上第一次有一家公司“霸榜“。而图森科技的竞争者,都是百度、三星、英伟达、斯坦福、中科院、多伦多大学、NEC实验室、加州大学圣迭戈分校等这些名企名校及科研机构。和这些巨头们相比,图森只是一个刚成立一年的创业公司。 即便获得了如此惊人的成绩,图森科技CEO陈默依旧很不满足。他对新浪科技说,“霸榜“其实是为了向投资人证明图森科技在自动驾驶领域是领头羊,这仅是手段。图森真正想做、并且在做的事情其实是货运商用车的自动驾驶。 根据中物联统计数据显示,2015年道路运输费用3.3万亿元,可交易的公路货运市场总体规模在2.6万亿左右。 陈默认为这是一个无比巨大的市场,至于巨头云集,而且高难度和高复杂度的大众消费级自动驾驶,他坦言并不兴趣,落地需要的时间太长,而时间对于一家创业公司而言太宝贵了。 “自动驾驶加货运足够支撑起图森科技的梦想,我们想改变行业,我们也想带着图森上市。更现实的角度来说,年轻的图森科技还可以在这个领域进行弯道超车。“陈默说,2017年是他们对货运自动驾驶落地的预期,现在就是和时间赛跑。 人工智能中国并不逊于国外 现在的投资圈,人工智能已经成为最热的议题,但是和以往互联网的投资相比,中国的投资人们似乎更愿意去看国外的创业公司,认为他们在这个领域更加先进。 对于这种取向,陈默有些忿忿不平,他觉得其他方面可能确实存在这种差异,但是基于大数据和深度学习的人工智能,中国和国外几乎是同时起步,差距其实很小,甚至在不少领域都是领先的。 “去参加 KITTI和Cityscapes评测数据集,目的其实很简单。我们说自己是领先的,怎么证明?没有什么比这种世界级的公开排行榜更具有说服力了,因为参与者都是最牛的机构和人。“ KITTI由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。 用了一个月时间,图森科技在KITTI数据集上,拿到了目标检测中车辆检测、行人检测、自行车三个单项、目标追踪中车辆追踪、行人追踪的两个单项、道路分割包括urban unmarked、urban marked、urban multiple marked三个场景及前三个场景的平均值urban road等四个单项四个单项的总计九项第一。 而Cityscapes数据集则是由奔驰主推,提供无人驾驶环境下的图像分割数据集。用于评估视觉算法在城区场景语义理解方面的性能。在fine和coarse两套评测标准中,图森排名靠前,人脸关键点定位的两个评测数据集300W和AFLW上排名第一。 十年积累 去参加KITTI和Cityscapes评测数据集“刷榜“其实是一件很冒险的事情,因为参加这种级别的竞争,无论是大公司还是小公司,都需要相关的研究团队和个人全身心地投入,工作停摆。如果没有拿到成绩,对于创业公司而言,无疑是沉重打击。 尤其是图森科技还有着巨大的野心,不满足于一两项的第一。 陈默告诉新浪科技,这种规模化的“霸榜“是他们一开始就想好的,要的就是不鸣则已,一鸣惊人的效果。所以他们选择了最开始就攻克难的项目,有把握的项目放在后面,甚至有项目仅用了一天时间,在最后截止日期上交的。 之所以敢这么做,陈默说是因为他有特别牛的团队。 图森科技有两个团队,工程及商业化团队在中国北京,核心算法研究院在美国加州圣地亚哥。目前公司规模70人左右,北美研究院有20个人在做核心算法,国内算法部门10人,硬件部门10人,工程部门10人。 北美研究院由联合创始人兼CTO的侯晓迪领导,他是加州理工学院的博士,计算机视觉和认知科学领域专家,创立了基于频域的视觉注意机制理论,基于这个理论的论文已经被引用2000多次。 国内算法团队由首席科学家王乃岩带领,他是香港科技大学博士,2014 Google PhD Fellow计划的入选者,多次在国际数据挖掘和计算机视觉比赛中名列前茅。 工程技术VP郝佳男,南洋理工大学博士,有十年并行和分布式运算研究经验,曾是淡马锡国家实验室研究员。另一位算法科学家黄泽铧则是卡内基梅隆大学机器人学硕士,计算机视觉和人脸分析领域专家,负责图森的驾驶员监控系统研发。 图森科技成立于2015年9月份,陈默认可“黑马“的论调,却不愿意别人给图森贴上“AI新人“的标签。“我们团队已经在人工智能方面研究了十年,这一年仅仅是厚积薄发而已“。 自动驾驶加货运 在自动驾驶之前,图森科技最开始做的是基于图片识别的广告业务,为用户浏览过的图片打上关键词标签,通过算法精准匹配,让广告主找到最适合产品定位的投放广告位等工作。 虽然营收在千万级,但陈默和他的小伙伴的们并不满足于此。陈默直言,技术团队们想做一些更酷的能改变世界事情,而他通过几次创业,已经实现了财务自由,这次他希望能带着一个公司走向上市。计算机视觉在广告领域,天花板太低。 转型是从今年年初开始的,陈默说转型的决定很快都在团队内部和投资人新浪那里通过了,那么转向哪里? “计算机视觉目前就人脸识别、安防和交通三大应用领域。人脸识别和安防可以归到一大类中,国内几家计算机视觉公司已经做了很久了,而且还有海康威视、大华等上市公司,不是一个好跑道。自动驾驶,虽然有很多大公司在尝试,但是整个市场还在探索,而且前景广阔。“ 虽然说目前自动驾驶还在探索阶段,但是自动驾驶是目前最为热门的科技领域也是无可回避的事实。谷歌、百度、英特尔、Uber、丰田、本田、福特等科技和车企巨头,Mobileye等大量专业技术提供方都是图森要面临的对手。 而陈默眼中,他们和图森其实是不同跑道的选手。“他们想攻占的是大众消费市场,面对的是消费者。而我们想做的是货运商用市场,面对的是企业“。 按照他的介绍,在自动驾驶上,图森互联的目标是与运营车辆企业合作,为定制摄像头配合毫米波雷达的低成本自动驾驶算法和解决方案。模式其实与国外自动驾驶卡车公司Otto相似,为高速公路、矿区卡车提供自动驾驶系统。 图森目前正在和北奔研究院、北京理工大学进行合作,联合研发军用重型汽车的自动驾驶技术。北奔主要提供整车平台以及相关试验资源,北理工为自动驾驶车辆的研发提供运动控制技术,图森负责计算机视觉和深度学习算法部分,提供以摄像头为主、配合毫米波雷达和视觉芯片的、经济型自动驾驶解决方案。最快需要1年的时间出原型车。 陈默的设想是,图森技术的自动驾驶汽车在2017年或者2018年就可以上路。 快速商业化落地 作为一个连续创业者,陈默将自己定义为一个务实的领导者,这让他避开了技术公司常常会遇到的一些理想主义的坑,也让图森在商业化上走得也比较早。无论是货运还是多目摄像头加毫米波雷达的综合解决方案,都是立足于让技术更好地落地。 “以激光雷达为核心,然后配上高精度地图的技术路线,不适合创业公司,成本太高了,一套64线激光雷达要8万美元,一台无人驾驶车基本上要装四部,而且降价恐怕至少要等到2020年。为什么谷歌先行了这么多年,一直没有大规模推广,成本是很大的一个因素“。 对于图森所选择的计算机视觉加毫米波雷达的方案,陈默表示,这会让成本降到激光雷达的二十分之一,而且能够实现数据采集和高精地图标定的快速部署,低成本和易量产让这种方案在商业化上会走得更快。最大的难点就是对算法的要求极高,但是这是图森的优势所在。而且有一天计算机视觉识别和深度足够强大的时候,可能就再也不需要激光雷达了。 选择货运方向,也是现实和理想的结合。 “货运是个万亿级的市场,中国有两千多万的运营车辆,从市场容量来看,这是一个天花板极高的市场。而且自动驾驶减少货运公司雇佣成本,让他们也愿意和我们合作。“据陈默透露,已经有物流公司打算和图森合作试点。 从技术难度而言,货运也是一个更快落地的方向。路线单一,基本都是高速路段,路况复杂程度远远低于城区,数据好收集等等都是货运的优点。 按照陈默的计划,最开始的目标是让每辆车减少一个司机,在指定路段下自动驾驶。到最后一个运输车队只需要一到两个司机,其他车辆追随领头车无人驾驶。这个原型化方案最快将在1年半之内达成。接下来,服务还可以蔓延到整个车队的管理系统。 更近能够实现的事情是ADAS硬件的落地,图森将从“两客一危“、室内公交等运营车辆入手。通过将4路摄像头连接车内计算机,在碰撞之前,对周边行人和车辆进行识别以及运行轨迹的测算,从而为司机提供碰撞预警。该产品将在4个月后投入市场,目标客户是公交公司以及运营车企等。 陈默说,从起步到上市,肯定是漫长而艰辛的过程。但是这次他憋着一口气,要和兄弟们一起带着图森上市。
«
未来人类生命安危 或离不开人工智能
|
OKCoin币行比特币回温 比特币支付在日本成潮流
»