专访戴文渊：AI应该像Windows一样让大众也能用-人物动态-人工智能实验室AiLab-中国人工智能网-Powered by AiLab.cn

导读：第四届世界互联网大会昨日在乌镇开幕。会议期间，国内AI初创企业第四范式发布了企业AI核心系统先知3.0版本，大幅降低了人工智能应用的开发门槛。不同于先前版本的全流程学习平台，先知3.0包括数据、算法、生产三个核心，能够帮助AI技术进入企业决策层的核心...

第四届世界互联网大会昨日在乌镇开幕。会议期间，国内AI初创企业第四范式发布了企业AI核心系统"先知"3.0版本，大幅降低了人工智能应用的开发门槛。不同于先前版本的全流程学习平台，先知3.0包括数据、算法、生产三个核心，能够帮助AI技术进入企业决策层的核心系统，也就是帮助企业建立自己的AI应用技术。发布会后，第四范式CEO戴文渊接受了媒体智能的专访，谈及他如何打造了AI时代的Windows系统。

以下戴文渊专访实录：

记者：先知3.0系统相比之前的版本最大的改变是什么？

戴文渊：先知产品是去年7月20号第一次对外发布，但其实当时的版本已经是2.0版，因为之前1.0版已经在某全国性股份制银行适用。

今年3.0版先知最大的一个定位改变，是把先知定位成“企业AI核心系统”，为什么要这样子改变？是因为我们越来越发现企业需要不仅仅是一个算法或者一个系统。一直以来，第四范式在做的事情都是要降低企业使用人工智能的门槛。在早期，我们把先知的目标设计为降低算法门槛和系统的门槛，所以一直到先知2.0，先知的定位都是低门槛的机器学习开发平台、低门槛的人工智能应用开发平台。

但是我们发现这样仍然不够，一个企业如果想要很好地应用AI能力，除了要降低机器学习的门槛外，外围还有很多的工作要做，所以先知又扩展了自己的外延，我们打通了从数据到业务的闭环，将机器学习产生智能的能力，与业务环节连接，形成了一个“机器学习圈”。围绕着“机器学习圈”，我们重构了整个先知的使用方式，让企业能够更清晰、更便捷地产生智能应用场景，这就是先知3.0想要达到一个效果。

记者：我们是如何选择客户的？目前为什么选择金融和医疗这两个领域？

戴文渊：我们的目标一直都是要帮助全行业惠享人工智能的福利，我们的愿景是AI for everyone，我们并没有说主攻哪个行业，当然现在来看有些重点的方向，比如说像金融、互联网、医疗，这些是我们更重点来关注的企业，但是我们并没有说只是做某一个行业。

其实从行业来说，金融是个很特殊的行业，金融并不是一个具体的行业，金融和科技一样，都是能够去服务其它每一个行业的，一个企业既需要金融的支持，也需要科技的支持，我们先服务好金融，也是我们服务好其他行业的一个基础，当我们服务好金融以后，我们其实可以切入到其他的行业，再切入到其他行业的时候，我们会使用科技和金融结合的方式去服务这些企业。

记者：先知3.0是要打造像TensorFlow这样的系统吗？这个理解准确不准确？我们跟他们差异是什么？

戴文渊：实际上我们比TensorFlow要宽得多。今天我们把先知定位成企业的AI核心系统，这个核心系统其实会有三个核心——数据核心，算法核心，还有生产核心。我们算法核心里面会分这么几个层面，一个是低门槛的算法，其核心算法是由我们自研，第二部分是我们也会充分地去集成各种各样开源系统，TensorFlow相当于是其中一部分。所以我们的产品并不仅仅是一个TensorFlow，而是帮助企业构建一个完整的智能能力的闭环，这个智能能力的闭环当中，可能会有一个环节，如果企业想用TensorFlow，就可以把它接入。企业可能在这个环节需要使用的不是TensorFlow，所以我们还配会有更低门槛的算法，会更适用一些业务人员去开发机器学习。

记者：我们给企业提供AI的时候，我们为什么想把这个门槛降低呢？因为在我看来好像人说专业的人做专业的事情，我们其实降低了门槛，也不可能真的让行政每天过来做开发？

戴文渊：其实真的未见得，我跟你说一个夸张的事，我们公司的行政都能开发AI，当然前提是在我们这个平台上。假设您有个APP，我能把它变成千人千面，这个门槛已经低到今天不需要一个科学家来做，在先知上面，哪怕是我们公司的HR、行政的同事都能够做。

记者：你们最终目标是什么？

戴文渊：为什么干这件事？因为未来AI应用应该是遍地开花，但科学家是少的，科学家一定是小众人群，从来没有说世界上有一大批人都是科学家，所以如果要依赖科学家去做应用，AI一定不能发展起来。所以未来我们希望这些应用背后都是由AI驱动，就必须要让大众能够去掌握人工智能的能力，这个时候就不叫专业的人做专业的事了，或者说未来在这个专业应该有更多的人。就好像现在的民航的飞机，经过培训的飞行员都可以飞，而最早莱特兄弟的飞机只有他们自己能往上飞，这就是很大的差别，所有科技都是需要慢慢朝大众化方向发展。就像汽车，现在考个驾照不那么难，仍然有人没有能力去考驾照，但是如果无人车出现了，那就没有驾照也可以了。

记者：不同的行业，它的数据采集标准应该是不一样的？

戴文渊：对，不同的行业标准不一样，我们定义了产生AI能力的数据的采集标准，并且我们提供了工具，然后能够帮助企业正确采集到AI所需要的数据。比方说金融领域反欺诈场景，过程数据我们要采集交易授权，反馈数据我们要采集投诉。

记者：之前我跟您聊的时候，先知还在2.0时代，您说您先知系统要打造AI时代的一个windows，现在做到了3.0版本，距离这个理想到还有多远？

戴文渊：其实更近了一步，在先知2.0就好像没有资源管理器的windows，虽然我们提供了核心的计算能力，核心的数据储存能力，但是在之后和客户磨合的过程当中，我们发现需要更多地关注资源有没有管理到位，数据有没有提供正确？所以为什么我们今天要把整个闭环管理起来，这样我们会更容易能够去提供出一个准确的AI应用。

记者：你们的商业模式是怎样的？

戴文渊：百度可以把语音识别免费，但是百度不能把百度云免费，一个是边际成本为零的事情，一个是边际成本不为零的事情，未来所有的边际成本为零的事情都是免费，但是边际成本不为零的事情不会免费。

记者：很多互联网巨头都在打造自己的AI平台和系统，先知系统在我看来就很特别，但与其他的AI平台有什么不同？

戴文渊：我们的目标是降低企业使用人工智能的门槛，但是我们一直在调整产品，目的是提供更多的服务。我们不是一定要去跟别人去对比说，你也是平台，我也是平台。讲平台是一件很容易的事，我做什么东西都可以说自己是平台，关键不在于是不是平台，关键在于你在解决什么样的问题。因为我长期在帮助企业去构建AI的能力，我会发现其实很多企业，它其实构建AI能力非常困难，这个困难体现在很多地方，包括算法的层面，包括系统的层面，包括认知的层面，今天我们已经解决了很多问题，但是其实我们仍然需要解决更多的问题。

记者：如果比如说有一个企业它想用你们的系统建立AI自己的核心系统，它提供的数据，如果想用语音的模块，还有视觉的模块，这个东西是你们来提供还是他们可以接其他的平台？

戴文渊：语音和视觉是先知3.0可以产生的模型，我们的系统构建一个语音识别的闭环，就可以产出语音识别的能力。在这个语音识别的闭环中，“行动”就是语音识别的一个过程，“反馈”就是说识别结果对还是不对，然后基于这两部分数据，机器学习就可以产生一个语音识别的模型。其实我们已经在帮助企业构建像手写识别的能力，人脸识别的能力。我们不一样的地方，是我们让我们的客户自己拥有产出了机器学习的能力，而现在市面上绝大多数AI公司，你不需要有机器学习的能力，你买我的服务就行，这是完全不一样的产品定位。

记者：假如说我有一个公司，我就觉得现在公司考勤这个环节，就特别地麻烦，因为现在考勤有各种各样的刷指纹，如果我用你这个可以怎么解决？

戴文渊：如果识别人脸就这样，您把您公司内所有人的照片给到我，并且每个照片对应的是什么样的人，输入到我们系统里，就生成了一个您公司的人脸识别模型。不过这个模型非常针对于您公司特定的问题，不是一个通用的人脸识别的问题，不能识别别人公司的人脸。而是只能解决你们公司的问题。

记者：企业利用先知系统自己做，跟我们去买一套方案相比的话，哪一个成本更低？

戴文渊：其实有两种解决方案，一种是咱们买别人的，就是找一拨人来替我做。另外一种我自己做，我自己做的话，其实门槛最大的问题，我能不能招到足够的人才去做这样的事情？如果说我采购一个平台，以后我就自己能做了，那其实是一个非常好的一件事，因为实际上应用会非常非常多，过去可能没有人做。比如在我们与某全国性股份制银行的合作中，银行内部员工就利用这套AI核心系统在其它20多个日常的运营业务场景中提升效率、发挥价值，有很多场景是这在没有这个系统之前是不会想到去优化的。

其实，先知系统的方案成本一定是更低的。不过我认为目前AI最大的问题还不在于成本，或者是怎么降低成本，最大的问题是没有足够多的人去做，AI应用方面其实能想到的方向与场景特别特别多，做都做不过来，但是因为只有一部分人会做，而那些人现在特别抢手，所以有大量的需求被压抑着，跟成本相比，我觉得能做是现在更需要解决的问题。

记者：这样一个企业级的核心系统，最难的地方在什么地方？

戴文渊：首先第一点是你的出发点，做企业级核心系统的出发点是，你必须时时刻刻心里想怎么去帮助这些企业解决问题，这是前提。其实我们在做这个过程当中，我们关注的不是说我们要推一个什么形态的平台，第一点最重要的是要解决企业什么样的问题，之后每天都要思考离解决这个问题还差什么。要解决的问题还差的部分，我们怎么来帮助。

基于这个出发点，我们发现，企业用AI首先要解决算法的问题。在过去的三年，我们投入非常多的精力研发低门槛的机器学习算法。实际上整个学界并不研究这个东西，学界研究的都是说效果更好的机器学习算法，哪怕说这个效果更好的机器学习算法，全世界只有一个人用，只有效果更好就可以了。而第四范式研究的是什么呢？假设我的算法跟你的算法哪怕一样好，但如果我这个算法能有多10倍的人会用，我认为这个事情是值得去做的事情，这就是围绕着我们的目标、我们要做什么。其次，在算法之外，怎么去定义人工智能的数据标准，以及构建这个数据采集的能力也是很重要的。

让团队瞄准企业确实很困难的点，围绕这些困难不管有多少的问题没有去解决，我们都要去把这个问题解决，我觉得这个出发点是很重要的。

其实在解决问题的过程当中，我们当然也组建了世界领先的团队，就像在解决哥德巴赫猜想的过程中会冒出很多世界领先数学家一样，我们现在也很自豪地说，我们在很多领域，包括在算法层面，特别是低门槛的机器学习算法层面我们是走在世界领先的；在系统架构层面，比方说多维的系统架构，这个多维是多达上亿维的系统架构，在这个基础上还要做到实时处理。实时现在其实已经门槛并不是那么高了，但是现在市面上所有的实时，都是低维实时，比如说一万维我做到毫秒级，这并不是很大的问题，但是如果万亿维仍然能做到毫秒级，业界其实也就我们现在能做到。

记者：您如何去维护先知的系统生态，当你们面向一些企业级的用户做开发者平台、开发者社区，怎么去做？

戴文渊：一个开发平台，上面一定是要有生态的，我们在去年推出了一个计划，叫做“范式大学”，范式大学的定位是，我们会用四天的时间（今年年初的时候是一个月，到今年下半年，我们把它优化到了用四天），在先知平台上培养出一个数据科学家，一个合格的数据科学家。当然这还不够，科学家并不是一个零到一的问题，咱们可以从四天时间从零到一，但是未来他还需要从一到十，从十到一百，所以四天以后我们还会有一个计划，是“范式大学”计划的长期版。您通过四天的培训以后，从零到一，您会结识一个导师，这个导师能够长期帮助您不断去提升，这就是在从一到十，从十到一百的过程，永远都会有一个人帮助你提升，遇到什么困难的时候会有人在旁边去提醒你或者点拨你，帮助您最后成为一个一百分的数据科学家。

记者：您怎么去定义“范式大学”这种模式呢？

戴文渊：这个模式其实就是，一开始我们有个种子，我们从两三个人发展到一个三四十人的团队，现在我们开始有信心能把三四十人的团队往外开展，让三四十人成为更多的范式大学学员的导师，把他们培养起来。未来这些学员当他从一到十、到一百的过程中，很多学员也能成为导师，我们又可以吸纳更多的学员，这样就慢慢地，整个的AI科学家的团体就会变大。

记者：请您总结一下今年第四范式成果？明年对于先知系统的期待是什么？

戴文渊：今年其实是一个先知平台大面积落地的一年，你们如果关注我们公司报道的话，我们最近也有些标杆客户不断在落地，基本上来说也都是国内最顶尖的、标杆性的客户，这是今年做到最重要的一件事情。

明年其实我们需要从标杆客户往整个世界去覆盖，所以我们为什么也在紧锣密鼓地去培养我们的生态，因为要覆盖整个市场需要的更多的人才。（完）

专访戴文渊：AI应该像Windows一样让大众也能用
来源：互联网发布日期：2017-12-05 09:18:30 浏览：45853次

相关内容

AiLab云推荐

最新资讯

本月热点

热门排行

推荐内容

在线客服

热门栏目HotCates

关于我们

版权声明

专访戴文渊：AI应该像Windows一样 让大众也能用 来源：互联网 发布日期：2017-12-05 09:18:30 浏览：45853次