人工智能已经成为重塑所有行业的生产效率的利器。在一系列让人“瞠目结舌”的战果之后,随之而来的是技术、机器学习以及一切“朝AI进化”的热潮快速来临。
近年来不少互联网企业都在积极举办算法比赛正是“AI热”的一个缩影,比赛并非唯一目的,很多公司真正的愿望是接触到更多的算法人才,这其中就包括了诸如腾讯、京东、滴滴、阿里巴巴等中国互联网领域的佼佼者。
不久前,腾讯首届高校算法大赛刚落下帷幕,来自南京大学的三位学子拿下了本届大赛的冠军,并赢得了高达30万元的冠军奖金。为什么腾讯社交广告要下大力气举办算法比赛?机器学习对于广告的意义在哪里?
配图:腾讯社交广告总经理罗征为本次算法大赛冠军团队颁奖
Morketing对话罗征,从一场比赛,了解他对人工智能的态度。
从转化入题
此次算法大赛的命题是“移动APP广告转化率预估”,题目并没有套上一个与AI有关的大帽子,而是着眼在了非常实际的问题上。在罗征看来,这个命题既有难度,又十分贴近社交广告最核心的部分:转化率优化。“转化率一直是广告主最关心的,他们花钱买点击和曝光,自然希望了解可以带来多大价值。这就是转化。”
从转化率入手,是因为罗征希望能让参赛的学生们不光在做算法,同时也能去更深入的了解计算广告,特别是社交广告领域中存在的现实问题。在与几个夺得优异名次团队的交流中,罗征明显地感到他们不止是“跑了些算法”这么简单。
“如果不了解转化的优化是为了什么,只是研究机器学习,基本没有可能赢得比赛,获奖的前几名团队都对腾讯社交广告的业务和逻辑做了深度的思考。”罗征说,比赛不仅训练了他们机器学习的能力,更多的是把算法落地在广告领域中的实际应用。
配图:腾讯社交广告APP推广成本优化专属解决方案oCPA
来自冠军团队“nju-newbie”的成员在接受采访时也谈到:“本次赛题的目标是转化率预测,相比于一般的点击率预测,转化率预测更困难,用户数据更稀疏,影响转化率的因素更多,这都是对于参赛选手的挑战。”
在腾讯社交广告的体系中,最早应用人工智能理念和方法的就包括转化率预估、点击率预估和广告审核等多个方面。在数据挖掘中,也会利用到AI,例如对用户商业兴趣、行为和生活状态等进行判断时,机器学习是最好的选择,可以避免人工参与导致的隐私问题。
数据,是这次比赛中让不少参赛团队印象深刻的一面,几位受访的参赛学生都谈到这次比赛的数据规模是他们见过的比赛中体量最大的一次。数据规模,从很大程度上激发他们使用了不少之前没有探索过的模型和技巧。获得比赛亚军的团队Raymone在接受采访时说:这次比赛的数据量是所有团队几乎都要面对的问题,很多小伙伴在此之前都很少有机会接触到几十GB级别的数据,在机器性能存在瓶颈的情况下,如何高效的处理并构建模型是非常考验能力的一面。
数据体量既是腾讯的优势之一,同样也是考点。罗征谈到当数据规模越来越大,对模型和算法的要求就不再局限于“做得好不好”,还要考虑到工程方面“做得快不快”。如今AI的基础研究已经不只是追求结果,也要追求速度和资源利用率。
这一点也体现了不少团队的解决方案中,许多队伍都强调在进行转化率预估前,对数据进行预处理,去噪以及特征提取的重要性。
今年比赛的高校学生让罗征印象深刻,除了感受到他们认真的投入,对于算法思考的质量也出乎意料的高水平,“参赛学生们的一些想法和思路,确实值得我们内部去借鉴和尝试”。
产品驱动下的智能时代
近几年来,AI的基础投入越来越多,算法的突破也越来越多。深度学习和各种技巧、能力,让AI的应用覆盖面越来越大。为了更好的应用AI,罗征和他的团队也会做一些研究性的投入,目的是利用AI来增加广告效率,增加广告主的利益。
配图:罗征在腾讯社交广告高校算法大赛
这在之前是很难想象的,罗征回忆在自己读书的那个时代,一项技术从科研到工业界尝试,最后变成产品实际应用往往需要5到10年的时间。而在互联网公司的时代,这一速度被迅速加快。
据悉,如今很多新兴的互联网公司例如Google和Facebook都已经不再像IBM和AT&T那样设立大型研究院。许多公司的研究院专精于最前沿的基础研究,比如腾讯的AI-Lab实验室,其发展目标是“学术有影响,工业有产出”,因此专注于基础研究和应用探索结合。而另外一个人工智能的研发驱动力已经从“学术研发”转向产品驱动。
“以前的技术研发,先是学术界出来很好玩的东西,然后研究下有什么应用价值,再去落地到产品层面,以专利的形式卖给大公司;如今,很多时候是产品团队要提升效率,需要这个功能,反推研究方向。”这样的变化让技术从理论落地到产品的速度大大加快,周期变得很短。罗征提到在算法大赛中,一些参赛选手直接参考了业界的一些前沿论文,并直接应用在比赛当中,这么快的反馈周期,是10几年前所不可想的。
然而时间的缩短,并不意味着一切都要朝“AI看齐”。“AI是一个很重要的提升效率的手段,但不是目标。我们不是为了做AI而做AI。作为一个企业的CMO来说,最重要的是结果,我们可以说使用了AI的技巧,提升了广告的效果,但最重要的还是转化结果。”[NextPage]
AI在罗征看来是一个工具,能够帮助实现一些人做不到的事情。落地在广告领域中,一是将人力所能做的事情自动化,比如在广告审核中引入AI技术,将某些步骤自动化处理从而起到对效率提升的作用;另一种是做一些人做不到的事情,比如在转化率预估中,数据的体量可能包含了几亿用户过去几个月的所有点击,所有转化,体量非常之巨大。要将他们总结为一个模型,得出有效的判断,是人力所不能及的,这也是机器学习等AI技术在广告领域中最为关键的应用。
Morketing观察到,近年来AI行业的发展速度惊人,许多互联网的一线企业都在加大投入,并且以开源的姿态鼓励更多的开发者进入AI的领域中。Google的Tenser Flow计划以及百度的无人车项目等都把开放平台作为主打。整个业界投入的加大,对于罗征所在的产品应用层来说,无疑是件好事。
人工智能的现实瓶颈
尽管AI正处于风口,但罗征认为人工智能的应用目前有两大瓶颈。
想要把AI做的更好,人才储备是第一位的。据媒体报道,人工智能在人才方面极为缺乏,例如为了给创新工场AI工程院抢人,李开复曾亲自跑了多场高校招聘会。而阿里云的人工智能科学家闵万里表示,团队里很多年轻技术人员都被挖走了。
配图:腾讯社交广告首届高校算法大赛参赛团队合影
未来人才争夺战可能会更加激烈,因为越来越多的公司开始成立人工智能研究部门。据悉,微软AI研究院曝光,位于微软雷德蒙德总部,拥有100多名来自各个AI研究子领域的科学家,包括认知、学习、推理以及自然语言处理。网易也在不久前设立了人工智能事业部。
与高校加深合作,从高校层面就开始招揽人才也是这次“算法大赛”的目标之一,罗征坦言人才的供应永远是不足的,每年这个领域的毕业的人才数量有限。招兵买马是一个需要持续下去的工作。
而另一个AI的门槛,更多的来自于企业自身的限制。例如在罗征所在的部门,出于对用户隐私保密的负责,所有的机器学习算法所处理的数据均不会利用任何的聊天记录,这是腾讯为自己定下的规则。
“虽然腾讯的数据很丰富,但是对于垂直行业的理解,还是有些合作伙伴比我们更强的,比如说我们跟易车一起探讨汽车类的用户,跟京东会探讨电商类的,美团点评就探讨O2O类的。他们对用户在垂直行业上面的行为兴趣理解更深入。我觉得下来更进一步的突破点,主要就是结合一些行业数据,如何与社交数据结合的更好。”
腾讯社交广告算法大赛由腾讯社交广告携手腾讯数据平台部、腾讯高校合作、腾讯云、应用宝、腾讯招聘、T派校园等各大资源与平台联合举办,旨在加速推进算法优化,持续提高广告的效率和投入产出比,为数字营销提供完整、精准的解决方案。