白癜风专业医院资讯网 http://pf.39.net/bdfyy/bjzkbdfyy/140823/4454957.html
新智元报道
作者:克雷格
7月30日,腾讯广告算法大赛决赛结果出炉:来自吉林大学、哈工大和北邮同学组建的“葛文强”队夺得大赛冠军,赢得30万元奖金!这次大赛赛题是Lookalike技术,目的是帮助广告主触达最大化相似人群量级,从而高效促进营销目标转化。主办方介绍,本届参赛选手73%是学生团队,C9院校参赛人数都超过了一百,竞争非常激烈。
Lookalike,相似人群拓展的利器技术,现在被腾讯广告大赛玩出新水平。
7月30日,第二届腾讯广告算法大赛决赛举办,十支队伍从超过2万名选手中杀出重围,进入决赛现场。
决赛队伍经过高手过招、现场答辩之后,最终诞生出今年的冠军“葛文强”队,获得30万奖金等奖励。
除了冠军选手外,腾讯公司副总裁、技术管理委员会主任王巨宏表示,本届大赛参赛选手73%是学生团队,C9院校都参加了算法大赛。
参赛选手云集的一个重要原因是腾讯海量资源开放。腾讯社交广告总经理罗征透露,这次大赛目的是提供一个平台,让学生群体可以去体验腾讯做的算法应用,去感受工业界需要解决哪些问题,同时也会为用户和客户带来更多价值,把全链条的技术到应用展示给大家。
有了腾讯的这些资源加持,今年的参赛者竞争非常激烈。
“熬”战20天拿下30万奖金,冠军地位险些被超惊出一身冷汗本次获得冠军的“葛文强”队,三名成员分别来自吉林大学、北京邮电大学和哈尔滨工业大学,并在初赛阶段获得第一名。
“葛文强”队成员告诉新智元,他们三人在组队后,看了无数论文,并且有至少20天是每晚至少一人通宵盯数据,最后终于以初赛第一的成绩进入复赛。
复赛之后的前两周一切很顺利,把持周冠军的宝座。
但突然有一天,“葛文强”发现自己的分数马上要被超了,队员当时有点慌。
稳住之后,“葛文强”把之前做过的一些模型,再通过一些精细化的处理,把第一保持到了最后。
本次大赛中,“葛文强”使用了两个模型。
增强树模型。核心是特征工程,特征工程分为六大块,包括基础特征编码、单特征转化率、双交叉转化率、三交叉转化率、多值变长特征降维、ID特征的(lda,nmf,svd)embedding向量。其中用户特征与广告特征的交叉转换率的特征重要性最高。在转化率的统计上面采用5折交叉统计配合贝叶斯平滑的方案。
神经网络ctr模型。核心是利用网络结构来代替手工特征交叉,为此“葛文强”以一个DNN神经网络为基础,融合了代表二阶交叉的FM部分、FFM部分、无限交叉的mvm部分、基于游走的图embedding等结构,形成了一个复杂网络。并且在此基础上加了注意力模型,取得了很好的效果。
此外,“葛文强”队还赢得“人气战队奖”。
第二、三名分别是“三只小蜜蜂”、“SML_21”战队,将10万元及5万元奖励收入囊中。“神魔咧”、“just-fighting”团队则抱走了另外两座“人气战队奖”。
C9院校每所参与人数均过百,腾讯开放资源让选手体验挑战工业界难题腾讯社交广告总经理罗征表示,早期学计算机算法,课本上的数据是“模拟的”数据,即所谓做算法多是涉及证明。现在做算法在课本上的技巧可以应用大量的数据集,但是也存在与工业界应用的距离。
因此腾讯举办广告算法大赛的目的是提供一个平台,让学生群体都可以去体验腾讯如何做算法应用,感受工业界需要解决哪些问题。
腾讯社交广告总经理罗征
罗征透露,这次大赛目的是通过使用脱敏数据,将全链条技术到应用展示给大家。
腾讯社交广告基于成熟的算法技术能力,运用Lookalike技术,能在保证精准的前提下,帮助广告主触达最大化相似人群量级,让品牌找到更多“对的人”,从而高效促进营销目标转化。
罗征说,Lookalike在广告主应用中非常广泛,并且对他们的效果影响非常大。今年将Lookalike作为赛题,除了有趣、好玩外,一个重要的原则是算法对广告主有很大的影响力。
AI技术在全链条的应用,Lookalike只是其中一块。算法的应用还可以体现在优化人力配置上,比如广告效果优化和广告审核这类目前投入非常多人力的地方,机器出错率比人类要低。
腾讯CDG人力资源中心负责人、腾讯集团组织发展部总经理艾兰表示,算法不仅有商业价值,还有包括公益在内更多应用价值。
腾讯CDG人力资源中心负责人、腾讯集团组织发展部总经理艾兰
腾讯公司副总裁、技术管理委员会主任王巨宏认为,算法决定了前台许多东西,这样的比赛让大家看到华丽的外表其实是由算法决定,算法带来的不仅有商业价值,还有更多其他价值。互联网巨头的一个重要优势就是广告,将来谁能在广告上做的好,就是要看算法。腾讯在产学研合作中有两块:一是做学术基础研究,腾讯也希望有同学在这条路上深耕;二是对想做产业的同学来说,腾讯欢迎大家一起,让更多的人体会到产品的价值。
腾讯公司副总裁、技术管理委员会主任王巨宏
王巨宏还透露了一组数字:参赛的73%是学生团队,今年C9院校参与人数均超过。王巨宏也欢迎参赛的学生参与到产业界中来,成为腾讯同事或者合作伙伴。
“未来,希望通过腾讯链接的服务,让更多的人体会到产品的价值,让大众享受到广告带来的快乐和幸福。”
详解腾讯广告另一大利器:大规模推荐技术互联网广告是大规模AI技术应用最重要的场景之一,不论谷歌、Facebook还是BAT,都在广告业务中投入了大量的研究资源和人力,因为广告场景的很多技术创新都能直接转换为商业收入。
腾讯社交广告在Lookalike等大规模推荐技术方面,进行了多年积累与探索,结合产品、运营推广,共同驱动社交广告业务高速增长。
腾讯社交广告专家架构师李长城介绍,TSA的推荐引擎采用了业界主流的向量检索方法(YouTube年发表)。虽然在电商等结构化场景,有一些新的方案提出并取得了不错的效果,在社交广告这种非结构化场景,结合对向量检索中具体问题的优化,该方案仍然获得最好的效果。
腾讯社交广告专家架构师李长城
向量检索主要由两部分组成:一是向量内积DNN,通过DNN学习用户/广告embedding向量,两者的内积表示感兴趣程度;二是近似最近邻(ANN)检索,通过ANN算法大幅缩短检索时间,召回近似topN感兴趣候选。向量检索能够以较低的性能开销获得近似全库遍历的检索效果。实际应用中,也存在很多问题需要优化改进。
李长城介绍了腾讯社交广告在推荐优化中的几项工作,包括ANN算法选取及细节改进(HNSW优化聚类分层及邻居计算),ANN通过数学变换支持内积度量,建模先验概率提升效果(内积不是距离度量,近邻检索算法不能直接使用,通常会归一化为cos,导致了相应的效果损失),以及共用lookupembedding建立双塔间的潜在特征关联,缓解向量内积DNN不能直接使用user-ad组合特征的问题。
除了模型算法,李长城也概述了TSA在NLP基础技术、大规模机器学习平台,超大规模稀疏DNN训练等方面的建设与创新。
腾讯社交广告是国内流量最大、场景最丰富、覆盖人群最为广泛的互联网广告平台。在超大规模数据的支撑下,多种主流AI技术协同优化,共同驱动广告业务高速发展,以及业界前沿技术的应用与创新。
AI实时判断用户推荐广告,腾讯推机器学习平台TI-ML降低技术门槛传统的广告判断是以天为单位来做判断,也可以勉强做到小时级,但是终究比实时上效果要差。
在注意力经济下,用户的广告判断对实时判断的要求越来越高,需要在用户点进来的时候就判断哪一条广告适合用户看,人类操作无法适应这种实时性要求。罗征说,目前腾讯的
转载请注明地址:http://www.1xbbk.net/jwbfz/879.html