我的网站

做1.84亿用户的“心腹”,网易云音笑携手飞桨让保举体系更“贴心”|歌弯|歌单

2022-01-22 13:38分类:资金融措 阅读:

每当深夜人静时,你掀开网易云音笑,或听歌刷笑评,或望直播闲聊,享福着以心交心的放松愉快。在这背后,有一群技术人员苦思冥想地探求着,只为让“云村”越来越懂你。

“分歧于时时的闲聊文本或图片,音笑自己是跨域数据,具备若干特征,数据维度特别专门众。而1.8亿月活海量用户的音笑关联数据,带来的计算量、保举量、参数周围都宏大无比。”网易云音笑机器学习平台技术团队认识到,在如此复杂题目目下,传统机器学习手法徐徐无力对立。

此外,云音笑的直播生意兴盛,商业化外现出色,团队的担子更重了,“直播动为与音笑动为迥异甚大,这意味着计算量与难度进一步补充。”压力之下,该团队将目光瞄向“图神经网络”,并结果选择利用百度飞桨PGL图神经网络技术来迭代升级云音笑的保举体系。

保举体系为何必要图神经网络?

动作全球驰名音笑社区,网易云音笑在繁盛发展的同时,其保举体系面临三大难题:囊括音笑、歌单、Mlog、直播、云圈、动态等的众域数据;海量用户产出的超大周围数据;超30万音笑人发布歌弯,超28亿用户产生歌单,27%用户交流/生产内容组成的动态数据标签。

传统的机器学习手法必要厉格拟订一套规范来挑取样本,逐项指定样本的各个特征。但云音笑用户产生的众域数据,可能会有若干个特征,加上近2亿的用户周围以及高频率的动态更新,必须进动巨量的计算,机器学习手法的训练后果因此大受节制,变得相当矬效。

而图神经网络技术的收敛性较小,把每个用户当做点,用户的标签动作边,分歧用户之间基于点和边的关联形成网,在此基础上建模分析,因此能更高效地外征、筛选某一类用户。比如,当两位素不相识的宝妈,同样嗜动听某些亲子歌弯时,她们在“图”中就有可触达的连接,模型会依据这些连接关连学习出适宜的外征,并把这些亲子歌弯保举给肖似的用户群体。

真相上,图神经网络已经成为方今互联网企业高效外征用户与内容陷阱的关键技术。既能基于用户在歌弯、歌单、动态、Mlog等各方面的跨域动为联络建模;又能声援众栽动为子图,如深挖用户在歌弯方面的播放、点赞动为;并声援载入用户节点的画像特征与内容节点的类型特征;还声援明达扩展,如适用音笑生意场景的图神经网络利用能很方便地迁移改造用来声援直播生意场景。

飞桨PGL图神经网络的三大领先能力

市面上挑供图神经网络技术的厂商不少,说首选择百度飞桨PGL的原因,网易云音笑机器学习平台技术团队总结了三点:飞桨PGL声援超大周围数据的全图存储、子图检索、高效图学习三大领先能力。

团队曾经尝试过众家国内外顶级厂商的图神经网络技术,其中两家国际大厂的产品他国现成的分布式编程范式,无法高效地处理超大周围图模型训练当中遇到的图存储、分布式训练等题目,在单机层面顶众声援到千万级别或亿级别,而到了百亿甚至千亿级别,只有飞桨PGL挺住了。

据介绍,云音笑的数据周围特别专门雄壮,数据关连即使经由过程裁剪也高达千亿级别以上。而飞桨PGL技术,原生声援分布式图存储和分布式采样,可将图的特征存储在分歧的Server上,也声援将分歧子图的采样分布式处理,并基于PaddlePaddle Fleet API来完美分布式训练,实方今分布式的“瘦计算节点”上加速计算,于是不妨为云音笑处理高达百亿级别的大周围数据。

不单如此,飞桨PGL实现了极矬成本的大周围图存储,这让网易云音笑技术团队特别专门认可。“飞桨PGL的分布式图存储方案比较明达,恰当云音笑,能迅速搭首若干个分布式网络,无需专科数据库存储底层能力,存储成本降矬70%+。”在4亿节点与400亿边数据如此的场景下,飞桨PGL的分布式图引擎资源,以60弹性节点(4CPU,16GB)的配置,可挑供比中央化数据库更浅显、更明达的存储服务。

再者,他们团队还体验到飞桨PGL的另一个利好,即明达的子图检索模式。飞桨PGL不单预置常用模式,同时联动分布式图存储引擎,声援自定义子图检索模式,更吻合生意实际需求,操纵首来更随手利市更高效。

飞桨PGL给网易云音笑技术团队印象最深的一次是,用不到30众台闲置老旧CPU机器在1天内训练完100个epoch数百亿边的LightGCN模型。这在业细君士听来可能会有些不可思议。“要是换成以前那栽单机方案很难实现,由于内存早已爆落空了,无法存储这么宏大的图。”团队成员介绍道,或许还有其他方案能实现,但飞桨PGL的方案,性价比极高,恰当大周围利用。云音笑的保举体系采用飞桨PGL技术后,在冷门歌弯分发、云村广场、结巴人一首听等众个细分生意场景的后果都有分歧水平的显然升迁,最高甚至升迁了近一倍。

没关连说,飞桨PGL所挑供的声援超大周围数据的极矬成本全图存储、明达子图检索、高效图学习等能力,在云音笑的工业实践中真实用下来,发现都是不妨已足实际必要的。这正是飞桨平台源于产业实践,更恰当产业利用的最好表明。

飞桨PGL图神经网络掀开利用新空间

基于超大周围复杂数据的用户与内容理解是很众互联网内容企业所面临的共同课题。而飞桨PGL图神经网络技术在网易云音笑的成功落地,佐证了自身动作企业可用的高性价比超大周围图神经网络方案的繁盛实力,将助力这些企业高效、矬成本地外征用户与内容,创建无缺精准保举机制,做用户的“知心人”,进而催生新式样新模式,从中获取商业收入。

接下来网易云音笑机器学习技术团队还将立足云音笑的实践,探求图神经网络技术与AI的深度协和创新,如构建音笑社区的用户和内容理解中台,以及基于知识图谱的图神经网络落地利用;并计划与飞桨一首逆哺开源社区,助推图神经网络技术在产业界普及落地。

郑重声明:文章来源于网络,仅作为参考,如果网站中图片和文字侵犯了您的版权,请联系我们处理!

上一篇:西门子总裁和德国外长撕破脸,政客资本内争爆发,美国奸计得逞?

下一篇:买二手房要交哪些税?买二手房要细致什么

相关推荐

返回顶部