全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
984 0
2020-09-03
Spotify如何使用机器学习和AI对您有很多了解。
在本文中,我们将讨论
Spotify如何使用人工智能和机器学习来增强听众的体验?
它如何帮助艺术家和创作者?
Spotify在其不同应用程序中使用哪种机器学习,损失函数,训练模型技术。
Spotify计划在即将到来的将来做什么?
Spotify是一个音乐流媒体行业,始于2006年。它于2019年2月在印度首次正式发布,其名单中已有数百万的订户。Spotify以其用户体验,音乐推荐而闻名,并且不断得到改进。它使用人工智能,机器学习和大数据为听众改善和个性化音乐体验。
Spotify无需介绍。Spotify是市场上最好的音乐流媒体行业之一。但是,最让我们兴奋的是它用来增强用户体验的惊人方式。
Spotify如何使用人工智能和机器学习来增强听众的用户体验?
我们都会熟悉“每周发现”,这是每个用户唯一的个性化播放列表。它使用人工智能和机器学习算法来生成播放列表。它可以通过您的音乐偏好,流式传输历史记录或您听过特定歌曲的次数来学习。每个人的发现在一天的不同时间都是不同的。
当您听音乐时,Spotify将监视您是听整首歌还是仅跳过整首歌。随着时间的流逝,它逐渐积累并了解您喜欢的音乐类型。他们甚至通过每分钟的节拍来剖析这类音乐,并设置声音的类型等等。因此,这可以帮助没有时间,精力或技能来创建自己的播放列表的用户根据自己的兴趣获得播放列表。
您听音乐的次数越多,他们获得的关于您的数据就越多,他们的算法就越适合您的音乐,因此可以带他们进行个人的听觉之旅。
在下一部分中,我们将讨论该系统的深入工作。
它如何帮助艺术家和创作者?
过去的传统音乐行业存在一个问题,那就是即使新创作者创作出人们喜欢的音乐,也要经历很多努力才能吸引听众。Spotify的音乐推荐系统用于机器学习,可学习您的歌曲类型,并预测并推荐您可能没有听过但会喜欢的新歌。
这使音乐创作者有机会被人们所认识,听众可以获得他们所喜欢的歌曲。这使听众和创作者都感到高兴,尤其是帮助创作者成为自己的最佳版本。他们不必经历障碍就能获得认可,他们可以专注于创作音乐。
Spotify在其不同应用程序中使用哪种机器学习,损失函数,训练模型技术。
首先,Spotify尝试收集尽可能多的数据,并尝试以不同的方式来理解它们。它创建了许多表示数据的共享模型,并被用作许多不同的应用程序。
下面讨论其中一些:
1.从播放列表中猜测丢失的曲目。
他们有数百万个播放列表,并且过滤出与培训相关的播放列表。选择是这里的重要因素,因为如果您在所有可用的播放列表上进行训练,则绝对不会获得更好的结果。
因此,它的作用是将歌曲从特定播放列表中删除,然后尝试猜测在使用其他播放列表的上下文中缺少哪个曲目。它使用Word2Vec类型算法。
Word2vec是一组用于生成单词嵌入的相关模型。这些模型是浅层的两层神经网络,经过训练可以重建单词的语言环境。Word2vec将一个大型文本语料库作为输入,并产生一个通常具有几百个维度的向量空间,该语料库中的每个唯一单词都在该空间中分配了一个对应的向量。词向量位于向量空间中,以便在语料库中共享公共上下文的词在空间中彼此靠近。
除此之外,他们在播放列表,曲目和艺术家之间有很多相似之处,并尝试映射这些艺术家的音乐类型如何彼此接近,或者这张专辑如何接近特定听众的音乐品味。
2. Spotify主屏幕:Spotify主屏幕使用称为BaRT的机器学习算法。
基本上,BaRT是一种贝叶斯加性回归树,它是一种贝叶斯“树和”模型,其中每棵树在成为弱学习者之前都受到正则化的约束,并且拟合和推论是通过迭代的贝叶斯反拟合MCMC算法完成的来自后部的样本。
在Spotify中,BaRT用于预测各种各样的货架,可以为您量身定制货架或与最近收听历史记录相关的建议。
如何提供个性化的体验?
BaRT算法以一种非常有趣的方式来了解其用户。
据为>30秒优化流。这意味着,如果您听一首歌,并且听了30秒钟以上,就会认为这是您的兴趣所在。
然后,他们每天根据收集到的互动数据重新训练模型
然后建立系统以消除位置偏差。这意味着,如果您点击顶部的某些内容,则价格会降低,而点击底部的某些内容将更有价值。
3. Spotify上的搜索栏
每当用户搜索查询时,它都会以不同的方式对搜索进行分类,例如搜索项目的受欢迎程度,用户之前是否曾搜索过该项目,项目与用户口味的相似度以及前缀查询与匹配项目之间的距离。排名模型在搜索交互日志上进行了训练,并使用以成功操作结束的搜索会话作为积极示例。所有这些预测仅需数毫秒即可完成。
那么排名算法如何获取其数据?
它基本上考虑了两件事,并在此基础上给出了分数。
过去用户看到的搜索结果。
过去的成功互动。
得分(成功项目为4,相关项目为2,其他所有项目为0)。
此系统中使用的损失函数是LISTWISE FUNCTION。
逐列表方法通过以下方式解决排名问题。在学习中,它以对象的排序列表(例如IR中的文档的排序列表)为实例,并通过最小化在预测列表和地面事实列表上定义的逐级损失函数来训练排序函数。基于列表的方法捕获了排名问题,特别是IR中的排名问题,其概念比以前的工作更为自然。
而培训模式采用的是LAMBDA沃尔玛与最大化NDCG(平均超过训练数据集)使用GBDT(梯度推进决策树。)
训练数据由项目列表组成,在每个列表中的项目之间指定了一些部分顺序。通常通过为每个项目给出一个数字分数(成功项目为4,相关项目为2,其他所有项目为0)来诱导此顺序。分级模型的目的是对分级,即在某种程度上在新的,看不见的列表中生成项目的排列,其方式在某种意义上类似于训练数据中的分级。
为什么要帮助Spotify达到这一水平?
Spotify 通过以下三种方式在Hyperight AB主题演讲中描述了其成功实现的机器学习。
用户创建的大量播放列表。
创建这些播放列表时,与用户息息相关的情感。
9年的不断迭代和辛勤工作。
用户研究员,数据科学家和数据工程师组成的团队。
Spotify计划在即将到来的将来做什么?
他们在伯纳德·马尔(Bernard Marr)先生的视频中与Spotify的数据科学家团队会面时提供了信息。
他们会将这些数据与其他数据源(例如GPS位置,年龄和工作)结合在一起。例如,如果您是早上上班或下班回来。或者您晚上在家中听音乐,或者去健身房时喜欢听什么类型的音乐。
而且,当它连接到健身追踪器乐队或Apple Watch时,他们现在将知道您的脉搏率是什么,什么类型的音乐将为您提供帮助。
在即将到来的未来,他们将使用机器学习和人工智能来自动执行音乐推荐。
现在,您无需在旅行,去健身房或参加重量级的比赛时手动选择播放列表,Spotify就会知道您此时会喜欢哪些歌曲。
这将是AI的绝佳实现,可为其客户提供真正的价值。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群