LOFTER

电脑版
提示:原网页已由神马搜索转码, 内容由www.lofter.com提供.

网易LOFTER算法服务情况说明

欢迎您使用网易LOFTER!杭州网易元气科技有限公司(“我们”)非常注重保护用户(“您”)的个人信息及隐私,我们希望通过《网易LOFTER算法服务情况说明》,帮助您更加直观、简洁地了解您在使用LOFTER过程中可能涉及的LOFTER算法服务的基本原理、目的意图和主要运行机制等,充分保障您的知情权。

 

一、网易LOFTER算法服务

1.  个性化推送类算法

算法名称

网易LOFTER个性化推荐算法

算法基本原理

网易LOFTER推荐算法通过用户群体对内容的交互行为分析建模,给用户推荐个性化的内容。其本质是给用户匹配标签兴趣相似的内容或相似用户群体喜欢交互的内容。同时网易LOFTER推荐算法系统也能够有效的分发积极正向的内容,弘扬社会正能量。

算法运行机制

网易LOFTER推荐算法主要包括内容引擎,特征引擎和推荐系统三部分:

1.内容引擎包含安全审核和内容标注模块:安全审核模块采用机器学习和人工确认方式,过滤用户发表的违法违规内容,保障产品内容安全;内容标注模块采用发布者选择和机器学习方式,给用户发表内容打上各个维度标签,给后续特征引擎和推荐系统使用。

2.特征引擎包含数据处理和特征分析模块:数据处理模块收集包括客户端日志、服务端日志、资源内容数据;针对用户隐私数据,通过隐私数据保护模块对用户的隐私数据进行加密处理。特征分析模块结合行为数据内容数据和内容标签分析用户和内容特征,后续推荐系统各个环节会使用这些用户和内容特征去匹配或筛选内容,或将这些特征直接应用于模型中。

3.推荐系统作用是通过召回、过滤、精排、重排模块,目的是从海量内容中筛选出个性化的推荐的内容推送给用户:

召回模块结合内容和用户特征,近期行为从百万级别的候选内容中召回千级别用户可能感兴趣内容,减少后续排序计算压力。

过滤模块过滤掉推荐过的或需要屏蔽的内容。

排序模块基于深度学习对召回的千级别内容进行排序,找到最可能符合用户兴趣的数十条数据。

重排模块对排序结果进行进一步优化,包括打散相似内容,添加推荐理由等,提高用户对推荐系统信任度,展示更多兴趣减少信息茧房效应。

算法应用场景

网易LOFTER客户端

算法目的意图

采用个性化推荐算法是为了让用户快速找到可能想看的内容,提升用户浏览图文、视频等内容的体验,增加用户对产品的满意度,将真正优质的内容传递给需要的用户。

2.  检索类算法

算法名称

网易元气信息搜索算法

算法基本原理

网易元气信息搜索算法通过理解用户输入的搜索词,并计算和内容库中已有内容的匹配度,展示给用户和搜索词相关的内容。

算法运行机制

网易元气信息搜索算法主要分为内容引擎、特征引擎、搜索引擎三部分。

一、 内容引擎

内容引擎包括了内容审核和标签理解。内容审核,是将用户发布的内容和主动打上的标签经过网易公司风控平台审核,审核通过后才可对外展示。标签理解主要来源于两方面:

 内容创作者主动为发布的文章打标签,数量一般有1~10个。

 标签提取模型对发布内容打标签。标签提取模型采用有监督的训练方式,喂入每篇文章人工打标签的训练集,机器学习模型对内容进行分类或预测标记,并通过人工监督完善训练库的方式不断完善训练数据库,从而提升模型的准确性。

二、特征引擎

特征引擎包含数据处理和特征分析模块:数据处理模块收集包括客户端日志、服务端日志、资源内容数据;针对用户隐私数据,通过隐私数据保护模块对用户的隐私数据进行加密处理。特征分析模块结合行为数据内容数据和内容标签分析用户和内容特征,后续各个环节会使用这些用户和内容特征去匹配或筛选内容,或将这些特征直接应用于模型中。

三、 搜索引擎

搜索引擎为搜索算法核心环节,其作用是通过意图识别、召回、排序、重排几大流程筛选出符合用户预期的内容展示给用户:

 意图识别

通过对搜索词比较完整的算法分析,体会用户的搜索意图。意图识别算法模块包括大小写转换、繁简体转化、错别字改写、同近义词扩展、分词操作,并提取出其中包含的标签词。该模型可以帮助后续模块理解用户的真实意图,实现精准召回。

 召回

在搜索引擎中,召回流程主要通过倒排索引的方式从内容池中筛选出粗略的万级别数量的内容。搜索引擎以传统基于字面召回为主要召回手段,并增加向量语义召回等扩充召回方式,一定程度上解决字面召回缺乏语义理解的弊端。

 排序

通过较为复杂的模型对候选内容进行打分排序。该环节中的模型会采用较全面的内容特征、搜索词和内容的匹配特征以及搜索词特征构建训练样本,采用深度学习模型训练并用于内容上的预测打分,实现个性化搜索的效果。

 重排

重排流程通过动态阈值过滤的方式将排序模型中打分较低的文章过滤掉,不返回给用户。此外,还会基于内容类型来控制多样性,保证用户较好的使用体验。

算法应用场景

网易元气平台产品,目前包括网易LOFTER客户端

算法目的意图

采用网易元气信息搜索算法是为了让用户快速找到想要搜索的内容,增加用户对产品的满意度。