欢迎访问大数据&AI生态共享平台
当前位置: 首页 > 案例 > 金融 > 正文

报业媒体个性化推荐与营销平台

2018-04-11 作者:3 【收藏】

报业媒体个性化推荐与营销平台

应用领域:媒体

应用背景及需求:

       互联网和移动互联网的发展使网民对信息的消费需求增大,且消费移动化趋势明显,对媒体互联化提出了要求。新媒体,特别是自媒体的发展很好地顺应了这一趋势,并给传统媒体带来了很大的冲击。传统媒体既面临着来自其他媒体的流量竞争,也面临着新媒体全新的运营方式的挑战,其在运营上的不足日益显现并成为制约媒体转型的关键。在这样的背景下,传统媒体主动寻求新旧媒体融合发展的变革之路,却存在诸多现实问题。

 

传统媒体在运营中存在的问题:

1. 数据资产分散难整合,媒体间缺乏协同营销

       分散在报纸、杂志、网站、电视、广播、电子屏、手机报、微博、微信、客户端等各类媒体的数据资产整合难度大;各类媒体自成体系,缺乏统一管理与运营,互动效率低。

2. 无法全面了解用户,运营效率难以提升

       缺乏统一的用户体系和全面立体的用户画像,影响了用户体验的有效提升;由于缺乏相关大数据工具而无法及时了解运营状况

3. 流量获取方式单一,无法精准推荐,变现能力差,营销效果反馈滞后

       传统媒体主要依靠运营站内推荐获取流量,靠内容授权和广告获得收益,人工内容推荐方式高度依赖编辑经验,造成流量获取方式单一,优质内容得不到充分展现,内容和流量变现能力差,且营销效果得不到及时反馈。

 

       在这样的背景下,北京久其智通数据科技有限公司依托长期的媒体大数据服务经验和对媒体行业的深刻洞察,研发了基于用户画像的媒体大数据解决方案,着重满足了媒体对用户行为画像、用户行为分析与精准推荐的需求。从而,变单一的流量获取方式,为“提升粘性获得流量、个性化实时推荐拉动流量、转发获得传播流量”的全方位流量获取方式;变基于编辑经验的人工内容推荐方式,为基于用户偏好的自动化、程序化、智能化的内容推荐方式;变靠内容授权和广告的单一收入模式,为依靠个性化、程序化广告实现内容与流量自动化交易的创新收入模式。使全面了解用户及运营效果、为用户精准匹配内容、最大程度变现客户流量成为可能。


应用系统逻辑架构: Hadoop、Spark、其他

采用的关键技术及产品组合:

基于Hadoop的计算框架

离线计算:Mapreduce(Hadoop & Yarn已支持 2.6.0版本)

内存计算:spark (已支持1.2版本)

流计算:spark streaming(已支持1.2版本)

非Hadoop计算框架:MPI并行计算框架、openMP计算框架、其他开源计算框架

多种存储模型支持

1. 结构化记录存储:非容器版本支持hadoop家族的Hive(已支持0.14版本)、Impala和spark sql;容器版本支持mysql各版本、Postgresql各版本和sqlite各版本

2. 文件存储:支持hadoop的分布式文件系统hdfs

3. KV存储:支持Hadoop家族的列示存储Hbase(已支持0.98.4版本);支持mongoDB和redis的kv存储

存储安全访问支持

1. 支持统一的存储访问封装,封装了hdfs、hive、hbase、mongodb等常用存储引擎的api集合;

2. 支持各类存储的统一命名访问服务;

3. 访问接口支持平台安全控制,支持授权和访问验证;

4. 支持存储空间的配额quota控制;

5. 支持文件级、数据库级、表级、记录级、列簇级以及单元格级等多种不同数据单元的访问权限控制;

6. 支持与kerberos兼容的身份认证;

分布式资源共享部署

1. 支持分布式消息队列通信:支持Kafka(已支持0.8.1版本)消息队列

2. 支持分布式配置共享与状态同步:支持zookeeper、etcd


具体实现的功能:

媒体用户行为画像

       全面、安全的行为采集,强大的媒体标签库,可实现海量用户行为数据的实时、跨屏采集,基于用户行为的用户模型的构建,并支持按标签对用户自定义分组。

媒体综合运营分析

    网站/APP运营分析、微博运营分析、微信+H5运营分析

内容运营分析

深入到每一篇报道的用户行为,评估吸引力,观察来源价值,洞察用户所想。

传播效果分析

    全面掌握媒体内容的传播渠道和传播情况,实现网站、APP、微信、微博全面追踪;

    提供按渠道、部门、版面、作者的内容生产数据、传播数据与排名数据,量化评估分析,为选题和报道手法提供参考;

    支持多维度(渠道、行业、地域、时间等)的传播效果统计分析等。

个性化推荐引擎

    快速识别线上用户偏好,绘制用户兴趣图谱,并根据用户画像提供跨屏、实时的个性化精准推荐服务。

    推荐方式支持人工推荐与机器推荐、实时推荐与离线推荐、以内容找人和以人找内容并举;支持基于内容、产品、广告、栏目、场景等的各个维度推荐;覆盖14种推荐场景。

精准营销与效果监测

       为媒体和广告主量身定做的广告与营销中心,可提供精准营销与营销效果监测服务:

       广告营销服务:精准广告(基于画像与关键词广告、基于位置广告、基于群体的广告、基于推导的广告)、ADX广告(SSP广告码管理、SSP广告)、网盟广告(网盟广告码管理)、固定与排期广告(固定与轮显广告、排期轮换广告)等;

       智能管理广告资源:一站式订单管理、广告管理、物料管理、广告排期管理

       营销效果监测:支持广告分析、物料分析、广告位分析,一键生成分析报告,实时了解广告运营和物料消耗情况。

 

技术难点:

       实时全量数据采集与分析,多源用户行为数据整合与拉通

       媒体旗下网站、APP、微博、微信公众号数据众多,目前基本上独立运行,存在用户体系复杂、主题种类多样,使用场景全面等特点,实现多个用户ID(如Cookie、用户名、微信账号等)在不同平台、不同应用中的拉通,全面整合不同渠道海量的用户行为数据,用户综合分析及不同渠道应用统计分析的难度大。

    用户行为精准画像   

       基于内容和产品属性来进行标签化的媒体用户行为画像,其精准度不仅有赖基于各类数据统计分析和挖掘建模而建立起来的统一的用户标签库,也需要在投放中不断分析优化目标用户标签和真实还原360度用户画像的过程,同时对多来源海量异构数据的整合拉通也有要求,是一项关键的技术挑战。 

       实时、自动个性化推荐

       结合全网用户数据和用户兴趣图谱,快速识别线上用户偏好,及时进行产品、内容、广告等信息的推荐技术,要做到实时、自动、精准和个性化,既需要精准的用户行为画像,也需要成熟的推荐算法。

       实时监测营销活动,调整运营方案

建立包含用户满意度指标、预测准确度、覆盖率、多样性、新颖性、惊喜度、信任度、商业目标评估指标在内的,针对内容、产品和广告推荐效果的计量算法和结果分析输出接口。


部署运维方案:

部署方案:

image.png


运维方案:

 image.png  

推荐服务高可用:Redis推荐缓存集群+实时推荐服务管理;

实时运营分析高可用:Hadoop分布式计算机群;

用户画像检索高可用:Elasticserch集群;

前端数据采集高可用:业务初期采用LVS主备双节点,支持热切换,随着业务量增加,采用硬件负载均衡器提供高可用;

日志数据实时处理:Logstash实时流同步控制管理;

统计数据存储及检索高可用:MySql主从实时复制同步,RDBMS集群管理;

数据抓取服务高可用:Spider集群管理。


大数据应用案例详细描述:

解决传统媒体在运营中存在的问题:

1、数据资产分散难整合,媒体间缺乏协同营销。分散在报纸、杂志、网站、电视、广播、电子屏、手机报、微博、微信、客户端等各类媒体的数据资产整合难度大;各类媒体自成体系,缺乏统一管理与运营,互动效率低。

2、无法全面了解用户,运营效率难以提升。缺乏统一的用户体系和全面立体的用户画像,影响了用户体验的有效提升;由于缺乏相关大数据工具而无法及时了解运营状况

3、流量获取方式单一,无法精准推荐,变现能力差,营销效果反馈滞后。传统媒体主要依靠运营站内推荐获取流量,靠内容授权和广告获得收益,人工内容推荐方式高度依赖编辑经验,造成流量获取方式单一,优质内容得不到充分展现,内容和流量变现能力差,且营销效果得不到及时反馈。

在这样的背景下,北京久其智通数据科技有限公司依托长期的媒体大数据服务经验和对媒体行业的深刻洞察,研发了基于用户画像的媒体大数据解决方案,着重满足了媒体对用户行为画像、用户行为分析与精准推荐的需求。从而,变单一的流量获取方式,为“提升粘性获得流量、个性化实时推荐拉动流量、转发获得传播流量”的全方位流量获取方式;变基于编辑经验的人工内容推荐方式,为基于用户偏好的自动化、程序化、智能化的内容推荐方式;变靠内容授权和广告的单一收入模式,为依靠个性化、程序化广告实现内容与流量自动化交易的创新收入模式。使全面了解用户及运营效果、为用户精准匹配内容、最大程度变现客户流量成为可能。


产品
解决方案
案例