欢迎访问大数据&AI生态共享平台
当前位置: 首页 > 解决方案 > 金融 > 正文

基于大数据的融媒体智能生产传播平台

2018-04-12 作者:luoc【收藏】

  • 所属分类:媒体

应用背景及需求:

在大数据和移动互联网发展的今天,传媒行业的传播体系发生了本质的改变。在传统传播机制下,控制媒体稀缺资源的精英人士掌控着信息源,更掌控着话语权;而新媒体的传播机制下,信息源和受众之间的角色逐渐模糊,媒体作为信息源在发布信息的同时,通过和受众的互动本身也成为了信息的接受者;受众在一定意义上也成为信息源。由于传统媒体还不能适应新时代的传播体制而导致内容发布与受众需求的不对称,因此用户流失给传统的传媒产业带来收益的断崖式下滑。
  如何筛选过载的信息资源中的价值点;如何利用广度和深度的选题研判支持媒体决策;如何在历史和海量资源中提供知识服务来辅助媒体创作更有价值的原创内容;如何能够量化传播数据以实现内容播发全流程闭环;如何帮助媒体重建与用户之间的关系连接,让内容创作与用户个性化需求之间建立匹配……正是在这些需求的强烈推动下,基于大数据的智能传播平台应运而生。

拓尔思一直以来作为国内在智能搜索和自然语言处理领域的领导者,结合多年为媒体服务的经验,将大数据技术、非结构化数据处理和融媒体业务场景相结合,为传媒机构提供基于大数据智能传播的全套解决方案。目前本平台已经服务了覆盖央媒、地方媒体和行业媒体等数十家传媒集团的机构客户,成为中国传媒行业利用大数据来支撑融合转型的典型平台。

 

系统架构:


拓尔思推出媒体行业基于大数据的智能生产传播平台,为全国媒体探索适合自身的媒体融合转型之路提供了完整的技术平台基础。智能生产传播平台打通了传统媒体线上和线下的数据资源;通过与媒体业务分析模型匹配的多维知识体系适配、形成了多源数据统一资源中心平台;打通了媒体资源融合共享壁垒,针对多种业务领域建设分析应用平台,提高了媒体资源加工应用水平;利用了大数据技术来提升了传媒机构的信息传播和服务运营能力,以形成可持续发展的媒体商业模式。

    277.jpg.png

    


 

采用的关键技术及产品组合:

采用的关键技术及产品组合:(包括产品组件的名称、版本、作用)

    本系统所用的大数据计算处理框架应遵循Hadoop和Spark Streaming的开发框架。系统包括对网络数据的采集和智能筛及转换清洗、预处理、智能标引、智能检索、智能关联等服务,并由Hadoop、ZooKeeper及Spark等开源环境结合自有的基于深度学习的自然语言处理技术(DL-CKM)实现大数据分析环境。这其中所涉及到的关键技术包括:

272.jpg.png 273.jpg.png

 

部署运维方案:

前端应用服务器:提供web访问。

数据源:自主本地采集、TRS数据中心推送、第三方数据接入、落地统计系统接入等来源。

数据清洗打标:定制开发,将数据源获取的数据进行初步加工储存到全文检索服务器。

接口服务器:提供API供前端及第三方调用。

后台应用服务器:通过调度Spark集群,对数据进行加工分析。

分布式文件存储:由数据服务平台提供,采用FastDFS/GlusterFs,实现高性能的分布式文件系统,保存图片和系统归档日志等线下数据。

关系型数据库:由基础服务平台提供,用于存储系统元数据及分析结果的数据,供前端和接口服务器调用。采用MySQL主从方案。

Spark集群:由数据服务平台提供,采用Spark+Hadoop+ Zookeeper,应对海量的数据聚类、热点发现、话题抽取等分析的需求。

全文检索集群:由数据服务平台提供,采用Hybase,应对互联网基础数据、社内稿件数据、采用数据、外刊外电数据、系统分析结果数据存储、检索的需求。

CI持续集成:采用Jenkins实现应用的持续化集成。

监控服务器:采用主流的Zabbix对服务、数据、资源、日志实时监控。

 

应用规模及效果案例:

拓尔思基于大数据的融媒体智能生产传播平台已经服务了覆盖央媒、地方媒体和行业媒体等数十家传媒集团的机构客户,成为中国传媒行业利用大数据来支撑融合转型的典型平台。

浙报集团目前已经建设并使用的“媒立方”智能生产传播平台,不仅仅是集团媒体融合的中央厨房体系,更利用大数据优化内容制作、存储、分发流程,使新闻传播实现了基于数据分析、决策和支撑的一站式生产、全媒体发布、智能化分析及精准化服务。

浙报集团媒立方系统的大数据平台全面支撑了跨媒体生产传播的全流程场景、并提供了热点追踪、辅助创作、事件分析、传播力分析和个性化推荐的五大类服务。项目采用了时间、领域、地域、范围、速度、流行度、深度和广度等多维度数据分析,通过可交互的实用可视化呈现,形成了全渠道多形态融合的创作模式,构建了集舆情研判、指挥调度、统一采集、中央厨房、多元分发、传播分析于一体的新型智能化内容生产传播平台。

浙报集团的“媒立方平台”运用内容大数据和云计算框架,结合文本挖掘与自然语言处理等技术,不仅实现了用大数据支撑全形态采编业务,还通过对传播分析能力的动态评估,建立了基于数据的传播评价体系。“媒立方”系统还打造了媒体产品数据监控与用户行为分析平台。集产品专业数据报表、用户画像与偏向性分析、用户传播价值体系、内容价值榜单、优质内容挖掘仓库、决策报表合集等模块。为集团产品线提供产品运营决策与全局资源调配的数据支持,通过对用户阅读行为的偏向性分析引导内容产出,多维度地提取与挖掘优质内容与作者,推动全集团产品决策数据化。
     对用户行为尤其是传播行为的研究,其研究结果将为媒体实现精准化内容与服务推送提供支撑。“媒立方”智能生产传播平台不仅为媒体业务提供资源数据、内容分析、行为画像推荐和全平台支撑外,还能够通过对平台的数据流向、数据利用效率及数据决策进行分析提供应用生产链的优化服务;并以数据可视化大屏的方式实现全媒体的指挥中心。

 

解决方案描述:

基于大数据的融媒体智能生产传播平台


企业信息:

北京拓尔思信息技术股份有限公司

产品
解决方案
案例