设为首页|加入收藏|登陆邮箱欢迎来到国家新闻出版广电总局广播电视规划院
【34】 浅谈互联网视听节目分析技术

阅读次数: 798 次    信息来源: 信息研究所

作者:周侠    陕西省广播电视监管中心

摘要:本文根据陕西广播电视监测中心(以下简称“我中心”)互联网视听节目内容管理分析系统实际技术应用,阐述了互联网视听节目分析技术在广播电视监管系统中的应用,并介绍了视听节目搜索、节目信息抽取、视听节目下载等相关技术。

关键词:智能分析,智能发现,下载分析

 

0 引言

    随着网络的迅速发展,万维网成为大量信息的载体,如何有效的提取并利用这些信息成为一个巨大的挑战,搜索引擎,例如传统的通用搜索引擎AltaVista、Yahoo!和Google等,作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。但是,这些传统的通用性搜索引擎也存在着一定的局限性,一般不会对视音频节目有针对性的分析,所以往往达不到精确获取相关信息的效果。本文主要在视音频节目的发现、信息抽取、下载以及图片摘要四个阶段来浅析互联网视听节目的智能化处理。

 

1 系统架构

    陕西省互联网视听节目监管平台(图1)主要是在互联网上进行数据采集后,通过智能分析系统对数据进行违规研判、节目下载、音视频检索、音视频特征抽取等处理,从而可以全面监控陕西省辖区内互联网站视听节目的传播情况,掌握互联网相关的舆情情报,及时发现网上传播的违规视听节目并进行定位、下载和取证,动态掌握热点节目、热点网站的排名情况,同时全面、完整、详实地为监管机构提供日常监控数据和信息。

 

2 系统关键技术

    由于当前互联网视听节目的多样化啊,我中心此次项目建设采用了先进的音视频智能分析技术,具体包括以下几点。

 

2.1 视音频节目智能发现技术

    网络的视音频节目由来已久,从早年的流媒体思想而诞生的一批音频格式流行以后,接着又出现了一批播放视频的流媒体协议,再到近些年来非常盛行的flash等技术,所以目前互联网上视音频节目的种类多种多样。这就使得对视音频节目的搜索难度进一步加大,针对各种可能的情况,本系统相应的提供了多种发现方式来有效的解决这个难题。

    对于传统的流媒体视音频格式,如rm、wmv等,可以采用根据节目后缀名的方式来发现,系统提供了可自定义视音频后缀的配置表;对于流媒体协议格式,如mms、thunder等,可以采用根据播放协议的方式来发现,系统提供了可自定义视音频协议的配置表;对于目前比较流行的第三方媒体播放软件,如flash、Sliver Light等,可以采用根据节目链接的方式来发现,系统提供了可自定义正则表达式的配置表。

    由于系统的发现方式非常有针对性,基本涵盖了所有可能的情况,从而有效提高了节目发现的准确率。

(全文详见《广播与电视技术》2014年7月刊。)

 

发表评论 欢迎读者发表评论,请将字数限定在200字以内
姓名: 单位: 行业或职位:

还没有评论
意见反馈 法律声明 网站地图 设计支持
Copyright@ 国家新闻出版广电总局广播电视规划院010-86091273北京市西城区复兴门外大街2号