尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 在当今移动互联网和物联网飞速发展的时代,大量的信息化数据逐年递增,如何有效的获取有价值的信息,大数据挖掘技术成为了重中之重。国民经济支柱之一的文化影视产业备受各大广电网络,投资人关注。票房和收视率作为影视行业的主要评测标准,制片人... 展开 在当今移动互联网和物联网飞速发展的时代,大量的信息化数据逐年递增,如何有效的获取有价值的信息,大数据挖掘技术成为了重中之重。国民经济支柱之一的文化影视产业备受各大广电网络,投资人关注。票房和收视率作为影视行业的主要评测标准,制片人、广告代理机构投资及收益的主要参考依据,无形中体现了有效数据分析的价值。面对大数据大潮的来临,影视大数据的存储,预处理及分析将面临巨大的挑战。 本文主要阐述了大数据的含义、特征及影视大数据的特点,统计学在数据挖掘、分析过程中的作用及方法。最后利用python网络爬虫获取互联网上的影视数据作为全量数据;通过hadoop大数据平台对非结构化数据进行数据预处理,数据清洗、数据去重、数据集成、数据标准化处理;处理完毕后基于数据挖掘技术,利用关联分析、聚类分析、因子分析法并建立k-means+关联分析算法训练模型,对电影、电视剧全量数据进行建模处理分析,根据影片类型、出品方、制片地区、投资额、票房、收视率、网络评分、受众群体等因素、对近年影视数据进行了分析研究。研究显示国内电影票房数逐年提升;知名导演;明星效应对于影片票房、收视率有很大影响;另外也可以看出,收视率与投资不一定成正向关系,投资大的电视剧收视率不一定有好的收视率;与此同时随着新媒体的诞生,以及网络影视娱乐的崛起,广电网络的收视率趋于平稳发展,更多的年轻人趋向于利用闲暇时间来追剧,黄金时段的广告投放因此受到了一定的影响。 基于以上的分析研究影视剧各个属性对于电影票房、电视收视率的影响,希望能致力于在数据挖掘过程中应用多种模型对影视行业进行预测,包括电影票房,电视收视率;不断通过大量数据仿真实验,验证完善算法模型。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。