新闻与舆情数据学
传媒大数据专业,大三上, 掌握基本的新闻文本数据分析方法, 2021
课前推荐材料:
理解媒介:论人的延伸,译林出版社,2019
效应 舆论传播的100个定律,中信出版社,2020
授课对象:数据科学与大数据技术(传媒大数据方向)专业本科生
开课学期:第10-17
学分/学时: 2/32
先修课程:概率论、数理统计、高等代数和数学分析
教学方式:课堂讲授、小组讨论
考核方式:考试
时 间:周一 3-4节;周四 3-4节 星期五 1-2节
地 点:一教 302
课程简介:本课程定位培养学生学习新闻与舆情数据处理与分析的原理,掌握新闻与舆情数据抓取、分析及可视化的方法,数据分析的原理介绍和新闻与舆情应用需求导向对接的垂直化课程体系设计,培养学生具备利用数据科学解决新闻和舆情相关问题的能力。主要内容分为新闻与舆情分析的基本原理,新闻与舆情不同环节的数据技术和分析方法,新闻数据部分重点介绍新闻传播媒介、传播内容、传播效果和传播受众不同维度和过程中的数据生产、获取、处理、分析和可视化表征等原理和方法;舆情数据分析部分重点介绍舆情诱发、舆情回应、舆情发酵、舆情干预、舆情博弈、舆情态势、舆情表达和舆情管控等维度数据的生产、获取、处理、分析和可视化表征等理论和方法。内容将数据处理技术、数据分析方法、机器学习相关技术以及统计分析方法与新闻与舆情具体研究内容对接遴选,既有新闻与舆情数据采集和处理通用的工具软件和一般数据挖掘和统计建模的方法整合,又有自然语言处理、中文文本特征与词分析技术、文本数据处理技术、文本分析和情感计算方法以及数据可视化技术。涵盖技术、软件工具、方法原理,同时注重与具体新闻与舆情事件结合进行知识传授和能力培养。
要求: 要求学生了解基本的新闻与舆情原理、要素、构成及类型特点,了解新闻整个生命周期和舆情研究中数据的产生来源、数据种类及属性特征;理解大数据对精准新闻、数据新闻、舆情引导、监测反馈的作用、机理;掌握不同的新闻事件和过程,不同的舆情研究领域数据的采集处理技术、数据分析方法、数据可视化技术;能够综合运用所学的方法和技术处理新闻和舆情事件,包括网络数据抓取技术、典型抽样方法、数据清洗转换方法,数据表属性统计分析方法、数据降维、分类和相关研究的统计模型和数据挖掘方法,基于自然语言处理的文本信息挖掘和分析技术,能够综合应用所学习的新闻与舆情数据原理、方法和技术解决行业内具体问题。
- 新闻与舆情理论(4学时)
1.1 新闻基本原理、媒介传播的特点
1.2 舆情主要研究领域及特点
重点内容:媒介核心要素构成和舆情主要研究领域
- 新闻与舆情数据产生及获取(4学时)
2.1 新闻数据来源、类型及特点
2.2 新闻数据采集方式
2.3 舆情数据来源、类型及特点
2.4 舆情数据采集方式
重点内容:新闻与舆情数据的采集
- 新闻与舆情数据处理技术(4学时)
3.1 新闻与舆情数据清理
3.2 新闻与舆情新闻集成
3.3 新闻与舆情数据规约
3.4 新闻与舆情数据变换
重点内容:新闻与舆情数据的清理、集成、规约和变换技术
- 新闻与舆情数据的分析方法(6学时)
4.1 新闻与舆情数据的描述性统计分析方法
4.2 新闻与舆情数据的时间序列数据建模方法
4.3 新闻与舆情数据分类与预测建模方法
4.4 新闻与舆情数据文本挖掘与情感分析方法
4.5 新闻与舆情数据中的社区识别与信息传播方法
重点内容:新闻与舆情数据的分析方法包括经典主流的时间序列分析方法、数据挖掘方法、多元统计方法和机器学习方法。
- 新闻与舆情数据的文本分类和聚类(4学时)
5.1 文本聚类概念
5.2 常用的文本聚类方法
5.3 文本数据流聚类方法
5.4 文本分类概念
5.5 基于概率的贝叶斯文本分类和基于核的文本分类
5.6 其他文本分类算法
重点内容:新闻与舆情数据文本聚类和分类算法
- 社会网络中社区识别和信息传播(2学时)
6.1 网络社区的识别
6.2 网络信息的传播模型
6.3 链路预测模型与算法
- 社会网络下情感分析(2学时)
7.1 观点挖掘方法
7.2 情感计算的分析方法
7.3 基于社会网络的情感分析应用
- 信息扩散模型(4学时)
8.1 经典扩散模型
8.2 数据驱动的信息扩散模型
8.3 传播模型的效果研究
- 新闻与舆情数据综合应用(2学时)
9.1 新闻与舆情研究对象及内容
9.2 新闻与舆情数据指标和模型建立
9.3 新闻与舆情数据模型求解与数据可视化解读
作业、实践环节
- 作业2周一次,一学期安排1次小组综合实践报告。*
推荐教材
[1] 饶元.舆情计算方法与技术. 北京:电子工业出版社,2016
[2] 蔡皖东. 网络舆情分析技术. 北京:电子工业出版社,2018
[3] 张伦 王成军 许小可. 计算传播学导论. 北京:北京师范大学出版社, 2018.
[4] 刘怡君等. 社会舆情的网络分析方法与建模仿真. 北京:科学出版社,2019