学数据科学与大数据技术(传媒大数据方向)专业, 我们最应该学些什么?

less than 1 minute read

Published:

我们的专业是一个全新的专业,而我们的所学所成直接影响着往后学习和报考我们专业的同学的兴趣。换句话说,未来什么样的人成为我们的师弟师妹,和我们未来的发展或者就业有着直接关系。

谈就业或许有点远,但同学们如今已经在这个专业领域里学习了三个学期(一学期线上,这个也会成为我们永久的记忆)。从下学期开始,我们就要正式学习相关的专业课了,在大一的班会上,我提到过我们专业的核心课程以及对应的就业方向;随着大家所学专业基础课的加深,现在我们再一起来回顾一下(大家有必要再听我啰嗦几句)。

我们专业课的构成包括数学、计算机和统计。

数学主要是数学分析(你们学的高等数学,但我建议你们有时间可以翻翻数学分析的课本)、高等代数(很重要,很重要,很重要!),概率论(数学的基础,概率的思维)以及数理统计(严格上来说是统计学的基础,但是这里面有太多数学的理论需要掌握)。

而对于计算机课程来说,主要是:

·计算机编程语言(C和C++,Python严格来说是脚本语言,易学但是理解计算机系统还要学习C和C++)

·数据结构(更好地理解算法,去大厂面试的必考科目)

·数据库(不论以后做什么数据分析,掌握SQL语句会面试官对你的整体印象加比较高的分数,也是必备技能之一)

·操作系统(至少会Ubuntu或Centos,寒假可以自己装个虚拟机练练,大厂的编程环境大都在Linux系统中运行)

·算法设计与分析(不知道以后会不会开设专门的课程,但是数据挖掘、机器学习等类似的课程中会不断地有算法出现)

以及分布式操作系统(最典型的是Hadoop,大厂的标配,可以自己尝试着在自己的虚拟机上弄个伪分布式)、Hadoop相关的组件(Hive和Hbase,类似于SQL,Spark分布式上的机器学习)相关的课程如:分布式系统与云计算,深度学习(学会用pytorch做深度学习,高级的显卡比较贵,可以试着装个便宜点的,上千元搞定,学校也有类似的平台)。

最后一个也是比较重要的是统计学(数据科学)相关的课程,所有相关的课程都是以概率论和数理统计为基础的,因此这两门课的课本需要经常揣兜了,说不定哪天就用到。

相关的课程包括:

· 统计计算或最优化理论(很基础,很重要,所有问题都是计算问题)

· 非参数估计(无法假定模型的都用此处理)

· 抽样技术(社会学、经济学用的比较多,但对我们来说思想很重要)

· 回归分析或多元回归分析(不仅仅是一元回归和Logistic回归,还可以衍生到广义回归模型中去,很实用)

· 统计机器学习(与机器学习的不同之处在于侧重于理论的验证)

· 数据建模方法与实践(侧重应用,可以关注一下近几年的数学建模大赛)

· 贝叶斯统计(贝叶斯的思想很重要,全球好多人在研究相关的模型,这个我也在课堂上不止一次地提到过)

· 时间序列分析(如果数据是基于时间记录的,如何研究它,这个课程的方法很实用,想以后做金融债券的同学可以多关注)

编程语言建议同学们用R(当然python也很好,但是R对于理解模型帮助更大些)。

以上是本科阶段的我们所上专业课的一个小结,如果同学们打算考研或保研统计学相关的学校,如人大、北大等(人大还有一个国民经济核算课程),以上的这些课在这些学校里都是有开设的,而且面试时也有可能会被问到哦。

从未来发展的角度来看,希望同学们在其中能够找到自己感兴趣的问题(如机器学习里的某个算法、经济学研究中的某个问题,深入进行研究,在未来两年里做出一些能在你毕业找工作或研究生面试时吹牛的成果)。

最后要学好如何进行搜索资源(不知道学校会不会开文献检索或情报学课程),这对于我们身处每天卷帙浩繁的信息环境中寻找自己感兴趣的问题是十分有帮助的,不仅是学习还是以后工作,学会寻找资源(或数据)都是一个很重要的本领。

以上是我的一些小结,一家之言,仅供参考。下面是我的师兄谢益辉, 此处安利下他的博客)十几年前(放到现在我觉得依然不过时)给人大统计学院的本科同学写的几篇短文,感兴趣的同学们可以阅读一下:

统计学领域

关于搜索统计资源

我的一些统计方法观

统计学专业应该使用什么样的统计软件

注:构思了很久不知道写些什么给大家,看了班里选课的通知以后有感而发;在这里提醒大家:重要的是要看看自己的培养计划,不要在一些公选课上少修了学分,影响到自己毕业。