随着数据科学与人工智能相关理论的快速发展,传统行业若没有借用数据科学方法,仅在自己的专业领域深耕,已经无法高效解决快速变化的学科研究与应用中面临的一些新问题。在数据智能时代,如何利用人类有限的算法来处理日益增长的数据,如何帮助社会实现“数据商业化”、创造数据产生的衍生价值,已经成为众多领域亟待解决的问题。
数据科学相关专业发展迅速,学科建设难度不可小觑
自2016年教育部首次批准部分本科院校开设“数据科学与大数据技术”专业以来,截止目前,已经有近500所高校成功获批大数据相关专业,另外,还有35所高校已直接获批“人工智能”专业。从数据上可以看出,我国对数据科学人才培养的需求已然呈爆发式的增长。
数据科学专业的建设如火如荼,但这背后却存在不小的隐忧。
数据科学类专业的大量开设往往伴着随之而来的学科评估工作,学科评估不仅要考核师资队伍与资源、科学研究水平、人才培养质量和学科声誉,对于数据科学这类行业结合度高的新专业,还需要关注教学模式、课程体系方面的革新举措,以及是否能将所学应用在科研和行业中,培养出符合时代需求的数据人才。所以,在数据科学相关专业大量开设以后,高校势必面临着一个问题:如何教好数据科学这门课?
数据科学在中国乃至世界范围内依然是全新领域,这个结合了数学、编程、领域知识的学科,相比传统学科,教学难度似乎大了很多,教学形式尚待摸索。而高校教师往往承担着教学和科研双轨结合的工作,放在学科准备和教学上的时间相对有限,那么这个专业应该如何高质量、高效率地开展教学?
在没有得到确切答案之前,有一点可以形成共识,那就是新学科需要新模式、新方法,传统封闭式教学方式很可能已经跟不上新学科的要求了。数据科学是一个需要调动跨学科知识解决实际问题的专业,也就意味着选择一套教材、采买一套软件、搜集精品案例进行课堂教学的传统教学方式不再能够培养出满足科研、生产的实战型人才了。
也就是在这个思考的过程中,数据竞赛开始出现在老师们的视野中。
将数据竞赛支持平台引入课堂,探索数据科学教育的新模式
何为数据竞赛?
简单来说,数据竞赛是指在数据科学领域,以真实数据集和真实业务问题为基础,由企业以及各类权威机构举办,在短时间内聚合大量优质数据科学家和爱好者参与,以高端数据算法或数据方案创新为结果导向的开放性竞赛模式。
自2014年以来,中国市场的数据竞赛每年都以倍数级增长,除部分国内顶尖高校以外,经济、金融、生物医疗等领域的企业与科研机构也都纷纷参与其中,甚至是庄严谨慎的政府机构也意识到了数据竞赛的力量,开始在众多数据竞赛中扮演极其重要的角色。
许多高校老师应该对“中国高校计算机大赛——大数据挑战赛”非常熟悉,值得注意的是,中国高校计算机大赛已列入全国普通高校学科竞赛排行榜,被绝大多数高校认定为是A类竞赛,与保研加分直机制接挂钩,选手在赛事中取得优异的成绩不仅能为就业加持,更能让他们申请奖学金和保研资格的过程更加顺利。
让我们以备受瞩目的“2019中国高校计算机大赛——大数据挑战赛”为例,这场由教育部相关单位指导、清华大学主办的竞赛,面向高校在校生开放,旨在提升高校学生对数据分析与处理的算法研究与技术应用能力,探索大数据的核心科学与技术问题,尝试创新大数据技术,推动大数据的产学研用。刚刚结束的新一届比赛,共有来自全球10余个国家及地区,4893位选手,4638支队伍,20000+次提交参与评审,创历史新高。
通过赛后选手采访,我们了解到数据竞赛为学生带来的不仅是名次上的荣誉和保研时的加分,更重要的是,这次数据竞赛其实是不少同学的首次编程实践,不同于普通的课内练习,参与数据竞赛不仅要求参与者掌握一定的编程技能,还要有敏感的商业洞察力。
还有一点很重要的是,这次数据竞赛的平台将数据、云算力和协作及时都集中在同一个在线工具上,让他们能够跑通一个完整的研发过程,通过K-Lab支持的数据竞赛,大家能掌握数据科学实践中最重要的团队协作能力、编程实战能力、计划管理能力和成果导向思维。
这些也正是数据科学中要求大家掌握的重点,更关键的是,这些过程几乎不需要主办方花费太多精力进行监督指导,只需要提供赛题和数据,学生便可以进行自主实践学习。
所以不妨设想一下,如果能将数据竞赛的支持工具直接引入课堂呢?又或是说将授课模式变成类似数据竞赛的过程?数据科学教育中的问题是不是就能迎刃而解了,这对于高校来说,将是一个有趣的问题。
这不是说说而已,国内还真有这么一所学校抛弃了传统厂商的封闭式教学环境,采用数据竞赛形式的教学平台来进行数据科学专业教学,这就是高校大数据挑战赛的主办单位——清华大学。
将数据竞赛平台引入课堂,探索全新教学方式
2018年,清华大学软件学院面向全校范围内的本科生开设了“数据科学与技术”辅修专业,由于数据科学的火热,原定80人的名额不但扩容到最后的120人,上百人的班级和亟待建设的课程体系本无疑非常棘手的问题,但清华大学软件学院面对这些需求却显得十分从容。
深入到课堂我们才发现,他们所用的教学工具与其他院校不同,这正是与高校大数据挑战赛同一套数据科学工具——和鲸科技旗下的K-Lab。前面提到过,大赛全程使用的工具也是K-Lab,作为竞赛的底层平台,可以支持了2000+人的并发使用,它开箱即用的在线环境让学生免去装包之类的繁琐教学准备,而可视化界面和代码片段功能也对各行业的数据分析十分友好。
除了这些优点之外,更令人惊喜的是,K-Lab还能够无缝链接在线社区资源的教学工具,不仅将海量的数据资源、前沿成果实时链入课堂,更能直接把平台上现成的优质数据竞赛体面和练习任务作为考核资料,让学生通过使用竞赛同款工具和同款赛题来提升能力,打磨成果。
将最新的行业数据引入课堂
毋庸置疑,每一场数据竞赛所提供的数据皆为出题方所提供的行业内真实且全新的数据,而评审方式和优质方案也都早已配置在平台上,这对于数据科学新专业是很大的利好。