随着大数据应用和数据科学应用逐渐升温,数据科学教育项目也在世界每个国家迅速发展,数据科学项目部署不仅代表着高校水平,更能反映出城市发展与国家竞争力。那么,我们的教育距离真正的数据科学教育到底有多远呢?
2020年3月,国内领先的数据科学协同平台和鲸科技联合TalkingData旗下腾云大学、全球知名云计算服务平台AWS、开源学习社群Datawhale多家机构共同发布了《数据科学教育白皮书》,旨聚焦于数据科学教育领域,研究基于全球视角下,数据科学教育的发展轨迹与方向。剖析数据科学作为通用目的技术(General Purpose Technology)在教育过程中所遇价值与痛点,并以此提出打通数据科学教育路径、发挥应用与生态价值的数据科学教育新范式。
数据科学作为通用目的技术,加速垂直科技技术创新与迭代的同时,也强化了赋能生态创新的广度和深度,对于教育模式的适用性要求更加严苛。截至2019年3月25日,全国34个省级行政区中有29个省级行政区的481所(截至2019年6月15日,全国普通高等本科学校总数为1265所)院校成功新增备案数据科学与大数据技术专业,其中有个别院校开设了两个不同学位的数据科学与大数据技术专业。
数据科学教育在国内依旧处于迅速发展的阶段,关于教育生态的资源整合以及学生就业发展选择的路径中,同样存在诸多痛点。如何更好的衔接科学研究与普适学习?如何在把握教育方向的前提下提高科研效率?如何提高教育生态中资源整合的效率?都成为亟需解决的问题。完整的数据科学教育流程需要包含理论学习、实践训练、项目实战、行业运用与科研研究五个子流程,学习路径十分复杂。
和鲸认为,数据科学项目应该采用来自开源回归开源的开放项目教育路线,以产业需求为拉动,将产学研用都纳入到教育体系中,以“数据科学SaaS平台+专业人才社区”的教育新模式,分别围绕知识体系、实践路径与项目训练、真实场景和开放生态连接进行具体结合与阐述,打造一体化的数据科学教育项目,才能让数据科学教育落脚于工业级应用。
《数据科学教育白皮书》阐述了数据科学这一学科的发展历程的建设路径,更得到了来自业内的知名学者中国人民大学商学院院长毛基业教授、中国人民大学统计与大数据研究院院长艾春荣教授、北京大学光华管理学院商务统计与经济计量系系主任王汉生教授联袂推荐。