分类
杜克大学新闻

在DataFest 2016上提问的艺术

During DataFest, students engaged in intense collaboration. Image courtesy of Rita Lo.

2016年4月1日至3日在杜克大学举行的数据与数据分析竞赛DataFest 2016期间,学生们进行了激烈的合作。图片由Rita Lo提供。

周六晚上,当大多数学生还在熟睡或外出参加派对时,杜克大学大三学生毛凯丽(Callie Mao)却熬夜到凌晨,一边推一边拉一组真实世界的数据集,看看她能拿
2做什么消遣。Callie和她的团队早在几个月前就计划参加2016年4月1日至4月3日举行的DataFest统计分析比赛。

共有277名学生,来自学校不同的杜克大学,北卡罗来纳大学教堂山分校,NCSU,梅瑞迪斯大学,甚至一个高中,北卡罗来纳州的科学和数学学院聚集在边缘提取的洞察力从一个神秘的数据集。友情是显而易见的,作为学生精力旺盛地草拟了他们的想法在白板上墙和聊天而吞噬大量的免费食品。

Callie Mao ponders which aspects of data to include in her analysis.

杜克大学大三学生毛凯丽(Callie Mao)在考虑应该把哪些方面的数据纳入她的分析。

Callie观察到学生们在DataFest所面临的挑战是非常独特的:“ DataFest最困难的部分是提出一个想法。在课堂上,我们会遇到特定的问题,但在DataFest中,我们会遇到一个庞大的数据集,必须找出如何处理它。我们最初提出了很多想法,但是数据集没有足够的信息来完全可视化思考

在核心问题上,Callie和她的团队没有回答课堂上提出的问题,而是提出了一些创新性的、有洞察力的问题。在几乎没有指导的情况下,该团队选择了数据的哪些方面要包含,哪些方面要排除。

所有类别的另一个主要考虑事项是使用哪些工具快速而清晰地表示数据。Callie和她的团队使用R解析相关数据,将他们想要的数据转换成JSON文件,并使用D3(一个Javascript库)编写图形代码来可视化数据。然而,其他组使用了Tableau,这是一个拖放界面,为创建漂亮的图形提供了一种快速的方法。

Mentors assisted participants with formulating insights and presenting their results

导师帮助参与者形成见解并展示他们的结果。图片由Rita Lo提供。

周日下午,学生们将他们的研究结果提交给他们的同侪,并提交给一个由行业专业人士、多所大学的统计学教授、以及杜克大学图书馆数据和可视化服务部门的代表组成的评审小组。评委们根据其他数据源的合并(如谷歌Adwords)、数据表示的可理解性以及结果在真实行业环境中的适用性等方面对项目进行了评价。

学生们在四个类别中竞争:最佳利用外部数据、最佳数据洞察力、最佳可视化和最佳推荐。如下图所示,Baeesians获得了最佳外部数据的第一名,SuperANOVA团队获得了最佳数据洞察力,标准正常团队获得了最佳可视化,样本解决方案团队获得了最佳推荐。获奖作品将于5月2日前在http://www2.stat.duke.edu/datafest/上公布。

Bayesian, the winner of the Best Outside Data category

Baeasians, 2016年DataFest最佳外部数据类别得主:Rahul Harikrishnan, Peter Shi, Qian Wang, Abhishek Upadhyaya。(没有贾斯汀·王的照片)图片由Rita Lo提供。

,

作者:学生作家Olivia Zhu professionalpicture

新闻旨在传播有益信息,英文原版地址:https://researchblog.duke.edu/2016/04/05/the-art-of-asking-questions-at-datafest-2016/