NYT 数据科学家开线上课程、快速上手Processing 与D3.js 做视觉化

Yen
·
·
IPFS
·

研究生周末在家不写论文,那就来点CP 值高的线上课程

我最喜欢周末宅在家、不出门社交的生活。作为这么宅,但偏偏又不想写论文的研究生,看线上课程的自学进度却很快。如果能分点能量给自己写论文就好了⋯⋯。

REVIEW

  • 纽约时报的数据分析方法论
  • 纽约时报数据科学家Chris Wiggins 在哥伦比亚大学开设的数据分析课
  • 丹麦艺术家Tim Rodenbröker 的Processing 动画系列课
  • 学D3.js 数据视觉化,顺便拿证书


纽时首席数据科学家解密NYT 分析心法

Christopher Wiggins 是《纽约时报》数据分析团队首领,我前几天正好见到Towards Data Science 的YouTube 发布新影片,点进去才发现是CW 在Toronto Machine Learning Summit 的演讲。影片主要分享《纽时》应用机器学习的方法论,虽然说是方法论,但CW 的讲解平易近人,即使是对机器学习没什么概念的人,也能理解数据分析在机器学习能扮演的功能。或许这跟CW 本身也在哥伦比亚大学任教,为没有任何数据基础的同学开设数据分析课有关吧?

随手takeaway

  1. 《纽时》的数据视觉化团队是门面,数据分析团队是基石。 Chirs Wiggins 带领的数据分析团队负责为商业运营、订阅制等商业模式提供解答。
  2. 通常数据分析团队的解读方式有三个:客观模式(descriptive modeling)、预测模式(predictive modeling)、指示模式(prescriptive modeling)
  3. descriptive modeling 的目的在于挖掘、综观现况, NYT Reader Scope就是descriptive modeling 的应用服务,从读者喜好、停留的位置等,为《纽时》了解读者的面貌。
  4. predictive modeling 则能延续descriptive modeling 的功能,从中学习、测试,让数据模型有预测能力。例如: Project Feels计画是《纽时》以机器学习模型分析读者阅读情绪,透过搜集、分析情绪资料后,推荐适合读者的文章。
  5. prescriptive modeling 在演讲中被形容的很神,能为未来的目标制定相应执行方案,类似predictive modeling 的延伸功能。因此我猜测培养读者的阅读喜好,是可能的应用方式之一。

MORE

  • Data Science at The New York Times
    这场演讲的完整简报。一直没找到最新版,但这份是2019 年1 月上传的,所以内容差异不大。
  • data: past, present and future
    CW 在哥大开的数据分析课,2020 年的讲义与程式码练习题都放在GitHub 内,自由取用。我决定这学期要将他的课看完。
  • @chrishwiggins
    CW 的推特帐号,虽然都没更新,但抱着朝圣心态仍要追起来~
  • chrishwiggins
    CW 的GitHub 帐号,更新的非常勤快(因为哥大教材就放在GitHub,每周定期更新)

数据视觉化:难的vs 简单的

拯救徒手绘图障碍者的Processing

先讲简单的。丹麦数位艺术家Tim Rodenbröker 因应大家都宅在家防疫,所以开设免费线上课程,教大家从零开始学习Processing。 Processing 是以Java 为主的视觉化工具,因为易学、好上手,所以是许多艺术家、互动设计师爱用的工具,熟悉的话,能在短时间内制作复杂的视觉动画。目前课程仍在陆续更新中,不过大部分都已有教学影片了,我自己花半天的时间就能透过教学影片熟悉Processing,相信有写程式经验的人肯定更快上手。 (看着自己亲手做出来的动画,超有成就感!)

MORE

  • Creative Coding Essentials
    Tim 的Processing 教学影片,共27 堂课,依我之前看的内容,大概只缺少5 堂而已。
  • tim rodenbröker creative coding
    Tim 的YouTube 频道,真的是对教学很有热忱的人,且不愧是艺术家+设计师,影片精美程度技压其他程式教学影片。
  • @timrodenbroeker
    Tim 的推特帐号,这么多产的艺术设计师,当然是要来观摩视觉化作品。
  • Processing.py 语法参考
    跟我一样喜欢写Python 的话,推荐Processing.py,在Processing 内下载Python 套件,在编辑页更改成Python 模式,就能少打很多{ }

重新认识D3.js

再来是难的。只要是接触资料视觉化的人,大概多少都要碰点以JavaScript 为基础的D3.js 。由于我不小心看了The Hitchhiker's Guide to d3.js这篇经典文章,内容将D3.js 学习路径与目标说明的很清楚,让我重燃提升D3.js 技能的动力。因为内容提供了众多资源,我一时之间也无法全部消化完,所以决定从最经济实惠的路径着手:FreeCodeCamp。互动式的程式教学,且完成后能获得资料视觉化证书,嗯,非常完美。我在上周日的凌晨一口气上完,剩最后的专案实作啰。

MORE

  • FreeCodeCamp Data Visualization
    就是这门课程,共分为三大部分,第一部分是基本语法,再来是JSON 与API 的操作,最后一部分就要自己实作各种图表。
  • @mbostock
    Mike Bostock 是D3.js 的爸爸,这位生父对资料视觉化的狂热,让他后来生出了Observable 这款JavaScript 版本的Jupyter Notebook。
  • List of Graphics People in NewsroomsAwesome Interactive Journalism
    这两个清单分别是各个资料视觉化记者的twitter 帐号与数据新闻作品,大部分都是以D3.js 呈现,看看就知道D3.js 的强大。


这篇文章同时发布在我经营的Tinker's Backchannel电子报。

Tinker's Backchannel 每周分享数据分析、视觉化、新闻媒体、互动设计的内容。如果你也对这些感兴趣,欢迎订阅、交流。


CC BY-NC-ND 2.0 授权

喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!