Anaconda 最新发布的一份《State of Data Science 2021》报告指出,数据科学和机器学习专业人士推动了 Python 编程语言的采用,但数据科学和机器学习在商业中仍然缺乏关键工具,在成为决策的必要条件之前还有发展空间。
该报告基于来自 140 多个国家使用数据科学和机器学习工具的个人的 4200 多份答复。主要探讨了数据科学作为一个领域是如何发展的、商业环境和学术机构采用数据科学的总体趋势,以及学生可以做些什么来为未来做准备。
调查结果显示,63% 的受访者表示他们一直或经常使用 Python,这使得该语言成功成为了今年调查中最受欢迎的语言。此外,71% 的教育工作者表示他们正在使用 Python 教授机器学习和数据科学;88% 的学生报告说,他们正在学习 Python,以便为进入数据科学/机器学习领域做好准备。
Anaconda 称,对于全世界的数据科学家、研究人员、学生和专业人士而言,Python 正在成为一种越来越流行的编程语言。紧随 Python 之后的则分别是 SQL、R、JavaScript、HTML/CSS、Java、Bash/Shell、C/C++、C·、Typescript、PHP、Rust、Julia 和 Go 语言。
在商业组织中,有 50% 的人表示他们的数据科学投资在大流行期间保持不变或增加(26% 的人增加了投资,24% 的人表示投资持平),37% 的人则透露出现了减少的趋势。
当被问及他们在商业决策中的角色参与程度时,14% 的受访者表示“所有”决策都依赖于他们或他们的团队的见解;39% 的人表示“许多”商业决策依赖于他们。报告称,“虽然仍需努力确保我们将数据科学家纳入其中,但令人鼓舞的是,他们的价值在组织中得到认可,这可能是该领域避免投资急剧减少的原因。”
此外,当今社会新闻存在一个趋势是,自动化正在接管并将最终取代人工。然而调查结果显示,自动化在数据科学领域受到欢迎。其并没有被视为竞争对手,而是被看做从业者的补充工具。
在被问及对数据科学中的自动化或 AutoML有何感想时,55% 的受访者表示希望在数据科学领域看到更多的自动化和 AutoML,只有 4% 的受访者担心自动化对数据科学的影响。
还有大多数受访者(65%)表示,他们的雇主正在授权他们通过增加与开源项目开发相关的资金来为开源做出贡献。但也有 18% 的受访者表示,受 COVID-19 或其他因素影响,雇主对开源的支持出现了减少。
完整报告地址:https://www.anaconda.com/state-of-data-science-2021