经济学家和社会科学家编程课程

IDSC为国内和国际研究人员提供经济研究方法领域面向实践的编程技能课程。以下课程现在是IDSC曲目的一部分。这些课程可以单独上,也可以在几天到一学期的时间框架内混合上,既适合研究生院的学生也适合教员。联系我们在idsc@iza.org如果你对学校的课程感兴趣。

动机

就像劳动力市场的其他领域一样,劳动力经济学家最终需要使用第二种语言,而不是主流的Stata语言。其他经济学家或社会科学家也是如此。Python最初是一种网络语言,现在是一种主要的统计语言,拥有丰富的不同模块集合,包括自然语言处理、回归、机器学习、深度学习、各种统计、最高绘图、基于代理的模拟等。根据TIOBE指数(https://www.tiobe.com/tiobe-index),截止2022年5月,Python是最流行的编程语言。相比之下,Stata的排名在50到100之间。根据世界经济论坛的数据,Python是世界科技巨头对工程师和数据科学家的顶级技能之一。

课程

1.使用Python将互联网作为社会科学的数据源

动机:随着越来越多的市场(婚姻市场、交通市场、劳动力市场等)转移到网上,或者完全是在网上诞生的,我们研究市场和理解社会经济现象的能力将取决于能否利用互联网作为数据源。这意味着文本挖掘将成为社会科学家的一项重要技能。认识到这一事实,欧洲议会正在努力将数据和文本挖掘排除在未来的数字版权立法之外。本课程有选择地涵盖了Python的基础知识,具体取决于示例需要哪些语言元素。核心目的是研究:

  • 使用Stata内置在基本的web浏览器和正则表达式的工作遇到了限制。
  • 如何安装和管理python安装及其模块的基础知识。
  • 如何用Python构造和标记一个网络浏览器。
  • 如何使用Python从web下载页面并存储它们。
  • 如何使用正则表达式(模块:re)从html文档中获取数据。
  • Python为存储数据提供的数据类型(模块:panda)。
  • 一些绘图,Python的基本回归等。

课程将用Jupyter笔记本书写,在浏览器中运行,这样参与者就可以一边学习一边玩代码。例子包括从谷歌Trends, RePEc, Twitter, Wahlrecht.de, LinkedIn, Yahoo Finance等下载数据。

2.使用Python将文本作为数据

动机:人类社会经济互动的很大一部分是通过书面文本进行的。将这些文本转换为数据的能力可以开辟新的研究途径。将文本转化为数据是社会科学中一个日益增长的研究领域。本课程教授在各种Python模块(NLTK, Gensim, sklearn等)中实现的基本NLP(自然语言处理)技术。

核心目的是研究:

  • 基本的文本统计分析和可视化
  • 建立文档语料库
  • 向量化文档(特征提取)
  • 遏制、清洁等。
  • 为你的语料库建立一个特征空间。
  • 为机器学习准备语料库。

课程将用Jupyter笔记本书写,在浏览器中运行,这样参与者就可以一边学习一边玩代码。本课程将涉及许多文献或其他数据来源的实例。

3.使用Python进行机器学习

动机:在很多情况下,你的数据都是多维的(x光、CT扫描、照片、向量化文本、人口统计数据等)。在这种情况下,让机器发现发生了什么,并为您的分析提供一个方向,或为您的数据拟合一个模型是很有帮助的。本课程涵盖了用Python实现的有监督和有监督机器学习的基础知识。

核心目的是研究:

  • 无监督学习技术(例如kmeans, k最近邻算法等)
  • 机器学习的数学基础(为什么它能工作?)
  • ML是什么,不是什么。
  • 神经网络的理论算法基础。
  • Python中的人工神经网络(例如sklearn等)。
  • Python中的深度学习(使用Tensorflow和Keras)。
  • 使用谷歌collaboration访问gpu和tpu。

本课程是一个实践介绍,在课程中,我们将训练和测试各种模型的几种数据,包括来自文本的数据。

4.使用Stata和Python

Python是一种很好的编程语言,写起来很容易,读起来也很容易。由于Stata 16将Python集成到劳动经济学中占主导地位的统计软件Stata中。本课程将教你如何无缝地使用两种语言工作。

核心目的是研究:

  • 使用Python获取并为Stata准备数据。
  • 用Python读取.dta文件。
  • 在Stata中编写Python。
  • 通过编程方式将数据从Stata传递到Python,反之亦然。
  • 在Jupyter笔记本上运行Stata(非常适合教授计量经济学课程的教师)。

所有课程要求

尼科斯阿斯基达斯

尼科斯阿斯基达斯

IDSC负责人