经济学家和社会科学家编程课程

IDSC为国内和国际研究人员在经济研究方法领域提供面向实践的编程技能课程。下面的课程现在是IDSC剧目的一部分。它们可以分开或混合在时间框架内,范围从几天到一个学期,适合研究生院的学生和教师。与我们联络idsc@iza.org如果你对你所在机构的课程感兴趣。

动机

就像劳动力市场的其他部分一样,劳动经济学家最终需要使用除主要的Stata之外的第二种语言。其他经济学家或社会科学家也是如此。Python最初是一种网络语言,现在是一种主要的统计语言,拥有丰富的不同模块集合,包括自然语言处理、回归、机器学习、深度学习、各种统计数据、最高绘图、基于代理的模拟等。根据TIOBE指数(https://www.tiobe.com/tiobe-index),截至2022年5月,Python是最受欢迎的编程语言。相比之下,Stata的排名在50到100之间。根据世界经济论坛的数据,Python是世界科技巨头对工程师和数据科学家的顶级技能之一。

课程

1.用Python编写的互联网作为社会科学的数据源

动机:随着越来越多的市场(婚姻市场、交通市场、劳动力市场等)转移到网上,或者完全在网上诞生,我们研究市场和理解社会经济现象的能力将取决于能否利用互联网作为数据来源。这意味着文本挖掘将成为社会科学家的一项重要技能。认识到这一事实,欧洲议会正在努力将数据和文本挖掘排除在未来的数字版权立法之外。该课程选择性地涵盖了Python的基础知识,这取决于哪些语言元素是示例所必需的。核心目的是研究:

  • 在使用Stata内置的基本web浏览器和正则表达式时,会遇到一些限制。
  • 如何安装和管理python安装及其模块的基础知识。
  • 如何在Python中构建和创建一个web浏览器。
  • 如何使用Python从网上下载页面并存储它们。
  • 如何使用正则表达式(模块:re)从html文档中获取数据。
  • Python为存储数据提供的数据类型(模块:panda)。
  • 一些绘图,基本的Python回归等。

讲座将写在Jupyter笔记本上,在网络浏览器中运行,以便参与者可以在我们进行的过程中玩代码。例子包括从谷歌Trends, RePEc, Twitter, Wahlrecht.de, LinkedIn,雅虎财经等下载数据。

2.使用Python将文本作为数据

动机:人类社会经济互动的很大一部分是通过书面文本发生的。将这些文本转换为数据的能力可以开辟新的研究途径。将文本转化为数据是社会科学中一个不断发展的研究领域。本课程教授在各种Python模块(NLTK, Gensim, sklearn等)中实现的基本NLP(自然语言处理)技术。

核心目的是研究:

  • 基本的文本统计分析和可视化
  • 建立文档语料库
  • 矢量化文档(特征提取)
  • 堵塞,清洗等。
  • 为你的语料库建立一个特征空间。
  • 为机器学习准备语料库。

讲座将写在Jupyter笔记本上,在网络浏览器中运行,以便参与者可以在我们进行的过程中玩代码。本课程将使用文献或其他数据源中的许多示例。

3.Python机器学习

动机:在很多情况下,你的数据是存在于多维流形上的(x射线、CT扫描、照片、向量化文本、人口统计数据等)。在这种情况下,让机器发现发生了什么,并为你的分析提供方向,或为你的数据拟合一个模型是很有帮助的。本课程涵盖了用Python实现的有监督和有监督机器学习的基础知识。

核心目的是研究:

  • 无监督学习技术(例如kmeans, k近邻算法等)
  • 机器学习的数学基础(为什么它可以工作?)
  • ML是什么,ML不是什么。
  • 神经网络的理论算法基础。
  • Python中的人工神经网络(例如sklearn等)。
  • Python中的深度学习(使用Tensorflow和Keras)。
  • 通过谷歌协作实验室访问gpu和tpu。

本课程是一个动手介绍,在课程中,我们将训练和测试各种模型的几种数据,包括来自文本的数据。

4.使用Stata和Python

Python是一种伟大的编程语言,可以很容易地编写和阅读。自Stata 16以来,Python被集成到劳动经济学中占主导地位的统计软件Stata中。本课程将教你如何无缝地使用两种语言工作。

核心目的是研究:

  • 使用Python收集数据并为Stata准备数据。
  • 用Python读取.dta文件。
  • 用Stata编写Python。
  • 通过编程方式将数据从Stata传递到Python,反之亦然。
  • 在Jupyter笔记本上运行Stata(非常适合教授计量经济学课程的教师)。

所有课程要求

尼科斯阿斯基达斯

尼科斯阿斯基达斯

IDSC负责人