文化与金融是金融学一个新兴的研究领域,但是地区之间的文化距离用何种代理变量往往成为实证研究中的一个巨大的难题,本数据集各地级市之间的方言距离,原始数据来自《汉语方言大辞典》一书。使用的方言数据来自中山大学岭南学院产业与区域经济研究中心。 该中心依据 2000 年出版的《汉语方言大词典》,整理了全国 2615 个县的方言, 县代码以 1986 年版行政区划为准。 我们依据中华人民共和国民政部网站上公布的历年全国县级以上行政区划变更情况,将 1986 年版行政区划对应到 2002 年版,最终得 到 2714 个县的方言。 按照《汉语方言大词典》,中国的方言可以分为官话、吴语、客话、平话、徽语、晋语、湘语、粤语、赣语、闽语共 10 个方言大区。 每个方言大区又分为不同的方言小区,例如官话又分为东北官话、北京官话、冀鲁官话、胶辽官话、中原官 话、兰银官话、西南官话、江淮官话。 每个方言小区再进一步分为不同方言片,例如北京官话包括京师片、克石片、怀承片、朝峰片、石克片等五种方言片。地级市间方言距离计算公式: 参照刘毓芸等(2015)的方法,以县的人口比例为权重来计算地级市之间的方言距离,具体可以参考一下文章的描述:
- Liu, Yuyun, Yang Jiao, and Xianxiang Xu. "Promoting or preventing labor migration? Revisiting the role of language." China Economic Review (2020): 101407.
- 刘毓芸,徐现祥,肖泽凯.劳动力跨方言流动的倒U型模式[J].经济研究,2015,50(10):134-146+162.
- 吴小康,于津平.方言距离与城市间产业结构趋同[J].世界经济,2021,44(02):126-15