数据介绍:
- 年份:2000-2024
- 范围:A股上市公司
- 三个版本:上市公司专利质量、知识宽度(未剔除未缩尾)、上市公司专利质量、知识宽度(已剔除金融STPT未缩尾)、上市公司专利质量、知识宽度(已剔除金融STPT已缩尾)
- 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
- 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
- 行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
- 代码格式:do文件(Stata 14/15/16/17/18)
- 程序说明: 评估代码对已计算的进行全面评估,包括:
- 1. 数据分布分析
- 2. 异常值检验
- 3. 逻辑合理性验证
- 4. 稳健性测试
- 5. 可视化输出
- 6. 详细日志记录
计算说明:
为了测度企业专利质量,我们使用中国国家知识产权局企业专利文件中IPC分类号的数量信息。依据不同专利其分类号格式有所不同。在发明专利和实用新型专利中,IPC专利分类号格式一般采取“部一大类一小类一大组一小组”的格式,如“A01 B01/00”。具体而言,分类号的第一个字母取值范围为A一H,以表示8个大部:
- A部:生活必需(农、轻、医)
- B部:作业、运输
- C部:化学、冶金
- D部:纺织、造纸
- E部:固定建筑物
- F部:机械工程、照明、采暖、武器、爆破
- G部:物理
- H部:电技术
第2至第3个数字表示大类,第4个字母表示小类,大组和小组之间用“/”隔开。在外观专利中,专利分类号则为“大类一小类”的格式,如“01-00”。为了充分利用每一种专利的分类号信息,定义了专利知识宽度以反映专利质量。
首先,我们认为,仅采用专利的分类号数量并不能准确区分出一项专利所包含分类号之间的内部差异,反而会对专利质量的测度产生偏误。例如,一项专利共有三个分类号A01B02 /00、A01 B02/10、A01B02/20,而另一项专利也有三个分类号: A01 B02/00、A02B13/00、B35D13/20 ,这两项专利虽然专利分类号数量相同,但由于第一项专利只利用了A01B02的一个大组信息,而第二项专利则利用了A01B02、A02B13、B35D13这三个大组信息,显然第二项专利所运用的知识宽度要大于前者,因此,其专利质量相应也更高。
为了尽量减少这一偏误,参照产业集中度的测算思路,采取大组层面的赫芬达尔一赫希曼指数(HHI)的逻辑思路对其进行加权,企业专利知识宽度的具体计算方法为:

其中,α表示专利分类号中各大组分类所占比重。可以看出,patent_ knowedge 越大, 各个大组层面的专利分类号之间的差异越大,即表明企业创造专利所运用的知识宽度越大,其专利质量可能就表现为越高。
在计算了基于专利层面的知识宽度信息指标之后,根据“企业一年份一专利类型”这三个维度,将申请和授权专利层面的知识宽度信息加总到企业层面。为此,我们采用两种类型加总方法:一是均值法;二是中位数法。需要特别指出的是,只估算了企业发明专利和实用新型专利的质量,没有估算外观设计专利的质量。这是因为外观设计的专利分类号体系与发明专利和实用新型专利截然不同,所以无法计算出外观专利准确的知识宽度。
参考文献
- 专利质量对企业出口竞争力的影响机制:基于知识宽度视角的探究--李宏
代码:
评估代码:
数据量:
结果数据