在过去五年中论文中“竞争企业”这一关键词的学术传播度展现出了显著的增长趋势。识别退市公司的产品市场竞争对手主要采用基于文本相似度的分析方法首先从上市公司年报中提取报告期内从事的主要业务和产品文本内容然后使用pkuseg中文分词工具结合专业词典对业务描述进行精确分词过滤掉生产、销售等通用停用词提取出行业专业关键词接着计算退市公司与同年其他上市公司的共同关键词数量按共同关键词数量降序排序只对存在共同关键词的企业计算TF-IDF余弦相似度并根据共同关键词数量对相似度进行动态权重调整共同关键词越少权重越低最终选择相似度最高的前10家企业作为该退市公司的产品市场竞争对手从而避免因通用词汇导致的误判确保识别出真正具有业务竞争关系的企业。最后再构建DID数据即当公司i是强制退市公司的产品市场竞争对手且t年处于强制退市发生当年及以后年度时取值为1其他情况取值为0。数据来源上市公司官网、上市公司年报、相关官方网站等。数据范围沪深交易所等市场中的退市企业及其对应的竞争对手企业。时间跨度2009-2024数据格式数据格式为Excel形式数据指标证券代码、股票简称、年份、试点年份、treat、post、did数据展示注delist表示退市企业competitor表示竞争者。参考文献[1]徐巍,梁上坤,钱宇航.资本市场出清与实体经济投资——基于上市公司强制退市的实证研究[J].管理世界,2025,41(08):185-206.【下载→地址1https://blog.csdn.net/iu011235/article/details/160278922?spm1001.2014.3001.5501或者下方地址2比较麻烦防失联资源包合集-CSDN博客