新三板挂牌公司(全国中小企业股份转让系统neeq)行业、地区、券商、以及域名浅析

新三板挂牌公司的数据都在http://www.neeq.com.cn/nq/listedcompany.html上,用 chrome浏览器,很容易的找到了网站使用的接口,是 json 格式。 显示公司列表用的以下接口:   进入公司详情用的以下接口:   使用 Postman 把接口地址转换在成 python 表达形式,类似以下: import requests url = “http://www.neeq.com.cn/nqhqController/detailCompany.do” querystring = {“callback”:”jQuery18302839439874045484_1503669590247″,”zqdm”:”430002″,”_”:”1503669590311″} headers = {     ‘cache-control’: “no-cache”,     ‘postman-token’: “ca867bb7-8797-78d7-c7b7-c56bfd427eb1”     } response = requests.request(“GET”, url, headers=headers, params=querystring) print(response.text) 把callback的jQuery18302839439874045484_1503669590247值删掉,观察得到的数据,多了一对括号,用类似于response.text[2:-2]的语句先去掉多余部分,使用loads将str 转成 dict格式,即json_data=json.loads(response.text[2:-2])( dumps为dict 转 str)。 这里都是用直接使用接口,不会用到BeautifulSoup,如需用到且有汉字乱码,尝试在BeautifulSoup之前加一句response.encoding = ‘utf-8’,提前编好码。 没什么问题的话,就用多线程把数据读回来,没有数据库就用 csv 格式暂存。 因为时间匆忙(学艺不精),先将得到的数据结果列出来,截止2017年8月26日,应该是互联网上新三板挂牌公司关于行业、地区、券商、以及域名的最新数据。 […]