Python—看我分析下已经退市的 可转债 都有什么特点
分析
需求分析
-
可转债退市原因的种类与占比是多少
-
强赎与非强赎导致的退市可转债 存续时间 维度占比
-
强赎与非强赎导致的退市可转债 发行资金 规模占比
-
强赎与非强赎导致的退市可转债 各个评级 的占比
-
强赎与非强赎导致的退市可转债 各个行业(一级行业) 的占比
程序环境分析
-
需要依赖的三方代码库:
-
requests(处理http请求)
-
pyecharts(图表显示)
-
pandas(数据表处理)
-
BeautifulSoup(html文件解析)
-
-
抓取数据的网站
-
集思录(www.jisilu.cn/)
-
程序逻辑分析
-
通过 http请求 抓取已退市可转债的列表
-
获取列表中的每个转债代码,通过 http请求 访问转债详情页面,通过BeautifulSoup库提供的方法 获取到债券评级与行业
-
获取列表中的(转债代码、转债名称、发行规模、存续年限、退市原因、债券评级、行业)字段,存入到csv文件中
-
存入到csv文件是因为后面要做各个维度的数据分析,如果不存到文件中,后面数据分析中一但出现一点错误,就又得重新去网站抓取数据,比较麻烦
-
-
读取csv文件中的数据,用pandas转成表格,按退市原因分组计数,用pyecharts做成饼图展示
-
读取csv文件中的数据,用pandas转成表格,按强赎与非强赎中的存续时间分组计数,用pyecharts做成饼图
-
读取csv文件中的数据,用pandas转成表格,按强赎与非强赎中的发行资金规模分组计数(从大到小排序,取前15),用pyecharts做成柱形图
-
读取csv文件中的数据,用pandas转成表格,按强赎与非强赎中的债券评级分组计数,用pyecharts做成饼图
-
读取csv文件中的数据,用pandas转成表格,按强赎与非强赎中的债券行业分组计数,用pyecharts做成柱状图
实现代码
编写http请求方法
import pandas as pd
from bs4 import BeautifulSoup
from pyecharts.charts import Bar, Pie
from pyecharts import options as optsdef get_request(url):# 设置请求头,防止部分网站对请求头做拦截 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36"}try:resp = requests.get(url, headers=headers)resp.encoding="utf-8"if resp.status_code == 200:return resp.textexcept Exception as e:print("http请求出错:",e)return None
爬取债券详情页,取 债券评级与行业 (列表页面中没有这两个)
def assemble_grade(resp):resp_json=json.loads(resp)datas=resp_json["rows"]if datas is None:return NonedataList=[]for data in datas:# 转债代码、转债名称、发行规模、存续年限、退市原因、债券评级bond_id=data["cell"]["bond_id"]bond_nm=data["cell"]["bond_nm"]orig_iss_amt=data["cell"]["orig_iss_amt"]listed_years=data["cell"]["listed_years"]delist_notes=data["cell"]["delist_notes"]#获取详情grade,indusity=parse_html("https://www.jisilu.cn/data/convert_bond_detail/%s" %bond_id)print("当前可转债是:%s,评级是:%s,行业是:%s" %(bond_nm,grade,indusity))dataList.append(",".join([bond_id,bond_nm,orig_iss_amt,listed_years,delist_notes,grade,indusity]))#防止访问过快,网站拦截,睡5秒time.sleep(2)return dataList
将抓取的数据存入csv文件中
def write_csv(data):if not data:print("当前要写入的数据为空")with open("bonds.csv", "w", encoding="utf-8") as f:f.write("\n".join(data))
读取csv文件的数据,用做分析
'''
type 1全部 2强赎 3非强赎
'''
def read_csv(type):dataList=[]with open("bonds.csv", "r", encoding="utf-8") as f:lines=f.readlines()for line in lines:line=line.replace("\\n","")data=line.split(",")# 排除可交换债if data[1].endswith("EB"):continueindustry=data[6].split("-")[0]year=assemble_year(data[3])if type==1:dataList.append([data[2], year, data[4],data[5],industry])elif type==2:if data[4]=="强赎":dataList.append([data[2], year, data[4],data[5],industry])elif type==3:if data[4] != "强赎":dataList.append([data[2],year,data[4],data[5],industry])return dataList
按退市原因进行分析,生成饼图
def craete_notes_pie(pf):data = pf.groupby(by=["delist_notes"]).size()notesList=list(data.index)notesCount=list(data)c=(Pie().add("",[list(z) for z in zip(notesList,notesCount)]).set_global_opts(title_opts=opts.TitleOpts(title="退市原因统计")).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}:{c}个 ,占比:{d}%")).render("notes.html"))
按强赎与非强赎中的存续时间分组计数,用pyecharts做成饼图
def craete_years_pie(pf,name,title):data = pf.groupby(by=["listed_years"]).size()notesList = list(data.index)notesCount = list(data)c = (Pie().add("", [list(z) for z in zip(notesList, notesCount)]).set_global_opts(title_opts=opts.TitleOpts(title=title),legend_opts=opts.LegendOpts(pos_left="20%")).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}:{c}个 ,占比:{d}%")).render(name))
按强赎与非强赎中的发行资金规模分组计数(从大到小排序,取前15),用pyecharts做成柱形图
def craete_amt_bar(pf,name,title):data = pf.groupby(by=["orig_iss_amt"]).size().reset_index(name="size").sort_values("size",ascending=False).head(15)print(data)notesList=list(data["orig_iss_amt"])notesCount=list(data["size"])c=(Bar().add_xaxis(notesList).add_yaxis("发行规模",notesCount).set_global_opts(title_opts=opts.TitleOpts(title=title),xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-20))).render(name))
按强赎与非强赎中的债券评级分组计数,用pyecharts做成饼图
def craete_grade_pie(pf,name,title):data = pf.groupby(by=["grade"]).size()notesList=list(data.index)notesCount=list(data)c=(Pie().add("",[list(z) for z in zip(notesList,notesCount)]).set_global_opts(title_opts=opts.TitleOpts(title=title)).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}:{c}个 ,占比:{d}%")).render(name))
按强赎与非强赎中的债券行业分组计数,用pyecharts做成柱状图
def craete_industry_bar(pf,name,title):# 按行业分组,排序,取前30位data = pf.groupby(by=["industry"]).size().reset_index(name="size").sort_values("size",ascending=False).head(30)print(data)notesList=list(data["industry"])notesCount=list(data["size"])c=(Bar().add_xaxis(notesList).add_yaxis("行业",notesCount).set_global_opts(title_opts=opts.TitleOpts(title=title),xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=45))).render(name))
最终调用 主方法
def main():#生成动太时间戳rTime=str(round(time.time()*1000))#获取退市可转债列表resp=get_request("https://www.jisilu.cn/data/cbnew/delisted/?___jsl=LST___t="+rTime)#组装每个可转债的评级dataList=assemble_grade(resp)#将数据写入csvwrite_csv(dataList)#读取csv文件中的数据,并制成表格(发行规模,存续时间,退市原因)dfData = read_csv(1)pf = pd.DataFrame(dfData, columns=["orig_iss_amt", "listed_years", "delist_notes", "grade", "industry"])dfData=read_csv(2)pf2=pd.DataFrame(dfData, columns=["orig_iss_amt", "listed_years", "delist_notes","grade","industry"])dfData = read_csv(3)pf3 = pd.DataFrame(dfData, columns=["orig_iss_amt", "listed_years", "delist_notes", "grade","industry"])#按退市原因分组计数,用pyecharts做成饼图craete_notes_pie(pf)#存续时间维度占比craete_years_pie(pf2,"qs_years.html","强赎存续年限统计")craete_years_pie(pf3,"years.html","非强赎存续年限统计")# 强赎与非强赎发行资金规模占比craete_amt_bar(pf2,"qs_amt.html","强赎发行规模统计")craete_amt_bar(pf3, "amt.html","非强赎发行规模统计")# 强赎与非强赎各个评级的占比craete_grade_pie(pf,"qs_grade.html","强赎评级统计")craete_grade_pie(pf, "grade.html", "非强赎评级统计")# 强赎与非强赎行业占比craete_industry_bar(pf2,"qs_industry.html","强赎行业统计")craete_industry_bar(pf3, "industry.html", "非强赎行业统计")if __name__ == '__main__':main()
结果展示图
退市原因分析:总135个已退市可转债中,127个都是 强赎导致的,占比是94.08%;8个是因为到期或者资产不足导致,占比5.92%
存续时间分析:
强赎的可转债中,按存续时间分析,1年以内被强赎的最多,有53个,占比 41.73%,其次是 大于1年,小于等于2年的,有46个,占比 36.22%, 其次是 大于2年,小于等于3年的,有 14个,占比11.02% .... ,从分析结果中可得知 可转债发行后,短时间内被赎回的概率比较大,存续时间越长,赎回概率则越小
发行规模分析:
强赎的可转债中,按资金规模划分 发行10亿的有6个,4.2亿的3个,25亿的3个...
按债券评级分析:
强赎的可转债中,按评级划分 占比最多的是AA级,有61个,占比 45.18%,其次是 AA+ 有25个,占比18.52, 第三是 AAA有22个,占比16.3%...
总结:最好买AA- 级或以上的,被强赎的概率最高
按债券行业分析:
强赎的可转债中,按一级行业划分,取排名靠前的30个,占比最多的是 电子行业,其次是医药生物、化工、机械设备等
总结:
-
岂今为止,在已退市的可转债中,94%以上都是被强赎的
-
可转债发行后,1年以内被强赎的概率最高,存续时间越往后,则概率越低
-
从债券评级上看,AA- 或以上,被强赎的概率最高,AAA级债券暂还没出现被回售的
-
从行业上看,电气、医药生物、化工、机械设备、电气设备等都是被强赎比较高的行业
注:此历史数据只供参考,具体投资还需要独立思考,且近两年,可转债的发行数量增加很多,质量更是参差不齐,选择时还需要谨慎。 如果能抱着持有到期的心态,买上价格在100以内AA级及以上的债券,相信亏本的可能性及小,且收益不会太差,此乃保守投资者投资的一种方式
程序猿与投资生活实录已改名为 程序猿知秋,WX同款,欢迎关注!