当前位置: 首页 > news >正文

Python—看我分析下已经退市的 可转债 都有什么特点

分析

需求分析

  • 可转债退市原因的种类与占比是多少

  • 强赎非强赎导致的退市可转债 存续时间 维度占比

  • 强赎非强赎导致的退市可转债 发行资金 规模占比

  • 强赎非强赎导致的退市可转债 各个评级 的占比

  • 强赎非强赎导致的退市可转债 各个行业(一级行业) 的占比

程序环境分析

  • 需要依赖的三方代码库:  

    • requests(处理http请求)

    • pyecharts(图表显示)

    • pandas(数据表处理)

    • BeautifulSoup(html文件解析)

  • 抓取数据的网站

    • 集思录(www.jisilu.cn/)

程序逻辑分析

  • 通过 http请求 抓取已退市可转债的列表

  • 获取列表中的每个转债代码,通过 http请求 访问转债详情页面,通过BeautifulSoup库提供的方法 获取到债券评级与行业

  • 获取列表中的(转债代码、转债名称、发行规模、存续年限、退市原因、债券评级、行业)字段,存入到csv文件中

    • 存入到csv文件是因为后面要做各个维度的数据分析,如果不存到文件中,后面数据分析中一但出现一点错误,就又得重新去网站抓取数据,比较麻烦

  • 读取csv文件中的数据,用pandas转成表格,按退市原因分组计数,用pyecharts做成饼图展示

  • 读取csv文件中的数据,用pandas转成表格,按强赎与非强赎中的存续时间分组计数,用pyecharts做成饼图

  • 读取csv文件中的数据,用pandas转成表格,按强赎与非强赎中的发行资金规模分组计数(从大到小排序,取前15),用pyecharts做成柱形图

  • 读取csv文件中的数据,用pandas转成表格,按强赎与非强赎中的债券评级分组计数,用pyecharts做成饼图

  • 读取csv文件中的数据,用pandas转成表格,按强赎与非强赎中的债券行业分组计数,用pyecharts做成柱状图

实现代码

编写http请求方法

import pandas as pd
from bs4 import BeautifulSoup
from pyecharts.charts import Bar, Pie
from pyecharts import options as optsdef get_request(url):# 设置请求头,防止部分网站对请求头做拦截 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36"}try:resp = requests.get(url, headers=headers)resp.encoding="utf-8"if resp.status_code == 200:return resp.textexcept Exception as e:print("http请求出错:",e)return None
 

爬取债券详情页,取 债券评级与行业 (列表页面中没有这两个)

def assemble_grade(resp):resp_json=json.loads(resp)datas=resp_json["rows"]if datas is None:return NonedataList=[]for data in datas:# 转债代码、转债名称、发行规模、存续年限、退市原因、债券评级bond_id=data["cell"]["bond_id"]bond_nm=data["cell"]["bond_nm"]orig_iss_amt=data["cell"]["orig_iss_amt"]listed_years=data["cell"]["listed_years"]delist_notes=data["cell"]["delist_notes"]#获取详情grade,indusity=parse_html("https://www.jisilu.cn/data/convert_bond_detail/%s" %bond_id)print("当前可转债是:%s,评级是:%s,行业是:%s" %(bond_nm,grade,indusity))dataList.append(",".join([bond_id,bond_nm,orig_iss_amt,listed_years,delist_notes,grade,indusity]))#防止访问过快,网站拦截,睡5秒time.sleep(2)return dataList
 

将抓取的数据存入csv文件中

def write_csv(data):if not data:print("当前要写入的数据为空")with open("bonds.csv", "w", encoding="utf-8") as f:f.write("\n".join(data))
 

读取csv文件的数据,用做分析

'''
type 1全部  2强赎  3非强赎
'''
def read_csv(type):dataList=[]with open("bonds.csv", "r", encoding="utf-8") as f:lines=f.readlines()for line in lines:line=line.replace("\\n","")data=line.split(",")# 排除可交换债if data[1].endswith("EB"):continueindustry=data[6].split("-")[0]year=assemble_year(data[3])if type==1:dataList.append([data[2], year, data[4],data[5],industry])elif type==2:if data[4]=="强赎":dataList.append([data[2], year, data[4],data[5],industry])elif type==3:if data[4] != "强赎":dataList.append([data[2],year,data[4],data[5],industry])return dataList
 

按退市原因进行分析,生成饼图

def craete_notes_pie(pf):data = pf.groupby(by=["delist_notes"]).size()notesList=list(data.index)notesCount=list(data)c=(Pie().add("",[list(z) for z in zip(notesList,notesCount)]).set_global_opts(title_opts=opts.TitleOpts(title="退市原因统计")).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}:{c}个  ,占比:{d}%")).render("notes.html"))

按强赎与非强赎中的存续时间分组计数,用pyecharts做成饼图

def craete_years_pie(pf,name,title):data = pf.groupby(by=["listed_years"]).size()notesList = list(data.index)notesCount = list(data)c = (Pie().add("", [list(z) for z in zip(notesList, notesCount)]).set_global_opts(title_opts=opts.TitleOpts(title=title),legend_opts=opts.LegendOpts(pos_left="20%")).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}:{c}个  ,占比:{d}%")).render(name))
 

强赎与非强赎中的发行资金规模分组计数(从大到小排序,取前15),用pyecharts做成柱形图

def craete_amt_bar(pf,name,title):data = pf.groupby(by=["orig_iss_amt"]).size().reset_index(name="size").sort_values("size",ascending=False).head(15)print(data)notesList=list(data["orig_iss_amt"])notesCount=list(data["size"])c=(Bar().add_xaxis(notesList).add_yaxis("发行规模",notesCount).set_global_opts(title_opts=opts.TitleOpts(title=title),xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-20))).render(name))
 

按强赎与非强赎中的债券评级分组计数,用pyecharts做成饼图

def craete_grade_pie(pf,name,title):data = pf.groupby(by=["grade"]).size()notesList=list(data.index)notesCount=list(data)c=(Pie().add("",[list(z) for z in zip(notesList,notesCount)]).set_global_opts(title_opts=opts.TitleOpts(title=title)).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}:{c}个  ,占比:{d}%")).render(name))
 

按强赎与非强赎中的债券行业分组计数,用pyecharts做成柱状图

def craete_industry_bar(pf,name,title):# 按行业分组,排序,取前30位data = pf.groupby(by=["industry"]).size().reset_index(name="size").sort_values("size",ascending=False).head(30)print(data)notesList=list(data["industry"])notesCount=list(data["size"])c=(Bar().add_xaxis(notesList).add_yaxis("行业",notesCount).set_global_opts(title_opts=opts.TitleOpts(title=title),xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=45))).render(name))
 

最终调用 主方法

def main():#生成动太时间戳rTime=str(round(time.time()*1000))#获取退市可转债列表resp=get_request("https://www.jisilu.cn/data/cbnew/delisted/?___jsl=LST___t="+rTime)#组装每个可转债的评级dataList=assemble_grade(resp)#将数据写入csvwrite_csv(dataList)#读取csv文件中的数据,并制成表格(发行规模,存续时间,退市原因)dfData = read_csv(1)pf = pd.DataFrame(dfData, columns=["orig_iss_amt", "listed_years", "delist_notes", "grade", "industry"])dfData=read_csv(2)pf2=pd.DataFrame(dfData, columns=["orig_iss_amt", "listed_years", "delist_notes","grade","industry"])dfData = read_csv(3)pf3 = pd.DataFrame(dfData, columns=["orig_iss_amt", "listed_years", "delist_notes", "grade","industry"])#按退市原因分组计数,用pyecharts做成饼图craete_notes_pie(pf)#存续时间维度占比craete_years_pie(pf2,"qs_years.html","强赎存续年限统计")craete_years_pie(pf3,"years.html","非强赎存续年限统计")# 强赎与非强赎发行资金规模占比craete_amt_bar(pf2,"qs_amt.html","强赎发行规模统计")craete_amt_bar(pf3, "amt.html","非强赎发行规模统计")# 强赎与非强赎各个评级的占比craete_grade_pie(pf,"qs_grade.html","强赎评级统计")craete_grade_pie(pf, "grade.html", "非强赎评级统计")# 强赎与非强赎行业占比craete_industry_bar(pf2,"qs_industry.html","强赎行业统计")craete_industry_bar(pf3, "industry.html", "非强赎行业统计")if __name__ == '__main__':main()
 

结果展示图

退市原因分析:总135个已退市可转债中,127个都是 强赎导致的,占比是94.08%;8个是因为到期或者资产不足导致,占比5.92%

存续时间分析:

强赎的可转债中,按存续时间分析,1年以内被强赎的最多,有53个,占比 41.73%,其次是 大于1年,小于等于2年的,有46个,占比 36.22%, 其次是 大于2年,小于等于3年的,有 14个,占比11.02% ....    ,从分析结果中可得知 可转债发行后,短时间内被赎回的概率比较大存续时间越长,赎回概率则越小

发行规模分析:

强赎的可转债中,按资金规模划分 发行10亿的有6个,4.2亿的3个,25亿的3个...

按债券评级分析:

强赎的可转债中,按评级划分 占比最多的是AA级,有61个,占比 45.18%,其次是 AA+ 有25个,占比18.52, 第三是 AAA有22个,占比16.3%...   

总结:最好买AA- 级或以上的,被强赎的概率最高

按债券行业分析:

强赎的可转债中,按一级行业划分,取排名靠前的30个,占比最多的是 电子行业,其次是医药生物、化工、机械设备

总结:

  • 岂今为止,在已退市的可转债中,94%以上都是被强赎的

  • 可转债发行后,1年以内被强赎的概率最高,存续时间越往后,则概率越低

  • 从债券评级上看,AA- 或以上,被强赎的概率最高,AAA级债券暂还没出现被回售的

  • 从行业上看,电气、医药生物、化工、机械设备、电气设备等都是被强赎比较高的行业

注:此历史数据只供参考,具体投资还需要独立思考,且近两年,可转债的发行数量增加很多,质量更是参差不齐,选择时还需要谨慎。 如果能抱着持有到期的心态,买上价格在100以内AA级及以上的债券,相信亏本的可能性及小,且收益不会太差,此乃保守投资者投资的一种方式

程序猿与投资生活实录已改名为  程序猿知秋,WX同款,欢迎关注!   

http://www.lryc.cn/news/34349.html

相关文章:

  • 【第八课】空间数据基础与处理——数据结构转化
  • MATLAB绘制三Y轴坐标图:补充坐标轴及字体设置
  • springboot项目中Quartz
  • Presto本地开发,plugin的设置
  • 2023年3月西安/杭州/深圳/东莞NPDP产品经理认证考试报名
  • Vue3笔记01 创建项目,Composition API,新组件,其他
  • pandas数据分析(二)
  • Spring实现[拦截器+统一异常处理+统一数据返回]
  • MySQL——插入加锁/唯一索引插入死锁/批量插入效率
  • 【专项训练】数组、链表
  • 基于Jeecgboot前后端分离的ERP系统开发代码生成(六)
  • 什么?同步代码块失效了?-- 自定义类加载器引起的问题
  • CHAPTER 4 文件共享 - Samba
  • 深入分析@Configuration源码
  • Unity 代码优化 内存管理优化
  • 设计模式~门面(外观)模式(Facade)-08
  • C++面向对象编程之一:封装
  • IDEA插件系列(3):Maven Helper插件
  • SAP 更改物料基本计量单位
  • 蓝桥web基础知识学习
  • Python+ChatGPT制作一个AI实用百宝箱
  • Python中格式化字符串输出的4种方式
  • C#基础教程15 枚举与类
  • 三步 让你的 vscode 自动编译ts文件
  • STM32程序下载和启动方式
  • 基础01-ajax fetch axios 的区别
  • Android Execution failed for task ‘:app:mergeDebugJavaResource
  • spring事物源码分析
  • 炫龙游戏本Win10系统总是蓝屏崩溃怎么办?
  • 华为OD机试题,用 Java 解【数字加减游戏】问题