Python量化如何监测领涨板块挖掘题材龙头股

引言

题材概念一直是A股市场投机炒作的主旋律。大多数散户都在复杂的理论、财务指标、技术图形和消息上折腾,缺乏从实践上去认识和把握市场。概念板块是市场资金达成共识的重要介质,主力资金凭借热点题材形成赚钱效应,热点炒作驱动资金与赚钱效应形成正向反馈环,推动热点板块个股上涨,而热点题材的级别大小和想象力大小则决定了股票上涨的空间。热点题材与板块主要来自经济、政策、情绪、资金、技术和外围环境。同花顺软件提供了各种热点题材和概念指数数据,为我们分析热点题材板块动向提供了依据。那么如何利用板块指数行情监测领涨板块,寻找板块龙头股呢?本文利用Python从tushare上获取同花顺概念板块行业指数行情数据和个股交易数据,分析板块及个股的动量走向,为构建热点题材和龙头股(强势股)监测系统提供参考依据。

数据获取与探索性分析

下面利用tushare pro获取同花顺概念板块行业指数相关数据,tushare pro需到其官网注册获取token才能使用,某些数据提取有积分限制,下面使用到的数据可以通过在WX公众号后台reply “20220210”或“同花顺概念”获取。

首先导入需要用到的Python库/模块。

import pandas as pdimport numpy as np#可视化:matplotlib、seaborn、pyechartsimport matplotlib.pyplot as pltimport seaborn as sns#正确显示中文和负号plt.rcParams[‘font.sans-serif’]=[‘SimHei’]plt.rcParams[‘axes.unicode_minus’]=False#这里的pyecharts使用的是0.5.11版本from pyecharts import Bar,HeatMap#导入时间处理模块from dateutil.parser import parsefrom datetime import datetime,timedelta#pandas赋值老提升警告import warningswarnings.filterwarnings(‘ignore’)#使用tushare pro获取数据,需要到官网注册获取相应的tokenimport tushare as ts token=’输入你的token’pro=ts.pro_api(token)获取同花顺概念和行业列表。index_list=pro.ths_index()#查看数据前几行index_list.head()

#数据保存本地#index_list.to_csv(‘index_list.csv’)#读取本地数据#index_list=pd.read_csv(‘index_list.csv’,index_col=0)

其中,ts_code:代码;name:名称;count:成分个数;exchange:交易所,包括A股、港股(H)和美股(US);list_date:上市日期;type:指数类型N-板块指数,I-行业指数,S-同花顺特色指数。

def plot_bar(data,title,label=True,zoom=False): bar=Bar(”) attr=list(data.index) v=list(data.values) bar.add(title,attr,v,is_label_show=label, is_splitline_show=False, is_datazoom_show=zoom) return bardata=index_list.groupby(‘exchange’)[‘name’].count()title=’同花顺概念和行业指数nA股港股美股’plot_bar(data,title)

上图显示,A股概念和行业指数高达939个,下面主要分析A股上的同花顺概念和行业指数做进一步考察。

A_index_list=index_list.query(“exchange==’A'”)A_index_list=A_index_list.copy()A_index_list[‘nums’]=pd.to_numeric(A_index_list[‘count’])#去掉缺失值A_index_list.dropna(inplace=True)A_index_list[‘nums’].describe()

概念或行业成分股中平均有53只个股,当然,每只个股可能分属不同的概念板块行业,如果某个概念板块所含个股数量太多或太少,相当于涵盖面太宽泛或代表性不足,分析起来意义不大。下面删除重复项和剔除成份个股数量低于12大于52(相当于取25%到75%分位数)。

#删除代码重复项,#保留type为N板块的指数final_index_list=(A_index_list .drop_duplicates(subset=[‘ts_code’], keep=’first’) .query(“12<nums<52") .query("type=='N'"))#去掉样本股或成份股指数final_index_list=final_index_list[-final_index_list.name.apply(lambda s:s.endswith('样本股')or s.endswith('成份股'))]final_index_list.sort_values('nums')

data=(final_index_list.sort_values(‘nums’,ascending=False) .set_index(‘name’)[‘nums’])title=’同花顺概念和行业指数成分股个数’plot_bar(data,title,False,True)

获取概念行业指数行情

下面通过日期循环获取某时间段所有概念行业指数的行情数据。使用tushare在线获取代码由于篇幅所限,此处略,完整代码见Python金融量化知识星球。数据也可以通过WX公众号上获取(Reply“20220210”或“同花顺概念”)后导入。

#获取股票交易日历def get_cals(): #获取交易日历 pass#获取某段时间内的交易日期(如200个交易日)def get_trade_date(n): #获取当天日期时间 pass#获取某段时间内的概念指数行情数据def get_index_data(n=200): pass

查看数据前几行。后续分析只需要使用指数的收盘价、交易代码和交易日期。

#通过tushare在线获取数据#all_data=get_index_data(n=200)#数据保存本地#all_data.to_csv(‘all_data.csv’)#通过本地导入数据all_data=pd.read_csv(‘all_data.csv’,index_col=0)all_data.head()

#删除重复缺失值、将代码使用概念中文名代替final_data=(all_data.sort_values([‘ts_code’,’trade_date’]) .drop_duplicates() .set_index([‘trade_date’,’ts_code’])[‘close’].unstack() .dropna(axis=1) .rename(columns=dict(index_list[[‘ts_code’,’name’]].values)))final_data.tail()

到这一步已获取到所需数据并做了规整处理。下面对板块和相关个股涨跌幅进行分析,并构建函数用于监测板块热点和强势个股的轮动走向。

板块热点与个股涨跌监测分析

要分析板块热点的走向,首先是计算板块指数在不同时间周期下的收益率(动量)。下面以1日、5日、20日、60日和120日作为时间窗口计算概念指数的收益率。

def date_ret(data,w_list=[1,5,20,60,120]): df=pd.DataFrame() for w in w_list: df[str(w) ‘日收益率%’]=(((data/data.shift(w)-1)*100) .round(2) .iloc[w:] .fillna(0) .T .iloc[:,-1]) return dfdate_ret(final_data).sort_values(‘120日收益率%’,ascending=False)

120日涨幅居前板块指数。

date_ret(final_data).sort_values(‘120日收益率%’,ascending=False)[:10]

120日跌幅最多的前五个板块指数。

date_ret(final_data).sort_values(‘120日收益率%’,ascending=True)[:5]

概念板块指数周期涨跌幅可视化#使用pyecharts0.5.11版本可视化def out_chart(w=120): col=str(w) ‘日收益率%’ ddd=date_ret(final_data).sort_values(col,ascending=False)[col] x=list(ddd.index) y=list(ddd.values) bar=Bar(f”同花顺概念指数{w}日收益率(%)”,title_text_size=15,title_pos=’center’) bar.add(“”, x,y,is_label_show=False, is_datazoom_show=True) return bar#最近一个交易日#图形为html动态交互式,可通过拖曳查看所有概念指数的详细涨跌幅out_chart(1)

#近5个交易日out_chart(5)

#近20个交易日out_chart(20)

#近120个交易日out_chart(120)

除了使用pyecharts对板块不同周期下的动量进行监测(动态交互式),还可以使用热力图监测最近交易日各板块指数的轮动走向。图片输出可以使用网页显示更全面。

#由于同花顺指数行情数据获取不到下面概念,需剔除xx=[‘华为汽车’, ‘盐湖提锂’, ‘鸿蒙概念’, ‘共同富裕示范区’, ‘MCU芯片’, ‘牙科医疗’, ‘CRO概念’, ‘钠离子电池’, ‘工业母机’, ‘北交所概念’, ‘NFT概念’, ‘抽水蓄能’, ‘换电概念’, ‘海峡两岸’, ‘WiFi 6’, ‘智能制造’, ‘EDR概念’, ‘动力电池回收’, ‘汽车芯片’, ‘传感器’, ‘柔性直流输电’, ‘虚拟数字人’, ‘预制菜’, ‘幽门螺杆菌概念’]sss=final_data[set(final_index_list.name.values)-set(xx)]import seaborn as snspt = ((sss/sss.shift(1)-1)*100).round(2)[-10:]plt.figure(figsize=(25,5))sns.heatmap(pt, linewidths = 0.05,cmap=’Reds’);

一旦出现赚钱效应,首先看的是哪个整体板块在领涨,这个板块是什么概念,是不是当下的大热点?选股就是先看热点板块,龙头股与题材有关,题材代表了一个板块,不会是单打独斗,关注热点板块,在板块中选股非常重要。发现最大题材板块后,核心是找板块龙头股。在整个板块中最先上涨,涨势最强的个股就一定要关注并分析。

热点板块成分股龙头股监测#受篇幅所限,以下代码略,完整代码分享在Python金融量化知识星球中。#注意,写作本文是交易日期为20220209,即默认end=’20220209′.def get_stock_price(code,start=’20200101′): passdef all_stock_price(name): passdef stock_rets_rank(name,p=120): passdef stock_heat(name=’数字货币’): passstock_rets_rank(‘钾肥’)

实际上钾肥这个概念所含个股较少,且盐湖股份由于中间停牌复牌后短期暴涨(实际上是盐湖提锂概念在驱动),因此该概念指数120日涨幅最大。一起看下近期较热门的数字货币概念。翠微股份120日涨幅高达314%,可以说是近期接替妖股九安医疗的一大热门股。妖股是主力资金博弈到极致之物,与基本面与价值投资没有任何干系

stock_rets_rank(‘数字货币’)

随着数字货币财经新闻的持续发酵,2022年2月09日数字货币板块单日暴涨9%,板块内近20只个股涨停,四只创业板20cm。值得注意的是,板块的短期暴涨也是风险集聚的表现,特别是碰上那些跟风上涨的个股,当板块整体进入回调时往往一地鸡毛。

stock_rets_rank(‘数字货币’,p=1)[:20]

使用热力图监测热点板块个股。

stock_heat(‘数字货币’)

结语

本文使用Python对同花顺概念板块指数及个股进行数据探索性分析,试图从动量的角度捕捉热门题材的走向,构建强势板块和个股的监测系统。利用板块和个股监测系统可以构建动量(强者恒强)或动量反转(物极必反)的量化交易策略。本文的数据挖掘存在一定的局限性,只考虑了某些时间周期内板块和个股的收益率表现(技术面)。关于概念板块行业的分析,还可以结合财经文本分析做深度挖掘,实际上热点题材最好是结合基本面与技术面的深入分析,技术面正如温度计一样只能告诉你当前的冷热,而基本面可以推断为啥上涨的原因,未来持续性如何,这个基本逻辑非常重要。金融市场上的交易,没有完全不变和百分之百确定的东西,任何分析和决策都是一种概率,而量化为我们多维度分析市场提供一种工具,实际上实战才是唯一能快速提升交易能力的方法。

未经允许不得转载:股市行情网 » Python量化如何监测领涨板块挖掘题材龙头股

相关文章

评论 (0)