当前位置: 首页 > news >正文

perl:获取同花顺数据--业绩快报,业绩公告

perldoc LWP::UserAgent

如果没有安装,则安装模块,运行 cpanm LWP::UserAgent  。

编写  get_yjkb_10jqka.pl  如下

#!/usr/bin/perl
# perl 获取同花顺数据--业绩快报
use LWP::UserAgent;
use Encode qw(decode encode);
use POSIX;
use Data::Dumper;
use HTML::TreeBuilder;
use HTML::TreeBuilder::XPath;my $tree= HTML::TreeBuilder::XPath->new;
open(my $DATA,'>', "data.html") or die "open data file failed:$!"; my $ua = LWP::UserAgent->new;
$ua->timeout(10);
$ua->env_proxy;
$ua->agent("Mozilla/8.0");
my $response = $ua->get('http://data.10jqka.com.cn/financial/yjkb/');if ($response->is_success) {print $DATA  $response->decoded_content;  # or whatever
#  print $response->decoded_content;  # or whatever$tree->parse_file( "data.html");
};my $title=  $tree->findvalue('/html/body//span[@class="text-value"]');
print " title is $title\n";
$title ='yjkb-2023Y'; 
my $pages = $tree->findvalue('/html/body//span[@class="page_info"]');
my @ps = split('/', $pages);
print " $title pages is $ps[1]\n";sub utf2gbk { encode('gbk', decode('utf8', $_[0]));} 
# 表头一行
my $headline ="序号,股票代码,股票简称,公告日期,营业收入(元),去年同期(元),同比增长(%),季度环比增长(%),净利润(元),去年同期(元),同比增长(%),季度环比增长(%),每股收益(元),每股净资产(元),净资产收益率(%),更多\n";for (my $n=1; $n<=1; $n++){open(my $T, ">", "$title-$n.csv");print $T utf2gbk($headline);my @arr1= $tree->find_by_tag_name("tr") ;shift @arr1; shift @arr1; # 忽略表头2行foreach my $row (@arr1) {my @arr2= $row->content_list;my @str;foreach my $a (@arr2){ push @str, $a->as_text;}my $line = utf2gbk(join(',', @str));     print $T "$line\n"; }close $T;
}

注意:源程序 编码:UTF-8.

运行 cmd

chcp 65001

perl get_yjkb_10jqka.pl 

 title is 2023年年报
 yjkb-2023Y pages is 23

生成 yjkb-2023Y-1.csv 


编写  get_yjgg_10jqka.pl  如下

#!/usr/bin/perl
# perl 获取同花顺数据--业绩公告
use LWP::UserAgent;
use Encode qw(decode encode);
use POSIX;
use Data::Dumper;
use HTML::TreeBuilder;
use HTML::TreeBuilder::XPath;my $tree= HTML::TreeBuilder::XPath->new;
open(my $DATA,'>', "data.html") or die "open data file failed:$!"; my $ua = LWP::UserAgent->new;
$ua->timeout(10);
$ua->env_proxy;
$ua->agent("Mozilla/8.0");
my $response = $ua->get('http://data.10jqka.com.cn/financial/yjgg/');if ($response->is_success) {print $DATA  $response->decoded_content;  # or whatever
#  print $response->decoded_content;  # or whatever$tree->parse_file( "data.html");
};my $title=  $tree->findvalue('/html/body//span[@class="text-value"]');
print " title is $title\n";
$title ='yjgg-2023Y'; 
my $pages = $tree->findvalue('/html/body//span[@class="page_info"]');
my @ps = split('/', $pages);
print " $title pages is $ps[1]\n";sub utf2gbk { encode('gbk', decode('utf8', $_[0]));} # 表头一行
my $headline ="序号,股票代码,股票简称,公告日期,营业收入(元),去年同期(元),同比增长(%),季度环比增长(%),净利润(元),去年同期(元),同比增长(%),季度环比增长(%),每股收益(元),每股净资产(元),净资产收益率(%),更多\n";for (my $n=1; $n<=1; $n++){open(my $T, ">", "$title-$n.csv");print $T utf2gbk($headline);my @arr1= $tree->find_by_tag_name("tr") ;shift @arr1; shift @arr1; # 忽略表头2行foreach my $row (@arr1) {my @arr2= $row->content_list;my @str;foreach my $a (@arr2){ push @str, $a->as_text;}my $line = utf2gbk(join(',', @str));     print $T "$line\n"; }close $T;
}

运行 perl get_yjgg_10jqka.pl 

 title is 2023年年报
 yjgg-2023Y pages is 7

生成 yjgg-2023Y-1.csv 

http://www.lryc.cn/news/327034.html

相关文章:

  • FPGA选型
  • centos系统的root密码忘记或失效的解决办法(超详细)
  • 【Android 源码】Android源码下载指南
  • MySQL数据库高级语句
  • 软件测试【理论基础】
  • 蓝桥杯每日一题(floyd算法)
  • 文心一言 VS 讯飞星火 VS chatgpt (224)-- 算法导论16.3 6题
  • flutter3_douyin:基于flutter3+dart3短视频直播实例|Flutter3.x仿抖音
  • VR全景赋能智慧农业,打造沉浸式种植体验平台
  • 百度文心一言(ERNIE bot)API接入Android应用
  • springboot基本使用八(mbatisplus+filter实现登录功能)
  • 蚂蚁庄园今天答案
  • 第5章 数据建模和设计
  • 牛客NC108 最大正方形【中等 动态规划 Java,Go,PHP】
  • C#学生信息成绩管理系统
  • 精品凉拌菜系列热卤系列课程
  • Java代码基础算法练习-求一个三位数的各位数字之和-2024.03.27
  • Excel 十字交叉聚光灯查询,再也不用担心看串行与列
  • 集合和字符串的使用
  • Wagtail-基于Python Django的内容管理系统CMS实现公网访问
  • Python入门级题目及答案
  • 【C语言基础】:字符串函数(二)
  • 【Docker】Docker资源(创建容器)CPU/内存/磁盘IO/GPU限制与分配教程
  • 发展规划--IM系统
  • stm32平衡车
  • google浏览器下载文件提示无法安全地下载怎么解决?
  • Navicat 干货 | 通过检查约束确保 PostgreSQL 的数据完整性
  • FPGA时钟资源详解(2)——Clock-Capable Inputs
  • 使用JMeter的JSON提取器:通过递归下降查找,从接口响应中提取特定字段
  • Js全部循环方法解析