当前位置: 首页 > news >正文

2、ChatGPT 在数据科学中的应用

ChatGPT 在数据科学中的应用

ChatGPT 可以成为数据科学家的绝佳工具。以下是我所了解到的关于它擅长的地方和不那么擅长的地方。


在这里插入图片描述

我从使用 ChatGPT 中学到了一个教训。它在数据科学中非常有帮助,但你必须仔细检查它输出的所有内容。它非常适合某些任务,并且可以非常快速准确地完成它们。对于其他一些任务,它已经足够好了,您必须多次提示它。我发现 ChatGPT 在一项任务上非常糟糕。

擅长:自动执行数据探索

您可以将您的数据集附加到 ChatGPT 消息中,通过给出一些简单的说明,ChatGPT 可以为您探索数据。

例如,我可以从这个数据项目中获取一个数据集。我给出的指示是:

“使用附加的数据进行描述性统计分析。包括以下内容:

  • 汇总基本统计数据(平均值、中位数、标准差等)。
  • 识别缺失值并提出处理它们的策略。

它返回如下所示的摘要。它对每个变量执行相同的计算。

年龄:

  • 平均值: 28.79 years
  • 标准差: 6.94 年
  • 范围:18至50年

它还未识别数据集中的缺失值。

如果还需要用于这些计算的 Python 代码,则可以提示它编写它们。

若要加载数据集,请使用此代码。

aerofit_data = pd.read_csv(file_path)

对于基本统计数据,它给出了这个。

basic_stats = aerofit_data.describe()

您可以使用此代码检查缺失值。

missing_values = aerofit_data.isnull().sum()

很棒:创建可视化效果

此外,我可以要求 ChatGPT 可视化关键变量的分布,并检测潜在的异常值和异常情况。

它为关键变量创建直方图和箱形图:年龄、收入和里程。它检测到收入和里程分布中可能存在的异常值。
在这里插入图片描述

http://www.lryc.cn/news/294739.html

相关文章:

  • 从小白到入门webrtc音视频通话
  • Qt之漂亮的地球
  • FPGA解码MIPI视频:Xilinx Artix7-35T低端FPGA,基于MIPI CSI-2 RX Subsystem架构实现,提供工程源码和技术支持
  • 使用docker部署Kafka(MAC Apple M2 Pro)
  • 车位检测,YOLOV8,OPENCV调用
  • FCIS 2023:洞悉网络安全新态势,引领创新防护未来
  • 前端工程化之:webpack2-1(常用扩展)
  • Python学习路线 - Python高阶技巧 - PySpark案例实战
  • 【TCP】高频面试题
  • Python||五城P.M.2.5数据分析与可视化_使用华夫图分析各个城市的情况(中)
  • 使用PDFBox实现pdf转其他图片格式
  • 【技术预研】StarRocks官方文档浅析(4)
  • 时序数据库 Tdengine 执行命令能够查看执行的sql语句
  • LeetCode、746. 使用最小花费爬楼梯【简单,动态规划 线性DP】
  • [香橙派开发系列]使用蓝牙和手机进行信息的交换
  • Jmeter 01 -概述线程组
  • 大数据Zookeeper--案例
  • VS编译器对scanf函数不安全报错的解决办法(详细步骤)
  • vscode连接ssh报错
  • C++ 哈希+unordered_map+unordered_set+位图+布隆过滤器(深度剖析)
  • 深入理解Netty及核心组件使用—下
  • vscode 突然连接不上服务器了(2024年版本 自动更新从1.85-1.86)
  • element-ui link 组件源码分享
  • 序列化和反序列化、pytest-DDT数据驱动
  • Spring Boot整合MyBatis Plus实现基本CRUD与高级功能
  • CSS 闪电按钮效果
  • 【Go-Zero】Error: only one service expected goctl一键转换生成rpc服务错误解决方案
  • 从头开始构建和训练 Transformer(上)
  • JVM-JVM内存结构(一)
  • React Emotion 如何优雅的使用样式(一)