如何使用ChatGPT生成图表和表格

使用ChatGPT制作图表和表格的方法

charts-gettyimages-175600876

知道什么让我兴奋吗?图表和图形。

给我一个酷炫的图表,我就会非常开心。我喜欢在选举之夜观看新闻,不是因为选票的数目,而是因为所有精彩的图表。整晚我会在不同频道间换来换去,看每个电视网络用什么方式展示数字数据。

这是不是很奇怪?我不认为这有什么奇怪的。

另外:我意识到ChatGPT Plus是我业务的改变者的那一刻

事实证明,ChatGPT在制作图表和表格方面做得很好。考虑到这个普遍存在的生成式人工智能聊天机器人可以将大量信息综合为值得制作图表的东西,虽然ChatGPT在漂亮的表现方面稍有不足,但在信息价值方面完全弥补了这一点。

ChatGPT有哪些制作图表的工具可用?你有三种选择:

  1. 在ChatGPT的免费版本中,你可以制作表格(但不能制作图表)
  2. 在ChatGPT Plus中,你可以使用先进的数据分析(之前称为“代码解释器”)插件制作图表和表格
  3. 在ChatGPT Plus中,你可以使用随机的图表插件制作表格和图表

本文将讨论前两种选项,跳过第三种。尽管有各种用于ChatGPT Plus的图表插件,但它们都会将你带出ChatGPT界面并使用外部服务。它们都试图通过附加费来让你使用他们基于SaaS的图表服务。实质上,它们在ChatGPT商店中列为广告,而不是现成的功能工具。此外,它们往往非常不可靠。

注意:ChatGPT之前称为“代码解释器”,现在称为“先进数据分析”。

先进数据分析生成的图表相对丑陋。但效果很好。首先,让我们讨论ChatGPT获取数据的方法,然后制作一些表格。

如何使用ChatGPT制作图表和表格

第一步:了解ChatGPT的不同版本

前面,我们谈到了不同ChatGPT版本提供哪些图表工具。但这并不是只有图表工具的事情。如果你想有效地使用ChatGPT,你需要了解各种版本能做什么。

ChatGPT免费版本:这个版本使用GPT-3.5大型语言模型(LLM),其功能没有GPT-4版本强大。从数据的角度来看,它对全球知识的了解停留在2021年9月。你可以将大约1500个字的数据粘贴到聊天对话中,并且它能够处理。

ChatGPT Plus:ChatGPT Plus是OpenAI的商业版本,功能完全。由于其受欢迎度,他们不得不启动一个新订阅的等待名单。它也是一个非常非常快速变化的目标。所以当我在ChatGPT Plus中描述要选择哪些功能时,请记住这些东西每周甚至每天都在变化。现在,ChatGPT Plus每个会话提供三个主要选择:GPT-3.5、GPT-4和插件。

现在,GPT-4版本已经包括DALL-E 3、Bing Web访问和高级数据分析。一些用户报告了使用Bing进行网络访问时遇到一些困难。我们将主要使用高级数据分析组件进行工作。即使没有Bing的网络访问,GPT-4报告称其训练数据现在包含截至2023年4月的信息。这是一个很大的变化,因为仅仅两个月前,GPT-4的训练数据库在2021年9月结束。

另外:GPT-3.5 vs GPT-4:ChatGPT Plus订阅费值得吗?

在本文的大部分内容中,我们将使用GPT-4选项的高级数据分析组件。该工具可以导入各种文件格式的数据表。尽管它没有为导入的数据指定大小限制,但它可以处理相当大的文件,但如果文件超出某个未定义的复杂性水平,它将会故障。

随着ChatGPT Plus的变化,我们会提供更多信息更新给您。现在,让我们来看一些酷炫的图表。

带有WebPilot插件的ChatGPT Plus:该版本还使用了GPT-4 LLM。基本上,您可以运行高级数据分析或插件。如果您选择运行插件,WebPilot插件在进行网络搜索时相当可靠(尽管在大请求上可能会出错)。这意味着ChatGPT的世界知识不需要终止于2021年,而可以通常延伸到当前日期。

ChatGPT Enterprise:新宣布的企业版本中,也可以使用高级数据分析和插件。您可以将文件上传到Enterprise,并且它们将保持机密。Enterprise还应该允许更大的文件和更大的响应。定价尚未指定。

步骤2:创建基本表格

让我们从一个示例开始。在下面的演示中,我们将使用人口排名前五的城市。

列出世界上排名前五的城市(包括国家)。

我向ChatGPT的免费版本提出了这个问题,以下是我得到的答案:

将这些数据转化为表格很简单。只需告诉ChatGPT你想要一个表格:

制作一个包含世界上排名前五的城市的表格(包括国家)。

步骤3:操纵表格

您可以通过给ChatGPT提供更详细的指令来操纵和自定义表格。同样,使用免费版本,我们将添加一个人口数量字段。当然,这些数据是过时的,但它仍然被呈现:

制作一个包含世界上排名前五的城市的表格(包括国家和人口字段)。

您还可以为表格指定某些详细信息,例如字段顺序和单位。在这里,我将国家移动到了第一位,并对人口数字进行了压缩。

制作一个包含世界上排名前五的城市的表格(包括国家和人口字段)。按照排名、国家、城市、人口的顺序显示字段。以百万为单位显示人口(保留一位小数点),因此37,833,000将显示为37.8M。

请注意,我给AI提供了一个数字如何显示的示例。

免费版本只能带我们走这么远。从现在开始,我们将切换到$20/月 ChatGPT Plus版本

步骤4:创建条形图

启用高级数据分析的ChatGPT Plus可以制作线图、条形图、直方图、饼图、散点图、热图、盒形图、面积图、气泡图、甘特图、帕累托图、网络图、桑基图、区域地图、雷达图、词云、树形图和3D图表。

在这个例子中,我们只是做一个简单的条形图。

制作一个按人口排名世界前五大城市的条形图

聊天的小工具,是不是很活泼?

你们中的鹰眼可能已经注意到了之前显示的表格人口数据与这里的结果之间的差异。请注意,表格有一个绿色图标,而这个图表有一个紫色图标。我们已经从 GPT-3.5(ChatGPT 的免费版本)跳到了 GPT-4(ChatGPT Plus)。有趣的是,不同的 LLMs 有稍微不同的数据。这种差异是为什么在使用 AI 时要谨慎的一部分,所以要仔细检查你的工作。在我们的案例中,我们只是在演示图表,但这是一个具体的例子,说明了自信呈现的数据可能是错误或不一致的。

步骤 5:上传数据

高级数据分析的超能力之一是能够上传数据集。在我们的示例中,我从 Data.gov 下载了“热门婴儿名字数据集”。这是一个包括 2011-2014 年纽约市婴儿名字的逗号分隔文件。尽管这个数据集已经过时了十年,但玩一下还是很有趣的。

我为本文选择的数据集可以很容易地从政府网站获得,所以你可以自己复制这个实验。在 Data.gov 上有大量优秀的数据集可用,但我发现很多数据集对 ChatGPT 来说太大了。

另外:如何使用 ChatGPT 创建应用程序

当我下载这个数据集时,我意识到它还包含关于种族的信息,所以我们可以从同一个数据集运行多种不同的图表。

点击小的上传按钮,然后告诉它你想导入的数据文件。

我让它显示文件的前五行,以便更了解文件的格式。

步骤 6:创建一个饼图(并改变颜色)

我对数据集中性别名称的分布很好奇。这是我的第一个提示:

创建一个饼图,显示性别在整个数据集中的百分比

这是结果:

不幸的是,深绿色使数字难以阅读。幸运的是,你可以指示高级数据分析使用不同的颜色。我小心地选择了不强化性别刻板印象的颜色。

创建一个饼图,显示性别在整个数据集中的百分比。使用浅绿色表示男性,使用中黄色表示女性。

步骤 7:对数据进行归一化以提高准确性

正如我们之前看到的,收集的数据包括种族信息。这是如何查看纽约在 2010 年代初期记录的各种种族分布的:

使用饼图显示数据集中各个种族的分布。使用浅颜色。

这是结果。注意到了什么吗?

显然,纽约没有正确归一化其数据。它将 “WHITE NON HISPANIC” 和 “WHITE NON HISP” 组合在一起,”BLACK NON HISPANIC” 和 “BLACK NON HISP” 组合在一起,”ASIAN AND PACIFIC ISLANDER” 和 “ASIAN AND PACI” 组合在一起。这导致数据的不准确呈现。

ChatGPT 的一个好处是它在整个会话中记住指令。所以我能够给它这个指令:

对于以下所有请求,请将 “WHITE NON HISPANIC” 和 “WHITE NON HISP” 组合在一起。将 “BLACK NON HISPANIC” 和 “BLACK NON HISP” 组合在一起。将 “ASIAN AND PACIFIC ISLANDER” 和 “ASIAN AND PACI” 组合在一起。在显示种族时使用较长的两个种族名称。

它回答道:

再试试这个图表,使用同样的提示。

使用饼状图展示数据集中不同种族的分布情况。只使用浅色。

好了:

查看结果时需要细心。例如,在请求前五个最受欢迎的婴儿名字时,人工智能将”MADISON”和”Madison”分为了两个不同的名字:

对于下面的所有请求,婴儿名字都应该不区分大小写。

第8步:导出你的图形

让我们以一个复杂的图表来结束。这是我们的提示:

对于每个种族,呈现两个饼状图,一个为每个性别。每个饼状图应列出该种族该性别的前五个婴儿名字。只使用浅色。

结果显示,生成的图表中的文本太小了,无法读取。所以,为了得到更有用的图表结果,我们可以将其导出。我会指定文件格式和宽度:

将这个图表导出为一个宽度为3000像素的JPG文件。

这是结果:

注意,Sofia和Sophia非常受欢迎,但被认作是两个不同的名字。但这也是图表如此迷人的地方。

常见问题解答

使用高级数据分析功能需要多少费用?

高级数据分析功能是ChatGPT Plus的测试功能,你需要在设置面板中启用它。ChatGPT Plus的费用是每月20美元。高级数据分析功能也包含在企业版中,但该版本的定价尚未公布。

上传到ChatGPT用于图表创建的数据是私密的还是存在数据曝露的风险?

请始终意识到隐私风险的存在。

我向ChatGPT提出了这个问题,这是它告诉我的:数据隐私是ChatGPT的首要任务。上传的数据仅用于用户当前会话的目的,并不会长期存储或用于其他任何目的。然而,对于高度敏感的数据,用户应始终谨慎,并考虑使用ChatGPT的企业版,该版本提供增强的数据保密性。

另外:生成式AI给大家带来了新的风险。以下是如何保持安全的方法

我的建议是:不要相信ChatGPT或任何生成式AI工具。企业版被认为具有更多的隐私控制功能,但我建议您只上传您不介意公开的数据。

ChatGPT的高级数据分析功能能处理实时数据,还是更适用于静态数据集?

理论上是可行的,但实际上存在一些限制。首先,Plus账户会限制您在特定时间段内的请求次数。其次,您需要逐个上传每个文件。有可能使用许可的ChatGPT API来进行实时分析。但对于聊天机器人本身来说,您需要在静态数据上进行数据解析。


你可以在社交媒体上关注我的日常项目更新情况。一定要订阅我的每周更新通讯on Substack,并在Twitter上关注我:@DavidGewirtz,在Facebook上:Facebook.com/DavidGewirtz,在Instagram上:Instagram.com/DavidGewirtz,以及在YouTube上:YouTube.com/DavidGewirtzTV