早在 2012 年,全球知名的咨询公司麦肯锡就宣布了“大数据时代”的来临:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”在这个大数据时代,数据的有效利用显得至关重要。

很多有价值的数据都被存储在各类数据库中。而要高效地利用这些数据,最有效的方法是掌握数据库查询语言,也就是 SQL。

对许多程序员而言,SQL 语言也许是编程语言中最简单的一种。然而,对于那些需要分析数据但未必具备编程背景的人群来说,比如市场营销人员和运营人员,并非每个人都有足够的兴趣或时间去学习 SQL 以满足日常工作中数据查询、分析及可视化的需要。

不过,好在近几年生成式人工智能技术的兴起,特别是 text-to-SQL 工具的出现,大大降低了数据分析的技术门槛。比方说国内比较出名的 Chat2DB,主打的就是让非技术背景的人员也可以通过简单的自然语言输入来生成复杂的 SQL 查询语句,对于市场运营人员,还可以直接生成可视化数据报表,让每一个人都能轻松掌握数据。

关于 Chat2DB

首先给大家介绍一下 Chat2DB 这个工具,我刚开始了解到这个工具的时候是在去年,最早是由阿里开源的,当时各大公众号和博主都在推荐。主要功能是将自然语言转换为 SQL,也可以转化为 BI 报表,无论是对开发人员,还是运营人员,都很友好。

接下来,我会介绍怎么用 Chat2DB Pro,让你不用写 SQL 也能做专业的数据分析。

第一步:连接数据库

首先,我们需要前往官网下载并安装 Chat2DB 软件。安装完成后,打开应用程序并选择左上角“+”添加数据库连接。在这里,我们根据所使用的数据库类型(如 MySQL、PostgreSQL 等)输入相应的连接信息,包括主机名、端口号、数据库名称、用户名和密码。完成设置后,点击“test”测试连接,测试成功后,保存连接设置。这样就完成了准备工作。

第二步:创建 AI 数据集

成功连接到数据库后,下一步需要为我们的数据库创建一个 AI 数据集。通过将数据库中具有复杂关系的表同步到 AI 数据集中,AI 能够自动学习这些数据结构中的复杂关系,从而帮助我们提升 text-to-SQL 查询的准确性。

如下图所示,这里我选择的是一个 ERP 的数据库作为示例。为该数据库创建一个名为 “ERP” 的AI 数据集,右上角选择 ERP 数据库,选中所有表,将它们同步到 AI 数据集中。

第三步:自然语言生成可视化图表

进入 Dashboard 界面,以 Product(产品)为名创建一个数据看板。

在创建后的看板中,点击 “AI Chart” 选项。在出现的输入框中,你可以用自然语言输入你的图表需求。例如,你可以输入:

“用条形图显示不同产品的销售额”

“用折线图显示每天收入的变化”

“用饼图显示不同产品类别占总销售额的百分比”

“用面积图显示库存随时间的变化情况”

在输入完上述指令后,转到右侧的选项栏,选择之前建立的 ERP 数据集作为 AI 数据集。完成这些步骤后,点击“发送”或“生成”按钮,系统将会根据你的指令自动生成相应的图表。

这样,你就可以直观地查看和分析所需的数据视图了。

如果开发人员对数据进行了一些更新,图表中的数据也将自动同步这些更改。整个界面的布局还可以通过简单的拖拽操作来进行调整,图表也支持导出为图片格式,便于分享和报告使用。

Chat2DB 提供了多种可视化图表类型,能够满足不同场景下的数据分析需求。

第四步:AI 对话数据分析

如果你不需要创建一个完整的数据看板,只是想快速生成一些特定的数据报表,那么也可以使用 AI 对话功能。

进入 AI Chat 的界面,并点击 “Create New Chat” 来启动一个新的对话会话。

在输入框的左侧,有一系列可供选择的功能选项,包括 Text to SQL、SQL 语句解释、SQL 优化等工具。

举个栗子,如果你想要了解目前有哪些因为销量不佳而处于滞销状态的产品,就可以这样问 AI :

“用表格展示库存周转率(库存量/销量)>6的滞销产品。” 

发送之后,AI 就会自动从你的 ERP 数据集中提取相关的信息,并以表格的形式清晰地展示出目前处于滞销的产品列表,这样就可以快速 get 到库存积压问题。

生成的图表也可以选择添加至之前创建的看表当中。

小结

在本文中,我通过一个极简的数据库样例,利用 Chat2DB 工具,在不写任何一句 SQL 代码的情况下,用了不到五分钟就生成了可视化数据看板。

现实的数据分析工作肯定比这个更复杂,例如在需要生成包含复杂数值计算的报表时,目前 AI 的生成准确性还有待提高。希望以后 Chat2DB 能够引入用户自定义 Prompt 的功能,让报表更加实用。