在当今数据驱动的学术研究和文献阅读过程中,快速处理和准确分析表格数据是科研工作的核心任务之一。我们很高兴地推出 TableFinder ,这款数据分析工具旨在简化学术研究中的表格处理流程,提高数据分析的准确性和效率。
TableFinder 通过其内置的代码解析器和 Uni-SMART 代码生成能力,基于用户的问题和历史对话生成数据表格操作代码并进行数据分析。以下是 TableFinder 的一些核心功能:TableFinder 能够解析 CSV 文件,识别列名和数据类型,为后续的数据分析打下基础。用户可以通过自然语言向 TableFinder 提问,系统会分析用户意图,生成相应的数据分析程序并执行,获取结果。分析结果包括图表、表格、数值或文本等信息,并且支持图表与表格的下载,方便用户进一步处理和分享。
TableFinder 作为一款表格数据分析助手,旨在为用户提供全面的数据分析解决方案,能够有效提升用户的数据处理和分析效率。以下是 TableFinder 在表格分析场景下具备的全流程能力:
1. 数据导入
a. TableFinder 提供了便捷的 CSV 文件导入功能,确保数据的完整性和准确性。上传的文件将被持久化存储在 Finder 知识库中,便于后续的查询、分析和问答操作。
a. 数据清洗, TableFinder 能够自动识别数据类型,并基于不同数据类型处理缺失值、重复值和异常值。b.数据转换, TableFinder 能够准确定位数据类型,并且根据用户需求配置映射表,进行数据格式的映射转换。指令:删除表格中有缺失数据的行,并将 Embarked 的数据标签转换为数字。
a. 数据排序与分组,用户借助 TableFinder 可以通过自然语言执行数据排序、分组等基础数据表格操作。
b. 数据筛选, TableFinder 能够理解用户意图,支持基本的查询操作,如条件过滤、选择特定列等。设置特定规则过滤表格信息,并将过滤后的信息返回给用户。
指令:给出名字中包括 Thomas 或者 Kelly 的所有数据,按照 PaasengerId 倒序返回。
4. 数据统计分析
a. 数据统计分析, TableFinder 能够准确定位用户期望的统计信息,并结合用户指向列进行精确计算。
指令:统计表格中数值型数据的常见特征,从集中趋势、变异程度、位置指标以及形状特征四个方面分析,提供表格给我。
a. TableFinder 能够准确理解用户意图,并基于正确的数据绘制用户要求的图形,生成常见的图表类型,如柱状图、折线图、饼图、散点图等。
指令:请给出表格中连续型数据的分布密度曲线,放在一个图上。
b. 用户可以用自然语言描述自己需要的配色信息, TableFinder 能够基于用户意图选择合适的绘图配色。
指令:绘制表格中年龄分布统计图,用饼图的形式,配色清爽一些。
TableFinder 的推出为文献阅读中的表格分析提供了一个高效、准确的解决方案。凭借其核心功能和智能化的操作体验, TableFinder 将成为学术研究中的得力助手,助力科研人员更好地进行数据分析和知识发现。
深势科技是“AI for Science”科学研究范式的引领者和践行者。AI for Science 即运用 AI 学习一系列的科学原理和科学知识,并进一步解决科学研究和工业研发领域的关键问题。深势科技依托在交叉学科领域的深耕,构建了“深势 · 宇知®”AI for Science 大模型体系,将众多学科的科研方法从“实验试错 / 计算机”时代带入了“预训练模型时代”,并以“微尺度工业设计与仿真”为切入点,打造了 Bohrium®玻尔®科研空间站、Hermite® 药物计算设计平台、RiDYMO® 难成药靶标研发平台及 Piloteye® 电池设计自动化平台等科研和工业研发基础设施,形成了 AI for Science 的“创新 - 落地”链路和开放生态,赋能“千行百业”,为人类经济发展最基础的生物医药、能源、材料和信息科学与工程研究打造新一代工业设计与仿真系统。深势科技是国家高新技术企业、国家专精特新“小巨人”企业,在北京、上海、深圳等城市布局研发中心。科研技术团队由中国科学院院士领衔,汇集了超百位数学、 物理、化学、生物、材料、计算机等多个领域的优秀青年科学家和工程师,其中博士及博士后在公司成员中占比超过 35%。核心成员获得过2020年全球高性能计算领域的最高奖项“戈登贝尔奖”,相关工作入选2020年中国十大科技进展和全球 AI 领域十大技术突破。