删除 38 个重复行。修剪 1247 个单元格。标准化 89 个日期。准确告诉你改了什么。
免费在线 Excel 和 CSV 数据清洗工具 — 去重、修剪空白、标准化日期和数字、修复不可见字符、删除空行。每次清洗都附带按动作分类的透明度报告以及可选的并列差异工作簿。无需注册。每个文件最多 50 MB。
基于与财富 100 强金融机构关键业务工作流相同级别的企业级文档处理技术构建 — 免费,输出质量绝不妥协。
- 🔒 256 位 HTTPS
- ⏱ 1 小时后自动删除
- ✅ 符合 GDPR
- 👁 无人工审阅
- 🤖 不用您的数据训练 AI
- 📊 每步操作透明报告
将 Excel 或 CSV 文件拖到此处,或点击选择
最大 50 MB · xlsx, xlsm, xls, xlsb, ods, csv, tsv
为什么「清洗」通常意味着「黑盒」
大多数免费 Excel 数据清洗工具给你一个下载按钮就算完事。你看不到删除了什么、重写了什么,也看不到工具是否悄悄合并了两个本不该合并的客户。ExcelMaster 的数据清洗器基于企业级文档处理构建 — 每次清洗都附带按动作分类的透明度报告和可选的并列差异工作簿。在确认之前,你将准确看到我们会删除多少重复、修剪多少单元格、重写哪些日期。
清洗哪些内容
精确去重 + 可选的 AI 模糊去重
删除整行重复,或将范围限定到特定列(「不论时间戳为何,都视为同一客户」)。还可选择让 Claude 捕捉精确匹配遗漏的近似重复 —「John Smith」与「Smith, John」、「Acme Inc」与「Acme Incorporated」。
空白与不可见字符
修剪首尾空格,折叠内部连续空白,剥离从网页或 PDF 复制粘贴时混入的 NBSP / 零宽空格 / BOM / 控制字符。
日期标准化
识别 MM/DD/YYYY、DD-MM-YYYY、ISO、「May 7 2026」、「2026年5月7日」、「2026년 5월 7일」并将它们全部重写为统一的目标格式。默认 ISO — 作为文本可正确排序,在任何地方都可被机器读取。
数字标准化
剥离货币符号($ € ¥ £ ₹ R$ kr…)和千位分隔符(en「1,234.56」/ de「1.234,56」/ fr「1 234,56」)。输出是真正的 Excel 数字,可用于 SUM、AVERAGE 和绘制图表。
大小写转换
对整张工作表或限定到特定列应用全大写、全小写、首字母大写或句首大写(「仅将客户名称列设为首字母大写」)。
空行与空列删除
删除修剪后所有单元格均为空的行。还可选择一并删除空列。表头行始终保留。
如何在线清洗 Excel 数据
- 1上传你的 Excel 或 CSV 文件 — 拖放即可,最大 50 MB,无需注册。
- 2点击「预览影响」 — 在你确认之前,我们会估算将触及多少行、单元格和日期。业界首创的透明度。
- 3选择清洗动作 — 去重、修剪、标准化日期、标准化数字、更改大小写、删除空行。所有开关默认采用保守设置。
- 4点击「立即清洗」 — 1 万行通常在 3 秒内完成。下载已清洗文件以及可选的并列差异工作簿,以便核对每一处变更。
ExcelMaster 为何超越同类
按每个动作分类的透明度报告
行业标准是「你的文件已清洗」式的黑盒成功卡片。我们会准确告诉你:删除 38 个重复行(其中 3 个由模糊 AI 完成)、修剪 1247 个单元格、标准化 89 个日期、剥离 23 个不可见字符。达到审计级。
并列差异工作簿
可选的第二个 .xlsx:原始行与清洗后行对照,变更单元格以黄色高亮,并附带一张「清洗摘要」工作表。在接受之前可核对每一个清洗决定。没有竞品在免费工具中提供此功能。
AI 模糊去重 — 可选启用
捕捉「John Smith」与「Smith, John」、「Acme Inc」与「Acme Incorporated」。通过我们的 LLM Proxy 由 Claude Sonnet 4.6 驱动。保守 — 仅在确信时才合并。出于成本考虑限于 500 行。
11 种语言,145 个日期区域设置
识别中文(2026年5月7日)、日文(令和8年5月7日 / 2026年5月7日)、韩文(2026년 5월 7일)、德文(07.05.2026)、法文(07/05/2026)等。与驱动我们 PDF→Excel 多语言提取的引擎相同。
表头行受保护
我们从不修剪、标准化或更改表头行的大小写。你的列标题原样送达 — 这是几乎每个电子表格工具迟早都会弄错的惯例。
免费 — 输出质量绝不妥协
与每月 49 美元商业工具相同的引擎。我们将其免费提供,不设行数上限、不加水印、无需注册。由我们面向桌面的付费 Excel AI 加载项资助 — 大多数用户从不需要升级。
常见问题
这与 Excel 内置的「删除重复项」有何不同?
Excel 内置的去重只做精确匹配比较,且毫无透明度。我们额外提供模糊 AI 去重(捕捉「John Smith」与「Smith, John」)、按动作分类的透明度报告、并列差异工作簿,以及一次性完成的另外 6 个清洗动作。而且免费 — Excel 的商业级等效品(Power Query)需要 Office 365。
模糊 AI 去重会错误地合并两个不同的实体吗?
我们已将提示词调校得偏保守 —「宁可漏掉一个近似重复,也不要错误地合并两个不同的实体」。我们会要求 AI 跳过它没有把握的合并。这个可选开关默认关闭。即便开启,并列差异工作簿也能让你在接受清洗后文件之前核对每一处合并。如果你发现错误合并,可以在不启用模糊开关的情况下重新运行。
可以识别哪些日期格式?
MM/DD/YYYY、DD/MM/YYYY(使用 - / . 分隔符)、ISO 8601、「May 7 2026」/「7 May 2026」、中文(2026年5月7日)、日文、韩文(2026년 5월 7일)、德文(7. Mai 2026)、法文(7 mai 2026),以及 Excel 原生的序列号格式。我们使用带 8 个区域回退的 .NET DateTime 解析器。任何会产生歧义解析的内容都会保持原样不动。
你们会剥离哪些不可见字符?
NBSP (U+00A0)、零宽空格 (U+200B)、零宽非连接符 (U+200C)、零宽连接符 (U+200D)、BOM (U+FEFF)、单词连接符 (U+2060),以及 U+0000–U+001F 范围内除制表符 (U+0009)、换行符 (U+000A) 和回车符 (U+000D) 之外的所有控制字符。这些正是从 PDF 和网页复制粘贴时悄悄混入的字符。
有行数限制吗?
最多支持 Excel 每张工作表的原生行数上限(1,048,575 个数据行)。当源文件超过 20 万个单元格时,我们会采用流式加载以避免内存压力。出于成本原因,模糊 AI 去重这一遍限于 500 行 — 当你的工作表超过该值时,我们会显示警告,仅跳过 AI 这一遍,同时仍执行精确去重。
我的数据会离开服务器吗?
文件在我们位于欧盟的服务器上处理,并通过 TLS 上传。清洗完全在我们的基础设施内进行。可选的模糊 AI 去重一遍会通过我们的 LLM Proxy 将行签名(你要求我们比较的那些单元格)发送给 Claude — 这是唯一一段向外发送的数据。文件会在 1 小时内从我们的服务器自动删除。我们不会用你的数据训练模型。
它支持 CSV 吗?
支持。CSV 和 TSV 都是一等输入 —「clean my CSV online」的 SEO 流量大多来自杂乱 CSV 的使用场景。输出可以是 CSV、xlsx、xlsm、xls、xlsb 或 ods。CSV 输出会被压平为仅第一张工作表。
我能清洗受密码保护的工作簿吗?
可以。提供打开密码,我们会照常清洗。我们从不暴力破解,从不分享,从不记录密码。(对于已丢失密码的工作簿,请参阅我们的 Excel Unlock 工具。)
「删除空行」和「删除重复项」有什么区别?
删除空行会删除修剪后所有单元格均为空的行。去重会删除每个单元格值都与另一行相同的行。它们是相互独立的开关 — 你可以单独运行任一项,也可以同时运行两项。
我能把去重限定到特定列吗?
可以。默认情况下我们比较整行,但你可以选择特定的列索引 —「仅当这些特定列都匹配时,两行才算重复」。这对「不论第 5 列的时间戳如何,都视为同一客户(第 0、1、2 列)」之类的场景很有用。同样的范围限定也适用于可选的模糊 AI 这一遍。
为什么清洗后的文件比源文件略小 / 略大?
略小通常是因为我们删除了空行 / 重复行或剥离了货币符号。略大可能发生在你开启 AI 模糊去重 + 生成差异工作簿时 — 差异是一个单独的文件。透明度报告中的「源行数」与「输出行数」会准确告诉你删掉了多少行。
你们会保留我的 Excel 格式 / 公式吗?
单元格的值会被清洗;单元格样式和数字格式会被保留。当单元格类型保持不变时(文本 → 文本),公式会被保留。当我们把字符串类型的货币单元格规范化为真正的数字时,依赖单元格上的公式保持完好,现在会读取到一个真正的数字 — 这通常正是你想要的。差异工作簿可让你逐例核对。