使用C# 高效实现 Word 文档内容查找与替换的6种方法

发布于:2025-08-17 ⋅ 阅读:(19) ⋅ 点赞:(0)

目录

环境准备

方法一:查找文本并替换为新文本

方法二:使用正则表达式查找并替换文本

方法三:将文本替换为图片

方法四:将文本替换为表格

方法五:将文本替换为另一个 Word 文档内容

方法六:替换表格中的文本

总结


在日常文档处理工作中,尤其是面对大型 Word 文档时,手动查找、替换文本往往既耗时又容易出错。无论是批量更新重复出现的术语、修正格式不统一的问题,还是替换占位符文本,手动操作都非常低效。通过 C# 自动化实现查找与替换,不仅能显著节省时间,还能提高准确性,使文档维护更加高效和规范。

本文将系统介绍 6 种实用方法,展示如何在 C# 中实现 Word 文档内容的查找与替换,内容涵盖从最基本的文本替换,到用图片、表格,甚至替换为其他 Word 文档内容的复杂操作。

本文涵盖的主题

  • 查找文本并替换为新文本
  • 使用正则表达式(Regex)查找并替换文本
  • 将文本替换为图片
  • 将文本替换为表格
  • 将文本替换为另一个 Word 文档中的内容
  • 替换表格中的文本

环境准备

在 Word 文档中实现查找和替换自动化,必须使用能够直接读取和操作 Word 文件的库。
虽然 Microsoft 提供的 Word Interop 可以实现这些功能,但它依赖本地已安装的 Word 程序,并通过启动 Word 应用执行操作,这在服务器端场景中往往不适用。

相比之下,Free Spire.Doc for .NET 更加灵活,能够直接处理 DOC、DOCX、DOT、DOTX 文件,无需启动 Word。

安装方法

打开NuGet Package Manager Console中执行以下命令,即可安装Free Spire.Doc for .NET:

Install-Package FreeSpire.Doc

方法一:查找文本并替换为新文本

在 Word 编辑中,最常见的任务就是将指定文本替换为其他文本,例如统一文档中重复出现的术语、修正文档错误或更新模板内容。

使用 Document.Replace() 方法,可以在整个文档范围内高效查找指定文本,并用新的文本替换,同时保留原有格式和排版。

关键参数说明

  • matchString:要查找的目标文本
  • newValue:替换后的文本
  • caseSensitive:是否区分大小写
  • wholeWord:是否仅替换完整单词

适用场景

  • 批量更新文档模板
  • 统一术语或重复词语
  • 批量修正文档中错误的用词

示例代码:

using Spire.Doc;

namespace ReplaceTextWithNewText
{
    internal class Program
    {
        static void Main(string[] args)
        {
            Document document = new Document();
            document.LoadFromFile("模板1.docx");

            // 将文档中所有“汽车”替换为“轿车”
            document.Replace("汽车", "轿车", false, false);

            document.SaveToFile("替换文字.docx", FileFormat.Docx);
            document.Close();
        }
    }
}

方法二:使用正则表达式查找并替换文本

有时需要根据文本模式进行更灵活的查找与替换,例如替换文档中所有占位符 {...}。此时可以使用 正则表达式(Regex 来匹配模式,并进行批量替换。

优势

  • 支持复杂文本模式匹配
  • 可以替换动态占位符
  • 提高批量替换的灵活性

示例代码:

using Spire.Doc;
using System.Text.RegularExpressions;

namespace ReplaceTextUsingRegex
{
    internal class Program
    {
        static void Main(string[] args)
        {
            Document document = new Document();
            document.LoadFromFile("模板2.docx");

            // 匹配花括号占位符
            Regex regex = new Regex(@"\{.*?\}");

            // 将匹配到的占位符替换为“肖恩”
            document.Replace(regex, "肖恩");

            document.SaveToFile("使用正则表达式替换文本.docx", FileFormat.Docx);
            document.Close();
        }
    }
}

方法三:将文本替换为图片

在某些文档中,文本占位符可能用于标记需要插入的图片(如 Logo、图标、示意图)。可以通过查找文本占位符并替换为图片,实现自动化插图操作。

实现思路

  1. 使用正则表达式找到占位符
  2. 加载对应的图片文件
  3. 将图片插入到占位符位置
  4. 删除原占位符文本

示例代码:

using Spire.Doc;
using Spire.Doc.Documents;
using Spire.Doc.Fields;
using System.Text.RegularExpressions;

namespace ReplaceTextWithImage
{
    internal class Program
    {
        static void Main(string[] args)
        {
            Document document = new Document();
            document.LoadFromFile("模板3.docx");

            // 查找以“//”开头的文本占位符
            TextSelection[] selections = document.FindAllPattern(new Regex(@"\/\/.*"));

            foreach (TextSelection selection in selections)
            {
                // 根据占位符文本加载对应图片 (该示例中图片的名称与文档中占位符文字一致)
                DocPicture pic = new DocPicture(document);
                pic.LoadImage("自行车\\" + selection.SelectedText + ".png");

                TextRange textRange = selection.GetAsOneRange();
                int index = textRange.OwnerParagraph.ChildObjects.IndexOf(textRange);

                // 在占位符位置插入图片并删除原文本
                textRange.OwnerParagraph.ChildObjects.Insert(index, pic);
                textRange.OwnerParagraph.ChildObjects.Remove(textRange);
            }

            document.SaveToFile("使用图片替换文字.docx", FileFormat.Docx2016);
            document.Close();
        }
    }
}

方法四:将文本替换为表格

在某些文档中,需要用结构化表格替换文本占位符,以便清晰展示数据。通过 C# 可以自动完成这一操作,包括创建表格、设置行列、填充内容,并替换原文本。

适用场景

  • 自动生成报表
  • 动态填充模板数据
  • 替换表格占位符

示例代码:

using Spire.Doc;
using Spire.Doc.Documents;
using Spire.Doc.Fields;

namespace ReplaceTextWithTable
{
    internal class Program
    {
        static void Main(string[] args)
        {
            Document document = new Document();
            document.LoadFromFile("模板4.docx");

            Section section = document.Sections[0];
            TextSelection range = document.FindString("雇员表", false, false);
            Paragraph paragraph = range.GetAsOneRange().OwnerParagraph;

            Table table = section.AddTable(true);
            table.ResetCells(3, 3);

            table.Rows[0].Cells[0].AddParagraph().AppendText("姓名");
            table.Rows[0].Cells[1].AddParagraph().AppendText("年龄");
            table.Rows[0].Cells[2].AddParagraph().AppendText("职业");
            table.Rows[1].Cells[0].AddParagraph().AppendText("肖恩");
            table.Rows[1].Cells[1].AddParagraph().AppendText("35");
            table.Rows[1].Cells[2].AddParagraph().AppendText("工程师");
            table.Rows[2].Cells[0].AddParagraph().AppendText("沙拉");
            table.Rows[2].Cells[1].AddParagraph().AppendText("28");
            table.Rows[2].Cells[2].AddParagraph().AppendText("老师");

            int index = paragraph.OwnerTextBody.ChildObjects.IndexOf(paragraph);
            paragraph.OwnerTextBody.ChildObjects.Insert(index, table);
            paragraph.OwnerTextBody.ChildObjects.Remove(paragraph);

            document.SaveToFile("使用表格替换文字.docx", FileFormat.Docx);
            document.Close();
        }
    }
}

方法五:将文本替换为另一个 Word 文档内容

在合并文档或动态引用已有内容时,可以将目标文本替换为另一个 Word 文档中的完整内容。

适用场景

  • 动态导入内容
  • 合并报告或模板
  • 自动生成文档章节

示例代码:

using Spire.Doc;

namespace ReplaceTextWithDocument
{
    internal class Program
    {
        static void Main(string[] args)
        {
            Document document = new Document();
            document.LoadFromFile("模板5.docx");

            Document loadedDocument = new Document("InputDocument.docx");

            // 将“Introduction”替换为另一文档的内容
            document.Replace("介绍", loadedDocument, false, false);

            document.SaveToFile("导入文档内容.docx", FileFormat.Docx);
            document.Close();
        }
    }
}

方法六:替换表格中的文本

在处理表格数据时,可能需要替换表格特定单元格的文本,例如报表或结构化数据。通过使用Table.Replace()方法并结合字典,可以批量替换内容。

示例代码:

using Spire.Doc;
using System.Collections.Generic;

namespace ReplaceTextInTable
{
    internal class Program
    {
        static void Main(string[] args)
        {
            Document document = new Document();
            document.LoadFromFile("模板6.docx");

            Section section = document.Sections[0];
            Table table = section.Tables[0] as Table;

            var values = new Dictionary<string, string>
            {
                { "#姓名", "张三" },
                { "#年龄", "28" },
                { "#性别", "男" },
                { "#电话", "01234567" },
                { "#地址", "北京梧桐巷" },
                { "#邮箱", "zhangsan@email.com" }
            };

            foreach (var entry in values)
            {
                table.Replace(entry.Key, entry.Value, false, true);
            }

            document.SaveToFile("替换表格内容.docx", FileFormat.Docx);
            document.Close();
        }
    }
}

总结

使用 C# 对 Word 文档内容进行查找与替换,不仅可以处理简单的文本修改,还能应对图片、表格或其他文档内容的替换需求。通过本文介绍的方法,你可以针对不同场景选择合适的方案,实现文档内容的快速更新和批量处理,同时保证格式和结构的一致性。掌握这些技巧后,无论是模板维护、报表生成还是内容合并,都可以更加高效、可靠。


网站公告

今日签到

点亮在社区的每一天
去签到