(Last Updated On: 2023-07-15)

如下面的屏幕截图所示,如果工作表单元格中存在许多html标记,那么如何在Excel中将它们转换为纯文本? 本文将向您展示两种从Excel单元格中删除所有html标记的方法。

使用查找和替换功能将html转换为选定单元格中的文本
使用VBA将HTML转换为整个工作表中的文本


 使用查找和替换功能将HTML转换为单元格中的文本

您可以将所有html转换为单元格中的文本 查找和替换 Excel中的功能。 请执行以下操作。

1.选择将所有html转换为文本的单元格,然后按 按Ctrl + F 键打开 查找和替换 对话框。

2.在 查找和替换 对话框,转到 更换 标签,输入 <*> 到 查找内容 盒子,保持 更换 框为空,然后单击 “全部替换” 按钮。 看截图:

3.然后 微软的Excel 弹出对话框,告诉您已替换了多少个html标签,请单击 OK 按钮并关闭 查找和替换 对话框。

然后,您可以看到所有html标记已从选定的单元格中删除,如下图所示。


 使用VBA将HTML转换为整个工作表中的文本

此外,您可以使用以下VBA代码同时将所有html转换为整个工作表中的文本。

1.打开包含要转换为文本的html的工作表,然后按 其他 + F11 键打开 Microsoft Visual Basic应用程序 窗口。

2.在 Microsoft Visual Basic应用程序 窗口中,单击 插页 > 模块,然后将以下VBA代码复制到“模块”窗口中。

VBA代码:将html转换为整个工作表中的文本

Sub RemoveHTMLTags()
'Update by Extendoffice 20180703
    Dim xRg As Range
    Dim xCell As Range
    Dim xStr As String
    Dim xRegEx As RegExp
    Dim xMatch As Match
    Dim xMatches As MatchCollection
    Set xRegEx = New RegExp
    Application.EnableEvents = False
    Set xRg = Cells.SpecialCells(xlCellTypeConstants)
    With xRegEx
        .Global = True
        .Pattern = "<(""[^""]*""|'[^']*'|[^'"">])*>"
    End With
    For Each xCell In xRg
        xStr = xCell.Value
            Set xMatches = xRegEx.Execute(xCell.Text)
            For Each xMatch In xMatches
                xStr = Replace(xStr, xMatch.Value, "")
            Next
        xCell.Value = xStr
    Next
   Application.EnableEvents = True
End Sub

Copy

3.仍在 Microsoft Visual Basic应用程序 窗口,请点击 鑫安工具 > 参考资料, 检查 Microsoft VBScript正则表达式5.5 在选项 参考文献-VBAProject 对话框,然后单击 OK 按钮。

4。 按 F5 键或单击“运行”按钮以运行代码。

然后,将所有html标记立即从整个工作表中删除。