如下面的屏幕截图所示,如果工作表单元格中存在许多html标记,那么如何在Excel中将它们转换为纯文本? 本文将向您展示两种从Excel单元格中删除所有html标记的方法。
使用查找和替换功能将html转换为选定单元格中的文本
使用VBA将HTML转换为整个工作表中的文本
使用查找和替换功能将HTML转换为单元格中的文本
您可以将所有html转换为单元格中的文本 查找和替换 Excel中的功能。 请执行以下操作。
1.选择将所有html转换为文本的单元格,然后按 按Ctrl + F 键打开 查找和替换 对话框。
2.在 查找和替换 对话框,转到 更换 标签,输入 <*> 到 查找内容 盒子,保持 更换 框为空,然后单击 “全部替换” 按钮。 看截图:
3.然后 微软的Excel 弹出对话框,告诉您已替换了多少个html标签,请单击 OK 按钮并关闭 查找和替换 对话框。
然后,您可以看到所有html标记已从选定的单元格中删除,如下图所示。
使用VBA将HTML转换为整个工作表中的文本
此外,您可以使用以下VBA代码同时将所有html转换为整个工作表中的文本。
1.打开包含要转换为文本的html的工作表,然后按 其他 + F11 键打开 Microsoft Visual Basic应用程序 窗口。
2.在 Microsoft Visual Basic应用程序 窗口中,单击 插页 > 模块,然后将以下VBA代码复制到“模块”窗口中。
VBA代码:将html转换为整个工作表中的文本
Sub RemoveHTMLTags()
'Update by Extendoffice 20180703
Dim xRg As Range
Dim xCell As Range
Dim xStr As String
Dim xRegEx As RegExp
Dim xMatch As Match
Dim xMatches As MatchCollection
Set xRegEx = New RegExp
Application.EnableEvents = False
Set xRg = Cells.SpecialCells(xlCellTypeConstants)
With xRegEx
.Global = True
.Pattern = "<(""[^""]*""|'[^']*'|[^'"">])*>"
End With
For Each xCell In xRg
xStr = xCell.Value
Set xMatches = xRegEx.Execute(xCell.Text)
For Each xMatch In xMatches
xStr = Replace(xStr, xMatch.Value, "")
Next
xCell.Value = xStr
Next
Application.EnableEvents = True
End Sub
Copy
3.仍在 Microsoft Visual Basic应用程序 窗口,请点击 鑫安工具 > 参考资料, 检查 Microsoft VBScript正则表达式5.5 在选项 参考文献-VBAProject 对话框,然后单击 OK 按钮。
4。 按 F5 键或单击“运行”按钮以运行代码。
然后,将所有html标记立即从整个工作表中删除。