html-to-text 解析 HTML 并返回美化的文本
html-to-text 是一款开源库,可将 HTML 转为结构清晰的纯文本,支持自动换行、Unicode、多种渲染选项和自定义钩子,适用于邮件渲染、日志输出、爬虫抓取等场景。
安装
npm install html-to-text核心功能
标签处理:智能区分内联(如
<span>)和块级(如<p>)元素,添加空格与换行。表格:可渲染为 Markdown 或模拟文本表格。
链接与图片:保留链接文本(可附带 URL)或忽略;图片占位或跳过。
美化选项:自定义列宽、Unicode 支持、标签映射(如将
<h1>渲染为#)。
基本用法
const { convert } = require('html-to-text');
const text = convert(html, { wordwrap: 50, tables: true });
console.log(text);示例输出:
# 示例标题
这是一个 **加粗** 的段落,包含 链接 (https://example.com)。
| 列1 | 列2 |
| --- | --- |
| 数据A | 数据B |忽略链接和图片
const { convert } = require('html-to-text');
const text = convert(html, {
wordwrap: false,
ignoreImage: true,
ignoreHref: true
});输出:
Welcome to My Website
This is a paragraph with a .
Another paragraph.
本文是原创文章,完整转载请注明来自 何小勺
评论
匿名评论
隐私政策
你无需删除空行,直接评论以获取最佳展示效果