xiaji
8dccf08126
feat(translate): 增加译文清洗 — pipeline 接入源头防御 + 批量清洗历史脚本
- 新增 app/services/translation/text_clean.py
clean_markdown_asterisks / clean_html_inner_text / wrap_html 共用工具,
清洗 LLM 输出残留的 ** / * / *** markdown 标记
- 改 pipeline.translate_article: 写库前清洗 tr_title/tr_body,
新翻译不再带 **;同时把私有 _wrap_html 替换为公开 wrap_html
- 新增 app/scripts/clean_translations.py
批量清洗历史脏数据 — 5 字段(title_zh/body_zh_text/body_zh_html/
body_zh_formatted/summary_zh),支持 dry-run/limit/source-slug/field
2026-06-16 22:12:45 +08:00
..
2026-06-15 20:50:39 +08:00
2026-06-13 18:22:40 +08:00
2026-06-15 19:37:40 +08:00
2026-06-15 19:37:40 +08:00
2026-06-16 22:12:45 +08:00
2026-06-16 22:12:45 +08:00
2026-06-16 22:12:45 +08:00
2026-06-07 21:51:01 +08:00
2026-06-14 21:12:36 +08:00
2026-06-07 21:51:01 +08:00
2026-06-15 18:26:35 +08:00
2026-06-07 21:51:01 +08:00