Skip to content

A VS Code extension for document and book proofreading based on LLM services

License

Notifications You must be signed in to change notification settings

Fusyong/ai-proofread-vscode-extension

Repository files navigation

一个用于文档和图书校对、基于大语言模型的VS Code插件,支持选中文本直接校对和长文档切分后校对两种工作流,这里是代码库。本插件与相应的Python校对工具库的功能大致相同。

A VS Code extension for document and book proofreading based on LLM services, supporting two workflows: proofreading selected text directly and proofreading long documents after segmentation. Here is the code repository. This extension has roughly the same functions as the corresponding Python proofreading tool library.

1. 安装和必要配置

  1. 打开VS Code中插件界面(Ctrl+Shift+X)
  2. 搜索AI Proofreader
  3. 点击安装按钮install安装
  4. 安装后点击设置按钮⚙️,选中弹出菜单中的设置项Settings
  5. 在设置界面选择下面的一个大语言模型服务平台
  6. 填写所选平台的API秘钥(须到上述平台通过注册、实名认证、生成API秘钥、充值等操作后获得有效的秘钥)

2. 快速上手

  1. 校对文档中的选段:

    1. 打开markdown等文本文件,选中一段文字
    2. 在所选右键打开菜单,使用其中的AI proofreader: proofread selection项校对选中文本
    3. 其间可选上下文范围、参考文本和温度
    4. 最后会自动展示校对前后的差异
  2. 切分文档后批量校对:

    1. 打开markdown文档,打开右键菜单,使用其中的AI proofreader: split ... 选项中的一个,把当前的切分为JSON文档
    2. 打开上述JSON文档,打开右键菜单,使用其中的AI proofreader: proofread file选项,批量校对切分好的片段
    3. 最后会提示你查看结果:前后差异、差异文件、JSON结果、日志文件

前后差异示例:

前后差异

打开命令面板(Ctrl+Shift+P)能查看和使用所有命令:

所有命令

3. 使用说明

3.1. 配置

请在 VS Code 设置中进行配置(Ctrl+, 打开设置)。

  1. 平台选择

    • ai-proofread.proofread.platform: 选择大模型服务平台(deepseek/aliyun/google)
  2. API密钥配置以上选中平台必须配置):

    • ai-proofread.apiKeys.deepseek: Deepseek开放平台 API 密钥
    • ai-proofread.apiKeys.aliyun: 阿里云百炼平台 API 密钥
    • ai-proofread.apiKeys.google: Google Gemini API 密钥
  3. 模型选择

    • ai-proofread.proofread.models.deepseek: Deepseek开放平台模型选择(deepseek-chat/deepseek-reasoner)
    • ai-proofread.proofread.models.aliyun: 阿里云百炼模型选择(deepseek-v3/deepseek-r1/qwen-max-2025-01-25/qwen-plus)
    • ai-proofread.proofread.models.google: Google Gemini模型选择(gemini-2.0-flash/gemini-2.0-flash-lite/gemini-2.0-flash-thinking-exp-01-21/gemini-2.5-pro-exp-03-25)
  4. 校对相关

    • ai-proofread.proofread.rpm: 每分钟最大请求数(默认15)
    • ai-proofread.proofread.maxConcurrent: 最大并发请求数(默认3)
    • ai-proofread.proofread.temperature: 模型温度(默认1.0,取值范围[0:2))
    • ai-proofread.proofread.defaultContextLevel: 校对选中文本时默认使用的标题级别,作为上下文范围(默认0,表示不使用)
    • ai-proofread.convertQuotes: 是否在校对后自动将拉丁半角引号转换为中文全角引号(默认为false)
  5. 文档切分相关

    • ai-proofread.defaultSplitLength: 默认的文本切分长度(默认600字符)
    • ai-proofread.defaultTitleLevels: 默认的标题切分级别(默认[2],表示按二级标题切分)
    • ai-proofread.contextSplit.cutBy: 带上下文切分模式下的切分长度(默认600)
    • ai-proofread.titleAndLengthSplit.threshold: 标题加长度切分时的段落长度阈值(默认1500)
    • ai-proofread.titleAndLengthSplit.cutBy: 标题加长度切分时的目标长度(默认800)
    • ai-proofread.titleAndLengthSplit.minLength: 标题加长度切分时的最小长度(默认120)
  6. 提示词管理

    • 必须通过命令面板选择提示词
    • 一般用户建议通过命令面板(Ctrl+Shift+P)设置提示词
    • 或通过设置项ai-proofread.prompts设置:
      • 每个提示词必须包含名称和内容
      • 内容必须对要处理的目标文本(target)、参考资料(reference)、上下文(context)进行说明
  7. 调试

    • ai-proofread.debug: 是否显示调试日志(默认false)

3.2. 切分文档

我的经验,在一般语言文字和知识校对场景中,大语言模型一次输出六百到八百字会有比较好的效果。因此,一本十来万字的书稿需要切分成三百多段,然后交给大模型校对。

打开markdown文件,右键点击编辑器,可以看到以下切分选项(或通过命令面板查找):

切分文档

  1. 按标题切分 (Split File by Title)
    • 输入标题级别(如:1,2)
  2. 按长度切分 (Split File by Length)
    • 输入目标切分长度
  3. 按标题和长度切分 (Split File by Title and Length)
    • 可配置标题级别、阈值(过大则切分)、切分长度和最小长度(过小则合并)
  4. 带上下文切分 (Split File with Context)
    • 输入标题级别作为上下文范围,输入切分长度

切分后都生成同名的 .json(用于校对) 和 .json.md(可查看切分情况) 两个结果文件。 切分操作都会生成日志文件(.log),记录切分统计信息。

请注意,文档切分依赖文本中的两种标记:(一)空行。在markdown中,一个或多个空行表示分段,没有空行的断行在渲染时被忽略。(二)各级标题。如## 开头的是二级标题。没有这些标记的文本就无法切分。

3.3. 合并JSON

插件每次调用大语言模型时能提交三种文本:要处理的目标文本(target,必须)、参考资料(reference,可选)、上下文(context,可选)。比如以一篇文章中的一部分作为target,那么整篇就可以作为context,而在处理中有参考价值的资料,如相关词条,就可以作为reference。

假设你校对一本书,切分后得到包含300个target的JSON文件。那么可以准备相同数量、一一对应的上下文或参考文献,切分成包含相同数量target的JSON文件。然后使用合并命令,将上下文文本中的target作为context合并,将参考文本中的target作为reference合并。

合并 JSON 文件 (Merge Two Files):

  1. 打开已切分的要校对的 JSON 文件
  2. 右键选择AI proofreader: Merge Two Files(或通过命令面板查找),选择要合并的文件
  3. 确定要插入/更新的字段和来源字段

校对功能

3.4. 校对文本选段或JSON文档

菜单见上两图。

  1. 校对选中文本 (Proofread Selection)
    1. 打开文本文件(支持常见文本文件,推荐使用Markdown)
    2. 选中要校对的段落
    3. 从右键菜单中选择 Proofread Selection
    4. 可选择上下文范围、参考文件和温度
    5. 最后会自动展示校对前后的差异
    6. 并生成日志
  2. 校对 JSON 文件 (Proofread File)
    1. 打开已切分的 JSON 文件
    2. 右键选择Proofread File
    3. 自动使用配置的默认值进行校对
    4. 支持进度显示和取消操作
    5. 最后会提示你查看结果
    6. 并生成日志

3.5. 管理提示词

本插件目前默认提示词的功能是校对一般的语言文字错误和知识性错误,具体内容见代码库种的proofreader.ts文件。

通过命令面板(Ctrl+Shift+P)可以

  1. 管理提示词 (AI Proofreader: set prompts),可增、删、改
  2. 选择当前使用的提示词 (AI Proofreader: select prompt)

也可以在配置文件中处理提示词,但不适合没有编程知识的用户使用。

为了写好提示词,你需要了解本插件的工作原理:

  1. 把你的提示词作为系统命令/系统提示词交给大模型
  2. 在第一轮对话中提交<reference>${reference}</reference><context>${context}</context>
  3. 在第二轮对话中提交<target>${target}</target>
  4. 接收、处理第二轮对话的输出作为结果

整个过程没有魔法,处理的目的和方法完全由提示词和三种文本及其标签(reference、context、target)来定义。这就是说,你可以通过自己的提示词,让AI根据三种文本做你期望的任何处理, 比如撰写大意、插图脚本、练习题、注释,绘制图表,注音,翻译,进行专项核查(专名统一性、内容安全、引文、年代、注释等)……

需要注意的是,在自定义提示词中,必须对要处理的目标文本(target)、参考资料(reference)、上下文(context)进行说明,如果用不到后两者也可以不说明。并且这种说明应尽可能与三种标签的字面意义相协调,比如target可以用作“要处理的目标文本”,也可以用作“要得到的具体目标”(作为系统提示词的补充),但不宜作为参考文本、样例等类。

3.6. 日志等过程文件

为了让用户能够核验、控制每一个步骤,插件会以要校对的文档(以“测试.md”为例)的文件名为基础,生成一些中间文件,各自的作用如下:

  1. 测试.md,要校对的文档
  2. 测试.json,切分上述文档的结果,供检查后用于校对;可以进一步与别的切分结果进行合并,以便搭配target + context + reference一起提交处理
  3. 测试.json.md,拼合上项JSON文件中的target的结果,用于查看或比较原始markdown文件,比JSON直观
  4. 测试.log,切分日志,用来检查切分是否合理
  5. 测试.proofread.json,校对上述JSON文件的直接结果,其中的null项表示还没有校对结果,重新校对时只处理null对应的条目,而不会重复处理已经完成的条目
  6. 测试.proofread.json.md,拼合上项JSON文件中的结果,比较最初的markdown文件即可看出改动处(可通过校对最终界面查看);如果这个文件已经存在,则自动备份,名字加时间戳
  7. 测试.proofread.html:通过jsdiff库比较校对前后markdown文件所得的结果,与Word近似的行内标记,可通过浏览器打印成PDF。需要联网调用jsdiff库,并等待运算完成;如果长文本处理困难,可分章节处理
  8. 测试.proofread.log,校对日志,校对文本选段的结果也会存在这里

请特别注意:除自动累加的日志文件和自动备份的测试.proofread.json.md,其余中间文件,每次操作都将重新生成! 如有需要,请自行备份。

3.7. 模型温度

每个模型用于校对的最佳温度需要耐心测试才能得到。

以往的经验是,温度为1时极少有错误和无效改动。

提高模型温度可以增加随机性,如此多次尝试有可能提高召回率,同时也增加不稳定和错误率。

以下是官方资料:

  1. deepseek

    temperature 参数默认为 1.0。

    官方建议根据如下表格,按使用场景设置 temperature

    场景 温度
    代码生成/数学解题 0.0
    数据抽取/分析 1.0
    通用对话 1.3
    翻译 1.3
    创意类写作/诗歌创作 1.5
  2. 阿里云百炼平台

    • deepseek v3/r1: temperature:0.7(取值范围是[0:2)
    • qwen系列: 取值范围是[0:2)
  3. Google Gemini

    默认为1

3.8. 其他功能

  1. 比较(diff)文件,使用右键菜单diff it with another file,然后可选两种模式:
    1. 调用vscode diff editor比较。查看“前后差异”的功能与此相通。对于长文本,diff editor有段落无法对齐的问题。此时,可以通过分行或删除分行来帮助diff。
    2. 用jsdiff生成HTML形式的比较结果文件。
  2. 从md反查PDF:从markdown文件选择文本,使用Search Selection In PDF命令,将调用SumatraPDF打开同名的PDF文件,并搜索选中文本。须先安装好SumatraPDF,在高级选项中设置ReuseInstance = true可以避免重复打开同一个文件。
  3. 转换半角引号为全角:使用AI Proofreader: convert quotes to Chinese命令或菜单。也可在设置中设定为自动处理。
  4. 文件格式转换功能,须先安装好Pandoc
    1. 使用命令convert docx to markdown将docx转为markdown,与下面的命令行等效
      set myfilename="myfilename"
      pandoc -f docx -t markdown-smart+pipe_tables+footnotes --wrap=none --toc --extract-media="./attachments/%myfilename%" %myfilename%.docx -o %myfilename%.md
      或:
      set myfilename="myfilename"
      pandoc -t markdown_strict --extract-media="./attachments/%myfilename%" %myfilename%.docx -o %myfilename%.md
    2. 使用命令或菜单convert markdown to docx,将markdown转为docx,与下面的命令行等效
      pandoc -f markdown -t docx -o myfilename.docx myfilename.markdown

3.9. 注意事项

  1. 确保在使用前已正确配置必要 API 密钥
  2. 长文本建议先切分后校对
  3. 校对过程可以随时取消,已处理的内容会得到保存,重新校对时不会重复处理
  4. 注意所用模型 API 调用频率限制,可通过配置调整

4. 相关工具

  1. vscode提供的比较(diff)功能:通过文件浏览器右键菜单使用;本插件在vscode中的比较即调用了本功能。vscode是这些年最流行的文本编辑器,有许多便捷的文字编辑功能,很适合编辑工用作主力编辑器。
  2. Acrobat,商业软件,可以把PDF文件转成docx或HTML,再用pandoc转markdown

5. 开发命令

# 安装依赖
npm install

# 开发时实时编译
npm run watch

# 打包
npm run package

# 构建 vsix 扩展安装文件用
npm run package-vsix

# 发布
npm run publish

About

A VS Code extension for document and book proofreading based on LLM services

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published