docs: update

2025-11-24 20:15:34 +08:00 · 2025-07-22 01:40:05 +08:00
parent 2356cfa10a
commit 13eb7c6ea2
17 changed files with 38 additions and 8 deletions
--- a/docs/getting-started/configuration.md
+++ b/docs/getting-started/configuration.md
@@ -15,13 +15,43 @@

 ## FFmpeg 配置

-如果想要使用切片生成和压制功能，请确保 FFmpeg 已正确配置；除了 Windows 平台打包自带 FFfmpeg 以外，其他平台需要手动安装 FFfmpeg，请参考 [FFfmpeg 配置](/getting-started/ffmpeg)。
+如果想要使用切片生成和压制功能，请确保 FFmpeg 已正确配置；除了 Windows 平台打包自带 FFmpeg 以外，其他平台需要手动安装 FFmpeg，请参考 [FFmpeg 配置](/getting-started/ffmpeg)。

-## Whisper 模型配置
+## Whisper 配置

-要使用 AI 字幕识别功能，需要在设置页面配置 Whisper 模型路径，模型文件可以从网络上下载，例如：
+要使用 AI 字幕识别功能，需要在设置页面配置 Whisper。目前可以选择使用本地运行 Whisper 模型，或是使用在线的 Whisper 服务（通常需要付费获取 API Key）。
+
+> [!NOTE]
+> 其实有许多更好的中文字幕识别解决方案，但是这类服务通常需要将文件上传到对象存储后异步处理，考虑到实现的复杂度，选择了使用本地运行 Whisper 模型或是使用在线的 Whisper 服务，在请求返回时能够直接获取字幕生成结果。
+
+### 本地运行 Whisper 模型
+
+![WhisperLocal](/images/whisper_local.png)
+
+如果需要使用本地运行 Whisper 模型进行字幕生成，需要下载 Whisper.cpp 模型，并在设置中指定模型路径。模型文件可以从网络上下载，例如：

 - [Whisper.cpp（国内镜像，内容较旧）](https://www.modelscope.cn/models/cjc1887415157/whisper.cpp/files)
 - [Whisper.cpp](https://huggingface.co/ggerganov/whisper.cpp/tree/main)

 可以跟据自己的需求选择不同的模型，要注意带有 `en` 的模型是英文模型，其他模型为多语言模型。
+
+模型文件的大小通常意味着其在运行时资源占用的大小，因此请根据电脑配置选择合适的模型。此外，GPU 版本与 CPU 版本在字幕生成速度上存在**巨大差异**，因此推荐使用 GPU 版本进行本地处理（目前仅支持 Nvidia GPU）。
+
+### 使用在线 Whisper 服务
+
+![WhisperOnline](/images/whisper_online.png)
+
+如果需要使用在线的 Whisper 服务进行字幕生成，可以在设置中切换为在线 Whisper，并配置好 API Key。提供 Whisper 服务的平台并非只有 OpenAI 一家，许多云服务平台也提供 Whisper 服务。
+
+### 字幕识别质量的调优
+
+目前在设置中支持设置 Whisper 语言和 Whisper 提示词，这些设置对于本地和在线的 Whisper 服务都有效。
+
+通常情况下，`auto` 语言选项能够自动识别语音语言，并生成相应语言的字幕。如果需要生成其他语言的字幕，或是生成的字幕语言不匹配，可以手动配置指定的语言。根据 OpenAI 官方文档中对于 `language` 参数的描述，目前支持的语言包括
+
+Afrikaans, Arabic, Armenian, Azerbaijani, Belarusian, Bosnian, Bulgarian, Catalan, Chinese, Croatian, Czech, Danish, Dutch, English, Estonian, Finnish, French, Galician, German, Greek, Hebrew, Hindi, Hungarian, Icelandic, Indonesian, Italian, Japanese, Kannada, Kazakh, Korean, Latvian, Lithuanian, Macedonian, Malay, Marathi, Maori, Nepali, Norwegian, Persian, Polish, Portuguese, Romanian, Russian, Serbian, Slovak, Slovenian, Spanish, Swahili, Swedish, Tagalog, Tamil, Thai, Turkish, Ukrainian, Urdu, Vietnamese, and Welsh.
+
+提示词可以优化生成的字幕的风格（也会一定程度上影响质量），要注意，Whisper 无法理解复杂的提示词，你可以在提示词中使用一些简单的描述，让其在选择词汇时使用偏向于提示词所描述的领域相关的词汇，以避免出现毫不相干领域的词汇；或是让它在标点符号的使用上参照提示词的风格。
+
+
+
--- a/docs/index.md
+++ b/docs/index.md
@@ -38,9 +38,9 @@ features:
  - icon: 🔍
    title: 云端部署
    details: 支持 Docker 部署，提供 Web 控制界面
-  - icon: 📦
-    title: 多平台支持
-    details: 桌面端支持 Windows/Linux/macOS
+  - icon: 🤖
+    title: AI Agent 支持
+    details: 支持 AI 助手管理录播，分析直播内容，生成切片
 ---

 ## 总览
@@ -63,7 +63,7 @@ features:

 ## 封面编辑

-![cover](/images/coveredit.png)
+![cover](/images/cover_edit.png)

 ## 设置

--- a/docs/public/images/accounts.png
+++ b/docs/public/images/accounts.png
--- a/docs/public/images/ai_agent.png
+++ b/docs/public/images/ai_agent.png
--- a/docs/public/images/archives.png
+++ b/docs/public/images/archives.png
--- a/docs/public/images/clip_manage.png
+++ b/docs/public/images/clip_manage.png
--- a/docs/public/images/clip_preview.png
+++ b/docs/public/images/clip_preview.png
--- a/docs/public/images/cover_edit.png
+++ b/docs/public/images/cover_edit.png
--- a/docs/public/images/coveredit.png
+++ b/docs/public/images/coveredit.png
--- a/docs/public/images/livewindow.png
+++ b/docs/public/images/livewindow.png
--- a/docs/public/images/rooms.png
+++ b/docs/public/images/rooms.png
--- a/docs/public/images/settings.png
+++ b/docs/public/images/settings.png
--- a/docs/public/images/summary.png
+++ b/docs/public/images/summary.png
--- a/docs/public/images/tasks.png
+++ b/docs/public/images/tasks.png
--- a/docs/public/images/whisper_local.png
+++ b/docs/public/images/whisper_local.png
--- a/docs/public/images/whisper_online.png
+++ b/docs/public/images/whisper_online.png
--- a/src/page/Setting.svelte
+++ b/src/page/Setting.svelte
@@ -612,7 +612,7 @@
                      Whisper 提示词
                    </h3>
                    <p class="text-sm text-gray-500 dark:text-gray-400">
-                      生成字幕时使用的提示词，提示词的含义无意义，只用于设定风格
+                      生成字幕时使用的提示词，尽量简洁明了，提示音频内容偏向的领域以及字幕的风格
                    </p>
                  </div>
                  <div class="flex items-center space-x-2">