AI 翻譯解鎖——日文網路小說無障礙閱讀體驗

10 分鐘閱讀 View counter badge

robot with books

圖片出處: arthub.ai

前言

已試過 AI 翻譯但並不滿意?
不要太快放棄,AI 翻譯品質與 prompt (提示詞) 高度相關。它表現不好是因為你的提示詞不好!

機器翻譯技術的進步為閱讀外文小說開啟了新的大門。過去,不管是 Google 翻譯還是 Deepl 翻譯,譯文都充滿了「機翻味」,難以達到可閱讀小說的水準。但自 OpenAI 推出 ChatGPT 後,AI 翻譯品質有了巨大提升。有了大型語言模型的加持,不僅可以生成流暢的譯文,根據上下文推測語意,甚至能模仿原文的文句風格。雖未臻「完美」,但將翻譯水準從「可以理解的文件」提升到了「閒暇時想讀的書」。

這篇文章瞄準「以翻譯機閱讀日本web小說」的讀者,介紹我使用的工具、翻譯設定和提示詞。
希望能為讀書人提供一些參考,順利踏入大 AI 時代。

本文提供以下日文小說網站的推薦設定

延伸閱讀


琳的備忘手札: 我的日文輕小說書單

事前準備

要錢 $_$a

要錢,但並不是很貴。

我們會使用 「GPT-4o mini」模型,具體的價目表在這裡: https://openai.com/api/pricing/
撰文時為 US$0.150 / 1M input tokens + US$0.600 / 1M output tokens

我猜你對 token 怎麼計算沒有感覺......我也是😆
它是語言模型在理解文章時的一個最小單位。
這個單位並不是「一個中文字」、「一個英文字」或是「一個字母」這種東西。
總而言之,你就當成它是一個技術上合理的計價單位就行了。

OpenAI API 是採用「先儲值,從中扣款」的收費模式。請你先儲個 5 美元進去,然後實際體驗看看讀了多少文章會用完它。

以備你有需要,這裡是 token 計算機

設定 —— 沉浸式翻譯

開啟擴充功能的「選項」,以下未提及的選項維持預設值即可

settings

「基本設定」頁籤

小技巧


告訴它以「正體中文 zh-tw」回應能大幅減少簡體中文字出現!

「進階設定」頁籤

「關於」頁籤

「開發者設定」頁籤

dev settings

[
  {
    "matches": "kakuyomu.jp",
    "selectors": [
      "#contentMain-inner"
    ]
  },
  {
    "matches": "www.alphapolis.co.jp",
    "selectors": [
      ".novel-body",
      ".title",
      ".abstract"
    ]
  },
  {
    "matches": "ncode.syosetu.com",
    "selectors": [
      ".p-novel__title",
      ".p-novel__body",
      ".p-novel__summary",
      ".p-eplist__subtitle"
    ]
  }
]

設定 —— OpenAI Translator

開啟擴充功能的「設定」,以下未提及的選項維持預設值即可

openai-translator-settings

設定 —— Stylebot

下載這個 json 設定檔
https://gist.github.com/jim60105/6f3ef74137c9e2b7bbf1ea25e01e0082

開啟擴充功能的「設置」,在「備份」頁籤導入設定檔

stylebot-settings1

stylebot-settings2

測試

我採用的是翻譯時間較久,但是準確度較高的配置。
建議預先在新分頁開啟下一章節( Shift + 滑鼠中鍵點擊),當翻譯開始轉圈後回去讀上一章節以節省時間。

常見問題

無限轉圈,譯文沒有出來

OpenAI 的翻譯速度會受到原文長度的影響。如果等待 30 秒後仍未收到翻譯結果或錯誤提示,請嘗試使用 OpenAI Translator 局部翻譯。將原文選中然後點選小圖示。如果 OpenAI Translator 也無法翻譯,則很可能是原文包含了禁詞。在這種情況下,請切換至 Google 翻譯來閱讀那一段落。

openai-translator

Error 429

429

名詞錯置

我注意到 AI 有時會隨意使用專有名詞對應表中的詞彙來取代未定義的專有名詞,這顯示它在處理未知詞方面仍存在錯誤。希望未來的 AI 模型在這方面有所改善,能更精確地理解全文脈絡及判斷適當的詞彙。

清除翻譯記錄

開啟翻譯快取功能後,工具會記住已翻譯的句子,以避免發出重複的 API 請求,從而降低使用成本。如果需要清除快取,可以在「選項」的「關於」頁籤中點選「清除快取」按鈕。

翻譯很慢等好久

對,它就很慢。 202401: 它變快很多了,真的!

我建議在切換章節時,先在新分頁預翻譯下一章節的內容,然後返回查看已完成翻譯的前一章。這樣可以減少等待時間,達到更流暢的閱讀體驗。

譯文品質未達預期

譯文的品質與原文和提示詞息息相關。

某些作者的文風較雜亂,使用大量專有名詞,會導致翻譯品質下降。可以嘗試兩個方向改善: 增加專有名詞對應表,以及加長每次請求的最大段落數。前後文可以幫助 AI 理解文意,建議設為 8 至 15 段落。但是設定太長可能超出 token 限制、漏掉一整段或直接無回應!

至於提示詞,上方的設定是我自己的,大家可自行修改。有更好的提示詞歡迎在下方留言分享。👍

延伸閱讀


琳的備忘手札: 我的日文輕小說書單

回覆

你可以使用 Mastodon 或其他 ActivityPub/Fediverse 帳號來公開回覆此文章。現有的公開回覆顯示在下方。

打開文章