本篇文章透過「筆韻智匠 Quill Sage🖋️✨」和 Claude 3.5 Sonnet 聯合創作
前言:創造 AI 助手的 AI 助手
在現今的 AI 時代,提示詞工程已成為 AI 應用開發中不可或缺的關鍵環節。身為一個熟悉 AI 助手的開發者兼使用者,我深刻了解一個優質的提示詞 (prompt) 能夠將一個笨 AI 轉變為專業的問題解決專家。在創造了一大堆的 AI 助手之後,我萌生了一個想法:
該創造一個「創造 AI 助手」的 AI 助手了😀!
正是基於這個想法,我在 Coze 平台上實作了「自動化提示詞工程」助手。這個助手的核心是基於 Automated Prompt Engineering (APE) 技術,特別採用了 Optimization by PROmpting (OPRO) 流程來反覆優化提示詞。
Automated Prompt Engineering 自動化提示詞工程
在接下來的章節中,我將詳細介紹這個 AI 助手的功能、使用方法,以及一些實用的技巧和最佳實踐。無論你是 AI 開發新手還是經驗豐富的工程師,我相信這篇文章都能讓你有所收獲。讓我們一起探索如何運用自動化技術來進行 AI 提示詞工程。
什麼是 Automated Prompt Engineering?
Automated Prompt Engineering (自動化提示詞工程,簡稱 APE) 旨在自動化大型語言模型 (LLM) 提示詞的生成和優化過程。
在傳統的 Prompt Engineering 中,開發者需要手動設計、測試和優化提示詞,這是一個耗時且常常需要反覆嘗試的過程。APE 的目的就是要簡化並加速這個過程,讓 AI 系統能夠自動找出最有效的提示詞。
APE 的核心原理是利用不斷疊代來優化 AI。它通過以下步驟來實現自動化:
- 初始化:設定任務目標和初始提示詞。
- 生成回應:使用當前提示詞讓 LLM 生成回應。
- 評估效果:分析生成的回應,評估其品質和相關性。
- 優化提示詞:基於評估結果,自動調整和改進提示詞。
- 疊代:重複上述過程,直到達到滿意的結果。
在 APE 的實踐中,Optimization by PROmpting (以大型語言模型做為優化器,OPRO) 是一種很好的提示詞優化方法。OPRO 策略來自 Google DeepMind 的論文《Large Language Models as Optimizers》,通過 LLM 分析先前疊代的結果並識別成功模式,從而優化提示詞。
在這篇部落格中我僅簡短的提及它的工作原理,若讀者對 APE 技術和 OPRO 流程感興趣,我強烈推薦閱讀下面這篇非常精彩的文章。這篇文章詳細講解了 APE 和 OPRO 流程,對理解本助手的運作原理非常有幫助。
自動提示詞工程解放LLM潛力,APE讓LLM探索更廣闊的提示詞設計空間 | T客邦
https://www.techbang.com/posts/118175-auto-prompt-engineering-guide
「Automated Prompt Engineering 自動化提示詞工程」助手
我的「Automated Prompt Engineering 自動化提示詞工程」助手以 Coze workflow 實作了使用 OPRO 方法的 APE 流程,以下介紹此助手的使用方式。
參數設置
這個 AI 助手使用四個關鍵參數來指導其運作。每個參數都在提示詞優化過程中扮演著重要角色:
- Goal 目標:這是你希望 AI 助手達成的最終目的。明確的目標設定能夠指導整個優化過程,確保生成的提示詞符合你的需求。
- Initial Prompt 初始提示詞:提供初始提示詞作為優化的起點。你可以提供一個初始提示詞,或者讓系統自動生成一個。
- Scoring Criteria 評分標準:這定義了如何評估生成的回應。你可以自己設定一個 0 到 100 分的評分標準,或者讓系統自動生成一個。
- User Input 用戶輸入:這是用於測試和評估提示詞效果的示例輸入。你可以提供一到三個用戶輸入,用來模擬真實場景下的互動。
值得一提的是,我推薦將「Initial Prompt」和「Scoring Criteria」留空,讓我的系統自動生成。你猜這個 APE 助手首先是用在哪裡?當然是優化它自己!經過我的精煉,生成這兩個值的 LLM 表現可以說是非常出色,比一般人寫得更好。
快捷指令
此助手使用以下三個快捷指令操作:
- New run 新任務:用於開始一個新的提示詞優化任務。當你想要啟動一個新的優化過程時使用它。
- Continue task 繼續任務:允許你在之前執行的結果基礎上繼續疊代。由於 Coze Workflow 有單次執行 node 數量上限,我設計了在此輸入 Run ID 接續執行前面的任務。
- Dump result 輸出結果:在每一次執行都會倒出結果,但若你需要,也可以使用這個功能單獨輸出過往的執行結果。
接下來將講解具體的操作使用流程。
步驟 1:設置並執行新任務
使用「New run」快捷指令來開始一個新的優化過程。在這一步,你需要:
- 明確定義你的目標 goal
- 提供一個初始提示詞 prompt (或選擇讓系統生成)
- 設定評分標準 scoring_criteria (或讓系統自動生成)
- 輸入一到三個用戶輸入示例 user_input
仔細考慮每個參數,確保它們準確反映了你的需求和期望。指令送出之後它會立即開始執行,請耐心等待。
步驟 2:分析結果和優化
任務執行完成後,助手會輸出評分最高的五個提示詞,並將所有的評估過程輸出為一個 zip 檔。請你評估優化後的提示詞是否達到了你的目標,生成的回應是否符合預期。如果需要進一步優化,可以使用「Continue task」指令,在現有結果的基礎上進行更多疊代。你也可以再次使用「New run」功能並帶入舊的 Run ID,這會讓它基於舊的提示詞評分記錄對新的目標進行優化,將產生不一樣的效果。
通過反覆使用這個助手,調整目標和提示詞,你就能創造出更優質、更精準的 AI 提示詞。
使用技巧和最佳實踐
要有效地運用「Automated Prompt Engineering 自動化提示詞工程」助手,關鍵在於制定明確且可衡量的目標。例如,與其籠統地說「改善對話」,不如具體地表述為「生成更具同理心的客戶服務回應」。
在選擇用戶輸入示例時,應盡量涵蓋各種可能的場景,包括簡單和複雜的查詢,以全面測試提示詞的適應性,擅用三個 User Input。
評分標準的設定也至關重要,它應該與你的目標保持一致,明確定義出什麼是好、什麼是不好,定出各個分數級距如何評分。
你也可以試著微調目標再繼續疊代,或許會得到更好的結果。此外,將你的領域知識融入優化過程中,考慮行業特定的術語、慣例和需求,這樣可以使得生成的提示詞更加貼合實際應用場景。
總結
本文深入探討了 Coze 平台上的「Automated Prompt Engineering 自動化提示詞工程」助手,這是一個旨在簡化和優化 AI 提示詞創建過程的革命性工具。我們介紹了 Automated Prompt Engineering (APE) 的概念,闡述了它如何通過自動化提高提示詞的品質和效率。我們詳細說明了助手的主要功能,包括四個關鍵參數和三個實用的快捷指令,並提供了使用這個 AI 助手的詳細步驟指南。
這個助手的價值在於顯著提升了效率,大大縮短了提示詞優化的時間,通過系統化的優化過程生成更高品質、更精準的提示詞,從而提高 AI 應用的整體表現。使用這個助手的過程本身就是一個學習 prompt engineering 的絕佳機會,幫助大家更深入地理解如何讓 AI 更聽話。
你可能會好奇,為什麼我選擇在 Coze 平台上實作 APE 助手呢?原因在於 Coze 獨特的訊息計價模式。OPRO 流程需要大量的 LLM 呼叫來不斷改進提示詞,這在傳統的以 token 計價的平台上會產生高昂的成本。然而,在 Coze 的訊息計價模式下,我們可以更自由地進行大量的 LLM 操作,而無需過度擔心成本問題。
「Automated Prompt Engineering 自動化提示詞工程」不僅提高了開發效率和應用品質,還為開發者提供了一個強大的工具,幫助他們更好地理解和進行提示詞工程。隨著 AI 技術的不斷發展,這樣的工具將變得越來越重要,成為每個 AI 開發者的必備利器。
延伸閱讀
回覆
你可以使用 Mastodon 或其他 ActivityPub/Fediverse 帳號來公開回覆此文章。現有的公開回覆顯示在下方。