|
(6) 編輯點評:將語言模型直接引入手機的安安装應用程序。 PocketPal AI本地大模型是卓版最新一個手機上直接運行的本地AI對話工具,這個軟件可以讓你無需連接網絡久等與其他的版本AI大模型進行聊天和交流,本地部署方法需要根據流程進行摸索,下载可以在本地增加一個最近十分熱門的安安装deepseek,這樣就不會卡頓的卓版最新進行使用了。 部署方法1.百度找到精品下載 2.在精品網中搜索PocketPal,版本點擊下載 3.打開軟件點擊Models,下载點+,安安装點Hugging Face搜索大模型 4.盡量下載名字帶Q4_NL(4bit量化 normal 壓縮)的卓版最新模型,回答比較精準。版本 5.解釋一下部分量化標識命名規則:NL 平衡精度與速度(Normal)、下载M 中等優化(middle)、安安装 XS 極致壓縮(Extra Small)、卓版最新K 極限壓縮(K-special)、版本Qx 量化位數(手機上運行 Q4 最佳)。 6.在加載好模型後在Settings中把N PREDICT設置為4096。 如果遇到問題請發到評論區,我會試著解決。 PocketPal AI是什麽軟件PocketPal AI 是一款袖珍型 AI 助手,由直接在手機上運行的小型語言模型 (SLM) 提供支持。PocketPal AI 專為 iOS 和 Android 設計,讓您無需互聯網連接即可與各種 SLM 進行交互。 軟件特色離線 AI 協助:直接在您的設備上運行語言模型,無需互聯網連接。 模型靈活性:下載並在多個 SLM 之間進行交換,包括 Danube 2 和 3、Phi、Gemma 2 和 Qwen。 Auto Offload/Load:當應用程序在後台運行時,通過卸載模型來自動管理內存。 推理設置:自定義模型參數,如係統提示符、溫度、BOS 令牌和聊天模板。 實時性能指標:在 AI 響應生成期間查看每秒令牌數和每個令牌的毫秒數。 使用流程下載模型 點擊漢堡菜單 導航到 “Models” 頁麵 選擇您想要的型號並點擊下載 加載模型 下載後,點擊 Load 將模型導入內存。現在您可以聊天了! 技巧 在 iOS 設備上,Apple 的 GPU API (Metal) 默認處於激活狀態。如果您遇到任何問題,請嚐試停用它。 iOS 金屬 自動卸載/加載 為了保持設備平穩運行,PocketPal AI 可以自動管理內存使用情況: 在模型頁麵上啟用 “Auto Offload/Load” (默認情況下是) 該應用程序將在後台卸載模型 當您返回時,它會重新加載(對於較大的模型,請等待幾秒鍾) 高級設置 單擊 V 形圖標可訪問高級 LLM 設置,例如: 溫度 BOS 代幣 聊天模板選項 等。 最後,讓我們聊聊吧! 加載模型後,前往 “聊天” 頁麵並開始與加載的模型交談! 此時還會顯示 generation performance (生成性能) 指標。如果有興趣,請觀察聊天氣泡以獲取實時性能指標:每秒令牌數和每個令牌的毫秒數。 重要提示:截至目前,我還沒有找到一種簡單的方法來從生成的響應中選擇和複製文本,同時保留文本格式,尤其是 Markdown 支持。 同時,以下是當前用於複製文本的選項: 段落級複製:長按特定段落可複製其內容。 完整響應複製:使用文本氣泡底部的複製圖標複製 AI 生成的整個響應。 我知道這些選項可能並不理想,這是我使用其他應用程序的挫敗感之一。複製部分文本的困難曾經是 ChatGPT 等聊天應用程序特別煩人的方麵。 開發商: PocketPal AI 是使用 React Native 構建的。找到一種平衡文本選擇和保留格式(尤其是 Markdown 支持)的簡單解決方案對我來說一直很棘手。如果您有這方麵的經驗,我很樂意聽取您的意見! 更新日誌v1.15.1專長:支持Gemini 3.5閃光。 專長:提升美人魚圖的渲染穩定性。 修複:修複 Markdown 內聯數學渲染問題。 修複:修複 Claude 和 OpenAI 工具調用繼續過程中缺失的功能/工具調用塊。 修複:修正統計熱力圖中的日期漂移。 v1.13.0變化 專長(店鋪):在#629中為美國高級好友添加深度鏈接購買按鈕 feat(Android):添加權重重裝切換,並在#637中優化MMAP/重新打包 feat(perf):在 #644 中添加內存分析流水線 feat:在#597中添加兼容OpenAI的遠程服務器支持 來自 #633 的 Hosted Weblate 翻譯更新 翻譯更新來自托管Weblate,來源於#646 修正(Android):在#645中正確調整外部顯示器的顯示密度 修複(存儲):在 #630 中保留應用重啟期間的用戶線程計數 修正#596中型號下拉菜單無法在短手機上滾動到底部的問題 版本 v1.11.16變化 任務/更新 e2e 測試 2 by #541 修複方法:#543 中通過基於互助的串行化防止模型切換時的內存泄漏 版本 v1.11.13任務:升級RN 0.82,llama.rn,並在#523修複 版本 v1.11.12專長:在#515中將llama.rn升級至0.10.0-rc.3 版本 v1.11.11變化 修複:通過 #504 將 llama.rn 更新到 0.9.2 版本 1.11.2feat:重構設備檢查 (GPU ...) 並在 #446 中為 OpenCL 要求添加詳細消息 版本 v1.10.24壯舉:通過 #413 升級 llama.rn v1.10.22雜務:將應用程序信息占位符圖標替換為 #400 專長:在 #410 中升級 llama.rn 1.10.21壯舉:添加UI控製 版本 v1.10.19壯舉:通過 #393 升級 llama.rn v1.10.17壯舉:在 #381 中為 PAL 添加導入/導出 [壯舉]:改進中文本地化翻譯 (0715) by in #373 雜務:通過 #387 升級 llama.rn v1.10.16壯舉:在 #380 中同步 llama.rn -> llama.cpp以支持 LFM2 版本 v1.10.15Feat: 新增思考控製 v1.10.13修複:useChatSession 中聊天消息重複的問題 V1.10.9Feat: 升級 llama.rn (因此llama.cpp) 以支持 GEMMA 3N by 1.10.7壯舉:通過為視覺模型添加選擇退出 v1.10.0更新 dependencys Feat: 改進中文本地化翻譯 雜務:去掉多餘的 JA: '日本語 (JA)' Feat: 通過 IN 為 Android 添加備份和恢複支持 feat: 添加 Lookie Pal 1.9.4修複(Android):阻止 app resume 時恢複 feat: 如果 content 為空,則不渲染 修複:文本生成過程中 token 缺失/重複 1.9.0特點: 在中為門控模型訪問添加 HF 令牌身份驗證 1.8.15Feat: 添加預設補全設置 1.8.12feat: 添加 iPad 支持 by in #249 重構:使用 IN #250 使用基於基準測試的模型改進內存需求檢查 feat: 添加 Thought 標簽並同步 llama.rn by in #251 修複(iPad):新增對 Upside Down Orientation 的支持 by IN #253 1.8.5修複:改進 Android 版本跨 Edge 到 Edge Display 的實現 v1.6.9修複:在 ChatGenerationSettingsSheet 中使用 processedSettings 1.6.7修複(Android):刪除 llama.rn 的 FP16 編譯器標誌以解決 Deepseek |
