11 月 2024 - Ai Pier

Perplexity 推出全新 AI 驅動購物助理： Shop Like a Pro 支援搜尋結果一鍵下單

Perplexity 推出全新 AI 驅動購物助理： Shop Like a Pro 支援搜尋結果一鍵下單 Perplexity 推出了一個全新的AI 驅動購物助理：Shop Like a Pro，將線上購買決策和購買流程整合到一個平台中，從提供答案的工具過渡到支援原生商業交易的平台，讓購物變得更加快捷和高效。主要功能和亮點一鍵結帳（Buy with Pro）：使用者可以直接在平台上完成從產品搜尋到下單的全流程，無需切換標籤頁。透過「Buy with Pro」功能，直接在平台上完成商品的研究和結帳。提供免費送貨服務，並透過安全入口網站保存用戶的運輸和付款資訊。適用範圍廣：支援家居用品、電子產品、時尚配件等多種商品類別。如果商品不支援 Buy with Pro，將自動引導至商家網站完成購買。 Snap to Shop 功能：視覺搜尋工具：使用者只需拍攝商品照片，系統即可顯示相關商品，即使沒有商品名稱或說明也能找到所需物品。個人化建議：根據使用者需求，提供專屬的商品推薦，例如適合送禮的商品、最佳咖啡機等。個性化推薦：提供工具驗證熱門產品是否可靠。基於使用者搜尋問題，提供精準、客觀的答案和商品卡。整合全網的產品評論，快速總結關鍵訊息，幫助使用者做出明智的購買決策。商品卡片包含關鍵細節，採用簡單、直覺的視覺格式。無廣告推薦：所有推薦完全由 AI 提供，未受贊助影響。強大的平台整合：整合 Shopify 等平台，確保獲取最新、最相關的商品資訊。提供清晰的產品比較和總結，幫助使用者快速自信地做出決策。商家計畫：提供工具幫助商家展示產品訊息，確保其準確且具吸引力。參與優勢：商家可以加入平台，透過優化的產品展示吸引更多用戶。

Perplexity 推出全新 AI 驅動購物助理： Shop Like a Pro 支援搜尋結果一鍵下單閱讀全文 »

SP-MangaEditor：一個完全免費的整合 AI 的網頁漫畫創作編輯工具

學習資源

SP-MangaEditor 是一個專門用來製作漫畫的網頁應用，可運行在你的瀏覽器裡。它提供了許多專業工具，例如漫畫面板管理、對話氣泡設計、AI 圖像生成等，讓你無需專業設計軟體也能快速完成自己的漫畫作品。你可以用它直接在頁面上設計漫畫、產生插圖，甚至調整圖片和文字的效果，非常適合漫畫愛好者、設計師，或是想嘗試漫畫創作的新手。主要功能 1. 漫畫面板製作提供現成的漫畫頁面模板，例如上下分欄、左右對齊等佈局，你可以直接使用。如果想個性化設計，可以自己調整面板的形狀、顏色和線條粗細。還能隨機產生「亂切」的分格效果（像那些很酷的斜線分割）。 2.AI 影像生成整合了 Stable Diffusion AI 模型，支援兩種功能：文字生成圖片（Text2Image）：輸入描述，例如“一個穿盔甲的武士”，就能生成圖片。圖片改造圖片（Image2Image）：上傳圖片，告訴 AI 修改成你想要的風格，例如讓一般照片變成漫畫風格。支援透過 WebUI、Forge 和 ComfyUI 的 API 進行影像處理。 3.圖像與文字編輯：影像調整：支援縮放、旋轉、翻轉、色調調整以及多種濾鏡（如模糊、像素化）。文字編輯：支援垂直/水平書寫，多種字體、陰影、輪廓和霓虹效果。提供 40 多種對話氣泡樣式，包括圓形、尖角、爆炸式的框框。支援自由調整顏色、線條粗細，還可以自己手畫對話氣泡！ 4.漫畫風格特效網點背景（Tones）：自動產生漫畫常見的背景網點效果，例如經典的點狀陰影和紋理填充。支援多種圖案和样式的選擇。黑白色調轉換：一鍵將彩色圖片轉換為黑白漫畫風格，同時保留所有細節和對比。混合模式：提供類似 Photoshop 的 25 種混合模式（如疊加、柔光等），可以讓你的圖片更有藝術感。發光效果：能為角色或物品添加光暈或霓虹邊緣效果，突顯重點內容。 5. 多語言和介面支持多語言介面：支援中文、日文、英文、韓文等多種語言。明暗主題切換：提供深色和淺色模式，根據喜好調整介面。 6. 圖層管理和文件匯出就像 Photoshop 一樣，你可以管理圖片、文字、面板的各個圖層，隨時調整位置和順序。支援保存你的項目，下一次打開可以接著編輯。匯出功能：可直接匯出高畫質漫畫頁面，適合列印或線上分享。 7. 其他貼心工具撤銷/重做：每一步操作都能自由撤銷，隨心所欲調整。拖放

SP-MangaEditor：一個完全免費的整合 AI 的網頁漫畫創作編輯工具閱讀全文 »

TxT360：一個用於大語言模型訓練的全球去重的高品質資料集 5.7兆個高品質的tokens

學習資源

TxT360：一個用於大語言模型訓練的全球去重的高品質資料集 5.7兆個高品質的tokens TxT360 是由 LLM360 創建的一個 Hugging Face 上用於大語言模型訓練的資料集。該數據集包含了來自多個領域的高品質文字數據，總計超過15兆個tokens，去重後的約5.7兆個高品質的tokens。該資料集透過全球去重技術解決了跨資料集的重複問題，同時保留了高品質的精選資料來源。 TxT360在規模和效能上超越了FineWeb和RedPajama等現有資料集，讓預訓練者更好地控制資料分佈和上採樣技術，從而優化模型訓練。 99個Common Crawl快照：資料集包含了99個從網路上抓取的網頁資料集 14個精選資料來源：除了網頁抓取的資料外，該資料集還包括14個高品質的精選資料來源，例如法律文件、百科全書等，資料權重調整配方：這個資料集也提供了一種方法（配方），讓使用者可以根據不同的資料來源或需求調整資料的權重。這意味著使用者可以靈活地決定哪些資料在模型訓練中應該佔更大的比例，以優化模型的效能。資料來源與去重：TxT360 匯集了來自多個領域的數據，例如法律文件（FreeLaw）和歷史書籍（PG-19）等，也包含了CommonCrawl上的99個大規模網頁快照。為了確保資料的獨特性，專案進行了複雜的去重操作，確保相同內容不會多次出現。多樣化的資料來源：TxT360結合了99個CommonCrawl快照和14個精選高品質資料來源，如FreeLaw、PG-19、Wikipedia、StackExchange、HackerNews、USPTO等。去重處理：TxT360是首個對如此大規模的數據進行全球去重的預訓練數據集，去除重複數據，避免了訓練中的數據冗餘和資訊重複現象。透過正規表示式，TxT360移除了文件中的個人識別資訊（PII），如電子郵件和IP位址，確保了資料的隱私和安全性。規模與品質並重：透過整合網路數據和精選數據來源，TxT360不僅具備大規模的多樣性數據，同時確保了數據的高質量，適用於最前沿的LLM預訓練。元資料和精確控制：此資料集不僅包含文本，還儲存了豐富的元資料（如每條資料的來源、類別等），使得研究人員能夠精確控制資料的使用和分佈。這意味著他們可以根據不同的需求調整數據的比例。上採樣策略：他們使用了一個特殊的策略來擴展資料量

TxT360：一個用於大語言模型訓練的全球去重的高品質資料集 5.7兆個高品質的tokens 閱讀全文 »

OpenAI 推出全新 Canvas 工具幫助用戶更好地寫作和編程 “Canvas” 的系統提示詞洩露

AI日報

OpenAI 推出全新 Canvas 工具幫助用戶更好地寫作和編程 “Canvas” 的系統提示詞洩露 OpenAI 推出了一款稱為 Canvas 的新工具，用來幫助使用者更好地與 ChatGPT 協作寫作和程式設計。 Canvas 讓使用者和 ChatGPT 在一個獨立的視窗中協作，即時修改內容。這個工具可以幫助改進文字、調整語言、審查和修復程式碼，甚至轉換成不同程式語言。你可以在 Canvas 裡直接寫東西，ChatGPT 會給你建議，例如如何改善文章、調整文字長度、修改閱讀難度等等。當 ChatGPT 辨識到可能有幫助的場景時，畫布會自動開啟。您也可以在提示中新增「使用畫布」來開啟畫布。寫作的捷徑包括：建議修改：ChatGPT 提供即時建議和回饋。調整文件長度：可以將文件的長度縮短或延長。調整閱讀程度：可以將閱讀程度從幼兒園提升到研究所。加入表情符號：為增強強調和色彩效果而添加相關的表情符號。編程的快捷鍵包括：程式碼審查：ChatGPT 提供即時建議，幫助您優化程式碼。新增日誌：插入列印語句以便於偵錯和理解程式碼。新增註釋：在程式碼中加入註釋，使其更易於理解。修復錯誤：識別並重寫有問題的程式碼以解決錯誤。程式碼轉換：將您的程式碼轉換為 JavaScript、TypeScript、Python、Java、C++或 PHP。模型功能模型知道何時打開畫布、進行針對性的編輯和全面重寫。它還能夠理解更廣泛的背景，從而提供精準的回饋和建議。使用畫布的 GPT-4o 比基線提示的 GPT-4o 提高了 18%的效能。 Plus 和 Team 用戶已經可以使用，未來還會增加更多功能！

OpenAI 推出全新 Canvas 工具幫助用戶更好地寫作和編程 “Canvas” 的系統提示詞洩露閱讀全文 »

One-Click Creative Template：創意模型用一張卡通圖片總結4張真實人物照片

學習資源

One-Click Creative Template：創意模型用一張卡通圖片總結4張真實人物照片 FLUX.1-dev-LoRA-One-Click-Creative-Template 是由 Shakker Labs 提供的一個用於文字生成圖像（Text-to-Image）的模板模型，專為創意照片生成而設計。模型會根據你的輸入提示詞產生 4 張背景照片，背景部分由 4 張真實照片組成，並在其中央插入一張卡通風格的圖像，作為對整個場景的總結。非常適合髮朋友圈、小紅書等炫耀… 當你輸入提示詞時，模型會：根據提示詞產生 4 張符合描述的真實風格的照片，作為圖像的背景部分。在這些生成的背景照片中間，插入一張卡通風格的圖像，這張圖是對背景內容的視覺總結或抽象化表達。生成概念：模型基於一個核心觸發句：“背景是4張真實照片，中間是一張總結這些照片的卡通圖片”，其他相似的描述也可以被接受並產生圖像。模型輸出：產生的圖片尺寸為896*1280，模型直接輸出，未經高解析度放大或重繪。 LoRA 權重：建議使用的權重範圍為0.8至1.3，CFG 值為3.5，步數為20。輸出圖片為單步驟產生的原生圖片。使用 The background is 4 real photos, and in the middle is a cartoon picture summarizing the real photos. 觸發圖像生成。擴散器中建議的比例為1.0 。模型基於 FLUX.1-dev，結合了 LoRA（低秩適應）技術，能夠實現高效的影像生成。此範本允許使用者透過簡化操作「一鍵」產生帶有創意設計的圖片。商業許可與限制：非商業用途：模型產生的圖片不能用於出售或商業用途，模型本身也不可作為合併模型出售。

One-Click Creative Template：創意模型用一張卡通圖片總結4張真實人物照片閱讀全文 »

Meta發布 Meta Spirit LM

學習資源

Meta發布 Meta Spirit LM 一個可以在語音和文字之間進行無縫轉換的多模態語音模型 Meta Spirit LM 是Meta推出的一個開源的多模態語言模型，其設計目的是能夠在語音和文字之間進行無縫轉換。它透過結合語音和文字數據，支援跨模態的生成任務。也就是它能夠聽懂語音，把它變成文字；也可以根據文字生成語音，並且能保持語音中的情感和語氣，使生成的語音更加自然生動。可以在文字和語音之間來回轉換。語音和文字互相轉換：它可以同時處理語音和文字資料。例如，它能夠把說話的內容轉成文字（就像字幕一樣），也可以把文字變成帶有情感的語音（像機器人說話一樣）。兩種模式：Base版本：可以處理語音的基本轉換，適合一般的語音辨識和生成任務。Expressive版本：使用音調和風格標記（pitch and style tokens）來捕捉語音中的情感，如興奮、憤怒、驚訝等，並產生帶有這種情感的語音，使得生成的語音更加自然、真實。可以根據語音中的情緒（如開心、憤怒、驚訝等）產生帶有情緒的語音，讓機器說話更自然。主要功能語音與文字產生： SPIRIT-LM 能夠產生文字或語音序列，輸入可以是文字、語音或二者的組合。模型能夠根據輸入模式切換生成模式。例如，它能夠從文字產生語音，也能夠根據語音輸入產生相應的文字。跨模態任務：模型可以執行多種跨模態任務，包括：自動語音辨識（ASR）：將語音輸入轉換為文字輸出。文字轉語音（TTS）：將文字輸入轉換為語音輸出。語音與文字的混合產生：根據輸入的模式自由產生文字或語音，並且能夠在生成過程中切換模態。少樣本學習： SPIRIT-LM 支援透過少量訓練樣本進行任務學習，特別是在跨模態任務中，它無需大量資料就可以執行諸如文字生成、語音生成、分類等複雜任務。情緒保持： SPIRIT-LM 能夠在文字或語音輸入中保留情緒特徵，並在生成的文字或語音中保留這種情緒表達。這使得模型在情緒豐富的對話、情感辨識等任務中表現優異。跨模態情感生成： SPIRIT-LM-EXPRESSIVE 版本特別關注語音中的情感表達，透過使用音調和風格單元，產生的語音不僅能傳遞語義，還能傳遞情感。這種功能使得它非常適合用於需要豐富語音表達的場景，如虛擬助理、語音生成等。模型的工作機制： SPIRIT-LM 的輸入可以是純文字、純語音或文字和語音的混合序列

Meta發布 Meta Spirit LM 閱讀全文 »

阿里雲推出Qwen-2.5-Turbo：刷新100萬Token上下文新高度

AI日報

阿里雲推出Qwen-2.5-Turbo：刷新100萬Token上下文新高度阿里雲推出 Qwen2.5-Turbo 專為處理長文字場景設計支援 100 萬 Token 的上下文長度，相當於 10 部完整小說、150 小時的語音轉錄或 30,000 行程式碼。在 Passkey Retrieval 任務中實現 100% 的準確率。處理 100 萬 Token 的時間從原來的 4.9 分鐘減少到 68 秒，提升 4.3 倍。處理 100 萬 Token 的費用為 ¥0.3，與 GPT-4o-mini 相比，在相同成本下處理 3.6 倍的內容。細節捕捉與複雜理解在超長上下文中，能準確捕捉隱藏訊息，回答複雜問題，並找到大量上下文中的關鍵資訊。優良的長文本理解能力：在複雜的長文任務（如 LV-Eval、LongBench-Chat）中表現優於 GPT-4o-mini。可處理超過 128K Token 的任務場景。 Qwen2.5-Turbo 支援的上下文長度是 GPT-4o-mini 的 8 倍，但短文字任務表現幾乎無損。推理速度時間優化：在 100 萬 Token 輸入下，首次產生 Token 的時間縮短至 68 秒，提升 4.3 倍（原為 4.9 分鐘）。稀疏注意力機制：顯著壓縮計算量，效率提升 12.5 倍。硬體相容性：在多種硬體配置下都能提供穩定的推理速度。性價比高效率計算：在相同成本下，Qwen2.5-Turbo 處理的 Token 數是 GPT-4o-mini 的 3.6 倍。每處理 100 萬 Token 的費用僅為 ¥0.3。 5. 綜合評價優於同類競品：在長文本任務中超越 GPT-4 和其他同類模型。任務適應性強：兼具長文本理解的深度與短文本處理的精準性。推理效率高：無論在超長文本或複雜任務中，都能以更快的速度完成。

阿里雲推出Qwen-2.5-Turbo：刷新100萬Token上下文新高度閱讀全文 »

OpenAI 官宣！ChatGPT 成為學生寫作神器，指南教你規範使用！

AI日報

OpenAI 官宣！ChatGPT 成為學生寫作神器，指南教你規範使用！引言使用得當，ChatGPT 可以成為一個強大的工具，幫助學生培養嚴謹思維和清晰寫作的技能，幫助他們思考想法、掌握複雜概念並獲得草稿回饋。如果使用得當，ChatGPT 可以成為一個強大的工具，幫助學生培養嚴謹思維和清晰寫作的技能，幫助他們思考想法、掌握複雜概念並獲得草稿回饋。反作用還有一些使用 ChatGPT 的方法會對學習產生反作用，例如產生一篇論文而不是自己撰寫，這剝奪了學生練習、提高技能和處理材料的機會。有效使用 ChatGPT 的方法引用格式化：利用 ChatGPT 自動化引用格式的處理，節省時間，專注創意和論證。快速了解新主題：ChatGPT 可協助學生快速掌握新領域的基礎知識，作為研究的起點。提供研究建議：ChatGPT 可推薦相關學者、資源和搜尋關鍵字，但仍需查閱原始文獻。深入理解複雜概念：透過提問，學生能解決理解上的疑惑，深化對複雜話題的理解。結構回饋：ChatGPT 幫助學生審查論文結構，改善邏輯流暢度。倒寫大綱：幫助學生透過倒寫大綱來評估論文的邏輯性和結構清晰度。對話思維發展：像蘇格拉底對話一樣，透過與 ChatGPT 的互動，提升思維深度。驗證論點：透過反駁挑戰，幫助學生發現論文論點中的潛在漏洞。歷史思想家視角：學生可藉由 ChatGPT 扮演歷史思想家的角色，從不同角度檢驗論點。寫作回饋：ChatGPT 提供持續回饋，幫助學生改善論文品質。語音模式閱讀伴侶：語音模式幫助學生在閱讀時提供即時解釋，提升理解。技能磨練：透過 ChatGPT 的回饋，學生可持續辨識並改善自己的思考和寫作能力。學術誠信：使用 ChatGPT 時應保持透明，並引用對話內容，確保學術誠信。

OpenAI 官宣！ChatGPT 成為學生寫作神器，指南教你規範使用！閱讀全文 »

Context Autopilot 震撼登場！全球首個上下文 AI 辦公助手，效率革命開始！

AI日報

Context Autopilot 震撼登場！全球首個上下文 AI 辦公助手，效率革命開始！ https://aipier.com.tw/wp-content/uploads/2024/11/11月14日-1.mp4 Context Autopilot 是由 Context 公司推出的一款 AI 辦公室助手，旨在透過先進的人工智慧技術提升工作效率。它能夠像人類一樣思考、學習，並使用使用者習慣工具來完成日常的工作任務。Autopilot 由全球首個情境引擎驅動，旨在無縫整合使用者現有的工作流程，支援多種資訊處理工作。 ▐ 自動化工作流程整合：Autopilot 可以連接到多種資料來源（如 SharePoint、Google Drive），並像同事一樣與文件合作。它具有完整的辦公室套件、瀏覽器、程式碼編輯器等功能，能夠進行深度研究和專案規劃。在處理複雜任務時，Autopilot 可以自動產生計畫文件、執行多步驟資料分析，甚至根據使用者需求建立財務模型和視覺化圖表。 ▐ 自適應的智慧協作：當面臨不確定的任務時，Autopilot 會主動向使用者請求指導，實現「人機協同」式的互動。這種協作模式支援任務並行處理，提高了生產效率。透過即時回饋機制，Autopilot 可以在使用者批准後自動產生投影片和報告，最終將成果匯出為 PowerPoint 等格式。 ▐ 代理人群體（Swarms of Agents）：Autopilot 能夠在大專案中「自我複製」產生多個微型代理（mini-pilots），共同分工完成複雜任務。這樣一來，系統能夠在保持高效率的同時，實現複雜任務的智慧分配與執行。 ▐ 實際應用能力：競爭對手分析與市場洞察：Autopilot 能夠利用瀏覽功能取得競爭對手資訊與市場分析。金融資料收集：它還可以選擇連接到如 CapIQ 等資料來源，收集財務資料。上下文引擎的使用：Autopilot 使用上下文引擎將其推理與個人和公司的需求對齊，並能夠回憶與任務相關的所有資訊。 Context 的 Autopilot 系統在 HELMET 128k 基準上達到了 90.5% 的狀態（提高了 24%），在 LOFT 1M 基準上達到了 98%（提高了 26%）。這些提升使得大型語言模型（LLM）在長文本理解能力上有了顯著的增強。 ▐ 主要功能特點： 1. AI 驅動的作

Context Autopilot 震撼登場！全球首個上下文 AI 辦公助手，效率革命開始！閱讀全文 »

Final Cut Pro 11 重磅升級！AI 自動摳圖 + 秒生成字幕，剪輯更輕鬆！

AI日報

Final Cut Pro 11 重磅升級！AI 自動摳圖 + 秒生成字幕，剪輯更輕鬆！ https://aipier.com.tw/wp-content/uploads/2024/11/twittervid.com_ilyamiskov_b4f0ee.mp4 蘋果發表 Final Cut Pro 11，這次重大更新為專業影片編輯帶來了先進的 AI 驅動功能、太空影片編輯支援和多項工作流程改進。 ▐ 新增的 AI 功能介紹： 1. 磁性遮罩（Magnetic Mask）：磁性遮罩功能利用 AI 技術自動辨識人和物體，讓使用者可以輕鬆隔離影片中的特定元素，而無需使用綠幕或手動摳圖。這項功能的優勢在於：．自動背景分離：無需繁瑣的手動操作，AI 可以快速識別和分離影片中的人物或物體，簡化影片製作流程。．靈活的背景替換：使用者可以替換背景或添加影片特效，創造獨特的視覺效果。．精準的色彩控制：磁性遮罩還可與色彩校正工具結合使用，幫助使用者精準調整畫面中不同部分的顏色，提升影片的整體效果。 2. 自動產生字幕（Transcribe to Captions）：自動產生字幕功能利用 AI 技術將影片中的語音內容即時轉錄為字幕，省去了手動添加字幕的繁瑣過程。該功能的主要亮點包括：．快速轉錄：自動將語音轉換為文本，並同步到時間軸，產生準確的閉合字幕（closed captions）。．支援多語言：這項功能由蘋果訓練的大語言模型驅動，具有高準確度，適用於不同語言的轉錄需求。．提升無障礙性：自動生成字幕不僅幫助影片更易於理解，也提升了影片的無障礙存取性，方便聽障人士觀看。 ▐ 其他 AI 功能亮點除了磁性遮罩和自動生成字幕外，Final Cut Pro 11 還包含了以下智慧功能：．智慧適配（Smart Conform）：自動將影片裁切為適合社群媒體的方形或垂直螢幕格式，方便在不同平台發佈。．自動色彩增強（Enhance Light and Color）：智慧調整影片的色彩、對比和亮度，讓畫面更清晰、更明亮。．平滑慢動作（Smooth Slo-Mo）：自動產生額外的幀，使慢動作影片更加流暢，尤其適合高幀率的慢動作拍攝。．語音去噪（Voice Isolation）：透過 AI 技術去除背景噪音，增強影片中的人聲效果，讓對話更加清晰。 Final C

Final Cut Pro 11 重磅升級！AI 自動摳圖 + 秒生成字幕，剪輯更輕鬆！閱讀全文 »