World Labs:李飛飛的空間智能公司正式成立

史丹佛大學教授李飛飛的新公司 World Labs 成功融資 2.3 億美元。 李飛飛被譽為“AI教母”,她的公司獲得了 Andreessen Horowitz、NEA 和 Radical Ventures 等投資者的支持。 World Labs 公司的估值超過 10 億美元,這些資金分兩輪募集,間隔幾個月完成。 World Labs 計劃在 2025 年推出首款產品,World Labs 的目標是開發能夠理解三維世界並與之互動的 AI 模型,稱之為「大型世界模型」。這些模型將供藝術家、設計師、開發者和工程師等專業人士使用。 Andreessen Horowitz 的合夥人 Martin Casado 表示,這些客戶可能包括遊戲公司或電影工作室。 什麼是空間智能? 空間智能是人類智能的一個重要方面,它讓我們能夠理解和與周圍世界互動。透過空間智能,人類能夠在腦海中建立視覺圖像,並將這些圖像轉化為現實世界中的事物,例如從簡單的沙堡到高樓大廈等。 World Labs 認為,人工智慧在未來將幫助人類建立更好的世界。雖然 AI 的進展已經很快,但我們目前只看到了生成式 AI 革命的初步階段。目前的 AI 主要依靠語言模型和透過文字生成圖像和影片的模型,但這還只是冰山一角。要進一步提升 AI 的能力,World Labs 認為我們需要開發能夠處理 3D 空間和時間的智慧 AI 模型。 World Labs 的願景 World Labs 的使命是透過開發「大型世界模型」(Large World Models,LWMs)來賦予 AI 豐富的空間智能,使其能夠感知、生成並與 3D 世界進行互動。目標是將當前 2D 平面的 AI 模型擴展到完整的 3D 虛擬和現實世界。人類的空間智慧經歷了數千年的演化,而 World Labs 希望能夠在這場快速進展的時代,短期內賦予人工智慧這種能力。 World Labs 的最終願景是透過這些具備空間智慧的 AI 模型,為使用者(如藝術家、設計師、開發者和工程師)提供工具,幫助他們在虛擬空間中進行創作和編輯。這些 AI 模型不僅能產生 3D 世界,還能處理其中的實體、語意和控制,讓人們自由創造和探索虛擬世界。 公司目標 World Labs 的目標是在未來開發越來越強大的模型,這些模型將具備更廣泛的能力,可以應用於各種領域,與人類一起工作和創新。

World Labs:李飛飛的空間智能公司正式成立 閱讀全文 »

Bland AI:宣布獲得1,600 萬美元 A 輪融資

Bland AI宣布,獲得了由 Scale Venture Partners 領投的 1,600 萬美元 A 輪融資。到目前為止,Bland AI 的總融資額已達 2,200 萬美元,其他投資者包括 Y Combinator 以及一些知名天使投資人,如 PayPal 創辦人 Max Levchin、Eleven Labs CTO Piotr Dąbkowski 和 Twilio 創辦人 Jeff Lawson 等。 Bland AI是什麼: Bland AI 是一個專為企業設計的人工智慧電話平台,可協助公司創建和管理智慧電話代理。這些代理商可以取代人工客服處理大量電話呼叫,如客戶支援、銷售和預約等任務。透過自動化這些常見的電話互動,Bland AI 使企業能夠降低營運成本,提高效率,並改善客戶體驗。 主要功能: 1.應用場景廣泛:  無論是銷售、客戶支援、或經營,Bland AI 都可以根據企業的需求進行客製化設定。使用者可以選擇任意語音或語言,並透過類似員工培訓的方式教導 AI 處理各種對話。 2.無縫集成:  Bland AI 支援與任何系統的集成,可以輕鬆集成到企業現有的工具中,並且能夠從文檔中獲取信息,並在必要時轉接到人工服務。支援自動轉接至人工、預約會議、發送文字訊息、更新 CRM 等功能。 3.企業專用:  Bland AI 提供客製化基礎設施,即使在高流量時段,企業的系統也能保持穩定。此外,Bland 還提供詳細的通話分析和工具客製化服務,幫助企業優化電話代理的效能。 4.通話記錄與分析:  提供通話記錄、通話後的分析,並支援基於企業現有資料訓練 AI。 5.無限的通話擴充:  支援語音複製、多語言以及 AI 測試系統。 6.效率提升:  Bland AI 可以 24/7 全天候工作,處理大量電話,同時根據企業的特定需求進行訓練,以提高整體效率。 Conversational Pathways 程式語言: Bland AI 開發了一種專門的程式語言,稱為Conversational Pathways。這個語言的特點是能夠將對話流程分解成多個節點,從而減少AI可能出現的誤解或“幻覺”,確保AI代理在與客戶互動時能夠準確地回應。 使用Bland AI的獨特程式語言“Conversational

Bland AI:宣布獲得1,600 萬美元 A 輪融資 閱讀全文 »

Consensus 完成 1,150 萬美元 A 輪融資

AI 學術搜尋引擎 Consensus 宣布完成 1,150 萬美元的 A 輪融資。本輪融資由Union Square Ventures領投,其他參與者包括Nat Friedman、Daniel Gross、Draper Associates和Kevin Carter等知名投資人。 Consensus 是基於 AI 的學術搜索,使研究人員和學術從業者能夠更快、更準確地找到相關研究論文。透過 Consensus,使用者可以搜尋超過 2 億篇研究論文,涵蓋科學和學術領域的各個方面。 自2022年冬季上線以來,Consensus的月活躍用戶已超過40萬,並預計在2024年實現了600%的成長,年化收入達到150萬美元。 Consensus 是什麼? Consensus 是一個基於 AI 的學術搜尋引擎,致力於透過語言模型(LLMs)和專用的搜尋技術(如向量搜尋)來呈現最相關的學術論文。它不僅能夠提供主題層級的見解,還能深入分析單篇論文的內容,所有內容都與真實的研究論文連結。 搜尋範圍: Consensus 目前的搜尋範圍涵蓋了超過 2 億篇研究論文,這些數據主要來自 Semantic Scholar 資料庫,涵蓋科學的各個領域。數據每月更新,並將持續增加新的數據。 適用人群: 學生與研究者:加速文獻綜述過程,快速了解目前研究方向,找到最有價值的論文。 醫師與臨床醫師:取得可信賴的病患問題答案,分享易於理解的訊息,並輕鬆引用參考文獻。 健康與健身專家:查閱有關補充劑安全性、飲食類型和運動科學結果的科學依據。 搜尋查詢格式: 單字搜尋:用於學習某個主題或概念,如「酪梨」或「癌症」。 概念關聯:了解兩個概念之間的關係,如「鎂與睡眠」或「維生素C與感冒」。 問答搜尋:例如「睡眠不足是否會增加阿茲海默症的風險?」。 搜尋結果的確定: Consensus 使用自訂的語言模型分析整個研究論文庫,從每篇論文中提取關鍵結論,並結合引文數量、研究設計、發表日期等元資料重新排名結果,以確保提供最相關的前20個結果。 Consensus Copilot 功能: Consensus Copilot 提供類似 ChatGPT 的功能,能夠回答問題、起草內容、建立清單等。與生成式LLMs不同,Copilot 直接連接到科學研究,每個結果都可連結到對應的研究論文。 學術功能: 搜尋過濾器:根據樣本量、

Consensus 完成 1,150 萬美元 A 輪融資 閱讀全文 »

Exa AI:真正的AI搜尋引擎 要做AI領域的Google

又一個AI搜尋引擎誕生:Exa AI。該公司最近宣布獲得了1700萬美元的A輪融資,由Lightspeed領投,Nvidia的NVentures和Y Combinator參投。 與其他旨在取代Google的AI驅動搜尋引擎不同,Exa的目標是創建一個專門為AI設計的搜尋工具。 Exa的使命: 網路包含人類的集體知識,但目前的搜尋體驗更像在垃圾場中導航,而非在知識圖書館中漫遊。核心問題是網路知識被大量資訊掩埋。Exa的使命是組織世界的知識,透過更好的搜尋演算法,過濾訊息,提取真正的知識。 Exa的技術優勢: Exa是首個網路級神經搜尋引擎,使用端對端的Transformer技術(與ChatGPT相同的技術)進行過濾,按意義而非關鍵字進行篩選。 例如,搜尋「startups working on climate change」在Exa上能返回真正從事氣候變遷工作的新創公司,而不是優化關鍵字的無關頁面。 模型訓練: Exa 的模型訓練資料集包括網頁上的共享鏈接,而非單純的文字和句子。這使得其搜尋引擎更能理解和預測網頁連結的相關性。 Exa的搜尋引擎不只是預測下一個詞,而是預測下一個相關連結。這意味著它的模型訓練不是基於自然語言的連續詞序列,而是基於網頁連結的關係和結構。 換句話說,它的模型學習如何從一個連結導航到下一個相關鏈接,而不是產生連貫的文字。 Exa 的訓練方法專注於預測最相關的鏈接,避免了傳統搜尋引擎中的SEO垃圾和AI生成的低品質內容。 主要功能和特點: 語意搜尋:Exa的搜尋引擎能夠理解語意意義,而不僅僅是關鍵字匹配,從而提供更相關的搜尋結果。 內容抓取:可以從任何網頁抓取完整、清理後的內容,為AI提供高品質的資料。 相似性搜尋:透過URL或長文本找到相似的結果,使得搜尋更精準。 大規模資料處理:能夠處理多達100萬個搜尋結果,滿足AI大規模資料處理的需求。 即時更新:每分鐘爬取新的URL,確保AI始終取得最新的數據。 強大的過濾功能:可按網域名稱、日期範圍或資料類別進行搜索,提供高度客製化的搜尋體驗。 簡單的API整合:Exa 提供簡單易用的API,開發者只需幾行程式碼即可整合和使用Exa的搜尋功能。 Exa AI的技術原理 1. 嵌入模型: 定義: 嵌入模型(embedding models)是將文字轉換為高維度數值向量(embedding)的模型。這

Exa AI:真正的AI搜尋引擎 要做AI領域的Google 閱讀全文 »

Morph Studio:將Stability AI生成的影片片段編織成一部電影

Morph Studio最近引入了一個創新的工具,允許用戶將Stability AI生成的視訊片段編織成一部電影。這個同名工具採用故事板形式,使用者可以透過輸入不同場景的文字提示來創建和編輯鏡頭,並將它們組合成一個連貫的敘事。 這個創作過程得益於Morph與Stability AI的合作關係,而Morph計劃最終為用戶提供多種生成視訊模型以供選擇。 Morph將產生、編輯和剪輯跨接的過程稱為「工作流程」。使用者可以在Morph的創作者社群中分享他們獨特的生產工作流程,其他人可以透過更改AI提示簡單地複製和修改這些範本。 目前,Morph約有10名員工,並已從百度創投募集到250萬美元的資金。 主要功能包括: 文字轉影片的轉換:Morph Studio擁有自己的文字到影片模型,允許使用者透過輸入文字描述來產生影片片段。這意味著創作者可以將他們的創意、故事或任何文字概念轉換成視覺內容。 故事板工具:平台提供了一個類似故事板的工具,使用戶能夠透過輸入不同場景的文字提示來創建和編輯鏡頭,然後將它們組合成一個連貫的敘事。這項功能簡化了故事構思和視覺呈現的過程。 與Stability AI的合作:Morph Studio與Stability AI的合作加強了其影片生成的能力,利用Stability AI產生的影片片段來豐富用戶的創作。這種合作為用戶提供了更廣泛的創意資源和靈活性。 生成、編輯和剪輯工作流程:Morph Studio將生成影片、編輯和剪輯定義為一個連續的“工作流程”,使得創作過程更加流暢。用戶可以在一個平台上完成從創意到最終影片製作的所有步驟。 分享工作流程:Morph Studio鼓勵使用者在其創作者社群內分享他們獨特的生產工作流程,其他使用者可以透過更改AI提示來複製和修改這些範本。這促進了創意的交流和分享。 AI驅動的電影製作新工作流程:Morph Studio透過AI技術改變了傳統電影製作的多個階段,將拍攝、編輯和後製融為一體一個連續的過程。這使得創作者能夠快速迭代和優化他們的作品。 Morph的聯合創始人徐懷哲(音譯)在接受TechCrunch採訪時表示:「拍攝、編輯和後製過去是傳統電影製作中的獨立步驟,但AI模糊了這些階段的界限,將其變成了一個連續的過程。 徐懷哲是一隊來自香港科技大學的電腦視覺博士輟學生團隊的一員,他們在2023年創立了Morph

Morph Studio:將Stability AI生成的影片片段編織成一部電影 閱讀全文 »

環球音樂與 AI音樂新創公司 SoundLabs合作 將為歌手客製化自己語音克隆模型

環球音樂集團(UMG)與AI音樂技術公司SoundLabs合作,將為歌手和藝術家提供創建自己語音克隆模型的技術。 歌手和藝術家可以使用SoundLabs的MicDrop功能,透過提供數據來產生自己的語音模型,並且可以自由控制這些模型的使用權。這些語音克隆不會對外開放。 除了只是複製聲音之外,MicDrop還提供了一種語音轉樂器功能,類似於能夠讓鍵盤聽起來像吉他或鼓的功能。 MicDrop也提供語言轉移功能,幫助藝術家在全球發行任何語言的歌曲,而不會有語言障礙。 MicDrop的主要功能 語音模型創建: 藝術家可以使用他們提供的數據來創建自己的語音模型。這些語音模型的創建和控制權完全由藝術家掌握,確保其所有權和使用權歸屬明確。語音轉樂器功能: MicDrop能夠將語音轉換為不同的樂器聲音,這類似於使鍵盤聲音聽起來像吉他或鼓。這項功能為音樂創作提供了更多的靈活性和創意空間。 語言轉換功能: MicDrop提供語言轉換功能,幫助藝術家將歌曲翻譯成不同語言,從而突破語言障礙。 這將使藝術家能夠在全球範圍內發布音樂,擴大其受眾群體。 保護藝術家權利: MicDrop中的語音模型不會對外開放,確保藝術家的虛擬肖像不會被濫用。 藝術家對這些模型的所有權和使用權完全掌控,防止未經授權的使用。 oundLabs由葛萊美提名的製作人、作曲家和軟體開發者BT創立,他曾與多位知名藝術家合作。 SoundLabs的團隊還包括獲獎的軟體開發者Joshua Dickinson和Dr. Michael Hetrick,他們擴展了AI在音樂創作中的應用。 UMG和SoundLabs也共同發布了《AI音樂創作原則》,呼籲在音樂創作中負責任地使用AI技術。 資料來源:https://www.rollingstone.com/music/music-news/umg-startsai-voice-clone-partnership-with-soundlabs-1235041808/

環球音樂與 AI音樂新創公司 SoundLabs合作 將為歌手客製化自己語音克隆模型 閱讀全文 »

API 兩名高中生創建的 AI 新創公司 獲得50萬美元投資

幾週前,18歲的Christopher Fitzgerald和Nicholas Van Landschoot剛從高中畢業。 在大多數同齡人在大學或工作前的最後一個暑假裡享受生活時,Fitzgerald和Van Landschoot則在科羅拉多州博爾德的創投辦公室裡忙碌。 他們在這個夏天專注於他們的新創公司APIGen,因為他們從Varana Capital籌集了50萬美元的種子前投資。 Fitzgerald將在秋天前往賓州州立大學,而Van Landschoot將搬到大學附近,但他決定暫停大學計劃,全職投入新創公司。 APIGen 的主要功能 APIGen是一個使用生成式AI(GenAI)從簡單的書面提示產生API的平台。使用者可以透過輸入指令來產生各種類型的API,包括連接資料庫的API、複雜的業務邏輯API和適用於物聯網設備的API。產生的API可以下載原始碼或立即部署。 1.客製化API產生: 從提示產生API:使用者只要輸入自然語言提示,APIGen就能產生完整的API,包括路由、模式和內部功能。業務邏輯產生:能夠建立具有自訂功能和業務邏輯的複雜API。例如,一個電子商務企業可以簡單地要求一個API來連接其網頁前端和資料庫,APIGen就可以產生這個API。 2.程式碼匯出與部署: 程式碼匯出:使用者可以點擊按鈕下載設定檔和完整的API程式碼。 即時部署:APIGen即將推出的功能,讓使用者將API無縫部署到APIGen的雲端伺服器,處理所有DevOps相關的工作。 3.整合與連接: 資料庫整合:支援與外部資料庫和第三方API的集成,方便資料存取和操作。 複4.雜功能支援: APIGen不僅產生標準的API,還可以建立具有多步驟或串列任務的複雜客製化API。 這些API可以包含業務邏輯和客製化功能,滿足特定需求。 5.動態修改: 程式碼修改:使用者可以在開發過程中隨時修改程式碼,以滿足具體需求。 6.文檔產生: API文件:為每個API產生簡單易懂的文檔,方便使用者理解和使用。 7.目標應用領域: 電商業務:例如,電商網站可以請求一個API,將其前端和資料庫連接起來。 物聯網(IoT)設備:例如,一個使用者可以要求一個API,控制無人機飛行並拍攝周圍環境的影像,並將結果傳輸給另一個應用程式。 安全系統:例如,使用者可以要求一個臉部辨識API,連接智慧鎖,透

API 兩名高中生創建的 AI 新創公司 獲得50萬美元投資 閱讀全文 »

Hebbia:用AI一次可以處理多達數百萬份文檔

Hebbia是一家利用生成式AI進行大型文件搜尋並返回答案的新創公司。該公司近日獲得了由Andreessen Horowitz領投的近1億美元B輪融資。此次融資使公司估值達到了7億至8億美元。 Hebbia的AI技術能夠在短時間內瀏覽數十億份文檔,包括PDF、PowerPoint、電子表格和轉錄內容,並返回具體答案,主要面向金融服務公司,如對沖基金和投資銀行,同時也適用於律師事務所和其他專業領域。 Hebbia被大型企業、金融機構、政府和法律事務所廣泛使用,幫助這些機構處理和分析大量資料。 主要功能特點 1. Matrix AI代理 功能:Matrix AI 能夠回答關於所有文件的問題,一次可以處理多達數百萬份文件。 優點:無需依賴只能一次處理一個檔案的大型語言模型(LLMs),或僅限於顯示少數結果的搜尋系統。 Matrix AI 提供了更全面、更有效率的文件搜尋和處理能力。 2.工作流程執行 功能:Matrix AI 設計用於執行包含數百個步驟的複雜工作流程,無論資料來源有多少。 優勢:將使用者的提示轉化為具體的工作流程,大大提高了工作效率和準確性,使用戶能夠在處理大規模資料和複雜任務時更加得心應手。 3.可信賴的AI 功能:Matrix 展示每個步驟的工作流程,使用者可以驗證和信任 AI 的每一個決策。 優點:與其他黑箱系統不同,Matrix 提供了高度的透明度,使用戶能夠更放心地與 AI 進行協作,確保結果的可靠性和可驗證性。 4.多重文件類型支援 功能:Hebbia 的 AI 可以瀏覽和分析各種類型的文檔,包括PDF、PowerPoint、電子表格和轉錄內容。 優點:能夠處理多種格式的文檔,使其應用範圍更加廣泛,並滿足不同領域使用者的需求。 5.高效資料處理 功能:能夠快速處理和分析大量文檔,提供精確答案。 優點:顯著節省了使用者在文件搜尋和資料分析上的時間,提高了工作效率。 Hebbia 由 George Sivulka 於 2020 年創立,當時他正在史丹佛大學攻讀電機工程博士學位。 Sivulka 的靈感來自於他在金融業工作的朋友,這些朋友告訴他,他們漫長工作週的一部分時間都花在了搜尋美國證券交易委員會文件和其他密集文件中的資訊。 Sivulka 認為,人工智慧可以幫助他們節省辦公時間,讓他們有更多時間休息和睡眠。該公司表示,Hebbia 的人工智慧

Hebbia:用AI一次可以處理多達數百萬份文檔 閱讀全文 »

返回頂端