GraphReasoning – 將科學論文轉換成知識圖譜的AI應用框架
GraphReasoning是什麼 GraphReasoning是一種基於人工智能技術將大量科學論文轉換成知識圖譜的方法。通過結構化分析,計算節點度、識別社區及其連通性,評估關...
PDF2Audio – 將PDF文檔轉換成音頻博客的開源工具
PDF2Audio是什麼 PDF2Audio 是一個開源工具,能將 PDF 文檔轉換成音頻內容,適合製作播客、講座或摘要。它基於 OpenAI 的 GPT 模型生成播客腳本,通過文本到...
SafeEar – 浙大和清華聯合開源的AI音頻僞造檢測框架
SafeEar是什麼 SafeEar是由浙江大學和清華大學聯合開發的AI音頻僞造檢測框架,保護用戶隱私的同時檢測音頻僞造。採用基於神經音頻編解碼器的解耦模型,分離語...
Paradot – AI社交伴侶應用,有記憶能力個性化定製的交友AI
Paradot是什麼 Paradot是由WithFeeling.AI推出的AI伴侶應用,專注於模擬真實的社交互動提供個性化的用戶體驗。基於先進的自然語言處理技術,記住用戶的喜好和...
美圖奇想大模型 – 美圖公司推出的AI視覺大模型
美圖奇想大模型是什麼 美圖奇想大模型(MiracleVision)是美圖公司推出的一款AI視覺大模型,專注於美學創作,包括東方美學、人像和商業設計等。模型完成了視...
豆包AI視頻模型 – 字節跳動推出的AI視頻生成大模型:PixelDance和Seaweed
豆包AI視頻模型是什麼 豆包AI視頻模型是字節跳動推出的兩款AI視頻生成大模型:PixelDance 和 Seaweed 。PixelDance基於DiT結構,擅長理解複雜指令,生成連貫...
MIMO – 阿里智能研究院推出的可控角色AI視頻合成框架
MIMO是什麼 MIMO是阿里巴巴集團智能計算研究所推出的可控角色視頻合成的新型AI框架,基於空間分解建模技術,將2D視頻轉換爲3D空間代碼,實現對角色、動作和場...
Llama 3.2 – Meta推出的中小型視覺語言模型和輕量級文本模型
Llama 3.2是什麼 Llama 3.2是Meta公司最新推出的開源AI大模型系列,包括小型和中型視覺語言模型(11B和90B參數)以及輕量級純文本模型(1B和3B參數)。Llama ...
15個免費的AI視頻生成工具和軟件,視頻創作提效神器
在數字時代,視覺內容的影響力不容小覷。視頻,作爲最吸引人的媒介之一,已經成爲傳達信息、講述故事和創造影響力的強大工具。高質量的視頻製作往往需要昂貴...
Cal AI – 掃描食物熱量的APP,AI分析食物中蛋白、碳水和脂肪含量
Cal AI是什麼 Cal AI是一款基於AI技術能掃描食物熱量的APP,通過用戶拍攝食物照片追蹤卡路里和營養成分,幫助用戶管理飲食和體重。Cal AI基於先進的圖像識別...