AI工具
Toucan TTS – 免費開源的文本轉語音工具,支持超7000種語言
Toucan TTS是什麼 Toucan TTS是由德國斯圖加特大學自然語言處理研究所(IMS)開發的文本到語音合成工具箱,支持超過7000種語言,包括多種方言和變體。Toucan ...
ExVideo – 阿里和華東師大推出的AI視頻長度擴展調優技術
ExVideo是什麼 ExVideo是由阿里巴巴和華東師大的研究人員推出的一種視頻合成模型的後調優技術,能夠擴展現有視頻合成模型的時間尺度,以生成更長和幀數更多的...
Diffutoon – 阿里推出的AI將視頻轉卡通風格的框架
Diffutoon是什麼 Diffutoon是由阿里巴巴和華東師大的研究人員推出的一個將視頻轉換爲卡通動漫風格的AI框架,基於擴散模型的可編輯卡通着色技術,能夠將真實感...
琴樂大模型 – 騰訊推出的AI音樂創作大模型
琴樂大模型是什麼 琴樂大模型是由騰訊AI Lab與騰訊TME天琴實驗室共同研發的人工智能音樂創作大模型,該模型通過輸入中英文關鍵詞、描述性語句或音頻,能夠直...
Unique3D – 清華大學團隊開源的圖像到3D生成模型
Unique3D是什麼 Unique3D是由清華大學團隊開源的一個單張圖像到3D模型轉換的框架,通過結合多視圖擴散模型和法線擴散模型,以及一種高效的多級上採樣策略,能...
谷歌DeepMind推出V2A技術,可爲無聲視頻添加逼真音效
在人工智能領域,谷歌旗下的DeepMind公司再次取得突破性進展,推出了一款名爲V2A(Video-to-Audio,視頻到音頻)的AI模型。該項技術能夠將視頻像素與文本提示...
Gen-3 Alpha – Runway公司最新推出的AI視頻生成模型
Gen-3 Alpha是什麼 Gen-3 Alpha是由AI視頻初創公司Runway最新發布的新一代AI視頻生成模型,通過大規模多模態訓練基礎設施,顯著提升了視頻的保真度、一致性和...
Hallo – 復旦百度等開源的AI對口型肖像視頻生成框架
Hallo是什麼 Hallo是由復旦大學、百度公司、蘇黎世聯邦理工學院和南京大學的研究人員共同提出的一個AI對口型肖像圖像動畫技術,可基於語音音頻輸入來驅動生成...
階躍星辰推出移動端AI智能問答助手躍問APP
AI工具集 6月14日消息,由微軟前全球副總裁姜大昕所創辦的人工智能初創公司階躍星辰日前宣佈上線其AI智能問答助手躍問的移動端APP,用戶可在蘋果App Store和...
MimicBrush – 阿里等開源的AI圖像編輯融合框架
MimicBrush是什麼 MimicBrush是由阿里巴巴、香港大學和螞蟻集團的研究人員推出的AI圖像編輯融合框架,允許用戶通過簡單的操作,在源圖像上指定需要編輯的區域...