7月26日,北京人工智能大模型企業智譜AI發布AI視頻生成模型“清影”,輸入幾個字到幾百個字后,清影就能在30秒內生成1440x960清晰度的高精度視頻。
“一艘巨大的古典帆船在巨浪的海面上行駛,灰蒙蒙的夜晚,月光照出藍色的光影,風浪顯得氣氛很緊張。”輸入一段文字后(俗稱Prompt),用戶可以選擇自己想要生成的風格,包括卡通3D、黑白、油畫、電影感等,配上清影自帶的音樂,就生成了充滿AI想象力的視頻片段。
據悉,清影底座的視頻生成模型是CogVideoX,采用新型DiT架構,可更高效壓縮視頻信息,以更好融合文本和視頻內容,加強其復雜指令遵從能力、內容連貫性、大幅的畫面調度等,相比前代(CogVideo)推理速度提升了6倍。除了文本生成視頻,清影也可以支持用圖片生成視頻,通過圖生視頻來實現劇情創作、短視頻創作等。同時,基于清影的“老照片動起來”小程序也同步上線,人們只需一步上傳老照片,AI就能讓凝練在舊時光中的照片動起來。
據了解,清影(Ying)的研發得到北京市的大力支持。其中,智譜清影的算力支持來自于北京亦莊人工智能公共算力平臺,該平臺5000P高性能智能算力已投入使用,通過高質量數據、高性能算力、國產軟硬件適配、模型評測、行業應用等一體化服務體系,助力人工智能技術迭代創新。
當前,北京正在打造人工智能產業高地,為智譜AI開展大模型研發提供了產業投資、算力補貼、應用場景示范、人才等全方位支持。“智譜清影在北京亦莊算力集群中誕生,未來也將應用實踐于北京亦莊廣闊的高精尖產業集群,形成大模型賦能實體經濟的新應用、新業態、新模式。”智譜相關負責人說。