
可灵大模型
可灵大模型是快手推出的一款创新的视频生成工具,它通过先进的Al技术,为用户提供了一个能够将创意快速转化为视频内容的平台。
Phenaki是一个能够根据文本提示生成视频的模型,它支持随时间变化的提示,并能够生成长达几分钟的视频。
Phenaki模型通过文本提示合成现实感视频,解决了生成视频的计算成本、高质量文本-视频数据量有限以及视频长度可变等挑战。它通过联合训练大量图像-文本对和少量视频-文本示例,实现了超越现有视频数据集的泛化能力。Phenaki是首个研究生成随时间变化提示视频的模型,并且在视频的空间-时间质量和每视频标记数方面超越了文献中使用的每帧基线方法。