Goku 是由中國(guó)香港大學(xué)與字節(jié)跳動(dòng)聯(lián)合推出的一款先進(jìn)的視頻生成模型,旨在通過(guò)圖像和文本的聯(lián)合生成技術(shù),推動(dòng)廣告創(chuàng)作、內(nèi)容制作等領(lǐng)域的創(chuàng)新。該模型的核心優(yōu)勢(shì)在于其革命性的 Rectified Flow Transformer 框架,不僅支持文本到圖像、圖像到視頻的生成,還能夠?qū)崿F(xiàn)文本到圖像的生成。
Goku官網(wǎng)入口網(wǎng)址:https://saiyan-world.github.io/goku/
Goku開源項(xiàng)目地址:https://github.com/Saiyan-World/goku

Goku 的官網(wǎng)地址為:https://saiyan-world.github.io/goku/ 。在官網(wǎng)上,用戶可以找到詳細(xì)的項(xiàng)目介紹、技術(shù)文檔以及在線體驗(yàn)入口。此外,Goku 的 GitHub 倉(cāng)庫(kù)也提供了完整的代碼和模型庫(kù),方便開發(fā)者進(jìn)行研究和應(yīng)用。
模型的主要特點(diǎn)包括:
- 高質(zhì)量生成:Goku能夠生成高質(zhì)量的視頻內(nèi)容,支持多種場(chǎng)景,如廣告、電商、電影預(yù)告片等。
- 低成本制作:相比傳統(tǒng)廣告視頻制作,Goku的成本降低了100倍,極大地降低了內(nèi)容創(chuàng)作的門檻。
- 多模態(tài)支持:Goku支持文本到視頻、圖像到視頻和文本到圖像的生成,能夠處理復(fù)雜的時(shí)空關(guān)系和多模態(tài)任務(wù)。
- 虛擬數(shù)字人生成:Goku可以生成逼真的虛擬數(shù)字人,展現(xiàn)自然動(dòng)作,適用于虛擬主播、客服等場(chǎng)景。
- 廣告優(yōu)化:Goku+是Goku的擴(kuò)展版本,專注于廣告場(chǎng)景,能夠生成穩(wěn)定且表現(xiàn)豐富的視頻內(nèi)容。
Goku 的應(yīng)用場(chǎng)景非常廣泛,包括但不限于廣告視頻制作、產(chǎn)品展示視頻制作以及互動(dòng)視頻生成等。通過(guò) Goku,用戶可以輕松地將文本描述轉(zhuǎn)化為高質(zhì)量的視頻內(nèi)容,極大地提升了內(nèi)容創(chuàng)作的效率和質(zhì)量。
Goku 是一個(gè)具有強(qiáng)大功能和廣泛應(yīng)用前景的視頻生成模型,其官網(wǎng)提供了全面的信息和支持,幫助用戶更好地理解和使用這一創(chuàng)新技術(shù)。