ここでは、2023年からオーディオ生成のための最新のAIモデルを追跡します!
日付 | 解放 | 紙 | コード | トレーニング済みモデル |
---|---|---|---|---|
30.01 | SingSong:歌から伴奏を生成する | arXiv | - | - |
30.01 | AudioLDM: 潜在拡散モデルを用いたテキストから音声への生成 | arXiv | ティッカー | 抱きしめる顔 |
30.01 | Moûsai:ロングコンテクスト潜在拡散を伴うテキストから音楽への生成 | arXiv | ティッカー | - |
29.01 | メイクアンオーディオ:プロンプト拡張拡散モデルによるテキストからオーディオへの生成 | - | - | |
28.01 | ノイズ2ミュージック | - | - | - |
27.01 | レイブ2 | arXiv | ティッカー | - |
26.01 | MusicLM:テキストから音楽を生成する | arXiv | - | - |
18.01 | Msanii:わずかな予算でのハイファイ音楽合成 | arXiv | ティッカー | ハグフェイスコラボ |
16.01 | アーキサウンド:拡散を伴うオーディオ生成 | ティッカー | - | |
05.01 | VALL-E:ニューラルコーデック言語モデルはゼロショットテキスト読み上げシンセサイザーです | arXiv | - | - |