|
本日、Modelersは、Step-Video(ビデオ生成)とStep-Audio(音声)が開発したオープンソースのマルチモーダル大規模モデル2つをリリースし、Huawei Ascend CANN異種コンピューティングアーキテクチャとAscendサーバーに基づくモデルの適応を完了したことを発表しました。 開発者や企業ユーザーは、Molo コミュニティで直接ダウンロードして体験できます。 Step-Video-T2Vは現在、パラメータ数において世界最大のオープンソース動画生成モデルであり、300億パラメータに達します。毎秒204フレーム、解像度540pの高品質動画を直接生成できます。 Step-Video-T2Vが以前に発表した評価結果によると、その指示コンプライアンス、動作の滑らかさ、物理的合理性、美しさの面での性能は、市場にある既存の最高のオープンソースビデオモデルを大幅に上回っています。一方、Step-Audioは、さまざまな感情、方言、言語、歌唱スタイル、パーソナライズされた音声スタイルを生成できる、業界初の製品レベルのオープンソース大規模音声インタラクションモデルです。 Jieyue Xingchen は最近行われたエコシステム オープン デーで、3 月にグラフ生成ビデオ モデルもオープンソース化することを明らかにしました。 中国電信クラウドとファーウェイが共同で構築したMoloコミュニティは、AI開発者やテクノロジー愛好家に対し、モデル、データセット、開発ツールチェーン、アプリケーションのためのワンストップホスティングおよびデモンストレーションサービスを提供しているとのことです。モデルとアプリケーションのデモンストレーションを容易にするため、コミュニティは無料のコンピューティングパワーサポートも提供しており、ユーザーは複雑な環境設定を必要とせずに、オンラインでモデル推論を体験し、AIソリューションを迅速に検証できます。 現在、主要な技術コミュニティは、Jieyue Xingchenの2つのオープンソースマルチモーダルモデルをリリースしています。Moleコミュニティに加え、ModelScopeコミュニティ、Gitee AI、HuggingFace、Replicateプラットフォームでも体験できます。 さらに、Jieyue Xingchenオープンソースは、チップ企業、クラウドベンダー、スマート端末メーカー、クリエイタープラットフォームなどの注目を集めています。天樹智信、アリババクラウド、Volcano Engine、TCL、LiblibAI、Huanrui Centuryなど、各業界のベンチマーク企業がJieyue Xingchenオープンソースエコシステムに参加しています。 |
Step Starry Sky プラットフォームに適合した Huawei Ascend のマルチモーダル オープンソース モデルが、Molo コミュニティでリリースされました。
関連するおすすめ記事
-
DeepSeek は Claude をステッチし、R1/o1 単体よりも優れたパフォーマンスを発揮します。(GitHub で 3,000 回閲覧)
-
2024年 中国オープンソースパイオニア33:人々の心に寄り添うオープンソースの人物たち
-
最大1440倍高速化!GCNを用いて確率計画法を15秒で解く - 中国科学院オートメーション研究所の新たな成果がICML 24に選出されました。
-
Huawei の Qiankun Intelligent Driving System と HarmonyOS Cockpit が MPV に初搭載されました。新型 Voyah Dreamer がデビューしました。
-
たった今、地球上で「最強」のヒューマノイドロボットが公開されました!OpenAIを搭載し、すでにBMWで稼働しています。
-
フェリックス・ヒルの最後の手紙が明らかに:18か月かけて書かれた、AIの天才の苦悩と別れ。