|
今年6月、Stability AIはStable Diffusion 3シリーズ初のオープンソース版となるStable Diffusion 3 Mediumを誇りを持ってリリースしました。このバージョンは画像生成において確かに一定の進歩を遂げましたが、ポートレートやディテールの生成には依然として課題が残っています。 Stability AIは、数ヶ月にわたる綿密な改良と最適化を経て、Stable Diffusion 3.5モデルシリーズを新たにリリースしました。このシリーズは、Large(8B)、Large Turbo(8B)、Medium(2.6B)の3つのバージョンで構成されています。中でも、Stable Diffusion 3.5 Largeはシリーズ最強のモデルで、80億のパラメータを誇り、最大100万ピクセルの解像度の画像を生成できるだけでなく、より幅広いスタイルの画像も生成できます。分析によると、Stable Diffusion 3.5 Largeは、迅速な順応性において市場をリードし、生成画像の品質においてはより大型のモデルに匹敵することが示されています。 異なるモデルのプロンプト語遵守能力と画像生成品質の比較 HyperAI チュートリアル セクションに「Stable-Diffusion-3.5-Large Image Generation Demo」が追加されました。これにより、コマンドを必要とせず、ワンクリックでクローンをすぐに体験できます。 表紙画像のすべての要素は、Stable Diffusion 3.5 Large を使用して生成されました。 チュートリアルアドレス: https://go.hyper.ai/JiAMY デモ実行中
HyperAI 限定招待リンク (コピーしてブラウザに直接貼り付けてください): https://openbayes.com/console/signup?r=Ada0322_QZy7
効果のデモンストレーション
「安定した拡散チュートリアル交換グループ」を作成しました。ぜひご参加いただき、さまざまな技術的な問題について議論し、アプリケーションの経験を共有してください。 WeChat で Hyperai01 (WeChat ID: Hyperai01) を追加し、「SD Tutorial Exchange Group」とメンションしてグループ チャットに参加します。 |
オンラインチュートリアル | 優位性を取り戻す: Stable Diffusion 3.5 多様なスタイルの画像を簡単に生成
関連するおすすめ記事
-
OpenAI が緊急に新機能を追加: ChatGPT に Deep Search が追加され、30 分後に 10,000 語の継続的な思考を実証し、「人類最後のテスト」のチャートでトップに立った。
-
2024年のvLLMへの旅:清華大学卒業生のvLLM開発パス
-
波に挑め!第3回ジェネレーティブAIアプリケーションイノベーションチャレンジが本日開幕。
-
自動車業界最大の AI「ダークホース」である Geely 社が独自に開発した大規模音声モデルは、最先端 (SOTA) システムを 10% 上回り、トップに立っています。
-
中国初のエンドツーエンドのユニバーサル音声モデルである Lingo のベータテストの予約が開始されました。
-
AI VenomがDouyinとXiaohongshuで話題沸騰中!Xianyuでは1回10元で販売されていますが、公式サイトではなんと無料で提供されています。