|
データホエール データホエールコンペティション 主催:Alibaba Cloud、NVIDIA 現在、大規模モデルの学習データの大部分はインターネット上の情報から得られています。しかし、大規模モデルの規模と性能が徐々に向上するにつれて、インターネット上で利用可能な膨大なデータは最終的に枯渇します。さらに、マルチモーダルな大規模モデルの場合、これらのリソースを大規模モデルの学習に適したレベルにまで引き上げるには、相当な追加処理と手動によるアノテーションが必要になります。そのため、限られた計算リソース内で、既存の強力な大規模モデルを用いて、新しいモデルの学習プロセスに必要な高品質な学習データを効率的に合成する方法が、新たな重要な課題となっています。 Alibaba Cloud と NVIDIA が主催し、Alibaba Cloud Tianchi Platform、Moda Community、Alibaba Tongyi Lab が共催する、第 4 回 Data-Juicer データ チャレンジ ( Tianchi Better Synth マルチモーダル大規模モデル データ合成チャレンジ)が正式に始まりました。 01 トーナメント紹介🎉 今回は新たな助っ人が加わりました。生データを自らクリーニングするだけでなく、既存の大規模モデルの創造力を活用して、新たな魅力的な要素を合成・創造し、成長を続けるマルチモーダル大規模モデルが、これらの先行モデルによって革新的に合成されたデータの珍味を吸収し、発展させることができるかどうかを探る必要があります。 おいしい料理の創作と生産をさらに強化するために、Data-Juicer は、BLIP-2 モデルに基づく画像からテキストへの演算子や、安定拡散モデルに基づくテキストから画像/テキストから画像への演算子など、便利なマルチモーダルデータ合成ツールと演算子を幅広く提供しています。これらのツールを使用すると、すぐに開始して、一連の革新的な材料を合成し、データ駆動型レシピを通じて料理に組み込むことができます。さらに、NVIDIA のオープンソースの大規模言語モデル推論アクセラレーションライブラリ TensorRT-LLM と、最近リリースされた NVIDIA TensorRT 10.0 によって提供される包括的なモデル最適化ライブラリ TensorRT-Model-Optimizer のおかげで、オフラインの参加者は、大規模モデルを使用して大量の高品質データを合成する際の効率を最大化する方法を探り、データ合成戦略を迅速に反復することができます。 コンテストウェブサイト: https://tianchi.aliyun.com/co... 02 賞🏆 * * このコンテストの賞金総額は130,000人民元(税抜)で、詳細は次のとおりです。 🥇優勝者(1位): 賞金50,000人民元と賞状が授与されます。 🥈準優勝(2位~3位): 賞金20,000人民元と賞状が授与されます。 🥉第3位(4位~6位): 賞金10,000人民元と賞状が授与されます。 優秀賞(7位~10位) 賞金2,500元と賞状が授与されます。 記念賞:オフラインコンテストの出場資格を得た参加者全員に、主催者が提供するスマート充電器やミニ電動パズルなどの記念品が贈られます。 参加賞:オンラインコンテストで11位から40位にランクインしたチームの各メンバーには、Alibaba CloudティーセットまたはPaipaiランプが贈られます。 共有賞:コミュニティにソリューションを投稿し、レビューに合格したチームには、チームメンバーごとに 1 つの Tmall Genie Fangtang が贈られます。 03 イベントの共有と交換👬🏻 Datawhale では、誰でも学んで参加できる、よりシンプルで使いやすいトーナメント ガイドも開発しました。さらに、チームメイトを探したり、トーナメントのテクニックを交換したりするために、トーナメントのディスカッション グループに参加することもできます。 👇コンテストディスカッショングループに参加する👇 Data-Juicer オープンソースコード: https://github.com/modelscope... Datawhale コンペティションのウォークスルー: https://datawhaler.feishu.cn/... 👇イベントに登録するには、クリックして元の記事を読んでください。 |
Alibaba CloudとNVIDIAが主催する、賞金総額13万元の大規模モデルコンテスト!
関連するおすすめ記事
-
中国車の売れ行きが好調です!BYDは1日1万台を販売、Li Autoの月間販売台数は5万台に戻り、NIOのような高級車でも2万台に達しています。
-
[TVMチュートリアル] TVMのスケジュールプリミティブ
-
5 つの強力な開発者ツールにより、「誰もが開発者」の時代が到来しました。
-
テキスト分類に LLM を使用する: ベースを選択するかチャットを選択するかを微調整します。
-
「電動リトルG」が99,800元で発売! でももう2025年なのに標準航続距離はたったの300km?
-
オンラインチュートリアル | 青島出身の焦恩俊の魂が『黒神神話』の孫悟空に転生?MuseV + MuseTalk で高品質なデジタル ヒューマンを制作。