|
データホエール データホエールの共有 最新情報: Li Mu、出典: Quantum Bit AI専門家の李牧氏が1年以上ぶりにビリビリに復帰し、定番の学術論文朗読シリーズで「ギャップを埋める」ことに! そうです、最新の星は依然としてラマ 3.1 です。 この約18分のビデオでは、Li Mu教授がLlama-3.1の技術論文の読み方をステップバイステップで解説し、ちょっとした裏話も披露してくれます。(詳細は7分50秒あたりをご覧ください。) 彼は、Llama チームが最大モデルをトレーニングしていたとき、最初はMoE モデルと高密度モデルの両方を同時にトレーニングしたが、前者は失敗したため、最終的にはシンプルなバージョンのみをリリースしたと述べました。 大勢の大学院生が駆け寄ってきています。雰囲気を見れば彼らの元気さがわかります。 (ビデオリンクを取得) Li MuのLlama 3.1論文の詳細な読み物 https://www.bilibili.com/vide... Datawhale Llama 3.1 のデプロイメントと微調整チュートリアル (Li Mu の論文の詳細な説明付き) https://github.com/datawhalec...\_1
|
AI専門家の李牧がビリビリに帰ってきた!
関連するおすすめ記事
-
Appleの大規模モデリングにおける最新の成果:GPT-4oがユーザーの役割を演じ、シナリオにおける大規模モデルツールの使用法を検証。ネットユーザー:Siriも追いつくべきだ | オープンソース
-
人気ランキング1位を獲得したあのパンダモデルがAI製品化!わずか3ステップ、10秒でポスターを生成。商用利用も無料です。
-
Midjourneyの地位は不安定?AIマッピングに新たなダークホースが登場。4つの製品を実際にレビュー。
-
大規模モデルのセキュリティに影響を与えるものは何でしょうか?NeurIPS'24 の新しい研究では、大規模モデルの脱獄攻撃に対する新しいベンチマークと評価システムが提案されています。
-
OpenAI は推論コンピューティング能力の新しいスケーリング法を開拓し、AI PC と CPU にチャンスを創出しています。
-
Ideal Intelligent Driving の切り札: 駐車スペースから駐車スペースまでの全プロセスがオンラインで行われ、ゲートの通過も自動で行えます。