|
Tritonは並列プログラミングのための言語とコンパイラです。カスタムDNN計算カーネルを効率的に記述し、最新のGPUハードウェア上で最大スループットで実行できるようにするためのPythonベースのプログラミング環境を提供するように設計されています。 Triton の中国語ドキュメントの詳細については、→ https://triton.hyper.ai/ をご覧ください。 Tritonは外部ライブラリからカスタム関数を呼び出すことができます。この例では、libdeviceライブラリを使用してasin関数をテンソルに適用します。利用可能なすべてのlibdevice関数のセマンティクスに関する詳細な情報については、以下のリンクを参照してください。
libdevice.pyでは、同じ計算を実行するもののデータ型が異なる関数をグループ化しようとしています。例えば、__nv_asinと__nv_asinfはどちらも入力の逆正弦の主値を計算しますが、__nv_asinはdouble型で動作し、__nv_asinfはfloat型で動作します。Tritonを使用すれば、tl.math.asinを呼び出すだけで済みます。Tritonは、入力と出力の型に基づいて、呼び出すべき適切なデバイス関数を自動的に選択します。 ASINカーネルデフォルトのlibdeviceライブラリパスを使用するtriton/language/math.py にエンコードされたデフォルトの libdevice ライブラリ パスを使用できます。 外: テンソル([0.4105, 0.5430, 0.0249, ..., 0.0424, 0.5351, 0.8149], libdeviceライブラリパスをカスタマイズするlibdevice ライブラリへのパスは、asin カーネルにパスを渡すことによってカスタマイズできます。 外: テンソル([0.4105, 0.5430, 0.0249, ..., 0.0424, 0.5351, 0.8149], Jupyterノートブックをダウンロード: 07-extern-functions.ipynb Pythonソースコードをダウンロード: 07-extern-functions.py 圧縮ファイルをダウンロード: 07-extern-functions.zip |
[Triton チュートリアル] Libdevice (tl_extra.libdevice) 関数
関連するおすすめ記事
-
世界有数のティア1サプライヤーが従業員7,000人を解雇。年間KPIが達成されていないことが判明し、欧州の自動車業界に衝撃が走っている。
-
オフライン イベント | AI for Science 学術フォーラムが北京で開催され、上海交通大学、浙江大学、清華大学、OpenBayes などの専門家が集まります。
-
AIでモバイルタスクの自動実行が可能に!中国の大学の最新研究により、モバイルデバイスの操作が簡素化されます。
-
SegmentFault 開発者サロンシリーズ: エコシステムの構築と未来の創造
-
「Datawhale Li Hongyi Tutorial」が1位に!
-
開発者の皆さん、チャンスを探しましょう!GDC が Love Combinator に変身し、簡単なスキャンであなたのパートナーを見つけられるようになります。