|
最近、このAI証明写真アプリが大人気になってます! ベンがハリー・ポッターの写真を何気なくアップロードすると、あっという間に青い背景の身分証明書用写真が生成されました。 さらに重要なのは、この素晴らしいツールは現在無料でオープンソースなので、誰でもすぐに使い始めることができるということです。 この素晴らしいツールはHivisionIDPhotosと呼ばれ、ここ数日 GitHub でトレンドになっており、現在 3.2K のスターを誇っています。 背景の変更だけでなく、軽量な背景削除、さまざまなサイズや用途の標準ID写真の選択、簡単に印刷できる6インチレイアウト写真もサポートしています。 すでにそれを体験した人たちは、次のように感想を述べています。 これはAIの優れた実用性の一例です。これからは、適当に写真を撮るだけで、AIが自動的に最終製品を作成してくれるようになります。 マスク氏はすでに最初の「テストユーザー」の一人となる予定だ。 ネット上では、ジャック・マー氏の息子であるラオ・マー氏が公務員試験(ドージ)を受ける際に使えるように、すでにこれを勧めたと冗談を言う人もいた。 興味深いことに、この驚くべきデバイスの開発者は、西安電子科技大学の博士課程の学生です。 皆さんに試してみます。さあ、皆さんも試してみましょう。 プロジェクトの作者はウェブページのデモを提供しており、現在中国語版と英語版の両方で利用可能です。今回は中国語版を直接使用します。 もちろん、最初のハードルは AI の画像切り取り能力をテストすることです。 「日常の写真から正式な身分証明書の写真を作成する」というシナリオを想定して、このツールが予期しないニーズに対応できるかどうかを確認してみましょう。 注意: このツールはフォーマルな服装をサポートしていないため、アップロードする写真にはフォーマルな服装を着用する必要があります。 たとえば、下の写真では背景が少し乱雑になっています。 公平に言えば、結果から判断すると、カットアウト効果はまだかなり明白であり、フォーマルな場での使用を躊躇させます。 しかし、他の写真に変更すると、切り抜きだけ見ると効果はかなり良さそうですよね? 公式サイトに掲載されている作例を見る限り、元の画像自体は非常に高品質なようです。 そこで、これからは主に費用を節約するために、このツールを使用して、ID写真を撮影した後に背景やサイズを変更できることに気付きました。 現在、公務員試験、教員資格試験、大学生のCET-4およびCET-6試験など、一般的なサイズと用途がいくつか含まれています... 簡単に印刷できる6インチレイアウト写真もございます。 ちなみに、このツールは現在、 FastAPI に基づく API サービスを提供しており、 Docker デプロイメントもサポートしているため、ユーザーはさまざまなオペレーティング システム環境でサービスを迅速に構築して実行できます。 このプロジェクトは、Linux、Windows、macOS プラットフォームで実行でき、Python 3.7 以上をサポートしています。 著者ZeYiLinによると: 画像マットモデルは、インターネット上のオープンソースのID写真データを用いてMODNetを微調整したもので、推論を高速化するためにONNXに変換されています。顔検出モデルにはMTCNNが使用されており、これもONNXに変換されています。コード全体はCPU上で許容できる時間で実行できます(ただし、最適化の余地はまだ大きく残っています)。 プロジェクトのホームページから判断すると、作者は美容フィルターや衣装カスタマイズ機能も提供することを計画しているようです。 つまり、これまでの皆さんの経験からすると、プロの証明写真として気軽にスナップ写真を撮るのと比べると、それほど良い結果にはならないということです。(運も必要ですが。) しかし、これは良いアイデアであり、さまざまな状況で個人が使用できます。 著者は西安電子科技大学の出身です。このプロジェクトの著者であるZeYiLin氏は、西安電子科技大学の電子工学学院のWu Jiaji教授の指導の下、同大学の博士課程1年生です。 彼は、SwanLab および SwanHub オープンソース コミュニティの創設者の一人でもあります。 彼の個人プロフィールによると、彼はフルスタックの仕事に情熱を注いでおり、機械学習、UI/UX、トップレベルの製品設計を楽しんでいます。 Zhihu での彼の投稿によると、HisvisionIDPhotos で使用されているアルゴリズムは、彼が以前参加した「インターネット + イノベーションと起業家精神のコンペティション」の結果だそうです。 これは私が開発した写真付き身分証明書作成アプリで使用されているコードで、中国では100万人近くが利用しています。 彼はなぜ今オープンソースを選んだのか率直に説明しました。 AIGC の波の到来により、画像ベースのコード エンジニアリングの実用的な応用例である ID 写真作成のシナリオは、やや時代遅れになりつつあります。 |
AI 搭載の ID 写真ジェネレーターが GitHub のトレンド リストでトップにランクイン。大学院入学試験、公務員試験、ビザ申請用のテンプレートが組み込まれており、クリック 1 回で生成できます。
関連するおすすめ記事
-
ビッグニュース!「AI界の拼多多」が再び登場!国産大規模AIモデルDeepSeek-V3がオープンソース公開され話題沸騰中。総学習コストは557万ドル、性能はGPT-40に匹敵。
-
オープンソースと学術評価の相乗効果に関する短い議論 | CCCFハイライト
-
オンラインチュートリアル | 史記夫人は一瞬で「四川・重慶の少女」に変身できるか?Step-Audio-TTSは音声複製・音楽合成・音声合成をワンストップで実現
-
タオ・ジ氏が率いる長安の自社開発インテリジェント運転システムは、12か月間の成績表を提出し、重慶の難関8Dインターチェンジを無事通過し、最新のフルサイズSUVでテストされている。
-
vLLM v1 リリース:推論速度が1.7倍向上!初のマルチモーダルステップワイズ推論ベンチマーク VRC-Bench が4,000ステップ以上のアノテーション付きでリリース
-
GPT-4o は、追加料金を支払うことでさらに高速化できます。新機能では、以前の 23 秒に比べて 7 秒でタスクを完了します。