あなたは、自分や知っている誰かにそっくりなAI生成画像をどのように作るかを考えたことがありますか?それが5ドル未満でできるとしたらどうでしょうか?FluxAIの力を借りて、数回のクリックで驚くほどリアルな画像を生み出すパーソナライズされたモデルを構築できます。このチュートリアルは、自分の写真を完全にコントロールできるAIモデルに変換するための完全な無駄のないガイドです。
このステップバイステップのチュートリアルを終えると、データセットを作成し、微調整を行い、最終推論を実行するという3つの簡単なフェーズで、ゼロからモデルをトレーニングできるようになります。プロフェッショナルなヘッドショットを作成したい方でも、AI生成アートを試してみたい方でも、このガイドがすべてのプロセスを案内します。Replicate上でOostris AI Lora Toolkitを使用します。
注意:FLUX Lora、Pro、Dev、およびSchnell を使用して作品のために超リアルな画像を生成したい場合、私は素晴らしいウェブサイトを見つけました。Anakin Aiを紹介します。すべてのFLUXモデルを商業的に無料で使用できるオールインワンプラットフォームです。




1. データセットの作成

画像の収集と準備
FluxAIモデルをトレーニングする最初のステップは、包括的な画像セットを集めることです。これらの画像の品質と多様性は、モデルのパフォーマンスを形作る上で重要な役割を果たします。
- 画像の数

広範な実験とオンラインAIコミュニティからのフィードバックに基づき、Flux Luraモデルはわずか10枚の画像でも良好な性能を発揮します。しかし、結果の不一致を避けるために、15枚以上の画像の使用は推奨されません。
- 画像の多様性

さまざまなポーズ、角度、背景を広範囲にわたって含めることが重要です。これにより、モデルが様々な特徴を捉え、最終出力の品質が向上します。
- 気を散らす要素を避ける
特定のアクセサリーや小道具など、画像に繰り返しまたはユニークな要素がないことを確認してください。これらはトレーニング中に不要なバiasを持ち込む可能性があります。例えば、被写体が常に同じ眼鏡をかけている画像を使用すると、モデルを混乱させるかもしれません。
画像を収集した後は、フォルダに保存してZIPファイルに圧縮します。この圧縮ファイルがモデルのトレーニングデータセットとして使用されます。
オプション:結果向上のためのキャプションデータセットの作成
さらに良い結果を求める方のために、各画像のキャプションデータセットを作成することがモデルのパフォーマンスを大幅に向上させることができます。たとえば、ある画像が木の下に立っている人を描写している場合、キャプションは「木の下に立っている人」のようなものであるべきです。これらのキャプションは.txtファイルに保存する必要があります。しかし、このステップをスキップした場合は、Replicateのインターフェースが自動的にキャプションを生成します。
2. モデルの作成と微調整

Replicateでのモデル設定
- モデルの作成:Replicateのウェブサイトにアクセスし、新しいモデルを作成します。このモデルはプレースホルダーとして機能し、ユーザーがデータセットをアップロードし、設定をカスタマイズできます。今後の参照を簡単にするために、モデルには記憶に残る名前を選択してください。
- 画像のアップロード:新しいモデルにトレーニング画像を含むZIPファイルをアップロードします。
- トリガーワードの定義: トリガーワードは、この特定のモデルを呼び出すためのユニークな識別子です。特定の個人については「photo_of_danush」や、クリエイティブなアプリケーションには「artistic_style」のように、個別の言葉やフレーズを選択します。
トレーニングパラメータの設定
トレーニング期間は、ステップ数と利用可能な計算能力に依存します:
- ステップ数:バランスが取れて安全な結果を得るには、1,500~2,000ステップでモデルをトレーニングすることをお勧めします。2,000ステップの場合、H100 GPUを使用して約45分かかりました。1,200や1,500などの少ないステップを選ぶことで、トレーニング時間とコストを削減できます。
- 自動キャプション生成:手動キャプションデータセットが利用できない場合は、自動キャプション生成機能を有効にします。これにより、Replicateがアップロードされた画像のためにキャプションを生成します。
- トリガーワードの確認:トリガーワードが正しく設定されていることを確認してください。これは、モデルが入力プロンプトに基づいて画像を解釈し生成する方法に影響を与えます。
Hugging Faceへのモデルの保存(オプションですが推奨)

トレーニングされたモデルをHugging Faceのモデルハブに保存することは、より簡単なアクセスや共有オプションなど、多くの利点を提供します:
- Hugging Faceのプロフィールに新しいリポジトリを作成します。

2. 記述権限トークンを生成し、それをReplicateの設定に貼り付けます。

3. Hugging FaceのリポジトリとReplicateからのトレーニングモデルをリンクします。

この設定により、モデルが安全に保存され、今後の使用に簡単にアクセスできることが保証されます。
3. モデルの推論とテスト
さまざまなプラットフォームでのモデルの実行
モデルがトレーニングされると、ユーザーはそのパフォーマンスをテストできます。モデルはReplicate上で直接実行できますが、より柔軟な環境を提供するプラットフォームもあります:
- Google Colab:コーディングに慣れている方や、よりカスタマイズ可能な設定を求める方に最適です。
- ローカルマシン:必要なハードウェアが利用可能な場合、モデルをダウンロードしてローカルマシンで実行できます。
- Hugging Face:Hugging Faceに保存されたモデルは、さまざまなAIプラットフォームの入力として使用できます。
Lura強度の調整
Lura強度パラメータは、最終画像生成に対する微調整モデルの影響を決定します:
- 高Lura強度:トレーニング画像に非常に似た出力が得られます。
- 低Lura強度:基本モデルと微調整モデルのバランスを取り、より一般的な外観を生成します。
各プロジェクトのために適切なバランスを見つけるために、異なるLura強度で実験することをお勧めします。
プロンプトでのモデルのテスト
事前に定義されたトリガーワードを使用して、モデルは異なるプロンプトに基づいて無限の画像バリエーションを生成できます。たとえば:
- プロンプト1: 空を飛ぶスーパーマンのdanushの写真

- プロンプト2: DanushのプロフェッショナルなLinkedInヘッドショット、DSLR品質の写真

FluxAIモデルは、単純なプロンプトに従い、最小のプロンプト詳細でも高品質な画像を生成するのが得意です。
FluxAIモデルの追加使用例
FluxAIモデルをトレーニングすることは、基本的なポートレート作成を超えたさまざまな使用例を提供します:
- プロフェッショナルヘッドショット:モデルは、LinkedInのようなビジネスプロフィールのために一連のプロフェッショナルヘッドショットを生成するために使用できます。
- クリエイティブプロジェクト:クリエイティブプロジェクトやSNSコンテンツのためにスタイライズされた画像を生成します。
- 芸術的スタイルの転送:デジタルアートやブランディング目的のために、異なる芸術スタイルを再現するためにモデルを使用します。
注意:FLUX Lora、Pro、Dev、およびSchnell を使用してあなたの作品のために超リアルな画像を生成する
Anakin Aiを紹介します。すべてのFLUXモデルを商業的に無料で使用できるオールインワンプラットフォームです。


結論
FluxAIを使用してAIモデルをトレーニングすることは、個別の画像を生成する可能性を解き放つ簡単でコスト効果の高いプロセスです。最小限の時間とお金の投資で、高品質のAIモデルを作成し、特定のニーズに応じてカスタマイズし、プロの写真サービスに関連するコストを回避できます。
この詳細なガイドは、カスタムAIモデルを作成し、さまざまなプラットフォームでテストし、将来の使用のために安全に保存するために必要なすべての手順を提供します。このプロセスに従うことで、ユーザーは個人プロジェクトとプロフェッショナルプロジェクトの両方のためにモデルをトレーニングでき、使えるツールを手に入れることができます。
AI生成画像やモデルに取り組むことを希望する方々にとって、このガイドは始めるための包括的なリソースとなります。
楽しいトレーニングを!