Salesforce Einstein Vision 開発者ガイド：Apexによる画像認識の実装

背景と応用シナリオ

Salesforce 開発者として、私たちは常にデータとビジネスプロセスを連携させ、よりスマートで効率的なアプリケーションを構築する方法を模索しています。近年、AI (人工知能) の進化は目覚ましく、特に画像認識技術は多くの業界で革命をもたらしています。Salesforce プラットフォーム上でこの力を活用するために提供されているのが Einstein Vision です。

Einstein Vision は、AI を活用した画像認識サービス群であり、開発者は最小限の労力でアプリケーションに高度な画像分析機能を組み込むことができます。例えば、次のようなシナリオが考えられます。

フィールドサービス: 現場の技術者が設置した機材の写真を撮影し、それが正しいモデルであるか、または損傷がないかを自動的に検証する。
小売業: 顧客がソーシャルメディアに投稿した写真から自社製品を特定し、関連するマーケティングキャンペーンやサポートケースを自動生成する。
保険業: 事故車両の写真から損傷の程度を自動で分類し、保険金請求プロセスを迅速化する。
製造業: 生産ライン上の製品画像を分析し、欠陥品をリアルタイムで検出する。

これらのシナリオは、これまで手作業で行われていたプロセスを自動化し、ヒューマンエラーを削減し、顧客満足度を向上させる大きな可能性を秘めています。この記事では、Salesforce 開発者の視点から Einstein Vision の基本原理を解説し、Apex を用いて画像認識を実装する方法を具体的に紹介します。

原理説明

Einstein Vision を利用するにあたり、いくつかの重要な概念を理解しておく必要があります。Einstein Vision の中核をなすのは、Dataset (データセット) と Model (モデル) です。

Dataset (データセット)

データセットは、モデルをトレーニングするための画像の集合です。例えば、「猫」「犬」「鳥」を分類するモデルを作成したい場合、それぞれのカテゴリに属する多数の画像を準備し、それらをラベル付けしたデータセットを作成します。データの質と量が、最終的なモデルの精度を大きく左右します。データセットは ZIP ファイルとしてアップロードするか、個々の画像 URL を指定して作成します。

Model (モデル)

モデルは、データセットを基にトレーニングされた AI の頭脳です。トレーニングプロセスを通じて、モデルは画像内のパターンや特徴を学習します。トレーニングが完了すると、モデルは未知の画像がどのラベルに属するかを予測 (Prediction) できるようになります。Einstein Vision には主に2種類のモデルがあります。

Einstein Image Classification (画像分類): 画像全体が何であるかを分類します。例えば、写真が「風景」なのか「建物」なのか「人物」なのかを判定します。一つの画像に対して、複数のラベルを確率とともに返すことも可能です。
Einstein Object Detection (物体検出): 画像内のどこに、何があるかを特定します。画像内の特定のオブジェクトの位置をバウンディングボックス（境界線）で示し、そのオブジェクトが何であるかをラベル付けします。例えば、棚に並んだ商品の中から特定のブランドの製品だけを見つけ出すようなケースで利用されます。

トレーニングと予測のフロー

開発者が Einstein Vision を利用する際の一般的なフローは以下の通りです。

準備: Einstein Platform Services アカウントを有効化し、秘密鍵を取得します。
データ収集: モデルの目的に応じた高品質な画像を収集・整理します。
データセット作成: 収集した画像とラベルを使用してデータセットを作成します。これは UI または API 経由で行えます。
モデルのトレーニング: 作成したデータセットを基にモデルをトレーニングします。トレーニングが完了すると、一意の Model ID が発行されます。
予測 (Prediction): 発行された Model ID を使用して、Apex や REST API 経由で新しい画像を送信し、予測結果（ラベルと確率）を受け取ります。

本記事では、特に開発者が最も関わるであろう「5. 予測」の部分に焦点を当て、Apex コードでの実装方法を詳しく見ていきます。

サンプルコード

ここでは、事前にトレーニングされた画像分類モデル（Model ID が与えられていると仮定）を Apex から呼び出し、指定した URL の画像を分類するサンプルコードを紹介します。このコードは、Salesforce が提供するネイティブの `EinsteinVision` Apex クラスを利用しています。

前提条件

Einstein Platform Services アカウントの設定: Einstein Platform Services のサインアップページからアカウントを作成し、秘密鍵 (einstein_platform.pem ファイル) をダウンロードします。
認証設定: Salesforce 組織で、Einstein Vision への認証を行うための名前付き認証情報 (Named Credential) を設定します。JWT を使用した認証設定が推奨されます。
リモートサイトの設定: Apex から外部の画像 URL にアクセスするために、そのドメインをリモートサイト設定 (Remote Site Settings) に登録しておく必要があります。
モデルの準備: 分類したい対象に合わせて、事前にデータセットを準備し、モデルをトレーニングしておきます。トレーニングが完了すると、`1A2B3C4D` のような形式の Model ID を取得できます。

以下の Apex コードは、特定の画像 URL とモデル ID を受け取り、その画像の分類結果を返すシンプルな例です。

public class EinsteinVisionController {

    /**
     * @description 指定された画像URLをEinstein Visionで分類し、最も確率の高いラベルを返します。
     * @param imageUrl 分析対象の画像の公開URL
     * @return 最も確度の高い予測ラベル名。予測失敗の場合はnullを返します。
     */
    public static String classifyImageUrl(String imageUrl) {
        // 分析に使用する事前にトレーニング済みのモデルID
        // 実際には、カスタム設定やカスタムメタデータ型から取得することを推奨します。
        String modelId = 'FoodImageClassifier'; // ここに実際のモデルIDを入力します

        try {
            // EinsteinVision.PredictionService のインスタンスを作成します。
            // 'einstein_vision_api' は、事前に設定した名前付き認証情報の名前です。
            EinsteinVision.PredictionService service = new EinsteinVision.PredictionService('einstein_vision_api');
            
            // predictUrlメソッドを呼び出して、画像分類を実行します。
            // 第1引数: モデルID
            // 第2引数: 画像のURL
            // 第3引数: 予測結果を返す数 (0はデフォルト値)
            // 第4引数: モデルバージョン (空文字列は最新バージョンを使用)
            EinsteinVision.PredictionResult result = service.predictUrl(modelId, imageUrl, 0, '');

            // 予測結果がnullでなく、かつ確率リストが空でないことを確認します。
            if (result != null && !result.probabilities.isEmpty()) {
                
                // 最も確率の高い予測を取得します。
                // probabilitiesリストは確率の高い順にソートされています。
                EinsteinVision.Probability firstPrediction = result.probabilities[0];

                // 予測結果をデバッグログに出力します。
                System.debug('Prediction successful!');
                System.debug('Label: ' + firstPrediction.label);
                System.debug('Probability: ' + firstPrediction.probability);

                // 最も確度の高いラベル名を返します。
                return firstPrediction.label;

            } else {
                System.debug('Einstein Vision returned no predictions.');
                return null;
            }

        } catch (Exception e) {
            // APIコールアウトの失敗やその他の例外を捕捉します。
            System.debug('Error calling Einstein Vision API: ' + e.getMessage());
            System.debug('Stack Trace: ' + e.getStackTraceString());
            return null;
        }
    }
}

このコードは、`EinsteinVision.PredictionResult` オブジェクトで結果を受け取ります。このオブジェクトには `probabilities` という `EinsteinVision.Probability` オブジェクトのリストが含まれており、それぞれが `label` (ラベル名) と `probability` (0.0 から 1.0 の間の確率) を保持しています。コードでは、最も確率の高い最初の結果のラベルを返しています。

注意事項

Einstein Vision をアプリケーションに組み込む際には、以下の点に注意する必要があります。

権限 (Permissions)

Einstein Vision の機能を利用するユーザーには、適切な権限セットが必要です。

Einstein Vision and Language Model Manager: データセットの作成、モデルのトレーニング、モデルの管理など、管理者向けの操作を行うユーザーに割り当てます。
Einstein Vision and Language User: トレーニング済みのモデルを使用して予測 API を呼び出すだけのユーザー（API ユーザーなど）に割り当てます。

API 制限 (API Limits)

Einstein Vision の API には利用制限があります。例えば、1ヶ月あたりに行える予測の回数には上限が設けられています。無料版と有料版で上限は異なります。大規模な実装を計画する前には、必ず最新の Salesforce Einstein の価格と制限に関するドキュメントを確認し、アプリケーションのトラフィックが制限内に収まるか評価してください。制限を超過すると API 呼び出しが失敗するため、使用状況の監視も重要です。

エラー処理 (Error Handling)

外部サービスへの API 呼び出しには、堅牢なエラー処理が不可欠です。`try-catch` ブロックを使用して、`CalloutException` などの潜在的な例外を必ず捕捉してください。考えられるエラーシナリオは以下の通りです。

無効な URL: 画像 URL が存在しない、またはアクセスできない。
モデル ID の誤り: 存在しないモデル ID を指定した。
認証エラー: 名前付き認証情報の設定が正しくない。
API 制限超過: 月間の API コール数上限に達した。

エラー発生時には、ログに詳細を記録し、ユーザーに適切なフィードバックを返すか、再試行ロジックを実装するなどの対策が必要です。

非同期処理 (Asynchronous Processing)

Apex トリガーなどの同期的なコンテキストから直接 API コールアウトを行うことはできません。また、画像分析には時間がかかる場合があります。そのため、Einstein Vision へのコールアウトは `@future(callout=true)` アノテーションを付けたメソッドや、Queueable Apex を使用して非同期で実行することがベストプラクティスです。これにより、ガバナ制限（特に CPU 時間）の回避と、ユーザーエクスペリエンスの向上が期待できます。

まとめとベストプラクティス

Einstein Vision は、Salesforce 開発者が AI 駆動の画像認識機能を迅速にアプリケーションに統合するための強力なツールです。Apex ネイティブクラスを利用することで、外部 API の複雑な処理を抽象化し、わずか数行のコードで高度な分析を実行できます。

最後に、開発者としてのベストプラクティスをいくつか紹介します。

1. モデル ID の管理

コード内にモデル ID をハードコーディングするのではなく、カスタムメタデータ型 (Custom Metadata Types) やカスタム設定 (Custom Settings) を使用して管理しましょう。これにより、Sandbox と本番環境で異なるモデルを容易に切り替えたり、モデルを更新した際にコードを変更することなく対応できたりと、保守性が大幅に向上します。

2. データ品質の重視

カスタムモデルの精度は、トレーニングデータの品質に完全に依存します。「Garbage in, garbage out（ゴミを入れれば、ゴミしか出てこない）」の原則を忘れないでください。多様で、偏りがなく、正確にラベル付けされた大量のデータを用意することが、成功への鍵です。

3. 予測結果のキャッシュ

同じ画像に対して何度も予測 API を呼び出すのは、API 制限を消費する上で非効率です。特に、製品カタログの画像など、頻繁に分析されるが結果が変わらない画像については、初回の予測結果をカスタムオブジェクトなどに保存（キャッシュ）し、次回以降は API を呼び出さずにキャッシュした結果を利用する設計を検討してください。

4. 継続的なモデルの改善

一度モデルを構築して終わりではありません。ビジネスニーズの変化や、新たなデータが蓄積された際には、モデルを再トレーニングして精度を向上させることが重要です。予測結果が期待と異なった場合にユーザーがフィードバックを提供できる仕組みを構築し、それを次のトレーニングデータとして活用するサイクルを作ることが理想的です。

Einstein Vision を活用することで、開発者は Salesforce プラットフォームの可能性をさらに広げ、データに基づいたインテリジェントなソリューションを提供できるようになります。ぜひ、この強力なツールをあなたの次のプロジェクトで試してみてください。

にゃんこのSalesforce日記

このブログを検索