ドキュメントアクションの作成

ドキュメントアクション​は、複数の AI エンジンを使用するマルチステッププロセスで、ドキュメントをスキャンし、項目を除外して、構造化された応答を JSON オブジェクトとして返します。各ドキュメントアクションは、入力として想定されるドキュメントの種別、抽出する項目、応答から除外する項目を定義します。項目を非表示にしたり、項目を必須とマークしたり、抽出する各項目で受け入れられる最小信頼度スコアを設定したり、自然言語を使用して質問することでデータ抽出プロセスが強化および改良されるようにプロンプトを設定したりできます。

定義済みの種別をテンプレートとして使用してドキュメントアクションを作成し、必須項目、JSON 応答から除外する項目、各項目に期待される最小信頼度スコアを指定します。

また、次のような自然言語での質問を使用して、ドキュメントから特定のデータを抽出することもできます。

  • What is the subtotal amount? (小計金額はいくらですか?)

  • What is the grand total? (総計は何ですか?)

  • When is the due date? (期日はいつですか?)

  • What is the highest price? (最高価格はいくらですか?)

新しいドキュメントアクションを作成したら、レビュー担当者を追加して Anypoint Exchange にパブリッシュすると、RPA でドキュメントアクションを実行できるようになり、任意の外部システムからコールできる API も作成されます。

ドキュメントアクションを作成するときに、設定されたスキーマがアップロードされた各ドキュメントで動作することを確認してください。すべてのサンプルドキュメントで動作するようにスキーマをカスタマイズできない場合は、複数のドキュメントアクションを作成することを検討してください。たとえば、ベンダーごとに個別のドキュメントアクションを必要とするほど、複数のベンダーからの購入注文が異なっている場合があります。

ドキュメントアクションを作成するには、次のタスクを完了する必要があります。

始める前に

次のいずれかの Anypoint 権限があることを確認します。

Manage Actions (アクションの管理)

ユーザーに IDP への完全なアクセス権を付与し、デフォルトですべてのドキュメントアクションのレビュー担当者権限を割り当てます。

Build Actions (アクションの作成)

ユーザーがドキュメントアクションを作成、編集、パブリッシュし、レビュー担当者をアクションに割り当てることができるようにします。

サンプルファイルをアップロードして結果をプレビューする

新しいドキュメントアクションの作成を開始するには、サンプルファイルをアップロードして抽出プロセスをテストします。

  1. サイドバーで、​[Document Actions (ドキュメントアクション)]​ をクリックします。

  2. [Create New (新規作成)]​ をクリックします。

  3. テンプレートとして使用するドキュメントの種別を選択し、ドキュメントアクションの名前を指定して、​[Create (作成)]​ をクリックします。

  4. [Select files (ファイルを選択)]​ をクリックし、分析するサンプルファイルをアップロードします。

    ファイルは 10 個までアップロードでき、ファイルあたり 8 MB のサイズ制限があります。

  5. [Run (実行)]​ をクリックしてファイルを分析し、結果のプレビューを取得します。

ドキュメントアクションエディターには、分析したドキュメントのプレビューが表示され、見やすいようにズームインやズームアウトができます。​[Previous (前へ)]​ (​<​) ボタンと ​[Next (次へ)]​ (​>​) ボタンを使用して、ドキュメントのページを移動します。ページを切り替えると、​[Outputs (出力)]​ セクションに表示される抽出値が更新されます。

抽出された値の信頼度スコアが設定されたしきい値を下回っている場合、項目が黄色で強調表示されます。

サンプルファイルをアップロードしたら、スキーマを設定します。

抽出用のスキーマを設定する

応答で非表示にする項目、必須項目、各項目で受け入れられる最小信頼度スコアを選択して、スキーマを設定します。

  1. [Outputs (出力)]​ セクションで ​[Fields (項目)]​ をクリックし、抽出された項目名のいずれかを選択して、次の設定を定義します。

    • Visibility (表示)​: この項目を出力 JSON 結果に表示するかどうかを定義します。この項目を非表示にするには、​[Visibility (表示)]​ (​2%​) をクリックします。

    • Threshold (しきい値)​: この項目で受け入れられる最低限必要な信頼度スコア。返された ​[Confidence (信頼度)]​ の値がしきい値を下回っている場合、ドキュメントは人間によるレビューのためにキューに追加されます。

    • Required (必須)​: 項目が見つからないか抽出できない場合にドキュメントをレビューに送信するには、このオプションを選択します。

    [Focus (フォーカス)]​ (​2%​) をクリックすると、対応する項目がプレビューの中央に表示されます。

  2. ドキュメントにテーブルが含まれている場合は、​[Tables (テーブル)]​ をクリックして、テーブル列の抽出設定を定義します。

スキーマを設定したら、プロンプトをドキュメントアクションに追加します。

プロンプトを追加して結果を絞り込む

プロンプトを追加して、自然言語でドキュメントに関する質問をして抽出結果を絞り込みます。

  1. [Outputs (出力)]​ パネルで ​[Prompts (プロンプト)]​ をクリックします。

  2. [Add New (新規追加)]​ をクリックします。

  3. 必要な詳細を設定します。

    • Name (名前)​: クエリの一意の名前。

    • Instruction (指示)​: 自然言語での質問または要求。

      プロンプトは特殊文字をサポートしていません。
    • Required (必須)​: 質問に回答できない場合にドキュメントをレビューに送信するには、このオプションを選択します。

    • Confidence Threshold (信頼度のしきい値)​: ドキュメントがレビューのキューに追加されないようにするための最小許容値。

  4. [Add (追加)]​ をクリックします。

    [Add and Run (追加して実行)]​ をクリックすると、IDP は質問を保存し、ドキュメントを処理し、指定した質問の信頼度スコアとともに結果を表示します。

  5. [Save (保存)]​ をクリックします。