SHD / MC Checker

MC675959 | Microsoft Information Protection: Microsoft Purview: Exact Data Match to support multi-token corroborative evidence.



MC675959 | Microsoft Information Protection: Microsoft Purview: Exact Data Match to support multi-token corroborative evidence.

Classification stayInformed
Last Updated 11/30/2023 19:19:28
Start Time 09/19/2023 23:30:50
End Time 02/19/2024 08:00:00
Message Content

Updated November 30, 2023: We have updated the rollout timeline below. Thank you for your patience.

Exact Data Match (EDM) will support string match detection of multi-token (i.e., fields with multiple words separated by spaces or punctuation) corroborative evidence without requiring mapping Sensitive Information Types (SITs) to multi-token corroborative evidence fields.

This message is associated with Microsoft 365 Roadmap ID 124847

[When this will happen:]

Rollout will begin in mid-December 2023 (previously mid-November) and is expected to be complete by early February 2024 (previously mid-December).

[How this will affect your organization:]

With this release, multi-token corroborative evidence can be detected as a string match, without requiring it to be mapped to a Sensitive Information Type (SIT) that is able to detect that content as a single entity, which may result in more accurate EDM detection.

In some cases, it may still make sense to map a SIT to a corroborative evidence field, both to reduce latency by limiting the amount of content that needs to be compared for each match, and to eliminate some potential false positives. For example, if you have indicated multiple characters as ignored delimiters using configurable match, but still want to only detect matches on strings which are formatted with some of the delimiters or where multiple delimiters match each other.

In general, if a SIT can be accurately matched to a corroborative evidence column, it is preferred to do so rather than to rely on automatic single-word or multi-token matching.

select primary elements

[What you need to do to prepare:]

To use this feature, you need to opt-in for multi-token support for each corroborative evidence field that you want enabled. You can do this either through the new EDM UI experience (see screenshot above) or through a schema XML file update. Before doing so, you will need to first uninstall your current version of the EDM Upload Agent and download / install the latest version from: learn.microsoft.com/en-us/purview/sit-get-started-exact-data-match-hash-upload#links-to-edm-upload-agent-by-subscription-type.

Once this feature has been released, additional details will be found in our EDM public documentation:

Learn about exact data match based sensitive information types | Microsoft Learn

Machine Translation

2023 年 11 月 30 日更新: 以下のロールアウト タイムラインを更新しました。何卒ご理解のほどよろしくお願いいたします。

完全データ一致 (EDM) は、機密情報の種類 (SID) をマルチトークンの裏付け証拠フィールドにマッピングすることなく、マルチトークン (つまり、スペースまたは句読点で区切られた複数の単語を含むフィールド) の裏付け証拠の文字列一致検出をサポートします。

このメッセージは、Microsoft 365 ロードマップ ID 124847に関連付けられています

[これがいつ起こるか:]

ロールアウトは 2023 年 12 月中旬 (以前は 11 月中旬) に開始され、2024 年 2 月上旬 (以前は 12 月中旬) までに完了する予定です。

[これが組織に及ぼす影響:]

このリリースでは、マルチトークンの裏付け証拠を文字列の一致として検出でき、そのコンテンツを 1 つのエンティティとして検出できる機密情報の種類 (SIT) にマップする必要がないため、より正確な EDM 検出が得られる可能性があります。

場合によっては、一致ごとに比較する必要があるコンテンツの量を制限することで待機時間を短縮し、潜在的な誤検知を排除するために、SIT を裏付け証拠フィールドにマップすることが依然として理にかなっている場合があります。 たとえば、構成可能な一致を使用して無視する区切り文字として複数の文字を指定したが、一部の区切り文字で書式設定された文字列、または複数の区切り記号が互いに一致する文字列の一致のみを検出する場合です。

一般に、SIT を裏付けとなる証拠列と正確に照合できる場合は、自動の単一単語または複数トークンの照合に依存するのではなく、照合することをお勧めします。

select primary elements

[準備に必要なこと:]

この機能を使用するには、有効にする各裏付け証拠フィールドに対してマルチトークンサポートをオプトインする必要があります。これは、新しい EDM UI エクスペリエンス (上のスクリーンショット参照) または、スキーマ XML ファイルの更新により行うことができます。その前に、まずEDMアップロードエージェントの現在のバージョンをアンインストールし、https://learn.microsoft.com/en-us/purview/sit-get-started-exact-data-match-hash-upload#links-to-edm-upload-agent-by-subscription-type から最新バージョンをダウンロード/インストールする必要があります。

この機能がリリースされると、EDMの公開ドキュメントに詳細が記載されます。

完全データ一致ベースの機密情報の種類について学習する | Microsoft Learn (英語)