SHD / MC Checker

MC947833 | Microsoft Purview | Communication Compliance: Detect potentially risky generative AI interactions



MC947833 | Microsoft Purview | Communication Compliance: Detect potentially risky generative AI interactions

Classification planForChange
Last Updated 12/03/2024 23:26:42
Start Time 12/03/2024 23:26:17
End Time 06/30/2025 07:00:00
Message Content

Introducing in Communication Compliance the ability to detect potentially risky generative AI interactions using Microsoft Azure AI Content Safety’s Prompt shields and Protected materials classifiers. The Prompt shield classifier can detect risk of prompt injection attacks (jailbreak) by malicious users and the Protected material classifier can identify when generative AI responses contain branded or copyrighted material so organizations can maintain content originality and protect their reputations.

This message is associated with Microsoft 365 Roadmap ID 422334.

[When this will happen:]

Public Preview: We began rolling out mid-November 2024 and expect to complete by late December 2024.

General Availability (Worldwide): We will communicate the plan for General Availability in a separate post.

[How this will affect your organization:]

Communication Compliance admins can expect two new classifiers in the trainable classifier list: Prompt shield and Protected material classifier. These classifiers are configured by default in the Detect Microsoft Copilot interactions template policy. When a policy flags a potentially risky Generative AI interaction, you can see the new classifier names listed in the Conditions detected banner:

admin controls

This change is available by default for admins to configure.

[What you need to do to prepare:]

This rollout will happen automatically by the specified date with no admin action required before the rollout. You may want to notify your admins about this feature availability and update any policies that may benefit from the new classifiers.

No action is required for the new classifiers to be enabled in your tenant. When classifiers are visible in your tenant, you can configure them in any Communication Compliance policy looking at a generative AI workload.

Learn more: The Trainable classifiers section of Create and manage communication compliance policies | Microsoft Learn (will be updated before rollout)

Machine Translation

コミュニケーション コンプライアンスでは、Microsoft Azure AI Content Safety の Prompt シールドと保護された材料の分類子を使用して、潜在的にリスクの高い生成 AI インタラクションを検出する機能を導入します。プロンプト シールド分類子は、悪意のあるユーザーによるプロンプト インジェクション攻撃 (脱獄) のリスクを検出でき、保護された素材分類子は、生成 AI 応答にブランドまたは著作権で保護された素材が含まれている場合を特定できるため、組織はコンテンツのオリジナリティを維持し、評判を保護できます。

このメッセージは、Microsoft 365 ロードマップ ID 422334に関連付けられています

[これがいつ起こるか:]

パブリック プレビュー: 2024 年 11 月中旬にロールアウトを開始し、2024 年 12 月下旬までに完了する予定です。

一般提供 (全世界): 一般提供の計画については、別の投稿でお知らせします。

[これがあなたの組織にどのように影響しますか:]

コミュニケーション コンプライアンス管理者は、トレーニング可能な分類子リストに 2 つの新しい分類子 ( プロンプト シールド保護された材料分類子) を期待できます。これらの分類子は、Microsoft Copilot インタラクションの検出テンプレート ポリシーで既定で構成されます。ポリシーで潜在的にリスクの高いジェネレーティブ AI インタラクションにフラグが付けられると、新しい分類子の名前が [検出された条件 ] バナーに表示されます。

admin controls

この変更は、管理者が既定で構成できます。

【準備に必要なこと】

このロールアウトは、ロールアウト前に管理者の操作を必要とせずに、指定された日付までに自動的に行われます。この機能の可用性について管理者に通知し、新しい分類子の恩恵を受ける可能性のあるポリシーを更新することができます。

テナントで新しい分類子を有効にするためのアクションは必要ありません。分類子がテナントに表示されている場合は、生成 AI ワークロードを調べる任意のコミュニケーション コンプライアンス ポリシーで分類子を構成できます。

詳細情報: 「コミュニケーション コンプライアンス ポリシーの作成と管理」の「トレーニング可能な分類子」セクション |Microsoft Learn (ロールアウト前に更新されます)