Azure AI FoundryにおけるAnthropic Claude Serverless APIのセキュアな統合とエンタープライズ展開アーキテクチャ

Tech

【本記事はGeminiの出力をプロンプト工学で整理した業務ドラフト(未検証)です】

Azure AI FoundryにおけるAnthropic Claude Serverless APIのセキュアな統合とエンタープライズ展開アーキテクチャ

【導入】

Azure AI Foundryから提供される高性能LLMを、厳格なセキュリティ基準を満たしつつ迅速かつセキュアに本番導入する設計手法を解説します。

【アーキテクチャ設計】

本構成は、Azure AI Foundry(旧Azure AI Studio)の「Serverless API(旧Model-as-a-Service)」としてホストされるAnthropic Claudeモデルを、プライベートネットワーク(VNet)に閉じ込めた状態で利用するためのエンタープライズ向けリファレンスアーキテクチャです。

クライアントアプリケーションは、オンプレミスまたはハブVNetから、Azure AI Hubのプライベートエンドポイントを経由してAPIにアクセスします。モデルへのアクセス認証には、従来のAPIキーではなく、Microsoft Entra IDによるマネージドID(OAuth 2.0)を利用し、クレデンシャルの漏洩リスクを排除します。

graph TD
    subgraph On-Premises / Spoke VNet
        App["Client Application"]
    end

    subgraph Hub VNet
        PE["Private Endpoint"]
    end

    subgraph Azure AI Foundry Managed Network
        AIProject["Azure AI Project"]
        AIHub["Azure AI Hub"]
        Endpoint["Claude Serverless API Endpoint"]
    end

    subgraph IAM & Security
        Entra["Microsoft Entra ID"]
        KV["Azure Key Vault"]
    end

    App -->|1. Authenticate & Get Token| Entra
    App -->|2. Resolve DNS & Access| PE
    PE -->|3. Private Link| AIHub
    AIHub -->|4. Secure Proxy| AIProject
    AIProject -->|5. Invoke Model| Endpoint
    AIProject -->|Retrieve Secret/Keys| KV

【実装・デプロイ手順】

Serverless API(従量課金モデル)のデプロイは、Azure CLIおよびBicepで行います。ここでは、Azure AI Hub、Project、およびPrivate Endpointを含むネットワークインフラの構成コードを示します。

Step 1: Azure CLIによるベースリソースの作成

# 変数定義

RESOURCE_GROUP="rg-enterprise-ai-prod"
LOCATION="eastus2" # Serverless API (Claude) が利用可能なプライマリリージョン
AI_HUB_NAME="ai-hub-prod"
AI_PROJECT_NAME="ai-project-claude"

# リソースグループの作成

az group create --name $RESOURCE_GROUP --location $LOCATION

# Azure AI Hub & Project の作成(ML拡張機能を使用)

az extension add --name ml
az ml workspace create --resource-group $RESOURCE_GROUP --name $AI_HUB_NAME --location $LOCATION --kind hub
az ml workspace create --resource-group $RESOURCE_GROUP --name $AI_PROJECT_NAME --location $LOCATION --kind project --hub-id /subscriptions/xxxx-xxxx/resourceGroups/$RESOURCE_GROUP/providers/Microsoft.MachineLearningServices/workspaces/$AI_HUB_NAME

Step 2: IaC (Bicep) によるインフラ閉域化とエンドポイント定義

// ai-hub-infrastructure.bicep
param location string = resourceGroup().location
param hubName string = 'ai-hub-prod'
param projectName string = 'ai-project-claude'
param vnetName string = 'vnet-core-prod'
param subnetName string = 'snet-pe-prod'

// VNet & Subnet の既存リソース参照
resource vnet 'Microsoft.Network/virtualNetworks@2023-09-01' existing = {
  name: vnetName
  resource subnet 'subnets' existing = {
    name: subnetName
  }
}

// Azure AI Hub の定義
resource aiHub 'Microsoft.MachineLearningServices/workspaces@2024-04-01-preview' = {
  name: hubName
  location: location
  kind: 'Hub'
  identity: {
    type: 'SystemAssigned'
  }
  properties: {
    friendlyName: 'Production AI Hub'
    publicNetworkAccess: 'Disabled' // インターネット経由のアクセスを完全禁止
  }
}

// Private Endpoint の定義
resource privateEndpoint 'Microsoft.Network/privateEndpoints@2023-09-01' = {
  name: 'pe-${hubName}'
  location: location
  properties: {
    subnet: {
      id: vnet::subnet.id
    }
    privateLinkServiceConnections: [
      {
        name: 'hub-connection'
        properties: {
          privateLinkServiceId: aiHub.id
          groupIds: [
            'amlworkspace'
          ]
        }
      }
    ]
  }
}

【アイデンティティとセキュリティ】

エンタープライズ要件に基づき、強固なアクセス制御と境界セキュリティを確立します。

  1. 最小権限原則に基づくRBAC設計:

    • クライアントアプリケーションや開発者には、モデルデータプレーンへの推論アクセス専用として「Azure AI Developer」または「Cognitive Services User」ロールのみを割り当てます。

    • モデルのデプロイや削除を行うシステム管理者には「Azure AI Administrator」を付与し、責務分離(SoD)を適用します。

  2. ネットワークセキュリティ:

    • Azure AI Hubの publicNetworkAccessDisabled に設定し、すべてのデータプレーン通信をプライベートリンク経由に強制します。

    • AI Foundryとサードパーティモデルプロバイダー(MaaSバックエンド)間の通信は、Microsoftのバックボーンネットワークおよびセキュアなプロキシを介して暗号化通信されます。

  3. Microsoft Entra IDによるマネージドID統合:

    • クライアントアプリケーションは、Azure SDK(DefaultAzureCredential)を利用してマネージドIDまたはサービスプリンシパルからの一時トークンを取得し、接続します。APIキーのソースコードへのハードコードは一切排除します。

【運用・コスト最適化】

  1. 可観測性(Observability)の向上:

    • Azure AI HubおよびProjectの診断設定(Diagnostic Settings)を有効化し、API要求元、送信トークン数、応答トークン数、モデルの応答遅延などのメトリクスを「Azure Log Analytics」に転送します。

    • AmlJuiceCognitiveServicesAudit ログを有効化することで、コンプライアンス監査や不審なリクエストパターンの検知を行います。

  2. コスト最適化(Pay-as-you-go)のガバナンス:

    • Anthropic Claude Serverless APIは、プロビジョニング済みの固定帯域(PTU)とは異なり、利用したトークン数に応じた「従量課金」が適用されます。

    • 開発・検証環境: アプリケーション側に呼び出し頻度を制限する「レートリミッター」を実装し、無限ループや過剰リクエストによる意図しない課金を防止します。

    • 予算アラートの構成: Azure Cost Managementにて、AI Foundryが属するリソースグループ単位で月次予算のアラートを設定(例:予算の80%到達時に管理者へ通知)することを必須とします。

【まとめ】

  1. DNS名前解決の事前設計: Private Endpoint構築時、社内DNSやAzure Private DNS Zone(privatelink.api.azureml.ms)の名前解決が正しく構成されていないと、接続エラー(403/Name Not Resolved)の原因となるため、最初に通信経路テストを実施してください。

  2. APIキー運用の排除: セキュリティリスク低減のため、接続には原則としてMicrosoft Entra ID(マネージドID)認証を採用し、キーローテーションや静的資格情報の管理コストを削減します。

  3. リージョン依存性の考慮: ClaudeをはじめとするサードパーティモデルのServerless APIは、提供されるAzureリージョンが制限される場合があります。デプロイ先リージョンと、システム全体のネットワークトポロジ(マルチリージョンやデータ転送コスト)をあらかじめ評価してください。

ライセンス:本記事のテキスト/コードは特記なき限り CC BY 4.0 です。引用の際は出典URL(本ページ)を明記してください。
利用ポリシー もご参照ください。

コメント

タイトルとURLをコピーしました