Sobol Index
Variance-based sensitivity analysis, or Sobol index, is a form of global sensitivity analysis designed to identify the most influential input variables/parameters in complex computer models. In these frameworks, Sobol index are used to quantify how the variability of an input affects the variability of a model's output, as well as to determine interactions among variables. Sobol analysis is particularly useful in models with multiple parameters, where understanding which variables contribute most to the model's uncertainty is essential.
Procedure for Calculating Sensitivity Indices
The numerical procedure based on Monte Carlo methods for calculating first-order sensitivity indices and total effect indices for a model with \(k\) input factors is discussed below:
Base Sample Generation: The procedure begins by generating a \((N, 2k)\) matrix of random numbers, where \(k\) is the number of inputs and \(N\) is the base sample size. In practical terms, \(N\) can range from a few hundred to several thousand. The matrix is divided into two parts, \(A\) and \(B\), each containing \(N\) samples and \(k\) variables.
\[A = \begin{bmatrix} x_1^{(1)} & x_2^{(1)} & \cdots & x_i^{(1)} & \cdots & x_k^{(1)} \\ x_1^{(2)} & x_2^{(2)} & \cdots & x_i^{(2)} & \cdots & x_k^{(2)} \\ \vdots & \vdots & \ddots & \vdots & \ddots & \vdots \\ x_1^{(N-1)} & x_2^{(N-1)} & \cdots & x_i^{(N-1)} & \cdots & x_k^{(N-1)} \\ x_1^{(N)} & x_2^{(N)} & \cdots & x_i^{(N)} & \cdots & x_k^{(N)} \end{bmatrix}\] \[B = \begin{bmatrix} x_{k+1}^{(1)} & x_{k+2}^{(1)} & \cdots & x_{k+i}^{(1)} & \cdots & x_{2k}^{(1)} \\ x_{k+1}^{(2)} & x_{k+2}^{(2)} & \cdots & x_{k+i}^{(2)} & \cdots & x_{2k}^{(2)} \\ \vdots & \vdots & \ddots & \vdots & \ddots & \vdots \\ x_{k+1}^{(N-1)} & x_{k+2}^{(N-1)} & \cdots & x_{k+i}^{(N-1)} & \cdots & x_{2k}^{(N-1)} \\ x_{k+1}^{(N)} & x_{k+2}^{(N)} & \cdots & x_{k+i}^{(N)} & \cdots & x_{2k}^{(N)} \end{bmatrix}\]Creation of Matrix \(C\): For each variable \(X_i\), a combined matrix \(C^{(i)}\) is generated, where all columns are copied from \(B\), except the \(i\)-th column, which is copied from \(A\).
\[C_i = \begin{bmatrix} x_{k+1}^{(1)} & x_{k+2}^{(1)} & \cdots & x_{i}^{(1)} & \cdots & x_{2k}^{(1)} \\ x_{k+1}^{(2)} & x_{k+2}^{(2)} & \cdots & x_{i}^{(2)} & \cdots & x_{2k}^{(2)} \\ \vdots & \vdots & \ddots & \vdots & \ddots & \vdots \\ x_{k+1}^{(N-1)} & x_{k+2}^{(N-1)} & \cdots & x_{i}^{(N-1)} & \cdots & x_{2k}^{(N-1)} \\ x_{k+1}^{(N)} & x_{k+2}^{(N)} & \cdots & x_{i}^{(N)} & \cdots & x_{2k}^{(N)} \end{bmatrix}\]Model Output Calculation: Compute the model output for all input values in the sample matrices \(A\), \(B\), and \(C_i\), obtaining three model output vectors of dimension \(N \times 1\):
\[y_A = f(A), \quad y_B = f(B), \quad y_{C_i} = f(C_i)\]Calculation of Sensitivity Indices: The first-order sensitivity indices \(S_i\) and total effect indices \(S_{T_i}\) are calculated for each variable \(X_i\) using the model outputs:
\[S_i = \frac{\mathrm{V}[E(Y|X_i)]}{\mathrm{V}(Y)} = \frac{y_A \cdot y_{C_i} - f_0^2}{y_A \cdot y_A - f_0^2} = \frac{(1/N) \sum_{j=1}^{N} y_A^{(j)} y_{C_i}^{(j)} - f_0^2 } {(1/N) \sum_{j=1}^{N} y_A^{(j)2} - f_0^2 }\]where
\[f_0^2 = \left( \frac{1}{N} \sum_{j=1}^{N} y_A^{(j)} \right)^2\]is the mean, and the symbol (·) denotes the dot product of two vectors.
Calculation of Total Effect Indices: The total effect indices are calculated as:
\[S_{T_i} = 1 - \frac{\mathrm{V}[E(Y|X_{\sim i})]}{\mathrm{V}(Y)} = 1 - \frac{y_B \cdot y_{C_i} - f_0^2}{y_A \cdot y_A - f_0^2} = 1 - \frac{(1/N) \sum_{j=1}^{N} y_B^{(j)} y_{C_i}^{(j)} - f_0^2 } {(1/N) \sum_{j=1}^{N} y_A^{(j)2} - f_0^2 }\]Interpretação dos Índices de Sobol
1. Índice de Sobol de Primeira Ordem (Si)
O índice Si indica quanto da variabilidade da saída de um modelo pode ser explicada pela variabilidade de uma única variável de entrada Xi, mantendo as outras variáveis fixas. Em termos simples, Si reflete o efeito principal de uma variável no modelo, ou seja, quanto a variabilidade de Xi contribui para a variabilidade da saída. Se uma variável for dominante, Si será grande, indicando que a sua variação tem um impacto considerável na resposta do modelo.
2. Índice de Sobol de Efeito Conjunto (Sci1, i2, ..., is)
Os índices de Sobol de efeito conjunto, como Sci1, i2, ..., is</em></em>, medem a redução da variabilidade do modelo quando múltiplas variáveis de entrada são fixadas simultaneamente. Isso captura as interações entre as variáveis. Por exemplo, Sci1, i2 indicaria o efeito conjunto de fixar as variáveis X1 e X2, o que é útil para entender como as variáveis podem interagir para afetar a saída do modelo. Se Sci1, i2 for grande, isso sugere que a interação entre essas variáveis tem um papel importante no comportamento do modelo.</p> O índice STi</em></em> representa o efeito total de uma variável Xi, levando em consideração tanto o seu efeito direto (efeito principal) quanto as interações com outras variáveis. A relação entre ST e Si é importante: STi</em> ≥ Si</em>, sendo que a diferença STi - Si reflete o grau de interação de Xi com outras variáveis. Se STi = Si, isso significa que Xi não tem interações relevantes com outras variáveis e seu efeito é exclusivamente devido à sua variabilidade. Por outro lado, se STi for muito maior que Si, isso indica que Xi está envolvido em interações importantes, e sua contribuição para a variabilidade da saída não é completamente explicada por seu efeito direto.</p> Se STi = 0, isso significa que a variável Xi não tem efeito sobre a saída do modelo, nem por meio de efeitos principais nem por interações com outras variáveis. Ou seja, Xi pode ser fixada em qualquer valor dentro de seu domínio sem afetar a variabilidade da saída. Isso indica que Xi é irrelevante para o modelo e pode ser ignorada na análise. Para modelos aditivos, a soma dos índices de Sobol de primeira ordem Si de todas as variáveis de entrada é igual a 1. Isso significa que a variabilidade da saída pode ser completamente explicada pela contribuição dos efeitos principais das variáveis de entrada. Para modelos não aditivos, a soma dos índices será menor que 1, indicando que a variabilidade da saída é parcialmente explicada por interações entre as variáveis. A diferença 1 - ∑ Si é uma medida do impacto das interações no modelo, refletindo o grau em que as variáveis interagem de forma não aditiva. A soma de todos os índices STi é sempre maior que 1. Para modelos perfeitamente aditivos, a soma dos STi será igual a 1. Caso contrário, a soma será maior que 1, indicando que o modelo contém interações entre as variáveis de entrada que aumentam a variabilidade da saída. 3. Índice de Sobol de Efeito Total (STi)
4. Índice de Sobol Total (STi = 0)
5. Soma dos Índices de Sobol (Para Modelos Aditivos e Não Aditivos)
6. Soma dos Índices de Sobol de Efeito Total (STi)