% Tese: Uma abordagem mecânico-estatística de dois tópicos de interesse em finanças, economia e sociologia. % Rafael S. Calsaverini % \today \beamertemplatenavigationsymbolsempty Parte 1: Teoria de dependência estatística, Cópulas e teoria de informação ========================================================================== Parte 1: Teoria de dependência estatística, Cópulas e teoria de informação -------------------------------------------------------------------------- * [Artigo](http://iopscience.iop.org/0295-5075/88/6/68003?ejredirect=migration) R. S. Calsaverini and R. Vicente. An information-theoretic approach to statistical dependence: Copula information._Europhys. Lett._ 88 68003, 2009. * URL: http://iopscience.iop.org/0295-5075/88/6/68003?ejredirect=migration * [Repositório git da tese](https://github.com/rcalsaverini/Thesis): http://github.com/rcalsaverini/Thesis Dependência estatística ----------------------- * Independência estatística: $P(x,y) = P(x)P(y)$, ou: $$P(x|y) = P(x)$$ * Dependência completa: $P(x|y) = \delta(x - F(y))$ * Definição informal: quanta informação uma variável oferece sobre o valor de outra. * Como medir dependência? * É possível separar informação idiossincrática sobre cada variável da informação a respeito de sua dependência? Correlação ---------- * Módulo usualmente empregado como medida de dependência estatística. $$|\mathrm{Corr}(X,Y)| = \left| \frac{E[XY] - E[X]E[Y]}{\sigma[X]\sigma[Y]}\right|$$ * Correlação é problemática: * $\mathrm{Corr}(X,Y) \ne \mathrm{Corr}(f(X), g(Y)) $, em geral; * $\mathrm{Corr}(X,Y) = 0$ não implica que $X$ e $Y$ sejam independentes; * $\mathrm{Corr}(X,Y) = 1$ não implica que $X$ e $Y$ tenham dependência perfeita. Medidas de dependência ---------------------- * Desideratos para uma boa medida de dependência \footnote{A. Renyi. \textit{Acta. Math. Acad. Sci. Hungar.}, 10:441–451, 1959;} * $M[X,Y]$ é um funcional da distribuição conjunta; * $M[X,Y] = M[Y,X]$; * $M[X,Y]$ é mínimo $\Leftrightarrow$ $X$ e $Y$ independentes; * $M[X,Y]$ é máximo $\Leftrightarrow$ $P(X|Y) = \delta(X - f(Y))$; * $M[X,Y] = M[g(X), f(Y)]$ $\forall g, f$ monotônicas * Se $X,Y \thicksim \mathrm{Normal}(\sigma_X, \sigma_Y, \rho)$, então $M[X,Y] = f(\rho)$ Medida de dependência --------------------- * Exemplos: * $\tau$ de Kendall $$\small\tau = \mathrm{Prob}\left[(X - X')(Y-Y') > 0\right] - \mathrm{Prob}\left[(X - X')(Y-Y') < 0\right]$$ * $\rho$ de Spearman. $$\rho = \mathrm{Corr}(\mathrm{rank}(X), \mathrm{rank}(Y))$$ Informação Mútua ------------------- * Definição $$I(X,Y) = \int \mathrm{d}x\mathrm{d}y\; p(x,y) \log\frac{p(x,y)}{p(x)p(y)}$$ 1. "Distância" \footnote{divergência de Kullback-Leibler: $\int p(x)\log\frac{p(x)}{q(x)} \;\mathrm{d}x$} entre a distribuição conjunta e a variedade de distribuições fatoráveis 2. Valor esperado da divergência KL entre $p(x)$ e $p(x|Y = y)$ 3. Valor esperado da redução na entropia de $X$ ao se obter o valor de $Y$ * Para qualquer distribuição: $I(X,Y) \ge -\frac{1}{2} \log(1 - \mathrm{Corr}(X,Y)^2)$ Cópulas - Teorema de Sklar -------------------------- Para toda distribuição cumulativa conjunta contínua de duas variáveis $F_{X,Y}(x,y)$, com distribuições cumulativas $F_X(x)$ e $F_Y(y)$, existe uma função cópula única $C(u, v)$ tal que: $F_{X,Y}(x,y) = C(F_X(x), F_Y(y))$ * Exemplos * Arquimedianas: $C(u,v) = \psi^{-1}(\psi(u) + \psi(v))$ * Normal: $N_{\rho}(u,v) = \frac{1}{2\pi\sqrt{1 - \rho^2}}\int_{-\infty}^{\Phi^{-1}(u)} \int_{-\infty}^{\Phi^{-1}(v)} \mathrm{d} u \mathrm{d} v\; e^{-\frac{u^2 + v^2 - 2uv\rho}{2(1-\rho^2)}}$ * Densidade de cópula: * $c(u,v)=\frac{\partial^2 C}{\partial u\partial v}$ * $p_{XY}(x,y)=c(F_X(x),F_Y(y))p_X(x)p_Y(y)$ Medidas de dependência revisitadas ---------------------------------- * Desideratos para uma boa medida de dependência: * $M[X,Y]$ é um funcional da cópula, e não depende das distribuições marginais; * $M[X,Y]$ é mínimo se $C(u,v) = uv$; * $M[X,Y]$ é máximo se $C(u,v) = \max(0,u+v-1)$ ou $C(u,v)=\min(u,v)$, chamadas cópulas de Frechet-Hoeffding; * Se $C(u,v) = N_\rho(u,v)$, então $M[X,Y] = f(\rho)$ * As exigências de (Renyi, 1959) são consequencia imediata das exigências acima. Medidas de dependência e cópulas -------------------------------- * $\tau$ de Kendall: $\tau=4 \int_0^1\int_0^1 C(u,v) \mathrm{d}C(u,v)-1$ * $\rho$ de Spearman: $\rho_{S}=12 \int_0^1\int_0^1 \left[C(u,v) - uv\right] \mathrm{d}u \mathrm{d}v$ * Informação Mútua: * Entropia da cópula: $$I(X,Y) = \int \int \mathrm{d} u \mathrm{d} v \; c(u,v) \log c(u,v) = - S[c] \ge 0$$ * para a cópula normal: $I(X,Y) = -\frac{1}{2} \log(1 - \rho^2)$ * Decomposição: $H[X, Y] = H[X] + H[Y] + H[\mathrm{copula}]$ * Cópula gaussiana maximiza entropia para dada correlação linear. Problemas com a Correlação ----------------------------- * $\mathrm{Corr}(X,Y)$ depende explicitamente das distribuições marginais * $\mathrm{Corr}(X,Y)$ vs. $\rho$: correlação não é um bom estimador do parâmetro $\rho$. * $\mathrm{Corr}(X,Y)$ pode subestimar grosseiramente a dependência. Problemas com a Correlação -----------------------------  Cópulas esféricas e elipticas ----------------------------- * Distribuição esféricas e elípticas: * Distribuição $p(\vec{x})$ é esférica se $E\left[ e^{i\vec{k}\cdot\vec{x}}\right] = \psi\left(|k|^2/2\right)$ * Distribuição $p(\vec{y})$ é elíptica se $E\left[ e^{i\vec{k}\cdot\vec{y}}\right] = \psi\left(\frac{1}{2}\vec{k}\Sigma^T \vec{k}\right)$ * $\vec{X} \thicksim$ distribuição esférica $\Rightarrow \vec{Y} = A\vec{X} \thicksim$ distribuição elíptica, * Proposição: Se $C(u,v | \Sigma)$ é cópula elíptica derivada da cópula esférica $C(u,v)$, então: $$I[C(u,v|\Sigma)] = I_{0}(\Sigma) + I[C(u,v)]$$ onde $I_{0}(\Sigma) = -\frac{1}{2}\log\Sigma$ é a informação mútua de uma cópula normal com matriz de correlação $\Sigma$. Excesso de Informação Mútua - teste de normalidade na dependência ----------------------------------------------------------------- * Parte gaussiana da dependência é associada a dependência linear. * $I[X,Y] \ge -\frac{1}{2}\log(1 - \rho^2)$ para distribuições elípticas. * $\tau$ de Kendall para distribuições elípticas $\rho = \sin\left(\frac{\pi\tau}{2}\right)$ * Algoritmo de Kraskov-Stogbauer-Grassberger \footnote{Kraskov et al. Phys. Rev. E, 69:066138, 2004} Excesso de Informação Mútua - teste de normalidade na dependência -----------------------------------------------------------------  Excesso de Informação Mútua - teste de normalidade na dependência -----------------------------------------------------------------  Excesso de Informação Mútua - teste de normalidade na dependência -----------------------------------------------------------------  Cópula t - ajuste ----------------- * Método de "moment matching" via $\tau$ de Kendall e informação mútua * Distribuição t de Student $\to$ Cópula t $$p_{t}(x,y\mid \rho, \nu) = \frac{\Gamma(1+\frac{\nu}{2})}{\Gamma(\frac{\nu}{2}){\pi\nu\sqrt{1-\rho^2}}}\left[1+ \frac{x^2+ y^2 - 2\rho xy}{(1-\rho^2)\nu}\right]^{-(1+\frac{\nu}{2})}$$ * fat tails, tail dependency, $t(\rho, \nu) \to \mathrm{Normal}(\rho)$ quando $\nu\to\infty$ * Cópula $t$: $$C_{T}(u,v|\nu, \rho) = \int_{-\infty}^{t_\nu^{-1}(u)} \int_{-\infty}^{t_\nu^{-1}(v)} \mathrm{d} x \mathrm{d}y \; p_{t}(x, y \mid \rho, \nu)$$ Cópula t - ajuste ----------------- * Se $\vec{x} \sim t(\rho, \nu)$, então $I(x_1, x_2, \ldots, x_n) = n H_{1}(\nu) - H_n(\nu)$ * $H_{n}(\nu)$ pode ser calculada usando um truque similar ao truque de réplicas $\log(x) = \lim_{a\to\infty}\frac{\partial}{\partial a} (x^a)$ * Informação mútua: $I(\nu) = 2\log\left(\sqrt{\frac{\nu}{2\pi}}B\left(\frac{\nu}{2},\frac{1}{2}\right) \right) - \frac{2+\nu}{\nu} + (1+\nu)\left[ \psi \left(\frac{\nu+1}{2}\right) - \psi \left(\frac{\nu}{2}\right) \right]$ * Ajuste: * $\rho$ é ajustado medindo $\tau$ * $\nu$ é ajustado medindo $I(X,Y)$ * Simulação: * excesso de informação mútua com relação à distribuição normal vs. $\nu$ * $I_\text{excess}$ independe de $\rho$ Cópula t - ajuste -----------------  Considerações finais -------------------- * Decomposição da dependência entre parte linear e não linear * Teste de normalidade _da dependência_ * Ajuste de cópulas empíricas a dados experimentais * Detecção de dependência não-trivial em séries temporais financeiras * Problemas com inferência de dependência baseada apenas correlação Parte 2: Um modelo para emergência de autoridade em sociedades humanas ====================================================================== Comportamento social igualitário vs. hierárquico ----------------------------------------- * Organização social - igualitária vs. autoritária * Grandes primatas (Chimpanzés, Bonobos, Gorilas) * Diversidade de comportamentos social humano * Origem da diversidade: ecológica vs. cultural. Evidências empíricas -------------------- * Evolução do comportamento social humano ("u-shaped evolution")\footnote{Knauft et al. Current Anthropology, 32:391–428, 1991.; Joyce Marcus. Annu. Rev. Anthropol, 37:25166, 2008}:  Evidências empíricas -------------------- * Ancestrais hierárquicos, paleolítico igualitário, neolítico hierárquico * Humanos modernos - relação entre tamanho de grupo e formas de organização social\footnote{Currie et al. Nature, 467(7317):801–804, Oct. 2010}. * Hipótese do cérebro social * Capacidade cognitiva vs. tamanho de grupo. Número de Dunbar ~ 150. * Pressão seletiva sobre capacidade cognitiva social\footnote{T Sawaguchi and H Kudo. Primates, 31:283–90, 1990; Robin Dunbar. Journal of Human Evolution, 20:469–93, 1992}. Evidências empíricas --------------------  Evidências empíricas -------------------- * Reverse dominance theory\footnote{Boehm et al. Current Anthropology, 34 (3):227–254, 1993; Boehm. Hierarchy in the Forest: The Evolution of Egalitarian Behavior. Harvard University Press, 2001.} * Manutenção de estruturas igualitárias em grupos de individuos com comportamento de dominância. * Reversão da dominância: candidatos a líder tem mecanismos de ascenção limitados por outros membros do grupo. * Observado em estudos de agrupamentos humanos de caçadores-coletores. Modelo baseado em agentes ------------------------- * Grupo de $n$ agentes com capacidade cognitiva limitada. * Mapa mental das relações sociais do grupo, codificado em um grafo. * Aresta conectada: relação conhecida. Aresta ausente: relação desconhecida. * Agente aprende nova informação através de observação e aprendizado social. * Aprendizado e manutenção de informação social é custoso (limitação cognitiva). * Agente deve balancear custos: * Custo cognitivo de obter, armazenar e processar informação social: $C_{c} \propto n_{e}$ * Custo Social de cometer erros de julgamento em situações sociais: $C_{s} \propto \frac{2}{n(n-1)}\sum_{i<j}L_{ij}$ Agentes isolados ---------------- * Variáveis dinâmicas do agente $k$: $$M^{k}_{ij} = \begin{cases} 1 & \text{se $i$ e $j$ estão ligados no grafo de $k$} \\\\ 0 & \text{outro caso} \end{cases}$$ * Custo total do agente $k$: $C(M^k, \alpha) = \frac{n_{\text{edges}}(M^k)}{n(n-1)/2} + \alpha \bar{L}(M^k)$ * Modelo de máxima entropia (vínculo: grafo conexo): $$P(M | \alpha, \beta) = \frac{q(M^k)}{Z(\alpha, \beta)} e^{-\beta C(M^k, \alpha)}$$ * Interpretação dos parâmetros * $\alpha$ - importância relativa entre os custos, proxy para capacidade cognitiva. * $\beta$ - intensidade de flutuações, pressão para otimização do custo total Minimização do custo ($\beta \to \infty$) ----------------------------------------- * $\alpha \gg 1$:  * $\alpha \ll 1$:  Simulações - corte do diagrama de fases ---------------------------------------  Simulações - corte do diagrama de fases ---------------------------------------  Simulações - corte do diagrama de fases ---------------------------------------  Simulações - corte do diagrama de fases ---------------------------------------  Simulações - diagrama de fases ------------------------------  Simulações - $\alpha$ crítico vs. $\beta$ -----------------------------------------  Simulações - taxa de aceitação do Monte Carlo ---------------------------------------------  Agentes em interação -------------------- * Agentes podem interagir através de "fofoca" * A simulação inclui agora $n$ grafos com $n(n-1)/2$ arestas cada * A cada passo de Monte Carlo: * com probabilidade $1-g$, há proposta de troca aleatória de uma aresta, * com probabilidade $g$, é proposta a mesma aresta do grafo de outro agente, * a alteração proposta é aceita com probabilidade $e^{-\beta \Delta H}$ * Equivale a introduzir um termo de interação $M^k_{ij} M^l_{ij}$ no custo total Simulações - muitos agentes ---------------------------  Sumário e Interpretação ----------------------- * Parâmetros de controle: $\alpha$, $\beta$ e $g$ * $\alpha$ grande: Situação social simétrica + reverse dominance theory, sistema igualitário * $\alpha$ intemediário: Grandes flutuações, situação social fluida, concentração de centralidade, dominância temporária, _primus inter pares_ * $\alpha$ pequeno, $g$ grande: Quebra de simetria, todos os grafos centrados no mesmo agente, sistema hierárquico Conclusões ---------- * Foi construído um modelo de agentes para tentar elucidar o problema da diversidade do comportamento social humano. * O modelo apresenta três parâmetros, associados (1) à capacidade cognitiva da espécie, (2) às pressões ecológicas e sociais por eficiência na minimização de custos e (3) ao nível de comunicação entre os agentes a respeito de relações sociais. * Três fases de interesse emergem nesse modelo que, à luz de outras evidências, podem ser interpretadas como formas distintas de organização social - uma igualitária, uma socialmente fluida, com constantes flutuações, e uma hierárquica. Conclusões ---------- * A existência de limitações cognitivas é suficiente, no modelo, para causar uma quebra de simetria que está na raiz da fase hierárquica. * O modelo corrobora informações empíricas: * a respeito da relação entre número de agentes e forma de organização social (Currie et al, Kennet & Winterhalder); * a respeito da relação entre pressões ecológicas e sociais nas formas de organização social (Earle, Summers). * A comparação com dados empíricos etnográficos é útil na avaliação da utilidade analítica desse modelo. Bibliografia ------------ * A. Renyi. On measures of dependence. _Acta. Math. Acad. Sci. Hungar._ , 10:441–451, 1959. * Alexander Kraskov, Harald Stögbauer, and Peter Grassberger. Estimating mutual information. _Phys. Rev. E_, 69:066138, 2004. * Bruce M. Knauft et al. Violence and sociality in human evolution. _Current Anthropology_, 32:391–428, 1991. * Joyce Marcus. The archeological evidence for social evolution. _Annu. Rev. Anthropol._, 37:25166, 2008. * Thomas E. Currie et al. Rise and fall of political complexity in island south-east asia and the pacific. Nature, 467(7317):801–804, Oct. 2010. * T Sawaguchi and H Kudo. Neocortical development and social structure in primates. _Primates_, pages 283–90, 1990 Bibliografia ------------ * Robin Dunbar. Neocortex size as a constraint on group size in primates. _Journal of Human Evolution_, 20:469–93, 1992. * Christopher Boehm et al. Egalitarian behavior and reverse dominance hierarchy [and comments and reply]. _Current Anthropology_, 34(3):pp. 227–254, 1993. ISSN 00113204. * C Boehm. _Hierarchy in the Forest: The Evolution of Egalitarian Behavior_. Harvard University Press, 2001. ISBN 9780674006911. * Douglas J. Kennett and Bruce Winterhalder. _Islands of Inquiry: Colonisation, seafaring and the archaeology of maritime landscapes, chapter Demographic expansion, despotism and the colonisation of East and South Polynesia_, pages 87–96. In Clark et al. [40], 2008. Bibliografia ------------ * T.K. Earle. _How Chiefs Come to Power: The Political Economy in Prehistory_. Antropology. Political science. Stanford University Press, 1997 * K. Summers. The evolutionary ecology of despotism. _Evolution and Human Behavior_, 26(1):106–135, 2005.