sábado, 4 de febrero de 2012

¿Porqué modelar? La respuesta de Joshua M. Epstein




Ya sea por la falta de información o simplemente porque no es una herramienta de uso común, cuando se habla de modelado de sistemas complejos todavía se puede llegar a tener una idea muy limitada del mismo, casi siempre recayendo en el tema de la predicción como su único fin. Pues bien, Joshua M. Epstein, director del Center on Social and Economic Dynamics en su discurso del Segundo Congreso Mundial de Simulación Social se dio a la tarea de extender, y por mucho, los usos y beneficios que se pueden obtener al modelar. El también Investigador Principal en Estudios Económicos de la Brookings Institution y miembro de la Facultad Externa del Santa Fe Institute tituló a su discurso con la sencilla pregunta Why Model? (¿Porque modelar?) en el cual enumera nada menos que 16 razones para usar modelos y va mas allá al explorar el uso de la analogía en el modelado como una herramienta para el avance de la ciencia, concepto por demás interesante.

Como todo buen discurso, este es breve y solo explica algunos de los 16 puntos, pero queda como una importante referencia al momento de querer ahondar en la naturaleza del modelado de sistemas complejos. Por esta relevancia Traza Digital a traducido, con el consentimiento del propio Joshua M. Epstein, por primera vez para el público hispanohablante este importante discurso, agradeciendo de antemano su gentil consentimiento y aclarando que la legibilidad en la traducción es responsabilidad solo de este Blog:


¿PORQUE MODELAR?
La empresa de modelar se remonta tan lejos como los tiempos de Arquímedes; y así también su malentendido. He sido invitado para compartir mis pensamientos sobre algunas ideas falsas perdurables sobre el modelado. Espero que al hacer esto, daré corazón a quienes aspiran a modelar y dar pausa a críticos malguiados.

¿Porqué modelar?
La primera pregunta que surge frecuentemente—algunas veces inocentemente y otras no—es simplemente "¿Porqué modelar?" Imaginando un inquisidor retórico (no inocente), mi réplica favorita es "Tu eres un modelador". Cualquiera que aventura una proyección o se imagina cómo una dinámica social se desenvuelve—una epidemia, guerra o migración—está ejecutando algún modelo.

Pero típicamente, es un modelo implícito en los que los supuestos están ocultos, su consistencia interna está sin probar, sus consecuencias lógicas son desconocidas y su relación a datos también es desconocida. Pero, cuando cierras los ojos e imaginas la dispersión de una epidemia o cualquier otra dinámica social, estás ejecutando algún modelo u otro. Es solo un modelo implícito que no has escrito (ver Epstein 2007). 

Siendo este el caso, siempre me sorprendo cuando esta misma gente me reta con la pregunta "¿puedes validar tu modelo?" La réplica apropiada es, claro, "¿Puedes validar el tuyo?". Por lo menos puedo escribir el mío para que, en un principio, sea calibrado a datos, si esto es lo que quiere decir con "validar", un término que evito de manera asidua (como buen Popperiano que soy). 

La elección entonces, no es si construir modelos; sino sobre si construir modelos que sean explícitos. En los modelos explícitos los supuestos se muestran con detalle para que podamos estudiar exactamente qué es lo que implican. Sobre estos supuestos este tipo de cosas suceden. Cuando alteras los supuestos eso es lo que sucede. Al escribir modelos explícitos permites que otros repliquen tus resultados. 

De hecho, puedes calibrar para casos históricos si es que existen datos, y puedes probarlo frente a datos actuales hasta donde sea posible la existencia de los mismos. Y, muy importante, puedes incorporar a los mejores expertos (por ejemplo en biomedicina, entografía) de una manera rigurosa. En realidad, los modelos pueden ser puntos focales de equipos en donde se involucren muchas disciplinas. 

Otra ventaja de los modelos explícitos es la factibilidad de los análisis de sensibilidad. Uno puede barrer un amplio rango de parámetros sobre un vasto rango de escenarios posibles para identificar las incertidumbres y regiones de robustez más sobresalientes y los umbrales más importantes. No veo cómo hacer eso con un modelo implícito mental. Es importante notar que en la esfera de lo político (si no en la física de partículas) los modelos no obvian la necesidad de un juicio. Sin embargo, al revelar ventajas y desventajas, incertidumbres y sensibilidades, los modelos pueden disciplinar el diálogo sobre opciones y realizar juicios ineludibles de manera más considerada.

¿Puedes predecir?
Tan pronto como estos puntos son concedidos, la siguiente pregunta surge inevitablemente: "¿Pero puedes predecir?" Por alguna razón, en el momento en que postulamos un modelo—como en una bola de cristal que puede decir el futuro—reflexivamente se presume que esa es su meta. Claro, la predicción puede ser una meta, y puede que sea factible, particularmente si uno admite que la predicción estática en las que las distribuciones estacionarias (por ejemplo de la riqueza o tamaños de epidemias) son las regularidades de interés. Estoy seguro que antes de Newton, la gente debió de haber dicho "las órbitas de los planetas nunca se van a predecir." No veo como la predicción macroscópica—pacem Heisenberg—puede ser definitiva y eternamente evitada.

Dieciséis razones aparte de la predicción para construir modelos
Pero, más al grano, puedo rápidamente pensar en 16 razones además de la predicción (por lo menos en un sentido escueto) para construir un modelo. En este espacio ofrecido, no puedo hablar de todos estos, y algunos han sido tratados de paso con anterioridad. Pero, de mi cabeza y sin ningún orden en particular, tales metas en la modelación incluyen:

1. Explicar (muy diferente a predecir)
2. Guiar la colección de datos
3. Iluminar sobre dinámicas principales
4. Sugerir analogías dinámicas
5. Descubrir nuevas preguntas
6. Promover un hábito de mente científico
7. Relacionar resultados a rangos posibles
8. Iluminar sobre incertidumbres principales
9. Ofrecer opciones de crisis en casi tiempo real
10. Demostrar ventajas y desventajas / sugerir eficiencias
11. Poner a prueba la robustez de una teoría prevaleciente a través de perturbaciones
12. Exponer conocimiento prevaleciente como incompatible con datos disponibles
13. Entrenar a practicantes
14. Disciplinar el diálogo sobre políticas
15. Educar al público en general
16. Revelar que lo aparentemente simple (complejo) es complejo (simple)

Explicación no implica predicción
Una diferenciación crucial es entre explicar y predecir. La tectónica de placas seguramente explica los terremotos, pero no nos permite predecir la hora y el lugar de su ocurrencia. La electrostática explica los rayos, pero no podemos predecir donde o cuando caerá el próximo rayo. En casi todas partes (y lamentablemente consecuente), la evolución es aceptada como la que explica la especiación, pero ni siquiera podemos predecir la cepa de gripe del próximo año. En las ciencias sociales, he tratado de articular y demostrar un acercamiento que llamo explicación generativa, en la que una explanada macroscópica—regularidades a gran escala tales como la distribución de la riqueza, patrones espaciales de asentamientos o dinámicas de epidemias—emergen en poblaciones de individuos de software heterogéneos (agentes) interactuando localmente bajo reglas de comportamiento posibles (Epstein 2006; Ball 2007). Por ejemplo, la reconstrucción computacional de una antigua civilización (los Anasazi) ha sido lograda con este acercamiento con agentes (Axtell et al. 2002; Diamond 2002) Considero este modelo como explicatorio, pero no insistiría que sea predictivo por eso. Este trabajo se impulsó con datos. Pero no creo que eso sea necesario.

Guiar la colección de datos
Sobre este punto, muchos que no son modeladores y en realidad muchos modeladores, albergan un inductivismo ingenuo que se puede parafrasear como sigue: "La ciencia procede de la observación, y luego se construyen los modelos para "representar" a los datos." La interpretación de las ciencias sociales— de la cual estoy muy familiarizado—sería una en la que primero colectamos muchos datos y luego ejecutar regresiones sobre estos. Esto puede ser muy productivo, pero no es la regla en la ciencia, en donde la teoría frecuentemente precede a la colección de datos. La teoría electromagnética de Maxwell es un ejemplo principal. La existencia de las ondas de radio fueron deducidas de sus ecuaciones. Solamente hasta entonces se buscaron...¡y se encontraron! La relatividad general predijo la desviación de la luz por la gravedad, que solo se confirmó después con un experimento. Sin modelos, en otras palabras, ¡no siempre queda claro que datos colectar!

Iluminar sobre dinámicas principales: todos los mejores modelos están equivocados
En un sentido ingenieril, los modelos sencillos pueden ser invaluables sin estar "correctos". En realidad, bajo esta luz, todos los mejores modelos están equivocados. Pero están fructíficamente equivocados. Son abstracciones iluminadoras. Creo que fue Picasso quien dijo "El arte es una mentira que nos ayuda a ver la verdad." Así es también con muchos modelos simples y hermosos: el modelo de ecosistema Lotka-Volterra, la Ley de Hooke o las ecuaciones epidémicas Kermack-McKendrick. Siguen formando los cimientos conceptuales de sus respectivos campos. Se enseñan de manera universal: practicantes maduros, sabiendo muy bien la naturaleza aproximativa de los modelos, sin embargo confían en ellos para la formación de las intuiciones más básicas de los estudiantes (ver Epstein 1997). Y esto es porque capturan comportamientos cualitativos de interés general, tales como los ciclos depredar-presa o la naturaleza de umbral no lineal de epidemias y la noción de la inmunidad de manadas. De nuevo, el asunto no es la idealización—todos los modelos son idealizaciones. El asunto es si el modelo ofrece una idealización fertil. Como George Box famosamente lo dijo "Todos los modelos son incorrectos, pero algunos son útiles."

Sugerir analogías
Es un hecho sorprendente y magnífico que una amplia y aparentemente inconexa variedad de procesos tienen formalmente modelos idénticos (es decir, todos pueden ser vistos como interpretaciones del mismo formalismo subyacente). Por ejemplo, la atracción electrostática bajo la ley de Coulomb y la atracción gravitacional bajo la ley de Newton tienen la misma forma algebraica. La diversidad física de los procesos difusivos que satisfacen la ecuación de "calor" o de los procesos oscilatorios que satisfacen la ecuación de "onda" es prácticamente ilimitada. En su Lectura Nobel de economía, Samuelson escribe que "si usted mira la firma monopólica como ejemplo de un sistema máximo, usted puede conectar sus relaciones estructurales con aquellas que prevalecen en un sistema termodinámico maximizador de entropía...la temperatura absoluta y la entropía tienen entre sí la misma relación conjugada o dual que la tasa del salario tiene al empleo o que la renta del suelo tiene a las acres del suelo." Un diagrama, en sus palabras, hace un "doble servicio, representa las relaciones económicas como también las termodinámicas." (Samuelson 1972; también ver Epstein 1997) Al desarrollar el modelo Anasazi mencionado anteriormente, mis colegas y yo hicimos una "analogía computacional" entre el bien conocido modelo Sugarscape (Epstein y Axtell 1996) y el paisaje de maíz en el cual vivieron los antiguos Anasazi.

Estoy sugiriendo que las analogías son más que hermosos testamentos del poder unificador de los modelos: son faros en un territorio oscuro e inexplorado. Por ejemplo, hay una poderosa teoría de enfermedades infecciosas. ¿Las revoluciones, o religiones, o la adopción de innovaciones se desenvuelven como las epidemias? ¿Es útil el pensar en estos procesos como formalmente análogos? Si es así, entonces una poderosa teoría pre-existente se puede llevar a un campo inexplorado, quizás conduciéndolo a un rápido avance.

Plantear nuevas preguntas
Los modelos nos pueden sorprender, volvernos curiosos y llevarnos a nuevas preguntas. Esto es lo que odio sobre los exámenes. Estos solo demuestran que puedes responder la pregunta de alguien, cuando la cosa más importante es: ¿puedes hacer una nueva pregunta? Son las nuevas preguntas (por ejemplo los problemas de Hilbert) las que producen grandes avances, y los modelos nos pueden ayudar a descubrirlas.

De militancia ignorante a ignorancia militante
Para mí, sin embargo, la contribución más importante de la empresa del modelado—tan distinto de cualquier modelo particular o técnica de modelado—es que hace cumplir un hábito mental científico, el cual caracterizaría como uno de ignorancia militante—un compromiso de hierro a un "yo no sé." Esto es, todo el conocimiento científico es incierto, contingente, sujeto a revisión y falsable de principio. (Esto, claro, no significa fácilmente falsificado. Significa que uno en principio puede especificar observaciones que, si son hechas, lo falsificaría). Uno no basa creencias en autoridad, sino fundamentalmente en evidencia. Esto, claro, es una idea muy peligrosa. Nivela el campo de juego, y permite al campesino más bajo retar al gobernante mas exaltado—obviamente un riesgo intolerable.

Esto es porque la ciencia, como un modo de investigación, es fundamentalmente antitética a todos los sistemas intelectuales monolíticos. En un hermoso ensayo, Feynman (1999) habla sobre la difícilmente ganada "libertad para dudar." Nació de un largo y brutal esfuerzo, y es esencial para una democracia funcional. Los intelectuales tienen un solemne deber de dudar, y de enseñar a dudar. La educación, en su sentido más verdadero, no es sobre "un juego de habilidades vendibles." Es sobre la libertad de prejuicios y argumentos heredados de la autoridad. Esta es la más profunda contribución de la empresa del modelado. Hace cumplir hábitos mentales esenciales para la libertad.

Agradecimientos
Agradezco a Ross A. Hammond por sus comentarios perspicaces y reconozco el apoyo financiero de la National Institutes of Health MIDAS Project [GM-03-008] y el 2008 NIH Director's Pioneer Award [1DP1OD003874-01].

Referencias
AXTELL, RL, JM Epstein, JS Dean, GJ Gumerman, AC Swedlund, JHarberger, S Chakravarty, R Hammond, J Parker, y M Parker, "Population Growth and Collapse in a Multi-Agent Model of the Kayenta Anasazi in Long House Valley". Proceedings of the National Academy of Sciences, Colloquium 99(3): 7275-79.

BALL, Philip (2007), "Social Science Goes Virtual" Nature, Vol 448/9 August .

DIAMOND, Jared M. , "Life with the Artificial Anasazi," Nature 419: 567-69.

EPSTEIN, Joshua M. y Robert Axtell (1996). Growing Artificial Societies: Social Science from the Bottom Up. MIT Press.

EPSTEIN, Joshua M. (1997). Nonlinear Dynamics, Mathematical Biology, and Social Science. Addison-Wesley Publishing Company, Inc.

EPSTEIN, Joshua M. (2006). Generative Social Science: Studies in Agent-Based Computational Modeling. Princeton University Press.

EPSTEIN, Joshua M. (2007). "Remarks on the Role of Modeling in Infectious Disease Mitigation and Containment". En Stanley M. Lemon, et al, Editors, Ethical and Legal Considerations in Mitigating Pandemic Disease: Workshop Summary. Forum on Microbial Threats, Institute of Medicine of the National Academies. National Academies Press.

FEYNMAN, Richard P. (1999) "The Value of Science." En Feynman, R. P. The Pleasure of Finding Things Out. Perseus Publishing.

SAMUELSON, Paul A. (1972). "Maximum Principles in Analytical Economics. En The Collected Scientific Papers of Paul A. Samuelson, editado por y Robert Merton, Vol III, 8-9. Nobel Memorial Lecture, Dec. 11, 1970. MIT Press.









Un algoritmo computacional nos acaba de ayudar a encontrar sentido a una maraña de relaciones urbanas (y de paso hacer mejores programas de desarrollo urbano).

¿Cómo leer esta red compleja que resultó de un ejercicio ciudadano en Bahía de Los Ángeles, México? "Las fuerzas que afecta...