 Con Windows Computer Cluster Server 2003 (WCC 2003), es más fácil llevar a cabo una experiencia positiva de Computación de Alto rendimiento (HPC, High-Performance Computing). Así lo atestiguan Ron Elber, de Cornell University, John Michalakes, del Centro Nacional de Investigación Atmosférica de los Estados Unidos, y Matt Wortman, de la Universidad de Cincinnati, que implementaron esta solución con el fin de ampliar la escalabilidad de sus sistemas. Esta nueva aplicación permite que los clusters que son utilizados por distintos departamentos dentro de las estructuras organizacionales, puedan aumentar su poder de procesamiento y sacar mayor provecho de los sistemas transaccionales de gran porte. Con el fin de entender la incidencia de este nuevo producto, una mesa redonda integrada por clientes como Ron Elber, profesor de ciencias de la computación en la Universidad de Cornell, John Michalakes, ingeniero de software en el centro Nacional de Investigación Atmosférica de EEUU (NCAR), y Matt Wortman, director de biología computacional y TI en el Instituto de Investigación del Genoma, de la Universidad de Cincinnati, cuentan sus experiencias utilizando Windows Computer Cluster Server 2003. ¿Cuáles son las actividades que desarrollan con Windows Computer Cluster Server 2003? Elber: En Cornell tenemos un edificio dedicado a la investigación en biología informática que brinda soporte a los grupos de biólogos. El cluster opera como plataforma para realizar trabajos de computación biológica, en un rango amplio de aplicaciones y actividades. Soportamos aplicaciones de minería de datos y otras soluciones preparadas especialmente para nuestro uso, que realizan tareas en áreas de investigaciones complejas como genética poblacional y predicciones de estructuras genéticas. Algunos de estos proyectos procesan gran cantidad de cálculos matemáticos y utilizan capacidades de las aplicaciones en forma concurrente, con tiempos de respuesta muy breves, por lo cual exigimos mucho de los sistemas. Para ello hemos desarrollado interfaces basadas en web que permiten a los biólogos e investigadores acceder a las aplicaciones aunque no tengan conocimientos acerca de la computación basada en clusters, sin dejar de aprovechar todo el poder que obtienen de esta tecnología. Michalakes: Ocho años atrás, NCAR y un número importante de organizaciones asociadas, se involucraron en una investigación acerca de la atmósfera del planeta y previsiones climáticas que requirió el desarrollo de sistemas y modelos datos que reemplazan las aplicaciones actuales. Este nuevo modelo, llamado WRF (Weather Research and Forecast), es básicamente un nuevo software diseñado bajo las pautas de funcionamiento de la computación de alto rendimiento (HPC). Esta aplicación se desarrolla y distribuye libremente en la comunidad de investigadores, y corre cientos de instrucciones a lo largo de una amplia cantidad de sistemas, desde estaciones de trabajo hasta servidores y supercomputadoras. Para nosotros, la clave de este sistema es la portabilidad sobre distintas plataformas y sus capacidades de para ser implementado en forma sencilla. Wortman: Una de las áreas clave en el Instituto de Investigación del Genoma es el descubrimiento de nuevas drogas. En las primeras etapas de este proceso, hay millones de componentes químicos que son contrapuestos con diversas enfermedades y síntomas con el fin de identificar y crear nuevas drogas. Nuestra investigación requiere informática para reducir costos, no sólo de tiempo, sino también de operación. Específicamente, usamos pantallas que simulan la interacción de millones de moléculas con distintas enfermedades, para poder evaluar cuáles componentes químicos intervienen en el desarrollo o la cura de una enfermedad. Los componentes que tienen más posibilidades de interactuar en estas simulaciones son tomados de una biblioteca de información, y luego son usados en experiencias reales, que permiten confirmar los experimentos informáticos. Esta combinación de sistemas con experimentación física es mucho más rápida y económica que la experiencia única de laboratorio, y permite obtener mejores resultados. Un trabajo típico en nuestro cluster comienza cuando una posible enfermedad es contrastada con diversos componentes, en una secuencia agendada. Hay nodos centrales que analizan y ubican en una lista de sucesos los resultados de cada simulación. ¿Qué los decidió a utilizar Windows Compute Cluster Server 2003 y cuáles fueron los beneficios que trajo a sus organizaciones? Michalakes: Hasta ahora, utilizábamos algún sabor de Unix o Linux, pero con el lanzamiento de WCC 2003 como una solución viable para nuestras necesidades de computación de alto rendimiento, y con sólo un pedido por mes, por parte de nuestros usuarios, preguntando si nuestra aplicación central funcionaría bajo Windows, vemos que este producto nos da la oportunidad de ampliar el rango de recursos informáticos disponibles para nuestra comunidad de usuarios, bajo una plataforma ya conocida por todos. Wortman: Nuestra decisión de usar WCC 2003 fue motivada por la necesidad de reducir costos económicos y la complejidad de nuestra infraestructura. WCC 2003 ofrece ventajas para organizaciones como la nuestra, que utilizan Active Directory para realizar la administración de identidades. Primero, nuestros técnicos pueden aplicar su conocimiento en servidores Windows, evitando tener que capacitarse en nuevas tecnologías. Esto se ve evidenciado en el hecho que las personas que trabajan en nuestra organzación no estaban acostumbradas a trabajar bajo los estándares de computación de alto rendimiento, pero pudieron hacerlo sin la necesidad de capacitación ya que acceden a un cluster que utiliza una tecnología cuya interfaz es conocida por todos. En segundo término, al utilizar Active Directory con la agenda de eventos de Microsoft, los usuarios pueden enviar sus trabajos al servidor sin tener que ampliar el número de cuentas. Elber: la actualización hacia WCC 2003 fue un paso natural para nosotros, ya que usamos esta plataforma desde que nació nuestra unidad de trabajo en 2001. Hasta hace poco tiempo, usamos sistemas Windows adaptados a la modalidad de computación de alto rendimiento, por medio de una implementación especial hecha por una organización de nuestra institución llamada Cornell Theory Center (CTC). Usamos SQL Server como bases de datos, y sistemas Windows para alojar nuestras interfaces web. Por nuestra experiencia anterior, utilizando una herramienta preparada para nosotros por el CTC, pensamos que WCC 2003 nos permite obtener una experiencia homogénea de computación de alto rendimiento. ¿Cuáles fueron las necesidades de negocio que pudieron resolver a través de la computación de alto rendimiento? Elber: Había muchos proyectos de investigación que no podrían realizarse sin una plataforma de computación de alto rendimiento, o se hubieran hecho con grandes gastos de tiempo y dinero. Por ejemplo, un típico trabajo de minería de datos con miles de secuencias de entrada, corriendo en una máquina paralela, funcionando sólo para eso, podría tomar días. Preparar los datos para poder aprender cómo es un proceso proteico podría tomar un mes, si se utiliza una computadora trabajando en paralelo; de otra forma, tomaría años poder hacer esto, ya que el volumen de datos que utilizan estos sistemas, y las combinaciones que realizan exigen un alto rendimiento de los equipos. Una máquina basada en el criterio de computación de alto rendimiento es una herramienta conveniente para dar servicio a varios proyectos de envergadura media porque WCC 2003 es fácil de administrar tanto para las diversas tareas que requieren las aplicaciones, como en el manejo de las bases de datos. Michalakes: Aunque el modelo de WRF (Weather Research and Forecast) es utilizado en principio en instituciones de servicio público que investigan los fenómenos atmosféricos y climáticos, hay un creciente número de empresas privadas dedicadas a este negocio, con servicios para la construcción y el agro, que empiezan a usar el modelo WRF. Wortman: Para nosotros, la clave de este negocio es la eliminación de la complejidad de las soluciones de alto rendimiento, algo que hicimos quitando Linux, lo cual nos permitió reducir los costos de soporte técnico. Algunos de ustedes quitaron Linux de sus sistemas. En base a su experiencia, ¿cuáles son las diferencias entre una plataforma de computación de alto rendimiento basada en Windows y otra basada en Linux, en áreas como desarrollo, mantenimiento, interoperabilidad, escalabilidad y aplicaciones? Wortman: La configuración y administración de Windows Compute Cluster Server versus un cluster basado en Linux está mundos de distancia. El hecho de que un técnico que conoce Windows pero no posee experiencia con herramientas de computación de alto rendimiento puede configurar un cluster en cuestión de horas. Los cluster basados en Linux requieren mayor cantidad de horas, y deben ser configurados por expertos, ya que requieren mayor cuidado y más instrucciones antes de empezar a funcionar. Además, los investigadores en biomedicina no tienen esa capacitación que requiere Linux, lo cual representa una carencia al momento de pensar en una solución de computación de alto rendimiento. Elber: Desde nuestra perspective, los cluster de gran escala basado en Linux son difíciles de configurar y de poner en sintonía fina. En cambio, los cluster basados en Windows son más fáciles de crear y administrar, incluso considerando que antes hemos usado una beta de WCC 2003. por otra parte, el cluster basado en Linux es menos amigable para el usuario promedio, que no está orientado a conocer herramientas informáticas complejas, ya que la utiliza como herramienta para sus investigaciones. Y por último, las bases de datos, los servicios web y los servicios de almacenamiento se integran mejor en la plataforma de computación de alto rendimiento de Windows.
|