3 votos

¿Cuánto cuesta un software de Grid Computing?

Hasta ahora, he estado realizando cálculos en mi propio ordenador o utilizando un programador interno que básicamente elige una de las estaciones de trabajo disponibles de los empleados para ejecutar tareas en segundo plano.

Como ahora realizamos cada vez más cálculos largos, nuestras estaciones personales empiezan a ser utilizadas todo el tiempo parcialmente (o incluso totalmente) por cálculos de fondo.

Por ello, he pensado en pasar a una infraestructura de Grid Computing. Digamos que llamo a cada cómputo un tarea . Cada tarea puede:

  • tienen diferentes paquetes necesarios disponibles, por ejemplo:
    • el tiempo de ejecución de MATLAB
    • el .Net Framework 4.5
    • el tiempo de ejecución de MATLAB y el .Net Framework 4.5)
    • y así sucesivamente...
  • tienen una prioridad específica
  • requieren otro tipo de recursos, por ejemplo:
    • varios núcleos porque el código de una tarea específica está bien paralelizado
  • dependen del éxito de otra tarea
    • una tarea puede requerir ser ejecutada sólo después de que otra tarea haya terminado, y sólo si esa otra tarea se ejecutó con éxito
  • una duración máxima para poder detectar e incluso detener una tarea que podría haber terminado en un bucle infinito.
  • hora a la que debe ejecutarse la tarea
    • o el tiempo en el que debe completarse la tarea

Quiero tener un software que se alimente con nuestras tareas y sus propiedades (enumeradas en los puntos anteriores) y que elija qué hacer con ellas utilizando los recursos disponibles en la infraestructura.

Obsérvese que nunca he hablado de cómo se implementa la red. Desde el punto de vista empresarial, esto no es interesante. Por ejemplo, Quiero que mis indicadores se computen en una tarea que debe completarse cada lunes a las 6 de la mañana . No me importa si fue en la estación de trabajo 1 o 2 o en algún servidor. Sólo estoy hablando de tareas con requisitos que tienen que ser completados.

También me gustaría poder ver lo que ocurre durante la ejecución:

  • qué tareas se benefician de qué recurso
  • desde que se inició una determinada tarea
  • que programó la tarea
  • y así sucesivamente.

Ahora, sé que la infraestructura detrás del software depende de la cantidad de recursos que necesitemos tener.

Pero me preguntaba cuánto costaría ese software por sí mismo ?

¿O cuánto costaría una infraestructura de este tipo con una configuración muy pequeña de 16 núcleos y una buena cantidad de memoria (RAM)?

EDITAR

Teniendo en cuenta las respuestas que se dieron, mi enfoque principal quizás no fue claro. Encontré unos cuantos programas diferentes que posiblemente puedan servir para lo que quiero. Estoy tratando de estimar aproximadamente el costo de una pequeña arquitectura de ese tipo. Los productos que he encontrado en línea no proporcionan precios.

Esencialmente, estoy tratando de determinar si va a costar algo así como 10 mil dólares? 100k? 500k? o 1m?

Eso es todo.

6voto

ciceron Puntos 151

No puedo opinar sobre el coste total del software, ya que hemos desarrollado nuestra propia red en la empresa y sólo hemos alquilado un gran bastidor situado en una sala de servidores. Lo que hay que tener en cuenta es que si tienes la intención de utilizar tu red las 24 horas del día, puede resultar bastante caro utilizar servicios externos como Amazon y/o rackspace.

Hemos realizado algunos escenarios y hemos comprobado que, en la mayoría de los casos, es mejor alquilar o comprar tu propio hardware; dependiendo del lugar en el que te encuentres, la depreciación reduce tus ingresos imponibles, por lo que también hay que tenerlo en cuenta. Dada nuestra utilización de la red, hemos descubierto que tendríamos que pagar mensualmente a proveedores externos lo que ahora pagamos anualmente por un alquiler (incluido el coste de la energía). Creo que Amazon/ rackspace están bien si tienes trabajos ocasionales y puntuales, pero se vuelven muy caros si ejecutas (un gran número de) trabajos continuamente.

Como he dicho antes, hemos rodado nuestra propia red, que creo que es preferible y no tarda demasiado en llegar a un estado de funcionamiento. He oído hablar bien de http://research.cs.wisc.edu/htcondor y parece que cubre tus necesidades, pero no tengo experiencia personal con él.

5voto

Baha Puntos 145

También recomendaría Amazon AWS

Con Amazon Elastic MapReduce puede programar trabajos, desplegarlos en tantos servidores como desee y consolidar los resultados de sus pruebas.

Sus precios son muy razonables (a partir de 0,020 dólares por hora)

Utilizamos bastante Amazon AWS para nuestro propio marco de comercio algorítmico AlgoTrader .

4voto

akmad Puntos 7059

Considere la posibilidad de construir algunas VM, y dejar que las tareas impliquen el inicio de la VM y la ejecución de la tarea en ella. Esto debería aclarar la parte más complicada, programar los trabajos para que se ejecuten en la máquina correcta con los requisitos adecuados, ya que construirías imágenes de VM con todas las piezas necesarias instaladas, y no dependería de la máquina que solicita el trabajo.

Si decides cambiar a soluciones "en la nube", o añadir algo de hardware para soportar algo de carga, las máquinas virtuales serán fáciles de poner en cualquier lugar, por lo que se escalan muy bien.

Hay software de VM gratuito (por ejemplo, VirtualBox), así que eso sería gratis.

El hardware dedicado es, con mucho, la solución más sencilla; tienes más control y puedes instalar todo el software necesario. Si sigues ese camino, consigue un SSD para Windows para acelerar el archivo de páginas (o desactiva el archivo de páginas), y un SSD separado o una matriz RAID para los datos para que no mueran juntos. Yo diría que unos 7.000 euros por una máquina de 16C. Esto evitaría cualquier necesidad de colas y consultas complejas, y será más fiable sin una red de la que preocuparse.

El punto principal del software de rejilla que he utilizado ha sido equilibrar las necesidades de múltiples usuarios, y asegurar que el entorno correcto está configurado en el nodo de destino. Pero en entornos heterogéneos basados en Windows que no pueden ser alterados y sin ninguna contención, realmente no puedo ver mucho beneficio en el costoso software de grid.

3voto

Markus Olsson Puntos 12651

Echa un vistazo a lo siguiente, no indica el coste pero me pareció un punto de partida interesante para estimar el coste (si puedes implementar componentes de código abierto o tienes que ir completamente a la propiedad):

por cierto has considerado las rejillas en la nube como alternativa, yo he jugado con las rejillas de Amazon y me sorprendió gratamente. Por otro lado, Azure de MS fue un gran rechazo por su complicación para configurar instancias y mantenerlas.

Aquí algunas comparaciones: http://www.ibm.com/developerworks/library/wa-cloudgrid/ y http://www.cloudscaling.com/blog/cloud-computing/grid-cloud-hpc-whats-the-diff/

Aunque lo siguiente tampoco le da información sobre los precios, es un proveedor de servicios que ofrece el motor de red subyacente:

http://www.univa.com/products/grid-engine.php?_kk=computational%20grid&_kt=841ea12a-5cf9-46f7-ab79-7b06c294baf2&gclid=CLam1sHFkbUCFQcipQod3gsASw

y un documento interesante, aunque un poco anticuado:

http://s-space.snu.ac.kr/bitstream/10371/6804/1/A%20Pricing%20Information%20Service%20for%20Grid%20Computing.pdf

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X