Magerit - Magerit

Magerit 3
UPM-CeSViMa-SupercomputadorMagerit-2011.jpg
Supercomputador Magerit (2011)
Ativo 2006
Localização CeSViMa ( UPM ) Espanha
 
Arquitetura Power ISA de 64 bits :
PowerPC (2006-2010)
IBM POWER7 (2011-2019);
x86-64 ( Xeon ) (2019 em diante)
Sistema operacional SUSE Linux Enterprise Server ; CentOS
Memória 13.056,0 TB
Velocidade 182,78 TFlops
Ranking TOP500 : 136, junho de 2011
Local na rede Internet http://www.cesvima.upm.es

Magerit é o nome de um dos supercomputadores mais poderosos da Espanha. Também alcançou a segunda melhor posição espanhola na lista TOP500 de supercomputadores . Este computador está instalado no CeSViMa , um centro de pesquisa da Universidade Técnica de Madrid .

O Magerit foi instalado pela primeira vez em 2006 e alcançou o 9º lugar na Europa e o 34º no mundo, a segunda melhor posição de um supercomputador espanhol na lista. Também alcançou a 275ª posição na primeira lista Green500 publicada. Não está mais entre os TOP500.

A segunda versão, instalada em 2011, alcançou a 1ª posição da Espanha, 44ª da Europa e 136ª mais rápida do mundo. Também alcançou a 18ª posição na lista Green500 .

Magerit (para * Materit ou * Mageterit ) é o nome mais antigo registrado da atual cidade de Madrid . O nome vem do nome celta de uma fortaleza construída no rio Manzanares no século IX dC , e significa "Lugar de água abundante".

História

Escola de Ciência da Computação, primeira localização do supercomputador Magerit

Primeiros passos (2005)

Magerit foi criado como uma colaboração entre a Universidade Técnica de Madrid e a IBM . O computador está alojado no CeSViMa recém-criado . Esta primeira versão tinha apenas 124 nós e foi alojada temporariamente na Escola de Informática de Madrid. O financiamento foi fornecido pelo Ministério da Educação e Ciência da Espanha e pela Região Autônoma de Madrid.

Juntando-se à Rede Espanhola de Supercomputadores (2006–2007)

No final de 2006, a CeSViMa se junta à Rede Espanhola de Supercomputação (Red Española de Supercomputación ou RES em espanhol) e o supercomputador foi atualizado. A nova configuração possui 1204 nós atingindo uma velocidade de 14 TFLOPS . Esta é considerada a primeira versão devido à sua inclusão na lista TOP500 na 34ª posição, a segunda melhor posição de um supercomputador espanhol na lista.

Em 2007 surgiram os primeiros usuários do comitê de acesso da Rede Espanhola de Supercomputação (o acordo faz com que a Rede possa agendar o uso dos 68% dos recursos) e os usuários gerenciados no comitê de acesso local (CeSViMa) (utilizando os outros 32%).

Migração e pequenas atualizações (2008–2010)

Edifício CeSViMa no Parque Científico e Tecnológico da UPM, localização atual

Em maio de 2008, os supercomputadores CeSViMa e Magerit migraram para um novo prédio Coordenadas : 40 ° 24′15,65 ″ N 03 ° 50′4,75 ″ W  /  40,4043472 ° N 3,8346528 ° W  / 40,4043472; -3,8346528 no mesmo campus (apenas 500 metros do local anterior na Escola de Ciência da Computação).

O computador foi atualizado: troca de switch de comunicação, subsistema de armazenamento e substituição de alguns blades por uma nova versão. Esta atualização aumenta o poder do supercomputador próximo a 2 TFLOPS, atingindo 15.95 TFLOPS. Esta atualização não evita a queda da lista TOP500 em novembro de 2008

Nesta configuração, 59,7% do tempo de CPU do supercomputador é atribuído via comitê de acesso RES e 40,3% é atribuído via políticas CeSViMa.

Um ano depois, em 2009, o sistema operacional e outros softwares de sistema foram atualizados (migrando para o SUSE Linux Enterprise Server 10)

Durante 2010, CeSViMa adquiriu um novo sistema de armazenamento massivo com 1 petabyte de capacidade em paralelo com o armazenamento próprio da Magerit.

Upgrade (2011)

No primeiro semestre de 2011, o supercomputador foi totalmente atualizado substituindo todos os nós de computador e redes de interconexão com as tecnologias mais recentes em apenas um mês (um tempo recorde)

Esta configuração alcançou a 136ª posição na lista TOP500 e a 18ª posição na lista Green500 relacionada (ambas amplamente utilizadas como o ranking de referência de supercomputador) tornando-se o supercomputador e supercomputador ecológico mais poderoso da Espanha

A nova distribuição de uso é 80% administrada pelo comitê de acesso CeSViMa-UPM e 20% administrada pela Spanish Supercomputing Network. Apesar do fato de que a porcentagem gerenciada de FER seja menor, os recursos doados à rede aumentaram de 4 a 5 vezes.

A atualização não inclui o subsistema de armazenamento (mantenha o armazenamento atualizado em 2008). Há uma pequena atualização planejada nos próximos anos para adaptar o sistema de armazenamento aos novos requisitos.

Arquitetura

Podemos considerar duas versões do supercomputador:

  • O 2006 original (os 124 nós do acordo de 2005 foram incluídos nesta configuração) com uma pequena atualização em 2008.
  • A atualização completa em 2011 que torna Magerit o primeiro supercomputador da Espanha.

Primeira versão (2005–2010)

Primeira versão do supercomputador Magerit (foto 2009)

Esta configuração alcançou a segunda melhor posição na lista TOP500 (34 de novembro de 2006). Quando esta versão entra em produção atinge o 2º lugar da Espanha, 9º da Europa e 34º do mundo na lista TOP500 e a 275ª posição na primeira lista Green500

A configuração da versão final (alcançada após a atualização de 2008) é um cluster de 1204 nós eServer BladeCenter (1036 JS20 e 168 JS21, ambos PowerPC 64 bits ) no SUSE Linux Enterprise Server 9.

  • Cada nó JS20 tem dois processadores IBM PowerPC single-core 970FX (dois núcleos) com 2,2 GHz , 4 GB de RAM e 40 GB de disco rígido local .
  • Cada nó JS21 possui dois processadores IBM PowerPC dual-core 970FX (quatro núcleos) com 2,2 GHz, 8 GB de RAM e 80 GB de disco rígido local.

O sistema possui um sistema de armazenamento distribuído com capacidade de 190 TB sob GPFS . O acesso a este armazenamento compartilhado é fornecido por um switch de alta largura de banda que permite picos de 1 Tbit / s .

Todos os nós estão interconectados com uma rede de baixa latência (2,6 - 3,2 μs ) e alta largura de banda chamada Myrinet . Esta rede é usada apenas para mensagens MPI das tarefas dos usuários.

Finalmente, uma rede Ethernet auxiliar é implantada para tarefas de administração.

Segunda versão (2011)

Segunda versão do Supercomputador Magerit (foto 2011)

Esta configuração converte Magerit no supercomputador mais poderoso da Espanha. Quando esta montagem entra em fase de produção em 2011, atinge a primeira posição da Espanha, 44ª da Europa e 136ª do mundo.

O sistema mantém a arquitetura de cluster com 245 nós PS702, cada um com 16 núcleos em dois processadores POWER7 de 64 bits (oito núcleos cada) 3,0 GHz , 32 GB de RAM e 300 GB de disco rígido local. Cada núcleo fornece 18,38 Gflops.

A interconexão foi substituída por uma rede Infiniband , de alta largura de banda (40 Gbit / s ) e baixa latência (0,3 μs ). O sistema mantém dois Gigabit Ethernet independentes para tarefas auxiliares: implantação de imagens e acesso ao subsistema de armazenamento.

O sistema de armazenamento permanece o mesmo (192 TB em GPFS ) com uma largura de banda próxima a 1 Tbit / s .

A atualização inclui uma atualização do software: sistema operacional ( SLES11SP1 ), sistema de implantação ( xCAT, eXtreme Cluster Administration Toolkit ) e todos os softwares e bibliotecas usados ​​no sistema.

Terceira versão (2019)

Magerit atualizado com nós Lenovo ThinkSystem SD530.

Usar

A Magerit processa jobs batch com grandes requisitos de processamento, como modelos do universo, simulações de materiais e modelos climáticos. Um exemplo de projeto é o projeto Cajal Blue Brain (participação espanhola no projeto Blue Brain).

Essas tarefas são organizadas por um gerenciador de filas. Devido à característica dos jobs (roda em centenas de CPUs por alguns dias) é impossível usar um acesso mais convencional aos recursos. O supercomputador deve estar executando trabalhos sem interrupções durante todo o ano.

O uso de um gerenciador de filas de jobs batch permite um agendamento global dos recursos aumentando o uso dos recursos e um jogo justo entre os usuários.

Acesso a recursos

O sistema está à disposição de qualquer pessoa, instituição ou empresa que solicite acesso através de:

  • Diretamente CeSViMa , preenchendo os formulários de solicitação de acesso na página da CeSViMa.
  • Como um acordo de colaboração com CeSViMa
  • Via Rede Espanhola de Supercomputação. Este é um processo competitivo. O comitê de acesso avalia todos os projetos e pode alocar recursos em qualquer outro supercomputador da rede para que seja agendado nos 20% dos recursos do Magerit gerenciados pelo RES.

Referências

links externos