Magerit - Magerit
Ativo | 2006 |
---|---|
Localização |
CeSViMa ( UPM ) Espanha |
Arquitetura | Power ISA de 64 bits : PowerPC (2006-2010) IBM POWER7 (2011-2019); x86-64 ( Xeon ) (2019 em diante) |
Sistema operacional | SUSE Linux Enterprise Server ; CentOS |
Memória | 13.056,0 TB |
Velocidade | 182,78 TFlops |
Ranking | TOP500 : 136, junho de 2011 |
Local na rede Internet | http://www.cesvima.upm.es |
Magerit é o nome de um dos supercomputadores mais poderosos da Espanha. Também alcançou a segunda melhor posição espanhola na lista TOP500 de supercomputadores . Este computador está instalado no CeSViMa , um centro de pesquisa da Universidade Técnica de Madrid .
O Magerit foi instalado pela primeira vez em 2006 e alcançou o 9º lugar na Europa e o 34º no mundo, a segunda melhor posição de um supercomputador espanhol na lista. Também alcançou a 275ª posição na primeira lista Green500 publicada. Não está mais entre os TOP500.
A segunda versão, instalada em 2011, alcançou a 1ª posição da Espanha, 44ª da Europa e 136ª mais rápida do mundo. Também alcançou a 18ª posição na lista Green500 .
Magerit (para * Materit ou * Mageterit ) é o nome mais antigo registrado da atual cidade de Madrid . O nome vem do nome celta de uma fortaleza construída no rio Manzanares no século IX dC , e significa "Lugar de água abundante".
História
Primeiros passos (2005)
Magerit foi criado como uma colaboração entre a Universidade Técnica de Madrid e a IBM . O computador está alojado no CeSViMa recém-criado . Esta primeira versão tinha apenas 124 nós e foi alojada temporariamente na Escola de Informática de Madrid. O financiamento foi fornecido pelo Ministério da Educação e Ciência da Espanha e pela Região Autônoma de Madrid.
Juntando-se à Rede Espanhola de Supercomputadores (2006–2007)
No final de 2006, a CeSViMa se junta à Rede Espanhola de Supercomputação (Red Española de Supercomputación ou RES em espanhol) e o supercomputador foi atualizado. A nova configuração possui 1204 nós atingindo uma velocidade de 14 TFLOPS . Esta é considerada a primeira versão devido à sua inclusão na lista TOP500 na 34ª posição, a segunda melhor posição de um supercomputador espanhol na lista.
Em 2007 surgiram os primeiros usuários do comitê de acesso da Rede Espanhola de Supercomputação (o acordo faz com que a Rede possa agendar o uso dos 68% dos recursos) e os usuários gerenciados no comitê de acesso local (CeSViMa) (utilizando os outros 32%).
Migração e pequenas atualizações (2008–2010)
Em maio de 2008, os supercomputadores CeSViMa e Magerit migraram para um novo prédio Coordenadas : 40 ° 24′15,65 ″ N 03 ° 50′4,75 ″ W / 40,4043472 ° N 3,8346528 ° W no mesmo campus (apenas 500 metros do local anterior na Escola de Ciência da Computação).
O computador foi atualizado: troca de switch de comunicação, subsistema de armazenamento e substituição de alguns blades por uma nova versão. Esta atualização aumenta o poder do supercomputador próximo a 2 TFLOPS, atingindo 15.95 TFLOPS. Esta atualização não evita a queda da lista TOP500 em novembro de 2008
Nesta configuração, 59,7% do tempo de CPU do supercomputador é atribuído via comitê de acesso RES e 40,3% é atribuído via políticas CeSViMa.
Um ano depois, em 2009, o sistema operacional e outros softwares de sistema foram atualizados (migrando para o SUSE Linux Enterprise Server 10)
Durante 2010, CeSViMa adquiriu um novo sistema de armazenamento massivo com 1 petabyte de capacidade em paralelo com o armazenamento próprio da Magerit.
Upgrade (2011)
No primeiro semestre de 2011, o supercomputador foi totalmente atualizado substituindo todos os nós de computador e redes de interconexão com as tecnologias mais recentes em apenas um mês (um tempo recorde)
Esta configuração alcançou a 136ª posição na lista TOP500 e a 18ª posição na lista Green500 relacionada (ambas amplamente utilizadas como o ranking de referência de supercomputador) tornando-se o supercomputador e supercomputador ecológico mais poderoso da Espanha
A nova distribuição de uso é 80% administrada pelo comitê de acesso CeSViMa-UPM e 20% administrada pela Spanish Supercomputing Network. Apesar do fato de que a porcentagem gerenciada de FER seja menor, os recursos doados à rede aumentaram de 4 a 5 vezes.
A atualização não inclui o subsistema de armazenamento (mantenha o armazenamento atualizado em 2008). Há uma pequena atualização planejada nos próximos anos para adaptar o sistema de armazenamento aos novos requisitos.
Arquitetura
Podemos considerar duas versões do supercomputador:
- O 2006 original (os 124 nós do acordo de 2005 foram incluídos nesta configuração) com uma pequena atualização em 2008.
- A atualização completa em 2011 que torna Magerit o primeiro supercomputador da Espanha.
Primeira versão (2005–2010)
Esta configuração alcançou a segunda melhor posição na lista TOP500 (34 de novembro de 2006). Quando esta versão entra em produção atinge o 2º lugar da Espanha, 9º da Europa e 34º do mundo na lista TOP500 e a 275ª posição na primeira lista Green500
A configuração da versão final (alcançada após a atualização de 2008) é um cluster de 1204 nós eServer BladeCenter (1036 JS20 e 168 JS21, ambos PowerPC 64 bits ) no SUSE Linux Enterprise Server 9.
- Cada nó JS20 tem dois processadores IBM PowerPC single-core 970FX (dois núcleos) com 2,2 GHz , 4 GB de RAM e 40 GB de disco rígido local .
- Cada nó JS21 possui dois processadores IBM PowerPC dual-core 970FX (quatro núcleos) com 2,2 GHz, 8 GB de RAM e 80 GB de disco rígido local.
O sistema possui um sistema de armazenamento distribuído com capacidade de 190 TB sob GPFS . O acesso a este armazenamento compartilhado é fornecido por um switch de alta largura de banda que permite picos de 1 Tbit / s .
Todos os nós estão interconectados com uma rede de baixa latência (2,6 - 3,2 μs ) e alta largura de banda chamada Myrinet . Esta rede é usada apenas para mensagens MPI das tarefas dos usuários.
Finalmente, uma rede Ethernet auxiliar é implantada para tarefas de administração.
Segunda versão (2011)
Esta configuração converte Magerit no supercomputador mais poderoso da Espanha. Quando esta montagem entra em fase de produção em 2011, atinge a primeira posição da Espanha, 44ª da Europa e 136ª do mundo.
O sistema mantém a arquitetura de cluster com 245 nós PS702, cada um com 16 núcleos em dois processadores POWER7 de 64 bits (oito núcleos cada) 3,0 GHz , 32 GB de RAM e 300 GB de disco rígido local. Cada núcleo fornece 18,38 Gflops.
A interconexão foi substituída por uma rede Infiniband , de alta largura de banda (40 Gbit / s ) e baixa latência (0,3 μs ). O sistema mantém dois Gigabit Ethernet independentes para tarefas auxiliares: implantação de imagens e acesso ao subsistema de armazenamento.
O sistema de armazenamento permanece o mesmo (192 TB em GPFS ) com uma largura de banda próxima a 1 Tbit / s .
A atualização inclui uma atualização do software: sistema operacional ( SLES11SP1 ), sistema de implantação ( xCAT, eXtreme Cluster Administration Toolkit ) e todos os softwares e bibliotecas usados no sistema.
Terceira versão (2019)
Magerit atualizado com nós Lenovo ThinkSystem SD530.
Usar
A Magerit processa jobs batch com grandes requisitos de processamento, como modelos do universo, simulações de materiais e modelos climáticos. Um exemplo de projeto é o projeto Cajal Blue Brain (participação espanhola no projeto Blue Brain).
Essas tarefas são organizadas por um gerenciador de filas. Devido à característica dos jobs (roda em centenas de CPUs por alguns dias) é impossível usar um acesso mais convencional aos recursos. O supercomputador deve estar executando trabalhos sem interrupções durante todo o ano.
O uso de um gerenciador de filas de jobs batch permite um agendamento global dos recursos aumentando o uso dos recursos e um jogo justo entre os usuários.
Acesso a recursos
O sistema está à disposição de qualquer pessoa, instituição ou empresa que solicite acesso através de:
- Diretamente CeSViMa , preenchendo os formulários de solicitação de acesso na página da CeSViMa.
- Como um acordo de colaboração com CeSViMa
- Via Rede Espanhola de Supercomputação. Este é um processo competitivo. O comitê de acesso avalia todos os projetos e pode alocar recursos em qualquer outro supercomputador da rede para que seja agendado nos 20% dos recursos do Magerit gerenciados pelo RES.