Wednesday the 5th - GT-PID: Plataforma IaaSDistribuída para e-ciência - GTA

Visão Geral

O objetivo do projeto GT-PID é promover o compartilhamento de recursos computacionais entre universidades e centros de pesquisa a partir do compartilhamento em nuvem de todos os recursos existentes. Por um lado, provê-se uma capacidade global do sistema superior à oferecida localmente. Por outro lado, diminui-se a ociosidade dos recursos computacionais, aumentando a eficiência e o retorno do investimento financeiro aportado na pesquisa. Para isso, utiliza-se o conceito de máquinas virtuais (Virtual Machines - VMs) que são oferecidas a cada solicitação de utilização da infraestrutura. As VMs são disponibilizadas em um conjunto responsável por executar as aplicações desejadas. Assim, o usuário possuirá acesso em nível de administrador a essas VMs e poderá instalar suas aplicações. O usuário, então, possuirá total flexibilidade na escolha dessas aplicações, caracterizando um serviço em nuvem IaaS (Infrastructure as a Service).  Por exemplo, o usuário poderá utilizar as VMs para realizar suas simulações, instalando ferramentas específicas para sua pesquisa.
A infraestrutura IaaS do GT-PID permite que usuários criem e utilizem VMs, que são hospedadas nos Servidores de VMs inicialmente distribuídos pelas universidades participantes. Os Servidores de VMs consistem em PCs comuns executando uma plataforma de virtualização (hipervisor) que, no contexto atual do GT-PID, é o KVM. Para a gerência da infraestrutura há dois tipos de administradores no GT-PID: global e local. O administrador global é responsável pela gerência da infraestrutura IaaS como um todo, enquanto os administradores locais são responsáveis por operações de gerenciamento dentro de um único sítio. Um sítio é definido neste projeto como o conjunto de Servidores de VMs e de Discos disponibilizado por uma universidade ou laboratório de pesquisa, ou seja, uma unidade administrativa autônoma. Essa definição de administradores globais e locais foi uma proposta do GT-PID para permitir que recursos em sítios distribuídos pudessem ser gerenciados na nuvem de forma organizada, atribuindo certa autonomia às instituições participantes. Dentre as operações características do administrador local e global, estão as operações de gerenciamento que incluem, respectivamente, a migração local e migração global de VMs.
Assim, o GT-PID possui impacto potencial para a comunidade acadêmica e científica brasileira através do aumento global da capacidade de recursos computacionais disponíveis, acarretando em uma melhora da qualidade da pesquisa e dos serviços das universidades e centros de pesquisa. Além do aumento da capacidade, o serviço IaaS geodistribuído permitirá a implantação de serviços tolerantes a falhas, devido à eliminação de ponto únicos de falha na infraestrutura. Finalmente, porém não menos importante, a implantação do serviço IaaS do GT-PID poderá tornar as comunidades e centros de pesquisas brasileiros autônomos no que concerne a infraestrutura de TI, evitando a utilização de nuvens comerciais (p. ex. Amazon e Rackspace), que são sujeitas à legislação do país hospedeiro e a alterações dos termos de uso.

Público Alvo

O GT-PID originalmente foi idealizado para prover infraestrutura computacional a pesquisadores de universidades brasileiras desde que tenham acesso com um mínimo de qualidade à Internet. Tal acesso poderia ser obtido pelas universidades interconectadas pela RNP. Assim, cada grupo de pesquisa conecta um conjunto de seus servidores à infraestrutura de nuvem, e os torna disponíveis a todos os usuários da plataforma do GT-PID. Em contrapartida, o grupo de pesquisa pode usufruir da infraestrutura global do GT-PID. É importante notar que, como cada vez mais a computação é utilizada na pesquisa e os laboratórios são equipados com recursos computacionais, o GT-PID não se limita para uso apenas de grupos de computação e engenharia. A infraestrutura do GT-PID pode ser utilizada para pesquisas em qualquer área do conhecimento na qual se necessite de poder computacional. Pode-se vislumbrar em um primeiro momento pesquisas realizadas por Físicos, Biólogos, Matemáticos, Cientistas Sociais, etc. Em um segundo momento, devido à flexibilidade oferecida pelo serviço IaaS, pode-se vislumbrar aplicações não científicas que também necessitam de infraestrutura computacional, como servidores de e-mail, sites web, etc. Em caráter mais assistencial, o GT-PID ainda pode ser estendido para instituições que não possuam infraestrutura computacional passível de ser integrada à plataforma. Por exemplo, escolas, hospitais, ou mesmo laboratórios de pesquisas emergentes com recursos escassos desde que essa aplicação não esgote o poder computacional do sistema. Por exemplo, os recursos destinados a usuários dessas instituições poderiam ser limitados em uma quantidade baixa. As instituições menos privilegiadas em termos de recursos podem utilizar aplicativos do tipo desktop remoto e ter acesso a máquinas virtuais com mais recursos computacionais, de forma inclusiva. Assim, o modelo de serviço e a plataforma desenvolvida no GT-PID podem fortalecer a popularização da computação por todo o Brasil, com tecnologia e desenvolvimento nacionais.