Criptografia Quântica

4 Criptografia Pós-Quântica

4.1 Novas Velhas Soluções

(Topo)

Desde que se descobriu o potencial de criptoanálise do computador quântico, especialmente com o algoritmo de Shor, criou-se a idéia de que a criptografia moderna se tornaria inútil assim que esse tipo de computador começasse a ser desenvolvido em larga escala [4]. Logo, todas as mensagens trocadas com o uso de algoritmos criptográficos atuais seriam facilmente interceptáveis.

Em resposta a isso, surgiu a criptografia pós-quântica, ramo da criptografia que estuda classes de algoritmos criptográficos resistentes à criptoanálise quântica. Como exemplos de classes de algoritmos, podemos mencionar os baseados em hash, os baseados em látice, os baseados em códigos, entre outros. Estes algoritmos demorariam um tempo exponencial para serem quebrados, mesmo em computadores quânticos. [4]

No entanto, boa parte da comunidade científica expressa grande ceticismo com relação ao quão rapidamente se desenvolverão computadores quânticos comerciais. Afirmam que, por causa disso, não há grande utilidade em se preocupar com tal possibilidade. Apesar disso, a empresa D-Wave Systems alega ter desenvolvido, em 2011, um computador quântico comercial de 128 Q-bits, dedicado a algoritmos de otimização (portanto incapaz de executar o algoritmo de Shor) [42]; o que já é, no entanto, uma forte motivação para o desenvolvimento desse tipo de algoritmo.

4.2 Criptografia baseada em Hash

(Topo)

A assinatura digital é de fundamental importância na realização de transações financeiras, entre outras operações. Porém, grande parte delas se baseia em algoritmos criptográficos vulneráveis à fatoração pelo algoritmo de Shor. Para solucionar esta deficiência, os algoritmos criptográficos baseados em função resumo (hash) se valem do fato de apenas poderem ser quebrados, de maneira determinísitca, com o uso de força-bruta, uma operação com custo O(n²), onde n é o número de bits empregados pela função.

A ideia de algoritmos criptográficos baseados em hash não é recente; os fundamentos existem desde final da década de 1970, início da de 1980 [7]. Existem duas grandes vertentes deste tipo de algoritmo: a autenticação de uso único e a autenticação em árvore. Dentre os exemplos mais conhecidos destas duas, estão o algoritmo de Lamport-Diffie e a árvore de Merkle.

4.2.1 Algoritmo Lamport-Diffie

(Topo)

O algoritmo de Lamport-Diffie foi proposto em 1979 por Lesley Lamport, com a contribuição de Whitfield Diffie, que propôs um problema que serviu de ponto de partida para a criação do algoritmo [25]. Ele usa duas funções básicas: uma função não-inversível f : {0,1}ⁿ → {0,1}ⁿ e uma função de resumo g : {0,1}^* → {0,1}ⁿ, onde n é a robustez desejada. O algoritmo utiliza, ainda, uma chave de assinatura A de 2n² bits, uma chave de verificação B, também de 2n² bits, que o usuário que deseja realizar a verificação de autenticidade possuía previamente, de mesmo tamanho, e assinaturas de n² bits, diferentes a cada troca de mensagem.

O primeiro passo é a geração do par de chaves, que serão 2n-uplas de strings de n bits. No caso, A = (a₀, a₁,..., a_2n−2, a_2n−1) e B = (b₀, b₁,..., b_2n−2, b_2n−1), onde b_i = f(a_i) para todo i ∈ 0, 1, ... 2n−1. Após a criação das chaves, é feita a aplicação da função de resumo sobre a mensagem M, gerando uma n-upla de bits C = (c₀, c₁,..., c_n−2, c_n−1) = g(M). Cada um dos bits de C corresponderá a um tipo de flag, que indicará as posições de A a serem utilizadas para a formação da assinatura µ_i = a_{c_i + 2i}, para 0 ≤ i < n.

Para realizar a autenticação, o usuário aplica a função f sobre µ_i e compara com B: se f(µ_i) = b_{[c_i + 2i]}, para 0 ≤ i < n, então há a garantia de autenticação de mensagem; caso contrário, houve algum erro ou algum tipo de interceptação.

O grande problema do algoritmo acima é que novas chaves precisam ser geradas a cada mensagem trocada, pois se A fosse mantido, alguém poderia gerar várias mensagens para que fossem autenticadas, de forma a descobrir A. Por exemplo, se houver duas mensagens M₁ e M₂ tal que g(M₁) = NOT g(M₂), o valor de A será facilmente descoberto.

No início da descrição do algoritmo, supomos que o usuário que queria realizar a autenticação já estava de posse da chave B no começo do processo. Porém a mesma não pode ser passada pelo canal, pois pode ser interceptada por alguém mal-intencionado. A efeito de curiosidade, existem algumas maneiras de realizar esta tarefa, entre elas o envio de mensagem de texto por celular, ou mesmo o envio de carta, contendo a sequência das próximas chaves de verificação a serem utilizadas.

4.2.2 Árvore de Merkle

(Topo)

Para tentar resolver o problema de uso único de cada par de chaves, Ralph Merkel propôs uma melhoria, onde é usada uma árvore cheia de altura h ≥ 2 [8]. Neste algoritmo, existem 2^h−1 pares de chaves (A_k, B_k) do mesmo tipo que as do algoritmo anterior, correspondentes a cada uma das folhas da árvore. A cada folha k é atribuído o valor g(B_k). Aos outros nós é associado o valor g(filho esquerdo | filho direito). A raiz da árvore representa a chave pública, outra modificação em relação a Lamport-Diffie.

Quando um usuário quiser autenticar uma mensagem M, ele calcula d = g(M) e escolhe uma folha s qualquer da árvore. Em seguida, ele gera α, formado pelas posições de A_s ,determinadas pelo valor d. Por fim, ele computa Σ, a sequência dos “irmãos” dos nós que formam o caminho percorrido a partir da folha s, em ordem, para que se possa obter o valor da chave pública. Feitos estes passos, ele cria µ = α | B_s | s | Σ.

Figura 5: Ilustração da sequência necessária, em uma árvore de Merkle, para se chegar na chave primária no caso de uma árvore de altura 4, que teve s escolhido como sendo a terceira folha, da direita para a esquerda. O primeiro nó da sequência é o de cor azul; em seguida são adicionados os vermelhos em ordem crescente de altura. Se a verificação estiver correta, o resultado será igual ao valor do nó de cor amarela.

Ao receber a assinatura µ, o usuário aplica g(M) sobre a chave de verificação e compara o resultado com f(α). Se os valores forem iguais, ele parte para o segundo passo, que consiste em tentar chegar à chave pública. O algoritmo de verificação é descrito a seguir, com o uso de uma função H de hash qualquer:

função verifica_caminho(caminho Σ, chave_pública raiz, índice s)
    nó nó_atual = Σ[0];
    para todos os nós i de 1 até tamanho(Σ)-1
        se s mod2 = 0 então
            nó_atual := concatenação(nó_atual, Σ[i]);
        senão
            nó_atual := concatenação(Σ[i], nó_atual);
        nó_atual := H(nó_atual);
        s = s / 2;
    fim para;
    se nó_atual = raiz então
        retorna verdadeiro;
    senão
        retorna falso;
fim função;

Este algoritmo não apresenta o mesmo problema do anterior, pois existem 2^h−1 pares de chaves e, no pior dos casos, em 2^h trocas de mensagens, é possível descobrir todos os valores das folhas da árvore e, ao mesmo tempo, os pares de chaves associados a cada uma delas. Se tivermos um valor de h grande, poderemos utilizar esta árvore por bastante tempo. Entretanto, o custo para armazenar uma árvore cheia é, também, exponencial no que diz respeito à altura. Como exemplo, um h = 25 permitiria a realização de assinatura digital 33,3 milhões de vezes aproximadamente com gasto de poucos Megaoctetos.

Para uma explicação mais completa dos algoritmos acima, consultar [4] [8].

4.3 Criptografia baseada em Código

(Topo)

Criptografia baseada em código é aquela que usa facetas presentes em códigos corretores de erro para a criação de sistemas criptográficos. O mais famoso deles é o Sistema de McEliece, que implementa criptografia assimétrica, podendo ser usado para a realização de assinaturas [4]. Ele usa um código criptográfico corretor de erros conhecido como código de Goppa [28].

Um código criptográfico C(n, k) possui palavras de código de n bits para representar valores de k bits, ou seja, os n − k bits restantes são usados para correção de erros. No caso, se d for a distância mínima de Hamming de C, então podem ser detectados até d/2 + 1 erros no código e corrigidos t = d/2. Podemos, ainda, definir uma matriz G: k × n geradora do código criptográfico C, tal que todas as suas linhas são linearmente independentes e que a combinação linear (correspondendo a sucessivas operações de XOR entre as linhas) delas gera as palavras de código de C, isto é, um símbolo γ_i de k bits é codificado em c_i = γ_iG ∈ C(n, k), onde há 2^k símbolos possíveis.

O Sistema de McEliece faz uso, ainda, de duas outras matrizes aleatórias: uma binária inversível S: k × k e uma de permutação P: n × n. Ele, então, calcula a matriz G’=SGP. Com isto, ele obtem a chave pública (G’, t) e a privada (P⁻¹, G, S⁻¹). A encriptação de uma mensagem M se dá através da divisão da mesma em blocos µ_i de k bits. Em seguida, ocorre a geração aleatória de um vetor υ de n bits, com t posições com o valor 1. Ele será usado para a geração de erros na mensagem encriptada que será passada. Finalmente, é calculada a mensagem encriptada χ = µ_i G’ + υ, que corresponderá ao bloco µ_i codificado com t erros aleatórios.

A decriptação é feita aplicando-se a chave privada, usando o fato de que AA⁻¹=I para qualquer matriz binária inversível A. O primeiro passo é a geração de χ’ = χ P⁻¹, produzindo um valor pertencente a C(n, k) a menos de um erro υ. Este, então, é corrigido e associado a um dos valores γ _i. Por fim, ocorre a multiplicação pelo inverso de S, gerando a mensagem original: µ = γ _i S⁻¹.

Abaixo, apresentamos um exemplo da utlização do Sistema McEliece com o uso do código C(5, 2) = {00000, 10111, 11001, 01110}, com distância mínima de Hamming igual a 3, ou seja, capaz de corrigir até 1 erro. Este código possui o conjunto γ = {[0 0], [0 1], [1 0], [1 1]} e a seguinte base geradora:

G =

⎛
⎜
⎝

1	0	1	1	1
1	1	0	0	1

⎞
⎟
⎠

As matrizes S, S⁻¹, P, P⁻¹ foram escolhidas aleatoriamente de forma que:

S =

⎛
⎜
⎝

0	1
1	0

⎞
⎟
⎠

S⁻¹ =

⎛
⎜
⎝

0	1
1	0

⎞
⎟
⎠

P =

⎛
⎜
⎜
⎜
⎜
⎜
⎝

0	1	0	0	0
1	0	0	0	0
0	0	0	1	0
0	0	0	0	1
0	0	1	0	0

⎞
⎟
⎟
⎟
⎟
⎟
⎠

P⁻¹ =

⎛
⎜
⎜
⎜
⎜
⎜
⎝

0	1	0	0	0
1	0	0	0	0
0	0	0	0	1
0	0	1	0	0
0	0	0	1	0

⎞
⎟
⎟
⎟
⎟
⎟
⎠

Com isto, teremos G′ = SGP:

G′ =

⎛
⎜
⎝

0	1	1	1	1
1	1	1	0	0

⎞
⎟
⎠

Se nossa mensagem for igual a µ = 01 e o nosso erro aleatório υ = [0 0 1 0 0], então a mensagem criptografada enviada, χ = µ G′ + υ, será:

χ =

⎛
⎝

⎞
⎠

Ao receber a mensagem, o usuário aplica, primeiramente, o valor P⁻¹ de sua chave primária, de forma a encontrar χ′ = χ P⁻¹:

χ′ =

⎛
⎝

⎞
⎠

O usuário, então, compara χ′ com as palavras de código de C, descobrindo que o valor sem erros é, no caso, 11001. Ele resgata o valor γ₃ = [1 0] ao qual a palavra de código está associada. Por fim, ele aplica S⁻¹ sobre γ₃, de forma a recuperar a mensagem original (µ = γ₃ S⁻¹):

µ =

⎛
⎝

⎞
⎠

⎛
⎜
⎝

0	1
1	0

⎞
⎟
⎠

⎛
⎝

⎞
⎠

A vulnerabilidade desta técnica se encontra na descoberta do código Goppa G e das matrizes S e P a partir da chave pública e utilização de G para fazer a correção dos erros gerados, ou fazê-la utilizando apenas G’. No entanto, as duas opções são problemas para os quais não se conhece solução polinomial [14]. Atualmente, utiliza-se chaves bastante grandes para garantir que esta operação não seja realizada em tempo hábil, da ordem de 64 kB, valor bem maior do que o presente nas chaves RSA de hoje em dia, apesar de que o tempo de encripação e decriptação é um pouco mais rápido que o da RSA (para mais informações, ver gráficos comparativos em [18] [33].

Gustavo Pfeiffer, Rodrigo Paim, Vinicius Motta

4 Criptografia Pós-Quântica

4.1 Novas Velhas Soluções

4.2 Criptografia baseada em Hash

4.2.1 Algoritmo Lamport-Diffie

4.2.2 Árvore de Merkle

4.3 Criptografia baseada em Código