Expressão de grafo

O conceito de expressão de grafo foi criado em 2015 por Glauber Donizeti Gasparotto Junior e tem como objetivo a representação de um grafo em forma de expressão matemática.

O conceito tem como objetivo explorar os benefícios de uma expressão matemática trocando os números por entidades. Com isso, podemos criar uma nova maneira de transportar dados e principalmente criar um novo meio de pesquisa em grafos complexos ou circulares.

É importante destacar que o conceito não tem o objetivo de ser melhor ou pior que outros já existentes. O objetivo é ser apenas uma nova forma de ver um grafo e suas informações.

Índice

Compreendendo uma expressão de grafo
Informações de uma ocorrência
Normalizando expressões
Desnormalizando expressões
Pesquisas
Implementações

Compreendendo uma expressão de grafo

Uma expressão de grafo é composta por 4 elementos básicos e diversas informações que veremos nesse documento.

Exemplo 1:

(A + B + C + D)

Os elementos que compõe uma expressão são:

Entidade: É o elemento fundamental da expressão, determina uma unidade, um vértice na teoria de grafo.
- São únicos, mas podem aparecer "N" vezes na expressão e em diferentes posições.
- São representados por um literal, no caso acima, as letras: "A", "B", "C" e "D".
Operador de soma: É o elemento que adiciona uma entidade em outra entidade.
- Fazendo uma analogia com a teoria de grafos, o operador de "+" pode ser visto como uma aresta.
Operador de subtração: É o elemento que remove uma entidade de outra entidade.
Parenteses: São usados para agrupar as entidades filhas de uma determina entidade.
- Em expressão de grafo, são denominados: Grupo de Expressão.

Esses elementos, são os mesmos de uma expressão matemática, a diferença é que no lugar de números teremos entidades que vão ser adicionas ou removidas. Além disso, o objetivo do resultado tem suas diferenças.

Essa expressão representa o seguinte grafo:

A 
----B
----C
----D

Resolução da expressão

A resolução é sempre da esquerda para a direita, onde a entidade da esquerda adiciona ou remove a entidade da direita e o resultado dessa soma é a própria entidade da esquerda e assim sucessivamente até chegar no final da expressão.

Exemplo simples (Etapas simbólicas da resolução):

(A + B)
Resultado final da expressão: A

Grafo final da entidade A

A 
----B

Exemplo complexo (Etapas simbólicas da resolução):

(A + B + C + D)
(A + C + D)
(A + D)
Resultado final da expressão: A

Grafo final da entidade A

A 
----B
----C
----D

Vimos que a cada etapa da resolução a entidade da "direita" desaparece e a entidade da "esquerda" prevalece até não restarem entidades a sua direita.

É óbvio que a cada etapa da resolução a entidade da esquerda é alterada internamente, ela adiciona a entidade da direita.

Entidade e suas ocorrências

Em um grafo, as entidades são únicas, porém elas podem estar em vários lugares ao mesmo tempo. Por exemplo, não existem duas entidades com o mesmo nome. Mas a mesma entidade pode aparecer em diversos pontos no grafo.

(A + (B + C + A) + C)

Note que as entidades "A" e "C" estão repetidas. Elas representam a mesma entidade, porém em posições diferentes. Cada ocorrência contém algumas informações que são únicas daquela posição. Veremos isso no tópico Informações de uma ocorrência.

Operador de soma

A operação de soma usa o operador "+", como dito, ela funciona como uma aresta que liga um vértice a outro vértice. Em expressão de grafo, dizemos que a entidade da "esquerda" adiciona a entidade da "direita" e sem restrições, por exemplo:

A entidade da esquerda pode adicionar a sí mesma quantas vezes for preciso:

Expression: A + A + A + A
Graph:
            A 
            ----A
            ----A
            ----A

A entidade "X" pode adicionar a entidade "Y" e a entidade "Y" pode adicionar a entidade "X" quantas vezes for necessário.

Expression: X + (Y + X + X) + Y
Graph:
            X 
            ----Y
                ----X
                ----X
            ----Y

Operador de subtração

A operação de subtração usa o operador "-". Em expressão de grafo, dizemos que a entidade da esquerda remove a entidade da direita fazendo com que a entidade da direita deixe de ser sua filha.

Para cada operação de subtração, apenas uma ocorrência será removida por vez, mesmo se a entidade à esquerda tiver mais de uma filha da mesma entidade. Por exemplo:

A entidade da esquerda remove uma das filhas "B"

Graph 1:
            A 
            ----B
            ----B
            ----B

Expression: A - B

Graph 2:
            A 
            ----B
            ----B

Note que uma das ocorrências da entidade "B" foi removida da entidade "A". Com base no mesmo exemplo, se quiséssemos remover todas as ocorrências da entidade "B" teríamos que fazer a operação de subtração 3 vezes, que é equivalente a quantidade de vezes que entidade "B" existe dentro da entidade "A".

Ainda é possível misturar as operações de soma e subtração.

Graph 1:
            A 
            ----B
            ----B
            ----B

Expression: A - B - B - B + (C + Y)

Graph 2:
            A
            ----C    
                ----Y

Nesse exemplo, removemos todas as ocorrências da entidade "B" da entidade "A" e adicionamos uma nova filha ("C") que contém a entidade "Y".

Grupo de expressão

O grupos de expressão é delimitado pelo uso de parenteses: ( para abrir e ) para fechar.

A primeira entidade do grupo de expressão (após abrir parenteses) determina a entidade pai daquele grupo, ou seja, todas as entidades subsequentes serão suas filhas até que se feche os parenteses.

Exemplo 1:

(A + B + C)

A entidade "A" é a entidade pai de seu grupo de expressão e a entidade "B" e "C" são suas filhas.

Exemplo 2:

(A + B + (C + D))

A entidade "A" é a entidade pai de seu grupo de expressão e a entidade "B" e "C" são suas filhas.
A entidade "C" é a entidade pai de seu grupo de expressão e a entidade "D" é sua filha.

Grupo de expressão raiz

O primeiro grupo de expressão é chamado de grupo de expressão raiz.

Não é obrigatório o uso dos parenteses no grupo de expressão raiz. Veremos que nos exemplos a seguir ambas as expressão estão corretas:

(A + B)

Ou

A + B

Sub-grupos de expressão

Um grupo de expressão pode conter outros grupos de expressão dentro dele e a lógica será a mesma para o sub-grupo:

(A + B + (C + D))

Nesse exemplo a entidade "A" será pai das entidades "B" e "C" e a entidade "C" será pai da entidade "D".

Declarações de entidades

Chamamos de "declaração" o primeiro momento em que uma entidade é escrita, ou seja, sua primeira ocorrência.

Caso essa entidade contenha filhos devemos declarar todo o seu grupo de expressão no mesmo momento, ou seja, adicionando seus filhos dentro dos parenteses.

Não existe uma obrigatoriedade para a declaração do grupo na primeira ocorrência, mas isso ajuda a simplificar a descoberta de algumas informações de uma maneira mais rápida.

Por exemplo, para descobrir se a entidade "B" contém filhos na expressão a seguir, será necessário verificar todas as suas ocorrências, pois não é possível dizer em quais ocorrências o seu grupo foi declarado.

A + B + (C + (B + D)) + B

Agora, se soubermos que os grupos de expressões foram escritos sempre nas primeiras ocorrências, então podemos verificar apenas a primeira ocorrência da entidade "B" para saber se ela contém ou não filhos:

A + (B + D) + (C + B) + B

Repetições de grupo de expressão

Um grupo de expressão não pode ser declarado mais de uma vez na expressão.

Por exemplo:

A + B + (C + D + E) + (I + C)

A entidade "C" tem os filhos "D" e "E"
A entidade "I" tem como filha a entidade "C", porém não é necessário redeclarar as entidades filhas de "C".

Errado:

A + B + (C + D + E) + (I + (C + D + E))

Entidade pai

A entidade pai é sempre a primeira do grupo de expressão, ela que dá origem ao grafo daquele grupo.

Por exemplo:

(A + B + (C + D))

Nesse exemplo, temos duas entidades pai: "A" e "C".
O elemento "+" é utilizado como simbolo de atribuição de uma entidade (filho) em outra entidade (pai).

Entidade raiz

A primeira entidade da expressão é a entidade raiz da expressão. Uma expressão só pode conter uma entidade raiz.

A + B + (C + A)

A entidade "A" é a entidade raiz da expressão e será o topo do grafo.

Entidade final

Uma entidade que não possui grupos de expressão em seu nível é chamada de entidade final. Isso não significa que a entidade não tenha filhos, veja:

Entidade final sem filhos:

(A + B + C + (D + E))

As entidades "B", "C" e "E" são entidades finais.

Entidade final com filhos:

(A + (B + C) + (D + B))

A entidade "C" é final e não contém filhos
A última ocorrência da entidade "B", do grupo de expressão da entidade "D", também é final, mas ela contém filhos.

Caminhos

Toda entidade contém um caminho que deve ser percorrido até chegar em sua posição. Para representar esse caminho podemos usar a seguinte notação:

A.B.C.D

Essa notação indica a localização da entidade "D" dentro da expressão abaixo:

A + (B + (C + D))

A entidade "D" é filha da entidade "C"
A entidade "C" é filha da entidade "B"
A entidade "B" é filha da entidade "A"

A notação utiliza o caractere "." entre a entidade pai e a entidade filho. A entidade da esquerda será a pai e a entidade da direita será o filho.

Outras exemplos:

Expressão:

(A + A + (B + C) + (D + B))

Caminhos da entidade A:

Ocorrência 1: A
Ocorrência 2: A.A

Na segunda ocorrência temos uma relação cíclica, portanto a notação é interrompida quando isso acontece, do contrário teríamos um caminho infinito.

Caminhos da entidade B:

Ocorrência 1: A.B
Ocorrência 2: A.D.B

Caminhos cíclicos

Quando uma entidade é pai de si mesma, ou uma entidade descendente é pai de alguma entidade ascendente, isso determina que existe um caminho cíclico entre as entidades. Nesse caso, a expressão deve apenas repetir o nome da entidade ascendente, isso é o suficiente para descobrir que existe uma situação cíclica.

Note que o grafo contém dois caminhos cíclicos:

A + A + B + (C + A)

Uma direta (A + A): onde a entidade "A" é pai dela mesma.
Uma indireta (C + A): Onde "C" é pai de uma entidade ascendente, no caso a entidade "A".

Informações de uma ocorrência

Uma entidade pode aparecer diversas vezes dentro de uma expressão e para cada ocorrência temos um conjunto de informações que serão vistas neste tópico.

Essas informações são muito importantes e veremos exemplos disso no tópico Pesquisas.

Níveis
Índices
Entidades vizinhas:
- Navegação para a esquerda
- Navegação para a direita

Níveis

Uma expressão tem dois tipos de níveis: Nível geral e Nível na expressão.

O nível geral é o nível em relação à hierarquia do gráfico. O nível inicia-se em "1" e é incrementado "+1" até chegar no último nível.

Por exemplo:

A (Level: 1)
----B (Level: 2)
    ----C (Level: 3)
    ----D (Level: 3)
        ----B (Level: 4)
----E (Level: 2)
    ----A (Level: 3)

O nível na expressão determina em qual nível a entidade está relacionada à expressão. O nível inicia-se em "1" e é incrementado "+1" até chegar no último nível.

Por exemplo:

                        A + B + C + ( D + E + ( F + G ) )
Level in expression:    1   1   1     2   2     3   3    
Level:                  1   2   2     2   3     3   4

Note que o nível da expressão é bem similar ao nível geral. A única diferença está no valor da entidade pai, no nível geral esse número é sempre menor que o nível geral de seus filhos e no nível da expressão eles são iguais.

Índices

Uma expressão tem dois tipos de índices: Índice na expressão e Índice do nível.

O Índice da expressão determina em qual posição a entidade está com relação a expressão. O índice inicia-se em "0" e é incrementado "+1" até chegar na última entidade da expressão.

Por exemplo:

A + B + C + ( D + E + ( F  + G ) ) 
0   1   2     3   4     5    6

O Índice do nível determina em qual posição a entidade está com relação ao seu nível. O índice inicia-se em "0" e é incrementado "+1" até chegar na última entidade do mesmo nível.

Por exemplo:

                A + B + C + ( D + E + ( F + G + Y ) )
Level:          1   2   2     2   3     3   4   4
Level Index:    0   0   1     2   0     1   0   1

Graph:

A (Level Index: 0)
----B (Level Index: 0)
----C (Level Index: 1)
----D (Level Index: 2)
    ----E (Level Index: 0)
    ----F (Level Index: 1)
        ----G (Level Index: 0)
        ----Y (Level Index: 1)

A entidade "A" é a raiz da expressão e seu "índice no nível" será zero. Note que por ser a entidade raiz, ela não terá outras entidades em seu nível.
A entidade "B" é a primeira do segundo nível e terá a posição zero. Ela é filha da entidade "A".
A entidade "C" é a segunda do segundo nível e terá a posição 1. Ela é filha da entidade "A".
A entidade "D" é a terceira do segundo nível e terá a posição 2. Ela é filha da entidade "A".
A entidade "E" é a primeira do terceiro nível e terá a posição 0. Ela é filha da entidade "D".
A entidade "F" é a segunda do terceiro nível e terá a posição 1. Ela é filha da entidade "D".
A entidade "G" é a primeira do quarto nível e terá a posição 0. Ela é filha da entidade "F".
A entidade "Y" é a segunda do quarto nível e terá a posição 1. Ela é filha da entidade "F".

Navegação para a direita

Toda entidade, com exceção da última da expressão, tem conhecimento da próxima entidade na expressão.

No exemplo abaixo, temos um mapa de conhecimento de todas as entidades a direita da entidade corrente:

A + B + C + ( D + E + ( F + G ) )
B   C   D     E   F     G

No exemplo, a entidade "A" tem conhecimento da entidade "B". Note que a entidade "B" é filha de "A", mas isso não influência, pois a ideia é conhecer a próxima entidade da expressão e não do seu nível.

Navegação para a esquerda

Toda entidade, com exceção da primeira da expressão (a entidade raiz), tem conhecimento da entidade anterior na expressão. No exemplo abaixo, temos um mapa de conhecimento de todas as entidades a esquerda da entidade corrente:

A + B + C + ( D + E + ( F + G ) ) 
    A   B     C   D     E   F

Normalizando expressões

As normalizações foram criadas para melhorar a visualização das expressões.

Normalização - tipo 1

A normalização de tipo 1 tem o objetivo de enxugar grupos de expressão que pertencem a mesma entidade pai e que estão em diferentes lugares na expressão.

Por exemplo:

A + (B + Y) + (D + (B + C))
     ^              ^

Note que na expressão acima, a entidade "B" tem dois grupos de expressão em lugares distintos. Na prática, isso não tem nenhum problema, mas será visualmente melhor se aplicarmos a normalização eliminando um dos grupos da entidade "B", veja:

A + (B + Y + C) + (D + B)

É preciso dizer que nenhuma alteração na expressão deve modificar o seu grafo final. É perceptível que no exemplo isso não ocorreu, as entidades apenas foram reorganizadas.

Já no próximo exemplo, veremos uma expressão que pode gerar confusão no momento da normalização:

A + (B + Y) + (D + (B + Y))
     ^              ^

Nesse exemplo, é natural pensar que um dos grupos da entidade "B" pode ser eliminado por serem iguais, mas esse pensamento está errado. Se eliminarmos um dos grupos, estaremos modificando o grafo final e esse não é o objetivo.

Errado:

A + (B + Y) + (D + B)

Correto:

A + (B + Y + Y) + (D + B)

Normalização - tipo 2

A normalização de tipo 2 tem o objetivo de organizar, quando possível, as entidades finais no começo do seu grupo de expressão para ajudar na visualização da expressão.

A + (B + (C + D) + E) + F + G
                   ^    ^   ^

Após a normalização ficaria assim:

A + F + G + (B + E + (C + D))
    ^   ^        ^

Note que as entidades "F" e "G" foram para o início do seu grupo de expressão.
A entidade "E" também foi reorganizada para o início do seu grupo de expressão.

Normalização - tipo 3

A normalização de tipo 3 tem o objetivo de declarar o mais rápido possível todos os grupos de expressões. Essa tema também foi abordado no tópico Declarações de entidades.

Exemplo:

A + B + (C + G + (B + F)) + (G + F)
    ^             ^    
             ^               ^

Note que as entidades "B" e "G" são utilizadas antes que seus grupos sejam declarados e após a normalização teremos:

A + (B + F) + (C + (G + F) + B) + G

Após a normalização, os grupos das entidades "B" e "G" foram declarados no primeiro momento que foram utilizadas.
A entidade "B", dentro do grupo "C", e a entidade "G" que está solitária no final da expressão, se transformaram em Entidade final e devido a isso, podemos aplicar a Normalização - tipo 2 para melhorar a visualização, veja:

A + G + (B + F) + (C + B + (G + F))

Note que agora a entidade "G" que estava no final da expressão foi movido para o início. Sendo assim, devemos aplicar novamente a Normalização - tipo 3:

A + (G + F) + (B + F) + (C + B + G)

Com isso concluímos a normalização e obtemos uma expressão muito mais legível.

Desnormalizando expressões

O objetivo da desnormalização é gerar uma nova expressão onde os grupos de expressões são declarados todas as vezes que a sua entidade pai for utilizada.

Após a desnormalização será impossível voltar na expressão original, esse processo não tem volta.

Considere a seguinte expressão original:

A + (B + D) + (E + B)

Note que a entidade "B" tem dois pais: "A" e "E"
Após a desnormalização teremos a seguinte expressão:

A + (B + D) + (E + (B + D))
                    ^

Após a desnormalização a entidade "B" teve seu grupo de expressão redeclarado por completo quando foi utilizada novamente como filho da entidade "D".

Como dito, é impossível voltar na expressão original, pois não conseguimos distinguir quais grupos de expressões eram da expressão original. Sendo assim, não podemos dizer que uma expressão original é igual a sua expressão desnormalizada.

Vejam um exemplo de como elas são diferentes:

Original:       A + (B + D) + (E + B)
Final Graph:
                A
                ---B
                ------D
                ---E
                ------B

Se pegarmos a expressão desnormalizada e extrairmos o seu grafo, teremos um grafo diferente do grafo original:

Original:                       A + (B + D) + (E + (B + D))
After normalization of type 1:  A + (B + D + D) + (E + B)
Final Graph:
                                A
                                ---B
                                ------D
                                ------D
                                ---E
                                ------B

Portanto, não podemos considerar que uma expressão desnormalizada seja usada como uma expressão original, isso altera o grafo final. Além do mais, ela infringe a regra do tópico Repetições de grupo de expressão.

Pesquisas

A pesquisa em expressão de grafo pode ser dividida em dois tipos: Pesquisa superficial e Pesquisa profunda.

Nos próximos tópicos vamos abordar a diferença entre esses tipos de pesquisas, mas antes, será preciso entender o que é uma matriz de informação. Esse é um assunto comum entre ambos os tipos de pesquisas.

Matriz de informação

Podemos representar uma expressão de grafo em uma matriz vertical com todas as informações de uma expressão.

Com a visão em forma de matriz conseguimos uma melhor visualização do grafo e entendemos melhor como funciona a pesquisa em grafos complexos usando o conceito de expressão de grafo.

Vejamos um exemplo:

Expressão:

Expression:     A + B + ( C + Y ) + ( D + E + ( F + ( G + B + C ) + Y ) + Z )
Level:          1   2     2   3       2   3     3     4   5   5     4     3
Level Index:    0   0     1   0       2   0     1     0   0   1     1     2

Hierarquia:

A (Level Index: 0)
----B (Level Index: 0)
----C (Level Index: 1)
    ----Y (Level Index: 0)
----D (Level Index: 2)
    ----E (Level Index: 0)
    ----F (Level Index: 1)
        ----G (Level Index: 0)
            ----B (Level Index: 0)
            ----C (Level Index: 1)
        ----Y (Level Index: 1)
    ----Z (Level Index: 2)

Matriz de informação:

Index   | Entity | Level | Level Index
#00     | A      | 1     | 0
#01     | B      | 2     | 0
#02     | C      | 2     | 1
#03     | Y      | 3     | 0
#04     | D      | 2     | 2
#05     | E      | 3     | 0
#06     | F      | 3     | 1
#07     | G      | 4     | 0
#08     | B      | 5     | 0
#09     | C      | 5     | 1
#10     | Y      | 4     | 1
#11     | Z      | 3     | 2

Perceba que a expressão mudou da orientação horizontal para a orientação vertical e todas as entidades foram empilhadas uma nas outras e respeitando a mesma ordem que elas tinha na expressão.

Inclusive, essa é uma regra importante: Nunca alterar a ordem das linhas, isso altera completamente o grafo.

Os elementos de soma e parênteses foram removidos, eles não são necessários, pois somente com as informações de índices e níveis, é possível identificar todos os grupos de expressões.

E é com base nessa matriz de informação e também pelo conhecimento das entidades vizinhas, ou seja, aqueles que estão posicionados na sua esquerda ou na sua direita, independentemente do nível, que podemos criar pesquisas e navegações.

Pesquisa profunda

A pesquisa profunda tem o objetivo de retornar a maior quantidade possíveis de resultados e para isso ela considera todos os caminhos que uma entidade percorre em um grafo.

Para poder criar uma pesquisa profunda, precisamos utilizar uma expressão desnormalizada. Isso é necessário, porque apenas a expressão desnormalizada contém todos os caminhos que uma entidade possui no grafo uma vez que a versão original da expressão não repete os grupos de expressão (e nem deve).

Vejamos a seguir o mesmo exemplo utilizado no tópico Matriz de informação, porém agora, a expressão foi desnormalizada:

Expressão:

Original:       A + B + ( C + Y ) + ( D + E + ( F + ( G + B + C ) + Y ) + Z )
                          ^                                   ^
Denormalized:   A + B + ( C + Y ) + ( D + E + ( F + ( G + B + ( C + Y ) ) + Y ) + Z )
                                                                    ^
Level:          1   2     2   3       2   3     3     4   5     5   6       4     3 
Level Index:    0   0     1   0       2   0     1     0   0     1   0       1     2

Hierarquia:

A (Level Index: 0)
----B (Level Index: 0)
----C (Level Index: 1) 
    ----Y (Level Index: 0)
----D (Level Index: 2)
    ----E (Level Index: 0)
    ----F (Level Index: 1)
        ----G (Level Index: 0)
            ----B (Level Index: 0)
            ----C (Level Index: 1)
                ----Y (Level Index: 0) *
        ----Y (Level Index: 1)
    ----Z (Level Index: 2)

Foi aplicada a desnormalização e a entidade "C" teve seu grupo de expressão redeclarado dentro da entidade "G".
Após a desnormalização um novo caminho foi criado para a entidade "Y":
- Antes:
  - Primeira ocorrência: A.C.Y
  - Segunda ocorrência: A.D.F.G.Y
- Depois:
  - Primeira ocorrência: A.C.Y
  - Segunda ocorrência: A.D.F.G.C.Y
  - Terceira ocorrência: A.D.F.G.Y

Matriz desnormalizada:

Veja como ficou a expressão desnormalizada em forma de matriz:

Index   | Entity | Level | Level Index
#00     | A      | 1     | 0 
#01     | B      | 2     | 0 
#02     | C      | 2     | 1 
#03     | Y      | 3     | 0 
#04     | D      | 2     | 2 
#05     | E      | 3     | 0 
#06     | F      | 3     | 1 
#07     | G      | 4     | 0 
#08     | B      | 5     | 0 
#09     | C      | 5     | 1 
#10     | Y *    | 6     | 0
#11     | Y      | 4     | 1 
#12     | Z      | 3     | 2

Foi criado uma nova linha com relação a versão original: A linha "#10" contém o novo caminho.

Pesquisa superficial

Na Pesquisa superficial não consideramos os caminhos que já foram declarados (ou percorridos), ou seja, não é aplicado a desnormalização para criar esses novos caminhos. Isso reduz muito o tempo da pesquisa, mas em alguns casos não terá a mesma precisão da Pesquisa profunda.

Por exemplo, se quisermos retornar todas as ocorrências da entidade "Y", teríamos a seguinte diferença entre os tipos de pesquisas:

Expressão de exemplo:

A + B + ( C + Y ) + ( D + E + ( F + ( G + B + C ) + Y ) + Z )

Pesquisa profunda:

Primeiro, aplica-se a desnormalização:

A + B + ( C + Y ) + ( D + E + ( F + ( G + B + ( C + Y ) ) + Y ) + Z )

Primeira ocorrência: A.C.Y
Segunda ocorrência: A.D.F.G.C.Y -> Novo caminho
Terceira ocorrência: A.D.F.G.Y

Pesquisa superficial:

Utiliza a expressão original:

Primeira ocorrência: A.C.Y
Segunda ocorrência: A.D.F.G.Y

Pesquisas sem referência

Nesse tipo de pesquisa não temos nenhuma entidade como referência e a busca será feita em toda a matriz.

Como existem infinitas opção de pesquisas dentro de um grafo, abordaremos apenas alguns exemplos de pesquisa sem referência.

Encontrando a entidade raiz da expressão

Para encontrar a entidade raiz da expressão, precisamos retornar a entidade que tem o índice geral igual "0".

Atenção: Essa pesquisa não apresenta diferenças entre os dois tipos de pesquisa: Pesquisa profunda e Pesquisa superficial.

Com base na expressão a seguir, podemos afirmar que a entidade "A" é a entidade raiz da expressão.

        A + B + C
Index:  0   1   2

Encontrando as "entidades pais" de uma expressão

Para encontrar todas as entidades pais do grafo, devemos aplicar a seguinte técnica:

Recuperar as entidades anteriores de todas as entidades cujo o índice do nível seja igual a "0".
Para cada linha encontrada, retornamos a sua entidade anterior que será sempre uma entidade pai.

Atenção: Essa pesquisa apresenta diferenças nos tipos: Pesquisa profunda e Pesquisa superficial. Contudo, a pesquisa profunda pode retornar entidades duplicadas em casos de grupos de expressões que foram declarados mais de uma vez. Será necessário remover as duplicações.

Pesquisa profunda

Usaremos nesse exemplo a matriz desnormalizada do tópico sobre Pesquisa profunda.

Primeiro, encontramos todas as linhas com o índice do nível igual a zero:

#00 (A)
#01 (B)
#03 (Y)
#05 (E)
#07 (G)
#08 (B)
#10 (Y)

Para cada linha encontrada, retornamos a sua entidade anterior que será uma entidade pai:

NULL -> #00 (A): Não contém entidade anterior, portanto não retorna nada.
#00 (A) -> #01 (B): Retorna a entidade "A" como sendo sua anterior
#02 (C) -> #03 (Y): Retorna a entidade "C" como sendo sua anterior
#04 (D) -> #05 (E): Retorna a entidade "D" como sendo sua anterior
#06 (F) -> #07 (G): Retorna a entidade "F" como sendo sua anterior
#07 (G) -> #08 (B): Retorna a entidade "G" como sendo sua anterior
#09 (C) -> #10 (Y): Retorna a entidade "C" como sendo sua anterior

Com isso, após removermos as repetições (no caso, a entidade "C" que aparece nas linhas "#2" e "#09"), obtemos como resultado as entidades "A", "C", "D", "F" e "G" como sendo as únicas entidades com filhos na expressão.

Pesquisa superficial

A lógica será a mesma da pesquisa profunda, contudo não teremos as duplicações, pois na pesquisa superficial não existem grupos de expressões repetidos.

Pesquisas com referência

A pesquisa com referência parte do princípio que a entidade ou uma de suas ocorrências já foi encontrada. Com base nisso, podemos tomar ações como: verificações, navegações ou pesquisas em seus ascendentes e descendentes.

Como existem infinitas opção de pesquisas usando uma entidade, abordaremos apenas alguns exemplos de pesquisas com referências.

Verificando se uma entidade é a primeira do grupo de expressão (primeira dentro dos parêntese)

Para descobrir se uma entidade é a primeira do seu grupo de expressão (primeira dentro do parênteses), verificamos se o seu nível geral é menor que o nível geral da próxima entidade, se for, essa entidade é a primeira de seu grupo de expressão.

Atenção: Essa pesquisa não apresenta diferenças entre os dois tipos de pesquisa: Pesquisa profunda e Pesquisa superficial.

        A + B + ( C + Y ) + (D + C)
                  ^
Level:  1   2     2   3      2   3
Index:  0   1     2   3      4   5

No exemplo acima, a entidade "C" do índice "#02", tem o nível geral igual á "2" e a sua próxima entidade "Y" tem o nível geral igual á "3", e é por este motivo que ela é a primeira dentro de seu parênteses.

Observação:

Não confunda essa técnica como sendo a solução para verificar se uma entidade contém filhos. Veremos isso no tópico Encontrando todos os descendentes de uma entidade.

Verificando se uma entidade é a última do grupo de expressão (última dentro dos parêntese)

Para descobrir se uma entidade é a última do seu grupo de expressão (última dentro do parênteses), verificamos se seu nível geral é maior que o nível geral da próxima entidade, se for, essa entidade é a última do seu grupo de expressão.

Atenção: Essa pesquisa não apresenta diferenças entre os dois tipos de pesquisa: Pesquisa profunda e Pesquisa superficial.

        A + B + ( C + Y ) + (D + C) + U
                      ^
Level:  1   2     2   3      2   3    2
Index:  0   1     2   3      4   5    6

No exemplo acima, a entidade "Y" do índice "#03", tem o nível geral igual á "3" e a sua próxima entidade "D" tem o nível geral igual á "2", e é por este motivo que ela é a última dentro de seu parênteses.

A entidade "U" do índice "#06" não tem uma próxima entidade, portanto ela é a última de seu grupo de expressão, embora ele esteja omitido por estarmos no grupo de expressão raiz.

Encontrando a entidade anterior

Para retornar a entidade anterior de uma determinada entidade, devemos subtrair o seu índice geral menos um ("-1").

Atenção: Essa pesquisa não apresenta diferenças nos tipos: Pesquisa profunda e Pesquisa superficial

Usaremos nesse exemplo a matriz desnormalizada do tópico sobre Pesquisa profunda.

Para obter a entidade anterior da entidade "Y" da linha "#03", pegamos seu índice geral ("3"), e subtraímos "-1". Com o resultado ("2"), encontramos na matriz a entidade que está nessa posição, nesse caso, retornaríamos a entidade "C".

Index   | Entity | Level | Level Index
#02     | C      | 2     | 1 
#03     | Y      | 3     | 0

Se o resultado for menor que zero, é porque estamos na entidade raiz e não existe a entidade anterior.

Encontrando a próxima entidade

Para retornar a próxima entidade de uma determinada entidade, devemos somar o seu índice geral mais um ("+1").

Atenção: Essa pesquisa não apresenta diferenças nos tipos: Pesquisa profunda e Pesquisa superficial.

Usaremos nesse exemplo a matriz desnormalizada do tópico sobre Pesquisa profunda.

Para obter a próxima entidade da entidade "Y" da linha "#03", pegamos seu índice geral ("3") e somamos "+1". Com o resultado ("4"), encontramos na matriz a entidade que está nessa posição, nesse caso, retornaríamos a entidade "D".

Index   | Entity | Level | Level Index
#03     | Y      | 3     | 0 
#04     | D      | 2     | 2

Se o resultado for maior que a quantidade máxima de itens na matriz é porque estamos na última entidade da expressão e não existe uma próxima entidade.

Encontrando todas as ocorrências de uma entidade

Para encontrar todas as ocorrências de uma entidade, devemos percorrer toda a matriz partindo do índice "0" até última posição da matriz.

Atenção: Essa pesquisa apresenta diferenças nos tipos: Pesquisa profunda e Pesquisa superficial. Contudo, a pesquisa profunda pode retornar uma quantidade maior de ocorrências. Isso ocorre porque, nesse tipo de pesquisa, os grupos de expressões são declarados todas as vezes que a entidade pai é usada.

Sendo assim, é recomendado o uso da pesquisa profunda caso a sua necessidade seja obter o maior número possível de caminhos.

Pesquisa profunda

Usaremos nesse exemplo a matriz desnormalizada do tópico sobre Pesquisa profunda.

Se quisermos buscar todas as ocorrências da entidade "Y" dentro do grafo, encontraríamos as linhas:

#03 (Y)
#10 (Y): Essa ocorrência é derivada da desnormalização.
#11 (Y)

Pesquisa superficial

A lógica será a mesma da pesquisa profunda, contudo não teremos as ocorrências decorrentes das redeclarações dos grupos de expressão.

Usaremos nesse exemplo a matriz original do tópico sobre Matriz de informação.

Se quisermos buscar todas as ocorrências da entidade "Y" dentro do grafo, encontraríamos as linhas:

#03 (Y)
#10 (Y)
Note que foi encontrado uma ocorrência a menos que na pesquisa profunda.

Encontrando todos os descendentes de uma entidade

Se quisermos encontrar os descendentes de uma entidade, verificamos se o nível geral é menor que o nível geral da próxima entidade, se for, essa entidade é uma descendente da entidade corrente. Essa é a mesma técnica usada no tópico Verificando se uma entidade é a primeira do grupo de expressão (primeira dentro dos parêntese).

Devemos continuar navegando para frente até quando a próxima entidade tiver o nível geral igual ou menor ao nível geral da entidade corrente ou se a expressão não tiver mais entidades.

Atenção: Essa pesquisa pode ser feita usando os dois tipos de pesquisa: Pesquisa profunda e Pesquisa superficial. Contudo, existem abordagens diferentes para cada uma delas. Além disso, devemos ter um tratamento especial para entidades que contenham uma ascendente da própria entidade, ou seja, um caminho cíclico.

Entidade com caminho cíclico:

Devemos ter alguns cuidados para encontrar os descendentes de entidades com caminhos cíclicos. Isso ocorre porque os grupos de expressões não podem ser declarados novamente.

Por exemplo, como podemos encontrar os descendentes da entidade "A" que está no índice "#05"?

        A + B + (C + Y) + (D + A + C)
                               ^
Level:  1   2    2   3     2   3   3
Index:  0   1    2   3     4   5   6

A entidade "A" que está no índice "#05" não foi declarada novamente para evitar um caminho cíclico.
Note que a entidade "A" contém descendentes (é a entidade raiz), mas é impossível saber disso analisando somente a ocorrência do índice "#05".

A resposta seria:

Encontrar todas as ocorrências da entidade "A".
Dentre as ocorrências encontradas, devemos encontrar e utilizar a primeira que contenha descendentes e ignorar as demais.
- Ocorrência 1:
  - #00: A entidade "A" tem o nível geral igual a "1".
  - #01: A entidade "B" é a próxima entidade depois de "A" e o seu nível geral é "2", é descendente.
  - Pronto! Encontramos a ocorrência que tem a declaração do grupo de expressão da entidade "A".
- Ocorrência 2:
  - #05: Não é preciso verificar a segunda ocorrência da entidade "A", pois já encontramos a sua declaração.
Retornar os descendentes da entidade "A" do índice "#00":
- #00: A entidade "A" tem o nível geral igual a "1".
- #01: A entidade "B" é a próxima entidade depois de "A" e o seu nível geral é "2", é descendente.
- #02: A entidade "C" é a próxima entidade depois de "B" e o seu nível geral é "2", é descendente.
- #03: A entidade "Y" é a próxima entidade depois de "C" e o seu nível geral é "3", é descendente.
- #04: A entidade "D" é a próxima entidade depois de "Y" e o seu nível geral é "2", é descendente.
- #05: A entidade "A" é a próxima entidade depois de "D" e o seu nível geral é "3", é descendente.
- #06: A entidade "C" é a próxima entidade depois de "A" e o seu nível geral é "3", é descendente.
- Acabou a expressão
- As seguintes entidades foram encontradas: A, B, C, Y, D, A, C.
Remover as ocorrências que estão duplicadas: C
Retornar o resultado: A, B, C, Y, D, A

Pesquisa profunda

Se uma entidade não tiver um caminho cíclico, podemos simplesmente continuar a pesquisa de descendentes da ocorrência corrente, pois é garantido que seu grupo de expressão foi redeclarado.

Pesquisa superficial

Na pesquisa superficial, alguns cuidados são necessários. Observe que na expressão abaixo chegamos em um cenário semelhante ao cenário de entidades com caminhos cíclicos.

Por exemplo, como podemos retornar os descendentes da entidade "C" do índice "#02"?

        A + B + C + (D + A + (C + Y)) + Z
                ^              
Level:  1   2   2    2   3    3   4     2
Index:  0   1   2    3   4    5   6     7

A entidade "C" que está no índice "#02" não foi declarada novamente, pois estamos usando a pesquisa superficial.
Essa expressão não esta normalizada, a entidade "C" deveria ter sido declarada o mais rápido possível, mas isso não ocorreu.
A entidade "C" contém descendentes. Seu grupo de expressão é declarado no índice "#05".

Nesse caso temos duas opções:

Opção 1:

Utilizar a mesma lógica que foi explicada para entidades com caminhos cíclicos. Com isso será avaliado todas as ocorrências da entidade "C" até encontrarmos a ocorrência que declara o seu grupo de expressão.

Seria encontrado a ocorrência do índice "#05" e a ocorrência do índice "#02" seria descartada.
Agora que achamos a ocorrência correta, devemos retornar os descendentes:
- #05: A entidade "C" tem o nível geral igual a "3".
- #06:A entidade "Y" é a próxima entidade depois de "C" e o seu nível geral é "4", é descendente.
- #07: A entidade "Z" é a próxima entidade depois de "Y" e o seu nível geral é "2", ela não é descendente.
- A expressão não terminou, mas foi interrompida depois do resultado negativo do índice "#07".
- A seguinte entidade foi encontrada: Y.
Remover as ocorrências que estão duplicadas, nesse caso, não tivemos nenhuma.
Retornar o resultado: Y

Opção 2:

A segunda opção pode apresentar uma melhor performance se a expressão já estiver normalizada, se isso estiver garantido, não precisamos executar o primeiro passo.

Aplicar a Normalização - tipo 3 para garantir que todas as entidades estão sendo declaradas logo na primeira utilização. Esse passo não é necessário se a expressão já estiver normalizada.

        A + B + (C + Y) + (D + A + C) + Z
                 ^              
Level:  1   2    2   3     2   3   3    2
Index:  0   1    2   3     4   5   6    7

Localizar a primeira ocorrência da entidade "C". Após a normalização, encontraremos a ocorrência que está no índice "#02".
Recuperar os descendentes da primeira ocorrência da entidade "C" do índice "#02".
- #02: A entidade "C" tem o nível geral igual a "2".
- #03: A entidade "Y" é a próxima entidade depois de "C" e o seu nível geral é "3", é descendente.
- #04: A entidade "D" é a próxima entidade depois de "Y" e o seu nível geral é "2", ela não é descendente.
- A expressão não terminou, mas foi interrompida depois do resultado negativo do índice "#04".
- A seguinte entidade foi encontrada: Y.
Remover as ocorrências que estão duplicadas, nesse caso, não tivemos nenhuma.
Retornar o resultado: Y

Por fim, é possível dizer que não precisamos atribuir um tratamento especial para entidades com caminhos cíclicos se estivemos usando uma pesquisa superficial. Vimos que a solução é a mesma nas duas situações.

Esse tema também foi abordado, de forma superficial, no tópico Declarações de entidades.

Encontrando os filhos de uma entidade

Para iniciar esse tópico é preciso entender por completo o tópico Encontrando todos os descendentes de uma entidade.

A lógica é exatamente a mesma da pesquisa de descendentes, a única diferença está no limite do nível geral: [nível geral da entidade corrente] + 1

Usaremos nesse exemplo a matriz desnormalizada do tópico sobre Pesquisa profunda.

Com base nessa matriz, se quisermos encontrar todas as filhas da entidade "D" da linha "#04":

A entidade "D" tem o nível geral igual a "2".
A entidade "E" é a próxima entidade depois de "D" e o seu nível geral é 3, é filha de "D".
A entidade "F" é a próxima entidade depois de "E" e o seu nível geral também é 3, é filha de "D".
As próximas entidades depois de "F" são: "G", "B", "C", "Y" e "Y", todas tem níveis maiores que 3, então serão ignoradas.
A entidade "Z" é a próxima entidade depois de "Y" e o seu nível geral também é 3, é filha de "D".

A expressão chegou ao fim e no final teremos o resultado: E, F, Z

Encontrando todos os ascendentes de uma entidade

Para encontrar os ascendentes de uma entidade, devemos verificar se a entidade anterior tem seu nível geral menor que o nível geral da entidade desejada. Se tiver, essa entidade é uma ascendente.

                A + B
Level:          1   2
                ^   *
Parent of B:    A

Se a entidade anterior for do mesmo nível da entidade deseja, deve-se ignora-la e continuar navegando para trás até encontrar a primeira entidade com o nível geral menor que o nível geral da entidade desejada.

                A + B + J
Level:          1   2   2
                ^       *
Parent of J:    A

Após encontrar o primeiro ancestral, deve-se continuar navegando para trás, porém o nível geral a ser considerado agora será o do primeiro ancestral e não mais da entidade desejada. Esse processo deve continuar até chegar na entidade raiz.

                A + B + (J + Y)
Level:          1   2    2   3
                ^        ^   *
Parents of Y:   J, A

Atenção: Essa pesquisa tem diferenças nos tipos: Pesquisa profunda e Pesquisa superficial. Contudo, a pesquisa profunda pode retornar uma quantidade maior de ocorrências. Isso ocorre por que nesse tipo de pesquisa os grupos de expressões são declarados todas as vezes que a entidade pai for utilizada.

Por exemplo, se quisermos pegar os ascendentes da entidade "C" considerando todas as suas ocorrências:

Primeira ocorrência:

A entidade "C" da linha "#02" tem o nível geral igual a "2".
#01: A entidade "B" tem o nível geral igual a "2". Não é um ascendente.
#00: A entidade "A" tem o nível geral igual a "1" (é menor), portanto, é a primeira ascendente (entidade pai). Agora o nível a ser considerado será o nível "1" e não mais o nível "2".

A expressão chegou a fim e teremos as seguintes entidades ascendentes: A

Segunda ocorrência:

A entidade "C" da linha "#09" tem o nível geral igual a "5".
#08: A entidade "B" tem o nível geral igual a "5", não é uma ascendente.
#07: A entidade "G" tem o nível geral igual a "4" (é menor), portanto, é a primeira ascendente (entidade pai). Agora o nível a ser considerado será o nível "4" e não mais o nível "5".
#06: A entidade "F" tem o nível geral igual a "3". Ela tem o nível geral menor que a entidade "G", portanto, é uma ascendente. Agora o nível a ser considerado será o nível "3" e não mais o nível "4".
#05: A entidade "E" tem o nível geral igual a "3". Não é uma ascendente.
#04: A entidade "D" tem o nível geral igual a "2". Ela é uma ascendente. Agora o nível a ser considerado será o nível "2" e não mais o nível "3".
#03: A entidade "Y" tem o nível geral igual a "3". Não é uma ascendente.
#02: A entidade "C" tem o nível geral igual a "2". Não é uma ascendente.
#01: A entidade "B" tem o nível geral igual a "2". Não é uma ascendente.
#00: A entidade "A" tem o nível geral igual a "1". Ela é uma ascendente. Agora o nível a ser considerado será o nível "1" e não mais o nível "2".

A expressão chegou ao fim e teremos as seguintes entidades ascendentes: G, F, D, A

Encontrando o pai de uma entidade

Seguindo a lógica do tópico Encontrando todos os ascendentes de uma entidade, para encontrar apenas o pai da entidade "Y", precisaríamos limitar o nível geral dos ascendentes á: [nível geral da entidade corrente] - 1; ou a primeira entidade com o nível geral menor que a entidade desejada.

Atenção: Essa pesquisa apresenta diferenças nos tipos: Pesquisa profunda e Pesquisa superficial. Contudo, a pesquisa profunda pode retornar uma quantidade maior de ocorrências. Isso ocorre porque, nesse tipo de pesquisa, os grupos de expressões são declarados todas as vezes que a entidade pai é usada.

Como existem 3 ocorrências da entidade "Y", teremos uma entidade pai por ocorrência:

Primeira ocorrência:

A entidade "Y" da linha "#3" tem o nível geral igual a "3".
#02: A entidade "C" é a entidade anterior a "Y" e tem o nível geral igual a "2", portanto, ela é pai da entidade "Y".

Segunda ocorrência:

A entidade "Y" da linha "#10" tem o nível geral igual a "6".
#09: A entidade "C" é a entidade anterior a "Y" e tem o nível geral igual a "5", portanto, ela é pai da entidade "Y".

Terceira ocorrência:

A entidade "Y" da linha "#11" tem o nível geral igual a "4".
#10: A entidade "Y" tem o nível geral igual a "6". Não é uma ascendente.
#09: A entidade "C" tem o nível geral igual a "5". Não é uma ascendente.
#08: A entidade "B" tem o nível geral igual a "5". Não é uma ascendente.
#07: A entidade "G" tem o nível geral igual a "4". Não é uma ascendente.
#06: A entidade "F" é a entidade anterior da entidade "G" e tem o nível geral igual a "3", portanto, ela é pai da entidade "Y".

Implementações

Esse tópico vai demostrar na prática alguns exemplos de implementações de alguns dos conceitos que estudamos.

Criando grafos com expressão de grafo
Convertendo uma matriz de informação para expressões de grafos
Criando uma matriz de informações a partir de um grafo

Usaremos a linguagem de programação C# devido a sua capacidade de sobrecarregar operadores matemáticos.

Criando grafos com expressão de grafo

Nesse exemplo, vamos demostrar como criar um grafo usando apenas expressão de grafo. Nós faremos isso da maneira mais simples e objetiva possível.

Será usado uma entidade circular, ou seja, uma entidade que se relaciona com ela mesma.

[DebuggerDisplay("{Name}")]
public class Entity : List<Entity>
{
    public string Name { get; private set; }
    public Entity(string identity) => this.Name = identity;

    public static Entity operator +(Entity a, Entity b)
    {
        a.Add(b);
        return a;
    }

    public static Entity operator -(Entity a, Entity b)
    {
        a.Remove(b);
        return a;
    }
}

A classe herda de uma lista genérica da própria classe, nossa intenção é criar uma instância cíclica.
A classe exige um nome como parâmetro de entrada, será o nome da entidade
Os operadores "+" e "-" foram sobrescritos, agora essa entidade pode ser utilizada dentro de uma expressão.
- Quando houver uma soma ("+"), a entidade da direita será adicionada na lista da entidade da esquerda, e a entidade da esquerda será devolvida como resultado. Essa é a base do conceito de expressão de grafo.
- Quando houver uma subtração ("-"), a entidade da direita será removida na lista da entidade da esquerda, e a entidade da esquerda será devolvida como resultado.

Para usar é simples, basta usar como se fosse uma expressão matemática:

class Program
{
    static void Main(string[] args)
    {
        var A = new Entity("A");
        var B = new Entity("B");
        var C = new Entity("C");
        var D = new Entity("D");
        var E = new Entity("E");
        var F = new Entity("F");
        var Y = new Entity("Y");
        var H = new Entity("H");

        // expression1
        A = A + B + (C + (D + E + F)) + (Y + H);

        // expression2
        D = D - E;
    }
}

Após executar a primeira expressão, teremos o seguinte grafo:

A
----B
----C
    ----D
        ----E
        ----F
----Y
    ----H

Após a execução da segunda expressão, vemos que a entidade "D" não tem mais a entidade "E" como filha, ela foi subtraída/removida:

A
----B
----C
    ----D
        ----F
----Y
    ----H

Note que a expressão é exatamente igual a todas as expressões que vimos durante esse estudo. Isso mostra que para entidades circulares é possível usufruir desse conceito sem o uso de grandes blocos de código.

Para entidades de maior complexidade, não seria tão simples o uso dos operadores. haveria a necessidade de criar mecanismos de reflexão e o uso de string para a criação e processamento da expressão.

Convertendo uma matriz de informação para expressões de grafos

Nesse exemplo veremos como converter uma matriz de informação de volta para expressão de grafo.

É importante destacar que esse código é simples e específico para o nosso exemplo. Embora ele possa ser útil para diversos propósitos devido a sua capacidade de identificar os momentos corretos de início e fim de uma iteração de uma entidade.

[DebuggerDisplay("{Entity.Name}")]
public class EntityItem
{
    private readonly Expression expression;

    public EntityItem(Expression expression)
    {
        this.expression = expression;
    }

    public int Index { get; set; }
    public int IndexAtLevel { get; set; }
    public int Level { get; set; }
    public int LevelAtExpression { get; set; }
    public Entity Entity { get; set; }

    public EntityItem Previous { get => expression.ElementAtOrDefault(Index - 1); }
    public EntityItem Next { get => expression.ElementAtOrDefault(Index + 1); }
    public EntityItem Parent
    {
        get
        {
            var previous = this.Previous;
            while(previous != null)
            {
                if (previous.Level < this.Level)
                    return previous;
                previous = previous.Previous;
            }
            return null;
        }
    }
}

Essa classe será nossa representação de cada linha da matriz de informação, ou seja, cada ocorrência de uma entidade dentro da expressão. Nela teremos todas as propriedades que uma ocorrência de uma entidade pode ter.
Nas propriedades Previous, Next e Parent, estamos implementando, respectivamente, as técnicas:

public class Expression : List<EntityItem>
{
    public string ToExpressionAsString()
    {
        var parenthesisToClose = new Stack<EntityItem>();
        var output = "";
        foreach (var item in this)
        {
            var next = item.Next;
            var isFirstInParenthesis = next != null && item.Level < next.Level;
            var isLastInParenthesis = next == null || item.Level > next.Level;
            var isNotRoot = item.Index > 0;

            if (isNotRoot) output += " + ";

            if (isFirstInParenthesis)
            {
                output += "(";
                parenthesisToClose.Push(item);
            }

            output += item.Entity.Name.ToString();

            if (isLastInParenthesis)
            {
                int countToClose;

                if (next == null)
                    countToClose = parenthesisToClose.Count;
                else
                    countToClose = item.Level - next.Level;

                for (var i = countToClose; i > 0; i--)
                {
                    parenthesisToClose.Pop();
                    output += ")";
                }
            }
        }

        return output;
    }
}

class Program 
{
    static void Main(string[] args)
    {
        var A = new Entity("A");
        var B = new Entity("B");
        var C = new Entity("C");
        var Y = new Entity("Y");
        var D = new Entity("D");
        var E = new Entity("E");
        var F = new Entity("F");
        var G = new Entity("G");
        var Z = new Entity("Z");

        var expression = new Expression();
        expression.Add(new EntityItem(expression) { Entity = A, Index = 0, IndexAtLevel = 0, Level = 1 });
        expression.Add(new EntityItem(expression) { Entity = B, Index = 1, IndexAtLevel = 0, Level = 2 });
        expression.Add(new EntityItem(expression) { Entity = C, Index = 2, IndexAtLevel = 1, Level = 2 });
        expression.Add(new EntityItem(expression) { Entity = Y, Index = 3, IndexAtLevel = 0, Level = 3 });
        expression.Add(new EntityItem(expression) { Entity = D, Index = 4, IndexAtLevel = 2, Level = 2 });
        expression.Add(new EntityItem(expression) { Entity = E, Index = 5, IndexAtLevel = 0, Level = 3 });
        expression.Add(new EntityItem(expression) { Entity = F, Index = 6, IndexAtLevel = 1, Level = 3 });
        expression.Add(new EntityItem(expression) { Entity = G, Index = 7, IndexAtLevel = 0, Level = 4 });
        expression.Add(new EntityItem(expression) { Entity = B, Index = 8, IndexAtLevel = 0, Level = 5 });
        expression.Add(new EntityItem(expression) { Entity = C, Index = 9, IndexAtLevel = 1, Level = 5 });
        expression.Add(new EntityItem(expression) { Entity = Y, Index = 10, IndexAtLevel = 1, Level = 4 });
        expression.Add(new EntityItem(expression) { Entity = Z, Index = 11, IndexAtLevel = 2, Level = 3 });
        var expressionString = expression.ToExpressionAsString();
    }
}

No método Main temos a chamada da nossa função. Note que estamos criando a matriz de informação de forma manual. Essa matriz deve representar a seguinte expressão:

(A + B + (C + Y) + (D + E + (F + (G + B + C) + Y) + Z))

A função ToExpressionAsString será responsável por fazer toda a iteração e chegar em nosso objetivo: Retornar uma string contendo nossa expressão.

A classe Expression representa uma expressão de grafo como um todo. Essa classe herda de uma lista do tipo EntityItem. Isso aproxima essa classe do conceito: Um conjunto de ocorrências de entidades com suas informações.
O método ToExpressionAsString retorna uma string que será a nossa expressão.
A lista (contendo todas as ocorrências das entidades) será percorrida completamente. Da posição zero até o final da lista. Cada iteração pode conter diversos níveis da expressão.
A variável parenthesisToClose armazena uma lista de todos os parênteses que foram abertos e precisam ser fechados. A lista tem que estar no formato: último a entrar, primeiro a sair.
Para cada iteração:
- Se a entidade for a entidade raiz, não adiciona o sinal de +.
  - Encontrando a entidade raiz da expressão
- Se a entidade for a primeira do grupo de expressão, adiciona o caractere (
  - Verificando se uma entidade é a primeira do grupo de expressão (primeira dentro dos parêntese)
- Se a entidade for a última do seu grupo de expressão (última dentro dos parênteses), então feche com o caractere ")". Como vários parênteses podem ter sido abertos nas iterações anteriores, então devemos calcular a quantidade de parênteses que precisam ser fechados e fecha-los. A variável parenthesisToClose contém a entidade que está sendo fechada, isso pode ser útil para alguma lógica.
  - Verificando se uma entidade é a última do grupo de expressão (última dentro dos parêntese)

Com esses trechos de códigos vimos como é simples iterar em uma expressão de grafo e entender seus momentos. Além de abrir caminhos para implementações mais completas como: pesquisa em expressão de grafo.

Criando uma matriz de informações a partir de um grafo

No exemplo anterior vimos como gerar uma expressão de grafo a partir de uma matriz de informação manual e que foi representada pela classe Expression.

Nesse exemplo, vamos abordar uma implementação que cria essa matriz de forma automática.

public class Expression : List<EntityItem>
{
    public bool Deep { get; }

    public Expression(Entity root, bool deep = true)
    {
        Deep = deep;

        if (root != null)
            Build(root);
    }

    private void Build(Entity parent, int level = 1)
    {
        // only when is root entity
        if (Count == 0)
        {
            var rootItem = new EntityItem(this)
            {
                Entity = parent,
                Index = 0,
                IndexAtLevel = 0,
                LevelAtExpression = level,
                Level = level
            };

            Add(rootItem);
        }

        var indexLevel = 0;
        var parentItem = this.Last();

        level++;
        foreach (var child in parent.Children)
        {
            var previous = this.Last();
            var childItem = new EntityItem(this)
            {
                Entity = child,
                Index = Count,
                IndexAtLevel = indexLevel++,
                Level = level,
            };

            Add(childItem);

            // if:   IS 'deep' and the entity already declareted in expression, don't build the children of item.
            // else: if current entity exists in ancestors (to INFINITE LOOP), don't build the children of item.
            var continueBuild = true;
            if (Deep)
                continueBuild = !HasAncestorEqualsTo(childItem);
            else
                continueBuild = !IsEntityDeclared(childItem);

            if (continueBuild && child.Children.Count() > 0)
            {
                childItem.LevelAtExpression = parentItem.LevelAtExpression + 1;
                Build(child, level);
            }
            else
            {
                childItem.LevelAtExpression = parentItem.LevelAtExpression;
            }
        }
    }

    private bool HasAncestorEqualsTo(EntityItem entityItem)
    {
        var ancestor = entityItem.Parent;
        while (ancestor != null)
        {
            if (entityItem.Entity == ancestor.Entity)
                return true;

            ancestor = ancestor.Parent;
        }

        return false;
    }

    private bool IsEntityDeclared(EntityItem entityItem)
    {
        return this.Any(e => e != entityItem && e.Entity == entityItem.Entity);
    }

    public string ToMatrixAsString()
    {
        var s = "";
        s += "Index    | Entity  | Level    | Level Index     | LevelAtExpression \r\n";

        foreach (var i in this)
        {
            s += $"{i.Index.ToString("00")}       ";
            s += $"| {i.Entity.Name}       ";
            s += $"| {i.Level.ToString("00")}       ";
            s += $"| {i.IndexAtLevel.ToString("00")}              ";
            s += $"| {i.LevelAtExpression.ToString("00")} \r\n";
        }
        return s;
    }
}

class Program 
{
    static void Main(string[] args)
    {
        var A = new Entity("A");
        var B = new Entity("B");
        var C = new Entity("C");
        var Y = new Entity("Y");
        var D = new Entity("D");
        var E = new Entity("E");
        var F = new Entity("F");
        var G = new Entity("G");
        var Z = new Entity("Z");
        A = A + (B + (C + A) + A) + (D + D + E + (F + (G + A + C) + Y) + Z) + G;
        var expression = new Expression(A, false);
        var matrix = expression.ToMatrixAsString();
    }
}

O método ToMatrixAsString será usado para verificarmos o resultado de nosso exemplo. E após o processamento do grafo da entidade "A", teremos a seguinte matriz de informação:

Index    | Entity  | Level    | Level Index     | LevelAtExpression 
00       | A       | 01       | 00              | 01 
01       | B       | 02       | 00              | 02 
02       | C       | 03       | 00              | 03 
03       | A       | 04       | 00              | 03 
04       | A       | 03       | 01              | 02 
05       | D       | 02       | 01              | 02 
06       | D       | 03       | 00              | 02 
07       | E       | 03       | 01              | 02 
08       | F       | 03       | 02              | 03 
09       | G       | 04       | 00              | 04 
10       | A       | 05       | 00              | 04 
11       | C       | 05       | 01              | 04 
12       | Y       | 04       | 01              | 03 
13       | Z       | 03       | 03              | 02 
14       | G       | 02       | 02              | 01

A classe recebe em seu construtor a entidade raiz. A partir dessa instância, vamos navegar em seu grafo por completo.
O parâmetro Deep determina se a varredura será profunda ou não e que foi explicado no tópico Pesquisa profunda
O primeiro if dentro da função Build verifica se é a entidade raiz, se for, devemos criar o primeiro item. Nesse ponto, as informações são fixas (por ser a entidade raiz), serão os valores inicias.
Na segunda parte da função, iniciamos a leitura dos filhos da entidade parent.
Será incrementado +1 no nível geral conforme se aprofunda na entidade. Esse valor é passado por parâmetro, pois ele transcende todo o grafo.
Será incrementado +1 no índice do nível. Esse valor está fechado apenas no escopo do foreach, ou seja, apenas para os filhos da entidade.
Para cada interação, é verificado se a propriedade Deep é true, se for, devemos manter a navegação mesmo se entidade corrente já foi percorrida por completo em algum momento da expressão. Contudo, a única situação que limita a continuação é se a entidade corrente tiver relações com ela mesma em um de seus ascendentes. Se tiver, é interrompida a continuação.
Se a propriedade Deep for false, então devemos apenas verificar se a entidade já foi percorrida em algum momento da expressão, se foi, então não continuamos.
A propriedade LevelAtExpression (nível da expressão) é preenchida com o nível de expressão da entidade pai. Soma-se "+1" quando a entidade tiver filhos e não soma nada quando não tiver.

Com isso, concluímos os três principais exemplos do conceito e que podem ser base para implementações mais complexas como a pesquisa em expressão de grafo.

Files

concept-pt-br.md

Latest commit

History

concept-pt-br.md

File metadata and controls