Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Material suplementar nova rota e carga #315

Open
2 of 4 tasks
gitnnolabs opened this issue Feb 8, 2022 · 4 comments
Open
2 of 4 tasks

Material suplementar nova rota e carga #315

gitnnolabs opened this issue Feb 8, 2022 · 4 comments
Assignees
Labels

Comments

@gitnnolabs
Copy link
Contributor

gitnnolabs commented Feb 8, 2022

Descrição da tarefa

Atualmente estamos armazenando os dados do material suplementar no mínio, “kernel”, porém não estamos disponibilizando uma forma de acessar esse conteúdo através do site.

Subtarefas

  • Alterar o opac-schema para conter um schema para armazenar esse conteúdo (deve conter um campo chamado matsuppl (similar ao campo pdfs) e deve conter pelo menos id, além de filename, uri e lang.
  • Capacitar o OPAC-Airflow para cadastra na base de dados do site esse conteúdo, no momento de sincronização
  • Resolver a rota antiga, ou seja, o legado: /<pdf ou htdocs/img>/<acron>/<volnum>/<nome_do_arquivo>.pdf (pois isso está nos PDF do legado e atuais)
  • Adicionar uma rota no site que permita resolver para o material suplementar só com o nome do arquivo: /matsuppl/<nomedoarquivo>

Considerações e notas

Este issue impactará no fluxo completo, logo em todas os repos envolvidos: opac_schema, packtools, opac-airflow, opac. No entanto, não deve impactar em reeditar os arquivos nem XML nem pdf. E implicará em reprocessar a partir do airflow.

Para execução da atividade de capacitar o opac-airflow é importante para execução os seguintes links e documentos:

@gitnnolabs gitnnolabs added the task label Feb 8, 2022
@scieloorg scieloorg deleted a comment from gitnnolabs Feb 9, 2022
@gitnnolabs gitnnolabs self-assigned this Feb 18, 2022
@gitnnolabs
Copy link
Contributor Author

Exemplo dos dados do material suplementar no opac_schema:

        "mat_suppl" : [
            {
                "ref_id": "suppl01",
                "lang" : "10.1590/S0103-50532006000200001",
                "url" : "https://minio.scielo.br/documentstore/2237-9622/d6DyD7CHXbpTJbLq7NQQNdq/5d88e2211c5357e2a9d8caeac2170f4f3d1305d1.pdf"
                "filename": "suppl01.pdf"
            },
            {
                "ref_id": "suppl02",
                "lang" : "10.1590/S0103-505320060002000002",
                "url" : "https://minio.scielo.br/documentstore/2237-9622/d6DyD7CHXbpTJbLq7NQQNdq/5d88e2211c5357e2a9d8caeac2170f4f3d1305d2.pdf"
                "filename": "suppl02.pdf"
            },
            {
                "ref_id": "suppl03",
                "lang" : "10.1590/S0103-50532006000200003",
                "url" : "https://minio.scielo.br/documentstore/2237-9622/d6DyD7CHXbpTJbLq7NQQNdq/5d88e2211c5357e2a9d8caeac2170f4f3d1305d3.pdf
                "filename": "suppl03.pdf"
            },
        ]

@gitnnolabs
Copy link
Contributor Author

Olhando um XML pré-processamento, verifiquei que não temos o caminho completo para o material suplementar:

Captura de Tela 2022-02-18 às 10 12 01

@gitnnolabs
Copy link
Contributor Author

Olhando o Kernel e considerando que no XML temos somente o nome do artigo, não compensa realizar qualquer alteração no momento de inclusão do XML e/ou no Kernel.

A ideia é pegar a partir do kernel no momento de sincronização com o site:

Captura de Tela 2022-02-18 às 13 38 16

@gitnnolabs
Copy link
Contributor Author

gitnnolabs commented Feb 21, 2022

@robertatakenaka @RPostalli

Importante: Nessa solução para o material suplementar é necessário no nome do arquivo a presença do termo "suppl".

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

1 participant