Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Rever obrigatoriedade de marcação de todos os dados de referência em element-citation #559

Open
RPostalli opened this issue Jan 17, 2018 · 10 comments

Comments

@RPostalli
Copy link
Contributor

Questiona-se neste tiket qual a necessidade de marcação de todo o conteúdo da referência em element-citation, quando muitos dados não são utilizados em métricas SciELO (levantar quais são usados? - autor/título do periódico/ ano?)

Na nota da tag element-citation no SPS diz: Todas as informações de uma referência devem ser marcadas. Caso não exista um elemento específico para determinada informação, esta deve ser inserida em comment.

Foi considerado que estas marcações em comment são "sujeiras" no XML e não tem uso real. Considerando que todo o conteúdo da referência já aparece em mixed-citation, rever regras de marcação em element-citation.

OBS para mim: Ver também regras para element-citation do PMC - talvez marcação de tudo venha de regras PMC já que ele não usam mixed-citation.

@RPostalli RPostalli added this to the versão 2.0 milestone Feb 22, 2018
@RPostalli RPostalli modified the milestones: versão 2.0, versão 1.9 Mar 14, 2018
@gustavofonseca
Copy link
Collaborator

Não me oponho a rever as regras, penso que é um exercício saudável.
Mas você conhece a frase "metadata is a love note to the future"?

@RPostalli
Copy link
Contributor Author

@gustavofonseca não conheço, tem a ver com XML?

@RPostalli RPostalli modified the milestones: versão 1.9, versão 2.0 Jan 30, 2019
@gustavofonseca
Copy link
Collaborator

@gustavofonseca não conheço, tem a ver com XML?

De alguma maneira sim, na medida em que estamos vivendo um momento em que dado é o novo petróleo.

O que quero dizer com isso é que tudo bem de marcarmos dados no XML que por hora não possuem nenhum valor prático, por exemplo na geração de métricas, pq amanhã esses dados poderão ser úteis, como já ocorreu.

Mas novamente, estou de acordo em rever as regras.

@gustavofonseca
Copy link
Collaborator

Ticket relacionado, em alguma medida, com #219

@lpanebr
Copy link

lpanebr commented Nov 11, 2019

@RPostalli o PMC aceita tanto mixed-citation quanto element-citation.

Adotar o mixed-citation como padrão mataria dois coelhos com uma só cajadada. As "sujeiras" simplesmente não precisam ser marcadas e todo o essencial fica marcado.

Do ponto de vista técnico, a @robertatakenaka e o @gustavofonseca podem dizer melhor, mas creio que as folhas de estilo poderiam ser ajustadas para lidar com 1) arquivos que apenas tem a mixed, e 2) artigos que tem ambas.

@robertatakenaka
Copy link
Member

@lpanebr não é tão simples assim:

Em mixed-citation nada é obrigatório. Ou seja, se as pessoas não marcarem nada, seria válido. No entanto do ponto de vista de nossos serviços, não poderia ser válido, sendo necessário criar validação no XPM.

SciELO usa o conteúdo marcado para gerar indicadores, enquanto o PMC, até onde sabemos não usa essa granularidade. Então comparar nem sempre é justo.

Do ponto de vista do site, obviamente a folha de estilo resolve. No entanto, temos que dar manutenção a várias ferramentas para estarem preparada para tratar o XML com mixed-citation com dados identificados. E por esse motivo temos mantido este issue parado. Documentar é muito mais fácil que atualizar as aplicações que são no mínimo 6: markup, xpm, xc, packtools, site atual, site novo pois pode haver mais.

@lpanebr
Copy link

lpanebr commented Nov 12, 2019

desculpe @robertatakenaka eu não tive a intenção de dizer que qualquer coisa que fazem é simples.

Me doeu o cérebro só de imaginar o trabalho técnico, mental e de orquestração para desenvolver, testar e propagar melhorias sem quebrar funcionalidades (atuais e legadas) em 6+ sistemas. (mais difícil com um outsider dando pitaco! rs)

@robertatakenaka
Copy link
Member

nem precisa dizer!

@robertatakenaka
Copy link
Member

@RPostalli

Questiona-se neste tiket qual a necessidade de marcação de todo o conteúdo da referência em element-citation, quando muitos dados não são utilizados em métricas SciELO (levantar quais são usados? - autor/título do periódico/ ano?)

Os dados usados nas métricas de SciELO acredito que tem a ver com título do periódico e ano. Mas possivelmente volume e/ou página também é usado para conseguir distinguir os periódicos com nomes similares. Mas não sou a pessoa mais indicada para esta confirmação.

No entanto, no âmbito maior como por exemplo nas métricas do SciELO CI talvez usem mais que isso ainda. Isso precisaria ser investigado.

Também temos que pensar em bases para as quais exportamos dados... Qual é o nível de granularidade necessária?

@RPostalli
Copy link
Contributor Author

@robertatakenaka este ticket tem relação com marcações "bizarras" que nenhuma base faz uso, por exemplo a marcação de dados em comment. Todos nos sabemos que o comment é usado pra dados que não tem tag para ser marcado, ou seja, dados que não tem representatividade para métrica. A figura a seguir mostra um uso bizarro de comment.

image

A princípio documentamos este formato pq partíamos do princípio que tudo o que estava em mixed deveria obrigatoriamente ser marcado em element, mas hoje sabemos que isso só gera sujeira, não precisamos ter o texto "Disponível em:" marcado, o que importa é o ext-link e o texto da ref na integra vai ser gerado pela marcação do mixed.

Acho que podemos para a versão 1.10 suprimir/proibir o uso da tag comment pelo menos e ir estudando a supressão/proibição de outras tags com base no uso de dados de ref de SciELO e outras bases ao qual interoperamos.

O que acha?

@gustavofonseca gustavofonseca removed this from the versão 1.10 milestone Nov 22, 2019
@RPostalli RPostalli added this to the versão 1.10 (2022) milestone Jan 10, 2022
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants